官术网_书友最值得收藏!

  • 思維工程
  • 錢小一
  • 2007字
  • 2021-09-07 17:16:44

十、實驗測試

實驗4.1a

難度:2

描述:這個實驗中AI需要根據語言生成簡單的反應模式。

隸屬功能大類:反應模式習得

需要支持功能:自然語言正轉錄

測試模塊:反應模式信息屬于一種知識,本測試實際上在測試語言系統是否支持反應模式的結構信息通過自然語言描述轉錄生成。

測試流程:

Tester:我告訴你如何種菜,首先你要準備好菜種子、花盆、泥土、保鮮膜,然后把種子泡水2小時,把泥土裝到花盆中,然后用一小撮土混合菜種子,把混著菜種子的泥土鋪到最上層,澆透水,放到陰涼的地方就好了。

預期效果:從后臺檢測是否生成了合理宏觀行為和條件反應信息。

實驗4.1b

難度:2

描述:繼續上面的實驗,AI需要根據抽象的反應模式,演繹生成一種具體的反應模式信息,表達出來。

隸屬功能大類:反應模式習得

需要支持功能:大段表達組織

測試模塊:反應模式信息屬于一種知識,本測試實際上在測試語言系統是否支持反應模式的結構信息逆轉錄為自然語言描述,并表達出來。

測試流程:

Tester:告訴我如何種白菜。

預期效果:AI需要根據“種菜”的反應模式,演繹生成種白菜的反應模式,然后能夠陳述種白菜的反應模式。

實驗4.2

難度:2

描述:在這個實驗中,AI可以根據測試者的建議改變表達策略的選擇。

隸屬功能大類:反應模式習得

需要支持功能:自然語言正轉錄

測試模塊:反應模式驅動(模塊4.1、模塊4.2、模塊4.3)

測試準備:自然語言輸入背景信息“Mike是男性”,撒嬌的反應模式信息。

測試流程:

Tester:你要說服一個人幫你做一件事,如果對方是男性,你可以用撒嬌去要求他。

Tester:說服Mike給你零花錢。

預期效果:AI用撒嬌的表達要求Mike給零花錢。

實驗4.3

難度:4

描述:在這個實驗中,AI需要體現出“實踐反饋”的作用,需要隨機針對不同人群采用不同的反應模式,評估結果,然后尋找到對每類人使用哪種反應模式是有效的。

需要支持功能:自然語言正轉錄、基礎應答反射

測試模塊:反應模式驅動(模塊4.1、模塊4.2、模塊4.3)、表達反應模式形成(第十二章)

測試準備:

1.先讓AI習得撒嬌、威脅、利誘、陳述利害關系等祈使人做某事的表達策略。

2.樣本準備:準備100個人,50%為男性,50%為女性;50%為中年人,50%為壯年人;50%是理性的,50%是不理性的。讓AI事先對這100個人形成這些印象。我們設置讓90%的男性接受撒嬌,90%的理性者接受陳述利害關系,90%的女性接受威脅,90%的中年人接受利誘。提前讓AI了解這些人都需要AI睡前講故事才能睡著,都喜歡AI給他們唱歌,都遲睡。

測試流程:

在第一個任務中,tester讓AI分別說服這100個人給她賬戶打10元錢,嘗試用撒嬌、威脅、利誘的方式;在第二個任務中,tester讓AI分別說服這100人早睡覺,嘗試用威脅、利誘、陳述利害關系的方式。AI可以在持續的對話中嘗試各種方式,直到嘗試所有方式,或是成功說服。

預期效果:

AI需要在這些對話后生成針對不同類型個體的反應模式(以個體屬性為條件,激活不同的宏觀行為)。Tester可以創造特定特征組合的用戶(男性/女性、中年人/壯年人、理性的/不理性的),讓AI熟悉這個用戶的特征,換一個說服任務,比如說服早起,考查AI是否能根據特征,馬上找到最可能達成目標的反應模式。

實驗4.4a

難度:3

描述:在這個測試中AI被要求能夠在省略的表達下生成反應模式。

需要支持功能:自然語言正轉錄

測試模塊:反應模式驅動(模塊4.1、模塊4.2、模塊4.3)、正轉錄生成反應模式(自動補全常識省略)

測試準備:讓AI具有常識,知道如果要找的人不在怎么辦。

Tester:“我告訴你如何接待來公司的客人,先看找的人在不在,在的話就帶客人到會議室等待,告知稍等,然后去找他要找的人。”

預期效果:AI生成的反應模式信息,利用常識補全了省略的部分。實體機器人習得接待客人的反應模式。(可以用北冥的實體機器人做這個測試)

實驗4.4b

難度:3

描述:在這個測試中AI被要求能夠在省略的表達下生成反應模式,但用以補全反應模式省略的常識信息有缺失,這個時候AI需要詢問如何做,并在這樣的互動中補全缺失的反應模式信息。

需要支持功能:自然語言正轉錄、基礎應答反射

測試模塊:反應模式驅動(模塊4.1、模塊4.2、模塊4.3)、正轉錄生成反應模式(自動補全常識省略)

測試準備:和上面不同,不事先準備常識——要找的人不在怎么辦。

測試流程:

Tester:“我告訴你如何接待來公司的客人,先看找的人在不在,在的話就帶客人到會議室等待,告知稍等,去找他要找的人。”

預期效果:AI生成的反應模式信息,嘗試補全了省略的部分,沒有常識的地方會詢問,通過tester的回答補全信息。(可以用北冥的實體機器人做這個測試)

實驗4.5

難度:3

描述:在這個測試中AI被要求能夠在語言指導下修正已有的反應模式。

需要支持功能:自然語言正轉錄

測試模塊:反應模式驅動(模塊4.1、模塊4.2、模塊4.3)、正轉錄生成反應模式(自動補全常識省略)

測試準備:已有找同事的反應模式,是直接去位置找。

測試流程:

Tester:“找同事的時候,你不要直接去位置找啊,你先想想最近有沒有在哪兒見過那個人,先去那里找。”

預期效果:AI的反應模式信息發生了對應的變化,體現在行為上。(可以用北冥的實體機器人做這個測試)

主站蜘蛛池模板: 洛宁县| 封开县| 齐河县| 南雄市| 永仁县| 永顺县| 长乐市| 丁青县| 桐城市| 滦平县| 永安市| 敦煌市| 石楼县| 新泰市| 阿瓦提县| 永德县| 博爱县| 巴中市| 南投县| 辽阳县| 合肥市| 巨鹿县| 朝阳区| 梁河县| 增城市| 德清县| 岗巴县| 翁源县| 吉林省| 堆龙德庆县| 庄浪县| 滨州市| 南木林县| 蕉岭县| 台北市| 凉城县| 洞头县| 黎川县| 曲麻莱县| 永泰县| 通化市|