官术网_书友最值得收藏!

1.8 推理法

1.8.1 思維鏈

2022年,Jason Wei等人在論文“Chain-of-Thought Prompting Elicits Reasoning in Large Language Models”中提到了思維鏈(Chain-of-Thought,CoT)方法,這種方法可以顯著提升大語(yǔ)言模型進(jìn)行復(fù)雜推理的能力。它鼓勵(lì)大語(yǔ)言模型解釋自己的推理過程,將大目標(biāo)拆解成小目標(biāo),一步步思考和計(jì)算最終結(jié)果。思維鏈的主要思想是通過向大語(yǔ)言模型展示少量的示例,在示例中解釋推理過程,模型在回答提示時(shí)也會(huì)顯示推理過程。這種推理的解釋往往會(huì)引導(dǎo)出更準(zhǔn)確的結(jié)果。

舉例如下:

提示詞:地球和火星哪一個(gè)適合人類居住?

AI輸出:

在當(dāng)前科技水平下,地球是唯一適合人類居住的星球。火星的環(huán)境對(duì)人類來說極度惡劣,問題包括極低的溫度、稀薄的大氣、缺乏液態(tài)水和食物源等。雖然科學(xué)家正在研究如何在火星上建立生態(tài)環(huán)境以供人類居住,但那仍然是一個(gè)未來的目標(biāo),而且充滿了巨大的挑戰(zhàn)。

而通過CoT方法,我們可以將一個(gè)多步驟推理問題分解成多個(gè)中間步驟,分配更多的計(jì)算量,生成更多的答案,再將這些答案拼接在一起提供結(jié)果。

提示詞:地球和火星哪一個(gè)適合人類居住?請(qǐng)?jiān)敿?xì)解釋你的推理過程。

AI輸出:

當(dāng)前的科學(xué)研究和技術(shù),使得人類居住在地球上遠(yuǎn)比火星上更為容易。以下是一些主要原因:

1.維持生命的條件:地球擁有適宜維持生命的氣候、豐富的水資源、合適的氣氛以及獨(dú)特的生物圈。對(duì)比之下,火星的環(huán)境無法直接支持人類生活,其表面溫度極低,大氣稀薄,且主要由二氧化碳構(gòu)成,而且目前還未在火星上發(fā)現(xiàn)液態(tài)水。

2.離地球的距離:火星距離地球數(shù)百萬(wàn)公里,在現(xiàn)有的技術(shù)下,單程旅行需要花費(fèi)6~9個(gè)月的時(shí)間。而且,由于地球和火星的軌道關(guān)系,安全地來回旅行每26個(gè)月才有一次機(jī)會(huì)。這使得向火星運(yùn)送物資和人員非常困難且成本高昂。

3.自給自足的挑戰(zhàn):在火星上維系一個(gè)人類殖民地將面臨諸多挑戰(zhàn),包括必須生產(chǎn)出所有必需的食品和物資,處理低重力導(dǎo)致的健康問題(例如肌肉和骨骼的喪失),以及解決大氣層缺乏導(dǎo)致的輻射問題。

因此,盡管火星是人類賴以生存的最可能的星球之一,但是目前而言,地球更適合人類居住。

1.8.2 自洽性

基于CoT方法,后續(xù)又有學(xué)者發(fā)布了研究成果:通過多數(shù)投票提高CoT性能,即自洽性(Self-consistency)方法。這種方法對(duì)CoT方法進(jìn)行了補(bǔ)充,它不是只生成一個(gè)CoT,而是生成多個(gè)CoT,然后取多數(shù)答案作為最終答案。

提示詞:

從資源獲取、氣候條件以及重力效應(yīng)這三個(gè)獨(dú)立的角度考慮,你認(rèn)為地球和火星哪一個(gè)更適合人類居住?請(qǐng)?jiān)敿?xì)解釋你從每個(gè)角度考慮的推理過程,并最終整合所有推理結(jié)果,輸出結(jié)論。

AI輸出:

1.資源獲取:地球擁有豐富的水資源,一直被視為生命的源泉。另外,地球還具備支持農(nóng)業(yè)生產(chǎn)的肥沃土壤、野生動(dòng)植物以及豐富的礦產(chǎn)資源。而火星的水資源主要以冰的形式存在,土壤資源也比較貧瘠,不能直接用于農(nóng)業(yè)生產(chǎn)。礦產(chǎn)資源方面,我們還無法確定火星的礦產(chǎn)資源種類和數(shù)量。

2.氣候條件:地球的氣候和溫度對(duì)大多數(shù)生物來說非常適宜。而火星冷,平均溫度在-80°F(-62°C)左右,盡管在赤道地區(qū)的夏天午間,溫度可以升至70°F(21°C)。然而,晚上的溫度可能降至-100°F(-73°C)。此外,火星的大氣主要由二氧化碳組成,對(duì)人類來說是致命的。

3.重力效應(yīng):地球的重力正好可以滿足人體迅速消除疲勞和細(xì)胞的正常生長(zhǎng)繁殖,而火星的重力只有地球的約38%,長(zhǎng)期生活在火星可能會(huì)影響肌肉和骨骼的發(fā)育。

4.結(jié)論:從上述三個(gè)角度來看,地球比火星更適合人類居住。我們對(duì)火星的生存條件了解還很有限,且目前火星上不利的資源狀況、惡劣的氣候條件及低重力環(huán)境都帶來了許多無法忽視的生存挑戰(zhàn)。在可預(yù)見的未來,地球依然是我們最好的居住選擇。

1.8.3 思維鏈的原理

在3個(gè)大語(yǔ)言模型上進(jìn)行的實(shí)驗(yàn)表明,CoT方法提高了一系列算術(shù)、常識(shí)和符號(hào)推理任務(wù)的成績(jī)。與一般提示法相比,CoT方法會(huì)在提示詞中提供中間的推理過程作為范例,如圖1-8所示。

圖1-8 CoT方法與一般提示法對(duì)比圖

下面這個(gè)例子采用直接提問的方式。

提示詞:

小萌說她送給媽媽2朵花,之后還剩下10朵;再送給爸爸3朵花,之后還剩下7朵。

她之前一共有多少朵花?

AI輸出:

小萌之前一共有15朵花。

在使用CoT提示方法后:

提示詞:

小萌說她送給媽媽2朵花,之后還剩下10朵;再送給爸爸3朵花,之后還剩下7朵。

她之前一共有多少朵花? 請(qǐng)一步一步思考和推理,并寫出你的思考過程,最后輸出答案。

AI輸出:

小萌給媽媽送了2朵花后還剩下10朵花。所以在給媽媽送花之前,她有(10+2=12)朵花。

她再給爸爸送去了3朵花,剩下7朵花。所以在給爸爸送花之前,也就是在給媽媽送花之后,她有(7+3=10)朵花。

通過以上的推理,我們可以確認(rèn)她在一開始的時(shí)候一共有12朵花,這個(gè)答案是符合題意的。

1.8.4 推理法的局限性

推理法包含多種推理方法,CoT是其中最為實(shí)用、最為知名的一種。大部分時(shí)候,讀者掌握該方法即可。推理法存在以下局限性:

應(yīng)用領(lǐng)域有限:目前主要應(yīng)用于數(shù)學(xué)問題和若干常識(shí)推理基準(zhǔn)。對(duì)于其他類型的任務(wù),如機(jī)器翻譯,其性能提升效果尚需進(jìn)一步評(píng)估。

計(jì)算成本:CoT需要大量計(jì)算資源,在較小的模型中可能存在問題。

準(zhǔn)確性問題:即使有了CoT,大語(yǔ)言模型在一些簡(jiǎn)單的數(shù)學(xué)問題上仍然可能出錯(cuò)。

需要將各種提示工程方法內(nèi)化為自己的理解。如CoT方法可以理解為分步法、分解法等,其核心思想是將任務(wù)分解為子目標(biāo)逐步完成。另外,還有ToT(思維樹)方法,可將其理解為投票法,即設(shè)定多角色分別給出結(jié)果,然后通過少數(shù)服從多數(shù)的投票原則確定最終使用結(jié)果。

主站蜘蛛池模板: 北京市| 吉木萨尔县| 五寨县| 渝中区| 板桥市| 馆陶县| 山丹县| 汉源县| 小金县| 沾益县| 丹巴县| 格尔木市| 阿克陶县| 闽清县| 西乌珠穆沁旗| 石门县| 灵丘县| 阿城市| 扬州市| 尤溪县| 汉川市| 南京市| 祁连县| 蒲城县| 福海县| 连山| 西充县| 安岳县| 麻阳| 长乐市| 巴东县| 阳春市| 玉林市| 荥阳市| 无极县| 黔江区| 德安县| 湘潭市| 阳新县| 中山市| 隆林|