- Prompt魔法:提示詞工程與ChatGPT行業應用
- 丁博生 張似衡等
- 1464字
- 2024-04-25 18:35:00
1.1 AIGC與AGI:從電到電網的跨越
1.1.1 第四次工業革命
下面回顧一下人類歷史上的幾次工業革命:
? 第一次工業革命以蒸汽機的使用為標志,人類進入蒸汽時代。
? 第二次工業革命以電力的使用為標志,人類進入電氣時代。
? 第三次工業革命則以原子能、電子計算機與互聯網的使用為標志,人類進入生產力空前發展的時代。
長期以來,人工智能被寄予掀起第四次工業革命的厚望。一方面,人工智能系統在各個領域(棋類游戲、電子競技等)不斷挑戰人類的紀錄;另一方面,人工智能系統在落地的時候往往因缺乏常識、容易犯錯等而被稱為“人工智障”。在人工智能的發展史上,高潮和低谷總是相伴而行。
在這種起伏的過程中,科學家們不斷重提通用人工智能(AGI)的概念。他們滿懷希望地向社會描繪這一人工智能系統發展的長期目標,認為技術的“奇點”將最晚在2050年來臨。到那時,智能系統會在以下能力上達到人類的水平:
? 自動推理。智能系統需要在不確定性的環境中做出決策,包括對掃描字符的識別、對音頻文字的識別等。
? 知識表示。智能系統需要有表示知識的方式,包括常識知識庫、領域知識庫等。常見的表示方法包括邏輯判斷語句、知識圖譜等。
? 自動規劃。智能系統需要對環境建立模型,并且知道各種操作的關系和后果,從而根據結果進行行動規劃。
? 自主學習、創新。智能系統需要自我學習,盡可能減少對人工“教師”的依賴,更多地從環境觀察中提煉知識。
? 使用自然語言進行溝通。智能系統需要理解人類語言,并使用人類語言表達自己,進行雙向溝通。
? 集成以上手段來實現一個復雜目標的能力,比如自動駕駛等。
近十年來,圖形處理器(Graphics Processing Unit, GPU)的發展為深度學習解決了算力障礙,大數據為深度學習解決了訓練數據問題,使得深度學習技術在人臉識別、自動駕駛、語音助手等產品中得到廣泛的應用。然而,這些產品在安全性、常識性等方面也常犯“低級”錯誤,表現出來的性能與人類相比可以說是相去甚遠。因此,從科學界到工業界,仍然有部分科學家對這種人工智能系統的主流實現方法持保留態度,他們質疑這種堆疊神經元的“暴力美學”能否真的模擬人類的能力。
但是,這種質疑在2022年到2023年年初的時間里幾乎銷聲匿跡了。2022年11月,OpenAI發布了對話大語言模型ChatGPT。GPT是生成式預訓練模型的簡稱,自2018年發布第1版之后,4年間經過了4輪主要的迭代,最后一個版本GPT-3.5的參數量達到了1750億。基于這一版本,OpenAI開發了多個微調后的分支,ChatGPT分支是專門用于對話的,它的多輪對話記憶能力、邏輯推理能力、意圖理解能力和表達能力達到了前所未有的高度。以ChatGPT為代表,AIGC掀起了一個又一個令人振奮的高潮。GPT迭代的主要版本和時間線如表1-1所示。
表1-1 GPT迭代的主要版本和時間線

2023年3月18日,美國公司Midjourney宣布了第5版商業AI圖像生成服務。與上一版本相比,第5版服務解決了AI生成圖像細節不清晰等問題,可以生成適合電影畫面比例的圖像。有平面設計師評價道:“此前版本就像是近視患者沒有戴上眼鏡,而第5版就是戴上眼鏡的清晰效果。”
2023年3月14日,OpenAI發布GPT-4。雖然GPT-3.5珠玉在前,但GPT-4仍然在短短幾個月的時間里做到了百尺竿頭更進一步。它不僅具備了多模態的能力,也修正了更多的常識缺失和邏輯謬誤,并在司法、醫生、哲學等專業考試中達到了人類考生前10%~20%的成績(相比之下,GPT-3.5在人類考生中排名80%左右)。3月24日,OpenAI宣布GPT-4推出插件功能,賦予ChatGPT使用工具、聯網、運行計算的能力,這意味著ChatGPT具備了作為平臺的功能,AI技術迎來了“iPhone/Android時刻”。
2023年3月22日,Runway發布了Gen-2軟件,該軟件在第一代基于原視頻進行自動改編的基礎上,新增了對使用文本描述創建全新視頻內容的支持。隨著AI視頻生成補齊了AI創作的最后一塊拼圖,下游應用進入了加速階段。