- 趣讀數(shù)字經(jīng)濟(jì)
- 李曉雨 馮麗偉 沈根海
- 3888字
- 2024-12-31 19:48:48
1.3 算力、算法與數(shù)據(jù):人工智能的核心
決定人工智能“智商”的核心因素有三個(gè):算力規(guī)模、算法模型的精巧度、數(shù)據(jù)的質(zhì)量和數(shù)量。
至于三者的關(guān)系,打個(gè)比方,用燃?xì)庠畛床耍懔κ侨細(xì)猓惴ㄊ菑N藝,數(shù)據(jù)就是食材,做出的菜品就是深藍(lán)、阿爾法狗、ChatGPT等人工智能產(chǎn)品。想做出好菜,三者缺一不可。
1.算力——人工智能的基礎(chǔ)
算力,是人工智能的基礎(chǔ),也是數(shù)據(jù)與算法的基礎(chǔ)支撐,更是推動(dòng)人工智能邁向規(guī)模化、多元化與創(chuàng)新化的決定性力量。
算力,靠的是芯片。GPT-1只需要在8枚GPU上訓(xùn)練一個(gè)月,而GPT-2需要在256枚Google Cloud TPU v3上訓(xùn)練(費(fèi)用為256美元/小時(shí)),訓(xùn)練時(shí)長(zhǎng)未知。到GPT-3,算力費(fèi)用已經(jīng)是千萬(wàn)美元級(jí)別。ChatGPT光從模型訓(xùn)練算力來(lái)看,至少需要上萬(wàn)枚英偉達(dá)GPU A100,單次模型訓(xùn)練成本超過(guò)1 200萬(wàn)美元(約合8 000萬(wàn)元)。
ChatGPT之所以能對(duì)答如流,靠的是一秒內(nèi)處理數(shù)十億個(gè)單詞的算力,更是上萬(wàn)枚英偉達(dá)GPU A100和H100提供的強(qiáng)大算力支持。
在國(guó)內(nèi),云計(jì)算技術(shù)專(zhuān)家公認(rèn)的說(shuō)法是,1萬(wàn)枚英偉達(dá)GPU A100芯片是做好AI大模型的算力門(mén)檻。
然而,由于美國(guó)限制高性能GPU供應(yīng),目前國(guó)內(nèi)云廠商擁有超過(guò)1萬(wàn)枚GPU(以英偉達(dá)中低性能產(chǎn)品為主,如A10)的企業(yè)不超過(guò)5家,其中擁有1萬(wàn)枚英偉達(dá)GPU A100芯片的企業(yè)最多只有1家。
目前,AI大模型的推理、訓(xùn)練高度依賴(lài)英偉達(dá)的GPU芯片。缺少芯片會(huì)導(dǎo)致算力不足,算力不足意味著無(wú)法處理龐大的模型和數(shù)據(jù)量,會(huì)極大地降低AI推理和模型訓(xùn)練的準(zhǔn)確度。
2.算法——人工智能的靈魂
算法是人工智能的靈魂,是人工智能的邏輯規(guī)則大腦。這些年來(lái)人工智能的飛速發(fā)展,正是因?yàn)樯疃葘W(xué)習(xí)算法的出現(xiàn)。
ChatGPT本質(zhì)上是一個(gè)由浮點(diǎn)數(shù)參數(shù)表示的深度神經(jīng)網(wǎng)絡(luò)大模型,屬于深度學(xué)習(xí)的框架,并在算法上有所突破,能很好地容納和分析大數(shù)據(jù)。個(gè)別國(guó)產(chǎn)大語(yǔ)言模型容易出現(xiàn)過(guò)載等問(wèn)題,就是因?yàn)樗惴ㄌ幚聿涣烁蟮臄?shù)據(jù)量。
GPT-1和GPT-2開(kāi)源,GPT-3沒(méi)有可靠的開(kāi)源軟件。目前,有的國(guó)產(chǎn)大語(yǔ)言模型實(shí)際是用開(kāi)源軟件加上中文語(yǔ)料處理的,所以中文效果并不理想。
我國(guó)人工智能產(chǎn)業(yè)發(fā)展過(guò)度依賴(lài)開(kāi)源代碼,真正屬于中國(guó)原創(chuàng)的代碼并不多。
開(kāi)源代碼可以拿來(lái)用,但專(zhuān)業(yè)性、針對(duì)性不夠,不能滿(mǎn)足具體任務(wù)的實(shí)際要求。在獲得同樣數(shù)據(jù)的情況下,以開(kāi)源代碼運(yùn)行,AI深度學(xué)習(xí)之后或許能輸出結(jié)果,但由于訓(xùn)練框架固定、算法限制,在實(shí)際應(yīng)用中很難達(dá)到預(yù)期效果,而且難以修改、完善、優(yōu)化算法。尤其面對(duì)專(zhuān)業(yè)性強(qiáng)的研究任務(wù),一旦被“卡脖子”,將非常被動(dòng)。
打個(gè)比方,賽跑時(shí),如果運(yùn)動(dòng)員的運(yùn)動(dòng)鞋量身定制,貼合腳型,輔助發(fā)力,則更容易取得好成績(jī)。
同理,用開(kāi)源代碼“調(diào)教”出的AI,其效果不會(huì)太驚艷。僅僅依靠開(kāi)源代碼和算法,無(wú)法支撐中國(guó)的人工智能產(chǎn)業(yè)發(fā)展。
只有掌握核心代碼,才能在未來(lái)的AI“智力大比拼”中擁有勝算,這就需要有以數(shù)學(xué)為基礎(chǔ)的原始核心模型、代碼和框架創(chuàng)新。
如果從底層算法做起,整個(gè)數(shù)學(xué)模型、算法設(shè)計(jì)、模擬訓(xùn)練就能一脈相承,不僅可以協(xié)同優(yōu)化,而且可以根據(jù)需求隨時(shí)修改,從而真正解決實(shí)際問(wèn)題。這需要數(shù)學(xué)家的參與,需要有一批人才能沉下心來(lái)做自己的底層框架和核心算法。相應(yīng)地,我們的教育也要更加重視數(shù)學(xué)和編程人才的培養(yǎng)。
3.?dāng)?shù)據(jù)——人工智能的食糧
數(shù)據(jù)是人工智能的食糧。現(xiàn)在,深度學(xué)習(xí)是人工智能發(fā)展的主流方向,非常依賴(lài)大數(shù)據(jù)。
數(shù)據(jù)作為AI學(xué)習(xí)的基礎(chǔ)資源,數(shù)據(jù)質(zhì)量和訓(xùn)練數(shù)據(jù)量對(duì)AI性能至關(guān)重要,不亞于模型大小。比如,Deepmind的Chinchilla語(yǔ)言模型只有700億個(gè)參數(shù),但經(jīng)過(guò)更廣泛的數(shù)據(jù)訓(xùn)練,可以勝過(guò)有1750億個(gè)參數(shù)的GPT-3。
GPT-1用了約5GB的文本數(shù)據(jù),GPT-2用了40GB,GPT-3猛增到45TB。而對(duì)于GPT-4,OpenAI沒(méi)有透露具體參數(shù)數(shù)量和使用的訓(xùn)練數(shù)據(jù),將“競(jìng)爭(zhēng)環(huán)境”列為保密的原因。
ChatGPT的用戶(hù)普遍反饋用英文提問(wèn)得到的回答更加精準(zhǔn),而用中文提問(wèn)則答案的錯(cuò)誤率較高,根本原因就在于其語(yǔ)料庫(kù)里中文只有5%,且數(shù)據(jù)質(zhì)量較差。高質(zhì)量的數(shù)據(jù)能夠?yàn)楹玫膮?shù)打好地基,否則就像用沙子做地基,不可能蓋出高樓。
看起來(lái),既然中文語(yǔ)料庫(kù)是ChatGPT難以逾越的壁壘,那么這正是中國(guó)版ChatGPT崛起的大好機(jī)會(huì)。然而尷尬的是,復(fù)旦大學(xué)發(fā)布的國(guó)內(nèi)第一個(gè)對(duì)話(huà)式大型語(yǔ)言模型MOSS,回答英文問(wèn)題的水平也同樣高于中文問(wèn)題。對(duì)此,復(fù)旦大學(xué)邱錫鵬教授解釋稱(chēng),英文作為科研主流語(yǔ)言,在學(xué)術(shù)界和工業(yè)界得到廣泛應(yīng)用,積累了大量高質(zhì)量的語(yǔ)料數(shù)據(jù),這為英文自然語(yǔ)言處理的研究提供了極大的優(yōu)勢(shì)。根據(jù)相關(guān)數(shù)據(jù),MOSS學(xué)習(xí)的英文單詞數(shù)量是中文的十倍。
的確,英文作為科研主流語(yǔ)言,全球范圍內(nèi)大量的學(xué)術(shù)期刊、網(wǎng)頁(yè)、書(shū)籍等,都可以成為ChatGPT的訓(xùn)練數(shù)據(jù)來(lái)源。比如《自然》《柳葉刀》等,這類(lèi)專(zhuān)業(yè)學(xué)術(shù)期刊能提供大量?jī)?yōu)質(zhì)數(shù)據(jù),幫助ChatGPT的寫(xiě)作更清晰、更有條理。除此之外,英文網(wǎng)站占全球網(wǎng)站總量近60%,而中文網(wǎng)站目前仍不足2%。
這是我國(guó)發(fā)展自然語(yǔ)言處理技術(shù)的過(guò)程中不得不重視的問(wèn)題。因此,語(yǔ)料庫(kù)的構(gòu)建不能只局限于簡(jiǎn)體中文語(yǔ)料庫(kù),要能理解多種語(yǔ)言,才能構(gòu)建一流的中文語(yǔ)料庫(kù)。單純靠人海戰(zhàn)術(shù)和低人力成本建一個(gè)簡(jiǎn)體中文語(yǔ)料庫(kù),并不能解決這一問(wèn)題。
在ChatGPT發(fā)布之前,很多人認(rèn)為我國(guó)的人工智能技術(shù)水平不僅穩(wěn)居世界第二,還與美國(guó)共處世界第一梯隊(duì),已經(jīng)十分接近美國(guó)。但ChatGPT推出之后,我們發(fā)現(xiàn),我國(guó)仍有很長(zhǎng)一段路要追趕。
人工智能技術(shù)正在從以編程/軟件為中心的1.0階段,快速進(jìn)入以數(shù)據(jù)為中心的2.0階段。ChatGPT等人工智能大模型的出現(xiàn),正在推動(dòng)AI技術(shù)的通用化和泛化,AI開(kāi)始脫“虛”向“實(shí)”,越來(lái)越多地參與控制、管理和優(yōu)化物理世界的運(yùn)行,成為引領(lǐng)新一輪科技革命和產(chǎn)業(yè)變革的戰(zhàn)略性技術(shù)。在這場(chǎng)科技革命里,中國(guó)不但不能落下,更要努力成為領(lǐng)跑者。
即使強(qiáng)如GPT-4,仍屬于弱人工智能,中國(guó)還有時(shí)間和機(jī)會(huì)。
4.弱人工智能、強(qiáng)人工智能和超人工智能
人工智能根據(jù)能力可劃分為三個(gè)層級(jí):弱人工智能、強(qiáng)人工智能、超人工智能。
弱人工智能專(zhuān)注于且只能解決特定領(lǐng)域問(wèn)題。
比如阿爾法狗能在圍棋方面戰(zhàn)勝李世石,但你讓它炒兩個(gè)菜試試。
弱人工智能本質(zhì)上還是“數(shù)數(shù)”,只是數(shù)得比較快。現(xiàn)在主要的算法基本離不開(kāi)窮舉法和概率統(tǒng)計(jì),多是數(shù)據(jù)映射、數(shù)據(jù)擬合、概率統(tǒng)計(jì)等數(shù)學(xué)運(yùn)算。
雖然GPT-4在某些方面表現(xiàn)得很神奇,但思維方式仍然局限于模式匹配和統(tǒng)計(jì)推理,并不能像人類(lèi)一樣,通過(guò)思考和邏輯推理去解決問(wèn)題,距離強(qiáng)人工智能還有較遠(yuǎn)距離。
強(qiáng)人工智能,又稱(chēng)通用人工智能或完全人工智能,指的是可以勝任人類(lèi)所有工作的人工智能,即真正能思考和解決問(wèn)題的人工智能。
簡(jiǎn)單來(lái)說(shuō),就是人可以做什么,強(qiáng)人工智能就可以做什么。一般認(rèn)為它有自我意識(shí),有和生物一樣的各種本能,比如生存和安全需求;可以獨(dú)立思考問(wèn)題,有自己的價(jià)值觀和世界觀,在某種意義上可以看作新物種。
這種定義過(guò)于寬泛,缺乏一個(gè)量化的標(biāo)準(zhǔn)。一般認(rèn)為,可以稱(chēng)得上強(qiáng)人工智能,起碼需要具備以下能力。
(1)基于一定抽象能力的學(xué)習(xí)能力。目前的深度學(xué)習(xí)技術(shù)需要大量的訓(xùn)練數(shù)據(jù),而人類(lèi)學(xué)習(xí)卻不需要。比如,教小孩子認(rèn)貓,只要看兩三只貍花貓就夠了,當(dāng)他再看到外觀差異較大的奶牛貓、暹羅貓,甚至無(wú)毛的巴比諾貓等,也能輕松認(rèn)出是貓而不是狗。但換作AI,起碼需要經(jīng)過(guò)上萬(wàn)張圖片的訓(xùn)練,才可能具備類(lèi)似能力。兩者的區(qū)別在于抽象能力,對(duì)AI而言,需要實(shí)現(xiàn)少樣本、無(wú)監(jiān)督的學(xué)習(xí),但目前的進(jìn)展還很有限。
(2)足夠的知識(shí)廣度,包括常識(shí)性知識(shí)和跨領(lǐng)域知識(shí)的應(yīng)用能力。很多常識(shí),即便是兩歲兒童也能理解和預(yù)測(cè),比如丟出的物體會(huì)下落、兩點(diǎn)之間直線最短等直觀的物理過(guò)程,但AI需要學(xué)習(xí)相應(yīng)的物理學(xué)知識(shí)才能掌握。常識(shí),不僅包括人類(lèi)所認(rèn)知的萬(wàn)事萬(wàn)物,更包括這些事物相互作用的準(zhǔn)則和因果關(guān)系,以及行為模式和價(jià)值判斷。
常識(shí)有多重要?以自動(dòng)駕駛為例,AI要靠學(xué)習(xí)已知路況積累經(jīng)驗(yàn),但當(dāng)遇到學(xué)習(xí)資料里沒(méi)有的危險(xiǎn)時(shí),能不能像人一樣正確處理?這就需要通過(guò)某種方法讓AI掌握一些類(lèi)似常識(shí)的知識(shí),讓其在危險(xiǎn)來(lái)臨時(shí)首先確保駕車(chē)人與行人的安全,路況過(guò)于極端時(shí)安全減速并靠邊停車(chē)等。
目前,AI被訓(xùn)練得精通某一特定領(lǐng)域,但缺乏生活常識(shí)的輸入,故表現(xiàn)得與人類(lèi)差異較大。同時(shí),跨學(xué)科知識(shí)的交融越來(lái)越重要,缺乏另一領(lǐng)域的知識(shí)也會(huì)導(dǎo)致AI表現(xiàn)較差。
(3)面對(duì)復(fù)雜的不確定因素,進(jìn)行推理、規(guī)劃、決策、解決問(wèn)題的能力。人類(lèi)具有聯(lián)想、類(lèi)比能力,能實(shí)現(xiàn)跨領(lǐng)域的推理,比如神探福爾摩斯可以根據(jù)嫌疑人的一頂帽子中遺留的發(fā)屑、沾染的灰塵,推理出嫌疑人的生活習(xí)慣,甚至家庭、婚姻狀況,并制訂下一步的計(jì)劃,但現(xiàn)在的AI顯然辦不到。
(4)從感知智能到認(rèn)知智能,靈活使用自然語(yǔ)言進(jìn)行交流的能力。感知智能模擬人類(lèi)的“視聽(tīng)”,認(rèn)知智能在感知的基礎(chǔ)上形成“自我的認(rèn)知”,當(dāng)前正處于從感知智能向認(rèn)知智能階段發(fā)展的“感知增強(qiáng)智能”過(guò)渡期。現(xiàn)在的AI,看似能與人自然對(duì)話(huà),實(shí)際不能真正理解語(yǔ)義。強(qiáng)人工智能起碼要實(shí)現(xiàn)認(rèn)知智能,能理解用戶(hù)實(shí)際意圖,比如能聽(tīng)懂“你等著”之類(lèi)的弦外之音。
(5)整合上述能力,實(shí)現(xiàn)既定目標(biāo)的能力。我們大概可以想象一個(gè)滿(mǎn)足上述能力要求的人工智能會(huì)表現(xiàn)出怎樣的行為特征,而這樣一個(gè)強(qiáng)人工智能或通用人工智能,基本上能完成所有人類(lèi)工作。
一般認(rèn)為,強(qiáng)人工智能和弱人工智能的工作原理是完全不同的,很可能基于量子計(jì)算機(jī)和量子網(wǎng)絡(luò),而不是現(xiàn)在的計(jì)算機(jī)的代碼格式,比如不再用帶正負(fù)電荷的電子分別表示0和1來(lái)編程。
當(dāng)然,也有一些研究者認(rèn)為,強(qiáng)人工智能只需要具備勝任人類(lèi)所有工作的能力就可以了,未必需要人類(lèi)的意識(shí)。總之,一旦牽涉“意識(shí)”,強(qiáng)人工智能的定義和評(píng)估標(biāo)準(zhǔn)等就會(huì)變得異常復(fù)雜,而人們對(duì)于強(qiáng)人工智能的擔(dān)憂(yōu)也主要來(lái)源于此。
超人工智能,即超級(jí)的強(qiáng)人工智能,各方面都比人類(lèi)強(qiáng)大得多,基本上可以理解為全知全能的上帝。
超人工智能的定義最為模糊,因?yàn)闆](méi)人知道超越人類(lèi)最高水平的智慧是怎樣的一種存在,到底會(huì)表現(xiàn)出何種能力。超人工智能更多存在于科幻場(chǎng)景下,比如斯嘉麗主演的《超體》。
- 臥底經(jīng)濟(jì)學(xué)3:非理性世界的理性經(jīng)濟(jì)學(xué)
- 高成長(zhǎng)思維
- 有原則績(jī)效之路:GRC理論與實(shí)踐初探
- 勞阿毛并購(gòu)新說(shuō)
- 牛奶可樂(lè)經(jīng)濟(jì)學(xué)3
- 賦能:新創(chuàng)企業(yè)的成長(zhǎng)課
- 供應(yīng)鏈管理精益實(shí)戰(zhàn)手冊(cè)(圖解版)
- 戰(zhàn)略與路徑:黃奇帆的十二堂經(jīng)濟(jì)課
- 簡(jiǎn)單學(xué)之資本密碼
- 未來(lái)技術(shù):顛覆性行業(yè)的戰(zhàn)略機(jī)遇期
- 人民幣匯率變動(dòng)對(duì)我國(guó)產(chǎn)業(yè)升級(jí)的影響研究
- 財(cái)富腦:通過(guò)歷史學(xué)賺錢(qián)
- 金融支持碳達(dá)峰、碳中和
- 助推(終極版)
- 財(cái)富、貧窮與政治