生成式AI的核心價值
從前文的敘述中,我們對人工智能模型的兩個主要類型——生成式AI和決策式AI有了一定的了解,也明晰了它們各自的“特長”是什么。簡單來說就是,決策式AI擅長的是對新的場景進行分析、判斷和預測,主要應用在人臉識別、推薦系統、風控系統、精準營銷、機器人、自動駕駛等;生成式AI主要擅長自動生成全新內容,主流的內容形式它基本都能生成,包含文本、圖片、音頻和視頻等。二者在技術路徑、成熟程度、應用方向上都有諸多不同。而在下文中,我們將聚焦生成式AI,圍繞其核心價值來展開論述。
生成式AI聚焦于認知的邏輯層面
你或許想不到,決策式AI和生成式AI不但名稱不同,從認識論的角度看,二者聚焦的認知層面也不相同。何為認識論呢?認識論即為與知識來源和知識判斷相關的理論。如圖1-12,在認識論中,人們的認識過程被描摹為金字塔形的結構,人類的認知會逐漸進階,從數據、信息、知識、邏輯向形而上的哲學、信仰邁進,所認識內容的顆粒度和結構深度也會隨之不斷改變。

圖1-12 生成式AI和決策式AI聚焦于不同的認知層面
決策式AI聚焦“知識”層面,而生成式AI則聚焦高一級的“邏輯”層面,二者在內容認知程度上大不相同,但還未上升至認識論中的信仰和哲學層面。因此總體來說,決策式AI更多體現的是基于大量數據、信息形成的知識總結和判斷,生成式AI體現的則是基于知識、信息和數據在邏輯層面產生的創新成果。后者是更接近人類智慧的AI技術,其內容的創新強度也更勝一籌。
在實際應用中,決策式AI根據已有數據進行分析、判斷和預測,已經在推薦系統、風控系統和精準營銷等諸多領域為人類服務,而生成式AI作為在認識論模型中更高階的一種,并非只分析已有數據,而是歸納已有數據進行演繹創新,也正在內容創作、人機交互、產品設計等諸多方面為人類貢獻力量。
生成式AI的優勢
如果在與決策式AI相對照后,你還不太理解生成式AI的優勢,我們就用一個簡單的比喻來描述一下這兩者:決策式AI更像在做選擇題,分類是它的強項;生成式AI則擅長做簡答題,以創作為長處。
從更深層次來說,決策式AI其實是有隱患的。我們現在來考慮這樣一個場景:假設我們擁有一種分類效果很好的神經網絡模型,這種網絡有非常高的準確率,能游刃有余地處理常規的圖像分類任務。但是,我們把一個加了少許噪聲的圖像輸入模型后,這個模型居然發生了十分離譜的錯誤,而那張圖像的改變在人類眼中十分微不足道。如圖1-13,在一個測試中,技術人員給一張貓的圖片(模型認為圖像是貓的概率為90%,是馬的概率為5%)添加了一些噪聲,模型就離奇地將其分類成了馬(模型認為圖像是馬的概率為90%,是貓的概率為5%)。這個案例說明,基于條件分布的神經網絡模型貌似缺乏對圖片的語義性理解,我們也可以以此來推測,與之相似的只對條件分布進行建模的決策式AI模型很難理解語義上的信息,也不易做出正確穩定的決策。

圖1-13 噪聲干擾決策式AI的識別能力
對此我們可以設想一下,僅需少許簡單的改變,決策式系統就很有可能放棄它所做出的判斷和選擇,它們又怎么能取得我們的信任呢?若我們所使用的系統建立在如此不穩定的模型之上,其日常的運行就會充滿隱患,如嬰兒般的模型很容易走入歧途,給我們帶來意想不到的麻煩。比如,決策式模型遇到一個新樣本時的輸出不穩定,原本高價值的客戶被誤識別為低價值客戶,或者原本風險較高的客戶被誤識別為低風險客戶,這些問題在現實場景中發生是阻礙決策式AI在更多行業落地的重要因素。
我們從模型背后的原理出發,會更好理解一些。決策式模型的原理是這樣的:模型會從海量的貓和狗的圖片數據中,了解到貓的外觀和狗的外觀差別非常大,當面對新的樣本時,模型判斷樣本的外觀和誰更相似,就認為樣本是誰。
而生成式模型則是這樣:它從訓練集中了解到了貓的特質(如大小、毛色、身形等個性化特征),而后從關于狗的數據中也了解到了這些特征,當面對新樣本時,它就會先提煉其數據的特質,將之和貓、狗分別進行比較,兩方都得到一個概率,哪組數據的概率較大,它就認為樣本是誰。
與決策式AI相比,生成式AI顯然成熟得多,它可以學習人的思維邏輯,產出具備常理和特定規則的內容。其依托的生成式模型會關注結果是如何產生的,但生成式模型需要的是十分充足的數據量,這樣才能保證模型能采樣到數據本來的面目,所以生成式模型的速度相對來說會慢一些。與之相反,決策式模型對數據量的要求沒有那么高,速度會更快,在小數據量下的準確率也可能更高。
基于生成式AI背后的原理,它的功能如此強大也就不足為奇了。如最新的生成式模型GPT等,就可以生成一系列的內容,給予人類更多的方便和選擇,讓人類能享受從冗余工作中被解放的快感。從這個角度來說,生成式AI真是某些打工人的“福星”呢!
生成式AI的價值
生成式AI究竟有多么“萬能”,以至于令人咋舌呢?我們就在這里做一個全面的介紹,展示生成式AI的核心價值,看看它是如何用強大的專業功能覆蓋眾多工作領域的。
如果以粗放的標準來劃分人類的內容生產工作,大略可以分為藝術創造性工作、設計性工作和邏輯思維性工作,而生成式AI在這三類均有涉獵,可以憑借強大的內容生產水平讓人類產生“危機感”。
如在藝術創作領域,繪畫已然不再能難倒生成式AI了。2023年3月,我國誕生了首部AIGC生成的完整情節漫畫。藝術家王睿利用AIGC,以小說《元宇宙2086》為藍本,通過加噪點、去噪點、復原圖片、作畫這幾個步驟,將文字轉化成了可視化的內容,畫面線條流暢、色彩絢爛,給人以強烈的視覺沖擊,也在中國的科技藝術發展史上留下了濃墨重彩的一筆。AIGC創作的繪畫作品甚至都進入了拍賣領域。2022年12月,AI山水畫的首次拍賣落下帷幕,成交價為110萬元。該畫作是百度文心一格和畫家樂震文續畫的陸小曼未完成的畫稿《未完·待續》。大家都知道,中國的山水畫注重寫意,很難模仿到神韻,而文心一格將陸小曼存世的畫稿、書法作品等作為AI的訓練數據,大量的數據“投喂”使得AI的創作頗具陸小曼畫作的靈性,到了以假亂真的地步。
除繪畫外,歌曲創作領域也已經被AIGC“入侵”了,百度數字人度曉曉與龔俊數字人共同獻聲的《每分每秒每天》這首歌就是AI出品,從作詞到編曲均由AI把控。演唱者度曉曉也大有來頭,她是國內首個可交互的虛擬偶像,除了唱歌跳舞,主持也不在話下。
喜歡看視頻的朋友也離不開AI的幫助。谷歌研究院最近就發表了一篇論文,致力于將文本條件的視頻擴散模型(video diffusion model, VDM)應用于視頻編輯,這個視頻編輯框架可以創建動態相機運動、為圖像中的事物設置動畫等,未來大家也有機會利用這項技術制作自己的個性化電影。網飛發布的動畫短片《犬與少年》也與AIGC有關。這個短片由AIGC制作,而且創造了一個“第一”——全球首個AIGC動畫短片,人工智能小冰在這部動畫里就利用自己的技術繪制了完整的畫面和場景,讓人類創作者有時間回歸到更根本的創意性工作中去。
在設計性工作領域,AIGC更是大展拳腳,平面設計、3D設計、服裝設計、環境藝術設計等統統不在話下。有了AIGC在繪畫創作中的先例,我們就不難看出它在平面設計中也必然很出色。在Midjourney等AIGC繪圖軟件中,只需要標明是T恤設計、絲巾設計還是插畫設計、角色設計,就可以得到可投入使用的設計稿,獨幅圖案抑或是連續紋樣,它都能輕松搞定。
生成式AI還滲透到了3D領域,Magic3D就是GPU(圖形處理器)制造商英偉達推出的一款應用,它會先用低分辨率粗略地對事物進行3D建模,然后進階優化為更高分辨率。OpenAI的Dream Fields更是不需要照片就能生成3D模型,把“無中生有”玩得透徹,現在,生成船、花瓶、公共汽車、食物、家具等的模型都不在話下。利用AIGC生成3D模型的技術,未來,游戲、電影、虛擬現實等領域都不再需要工作人員手動進行3D建模了,方便、高效了許多。
你是不是也好奇AIGC是怎么在服裝領域應用的?3D衣物建模是其背后的一項核心技術,隨著技術的發展,甚至還能做到3D衣物重建和可控衣物編輯。國外的Project Muze是谷歌與Zalando電商合作,利用谷歌深度學習框架打造的AI服裝設計師。其所構建的神經網絡融合了超過600名時裝設計師的風格和多種設計元素,只需用戶輸入性別、喜好、情緒等信息,它就能設計出一套獨特的時裝。雖然在AI與服裝結合的道路上,我們還需要摸索進行高水準的設計,但在服裝設計的產業布局中,AIGC將是不可缺少的一環。
在你生活的城市中,AI說不定已經在進行市區的環境藝術設計工作了。谷歌發布過一款能幫助城市進行綠化工作的AI工具,人類能借助AI和航拍,繪制一張城市的“綠化地圖”,并據此來生成綠化建議,用以解決全球變暖造成的極端高溫天氣問題。這款AI工具既高效又科學,取代了傳統上昂貴的逐塊研究綠化的方式。試想一下,在未來所有的城市中,公園、道路……只要能見到植被的地方,可能都是由AI規劃并推動實施的,你會生活在一個由AI進行科學規劃后建設的綠色城市。生活在這里,你應該也會被隨處可見的植物治愈吧。
在家裝方面,“AI +家裝”產業也發展得如火如荼。AIGC工具可以幫助家裝設計師、從業者快速創作出設計圖及方案,促進家裝管理及服務智能化和精準化,推動“AI +家裝”產業數字化應用升級;另外,引入、應用先進的智能對話技術,搭建人工智能客服服務體系,協助家裝商家和用戶更為及時和全面地追蹤服務進度,能進一步幫助平臺打造更加開放的家裝內容和服務生態,提升家裝體驗。國內的一家科技企業群核科技成立了AIGC實驗室,旨在拓展全空間領域AIGC,進行家居家裝、商業空間、地產建筑等空間領域的AI設計生成和迭代創作。說不定以后為我們進行家居裝修的都是AI設計師。
說了這么多,你可能會認為,AIGC無非就是被“喂”了足夠多的人類創作的內容,模仿大于創造。其實AIGC并不是“copy怪”,它還能從事非常需要邏輯思維的工作,像寫代碼這種專業工作它也能做。ChatGPT可以幫人寫代碼想必大家都已經知道了,但可以做到什么程度,大家可能并不太了解。現實中可能已經有讀者用它解決過不少代碼難題。除了知名度頗高的ChatGPT,aiXcoder公司推出的aiXcoder XL也是AIGC的代表,在2023年2月首次開放了代碼生成模型的API(應用程序編程接口),讓更多使用者能夠利用人工智能提升軟件開發的質量和代碼撰寫的效率,極大地提升應用程序的推進速度。從寫代碼這點來說,AIGC通過分析大量開源項目的代碼,學習語言特征,動態生成新的代碼,能夠對不同類型的任務更加靈活、快速地進行開發。
除了上文提到的眾多領域,人工智能還進軍醫藥領域。對此,“生物版ChatGPT”有話說。“生物版ChatGPT”的任務是生成蛋白質。在產業落地應用的場景中,許多從業者最關心的問題之一就是大分子藥物,尤其是抗體等蛋白質類藥物能不能使用AI“一鍵生成”。藥企晶泰科技是AI藥物研發的先行者,其自主研發了大分子藥物設計平臺XuperNovo,這個平臺包括許多大分子藥物從頭設計的策略,其中有一款策略被稱作“ProteinGPT”。如此命名的原因是ProteinGPT的技術路線與ChatGPT相似,ProteinGPT可以一鍵生成符合要求的蛋白質類藥物設計。目前,ProteinGPT已經被正式應用于晶泰科技的各類大分子藥物項目中,表現得非常好。
繪畫、影視、環境藝術、家裝、代碼、醫藥……似乎只有我們想不到,沒有AIGC做不到的,相信未來AIGC將會在更多領域得以應用,給我們帶來意想不到的應用效果。
說了這么多,我們對生成式AI獨特的價值和優勢應該都有了不少認知。其實,生成式AI和決策式AI還能兩相結合、強強聯手,多層次、多維度地解決人類更多的煩惱,將我們從機械式的生硬工作中解放出來,提升內容生產的效率,當然前提是內容質量要過硬。為此,也需要技術人員對人工智能進行更多的研究、開發和測試,文明社會未來主要的突破口和增長點或許就系于AIGC之手。