縱觀AI產業版圖
如果要選出2023年最熱的幾個話題,ChatGPT一定榜上有名。2023年初,ChatGPT席卷全球并成為流量熱點,人們都在前赴后繼地挖掘ChatGPT的各種潛能,探討其未來發展趨勢,甚至是與人類的關系。作為“人工智能家族”的大熱應用,以ChatGPT為首的各大人工智能應用開始被越來越多的人關注,也引發了人們的更多思考。
人工智能技術被稱為當代三大尖端技術之一,近年來在人們生活中的“存在感”也越來越強,這都是產業飛速發展的結果。想要清晰地了解以ChatGPT為代表的新興智能技術,完整地認識人工智能,我們可以先從其產業版圖的發展和現狀入手。
其實,人工智能的發展、傳播和被接受是經過了一段漫長的寒冬的。十多年前,它還只是一個不被人看好的小眾領域,但是現在,它卻已經成了街頭巷尾的熱點談資,幾乎任何事情都可以和人工智能聯系在一起。短短十多年間,世界發生了天翻地覆的變化,新數據不斷涌現,各種問題層出不窮,直到現在,人工智能的春天才算是真的到來了,各個領域都急需人工智能的幫助。這也是為什么人工智能的行業應用范圍如此廣闊,人工智能市場更是如一塊一望無際的遼闊土地,有待進一步開發。如圖1-1,這是一份人工智能的行業應用版圖,不同的行業領域(零售、金融、醫療和教育等)與不同的職能方向(營銷、風控和安全等)共同構成了一個人工智能應用矩陣,對于每個行業中的相關職能,人工智能都可以找到應用場景,例如在零售行業的供應鏈、營銷、客服等方面以及金融行業的研發、營銷、客服、風控等方面都已經有人工智能落地實踐(圖中藍色表示)。但是,現在的人工智能只填充了廣闊的行業領域中的一部分,還有更多沒嘗試和拓展的行業以及職能中的應用場景。

圖1-1 人工智能的行業應用版圖
從產業的視角來看,人工智能包括基礎層、技術層和應用層。其中,基礎層是人工智能產業的基礎,為人工智能提供數據及算力支撐;技術層是人工智能產業的核心,主要包括各類模型和算法的研發和升級;應用層則是人工智能面向特定場景需求而形成的軟硬件產品或解決方案。那么,人工智能的產業規模發展至何種程度了呢?英國德勤(Deloitte)的報告中預測,世界的人工智能產業規模會從2017年的6900億美元增長至2025年的64 000億美元,2017—2025年的復合增長率將達到32.10%,整體呈現出飛速攀升的趨勢。另外,人工智能近幾年成了各個行業在進行投資的熱門選擇。人工智能完全稱得上是風頭正勁,受萬人追捧,為經濟帶來了十分顯著的增量。
在產業應用上,人工智能發展到今天,我們能看到其在各個行業都有用武之地:制造業、零售業、金融業、醫療衛生行業……它在一定程度上改變了組織的運轉方式,使其可以更快更好地解決遇到的問題,并壓低各類成本。站在消費者的角度,人工智能的出現也為廣大的用戶群體帶來了更多的選擇。總的來說,人工智能可以看作一塊已開始被打磨的原石,露出了它璀璨的一角,它在推動世界經濟發展的同時,也將深層次地改變人類的生活。為了進一步了解AI產業版圖,下面我們從兩種不同的AI——決策式AI和生成式AI談起。
決策式AI和生成式AI
人工智能可從不同的維度進行劃分。如果按其模型來劃分(人工智能是由模型支撐的)可以分為決策式AI和生成式AI。
決策式AI(也被稱作判別式AI)學習數據中的條件概率分布,即一個樣本歸屬于特定類別的概率,再對新的場景進行判斷、分析和預測。決策式AI有幾個主要的應用領域:人臉識別、推薦系統、風控系統、其他智能決策系統、機器人、自動駕駛。例如在人臉識別領域,決策式AI對實時獲取的人臉圖像進行特征信息提取,再與人臉庫中的特征數據匹配,從而實現人臉識別。再例如,決策式AI可以通過學習電商平臺上海量用戶的消費行為數據,制訂最合適的推薦方案,盡可能提升平臺交易量。
生成式AI則學習數據中的聯合概率分布,即數據中多個變量組成的向量的概率分布,對已有的數據進行總結歸納,并在此基礎上使用深度學習技術等,創作模仿式、縫合式的內容,相當于自動生成全新的內容。生成式AI可生成的內容形式十分多樣,包括文本、圖片、音頻和視頻等。例如,我們輸入一段小說情節的簡單描述,生成式AI便可以幫我們生成一篇完整的小說內容;再例如,生成式AI可以生成人物照片,而照片中的人物在現實世界中是完全不存在的。如圖1-2,它展示的是國外一個網站生成的“不存在的人”的照片。
總的來說,不管是哪種類型的模型,它的基礎邏輯是一致的:AI模型從本質上來說是一個函數,要想找到函數準確的表達式,只靠邏輯是難以推導的,這個函數其實是被訓練出來的。我們通過喂給機器已有的數據,讓機器從數據中尋找最符合數據規律的函數。所以當有新的數據需要進行預測或生成時,機器就能夠通過這個函數,預測或生成新數據所對應的結果。

圖1-2 “不存在”的人
圖片來源:https://generated.photos/faces
決策式AI和生成式AI作為AI模型的兩個主要分支,顧名思義,在諸多方面都有相異之處。
從宏觀角度來看,決策式AI是一種用于決策的技術,它利用機器學習、深度學習和計算機視覺等技術來處理專業領域的問題,并幫助企業和組織優化決策。而生成式AI則是一種用于自動生成新內容的AI技術,它可以使用語言模型、圖像模型和深度學習等技術,自動生成新的文本、圖片、音頻和視頻內容。因此,決策式AI可以說是在對人類的決策過程進行模仿,但生成式AI就聚焦在創作新內容上。
而從微觀上看,這兩類技術的區別就更加明晰了,我們就從技術路徑、成熟程度、應用方向這三個角度來挖掘其深層次的不同(表1-1)。
表1-1 決策式AI和生成式AI的對比

從技術路徑來看,決策式AI的主要工作是對已有數據“打標簽”,對不同類別的數據做區別,最簡單的例子如區分貓和狗、草莓和蘋果等,干的主要是“判斷是不是”和“區分是這個還是那個”的活兒。生成式AI就不一樣了,它會在歸納分析已有的數據后,再“創作”出新的內容,如在看了很多狗的圖片后,生成式AI再創作出一只新的狗的圖片,實現“舉一反三”。
從成熟程度看,決策式AI的應用更為成熟,已然在互聯網、零售、金融、制造等行業展開應用,極大地提升了企業的工作效率。而生成式AI的“年歲更小”,2014年至今發展迅猛,堪稱指數級的爆發,已在文本和圖片生成等應用內落地。
從應用方向來看,決策式AI在人臉識別、推薦系統、風控系統、機器人、自動駕駛中都已經有成熟的應用,非常貼合日常生活。生成式AI則在內容創作、人機交互、產品設計等領域展現出巨大潛力。
我們來舉一些生活中的例子,以更深入地了解兩者在日常生活中的應用。喜歡購物的讀者都知道,你在購買某一類產品后,購物平臺會自動給你呈現諸多同類或相關商品。這件事的背后就是,電商平臺會根據用戶常看的商品,剖析用戶和商品的關聯,從而有針對性地為用戶推薦內容,而這項功能就應用了決策式AI技術。從2003年開始,亞馬遜就將此技術應用到了電商領域,推薦的商品精準地匹配用戶需求,可以極大地降低用戶的搜索次數,并因此增加產品的銷售額。由此你可能會發現,平臺似乎比你更清楚你需要什么,自然而然,自己的消費額也跟著上去了。平臺也憑借這個功能,讓更多用戶心甘情愿地掏了腰包,來獲取更廣闊的商業價值。
根據行業數據統計,在亞馬遜的收入中約有40%來自個性化推薦系統,而推薦系統每年能給網飛(Netflix)帶來10億美元以上的產值。除了電商平臺,新聞、音樂、視頻等平臺,也會利用個性化推薦系統為用戶推薦內容,在剖析用戶的長期興趣和短期興趣后,將精細化內容推送給用戶,并可以通過對用戶的停留、觀看時間、點贊、收藏等行為特征的實時分析,精準刻畫出用戶畫像,減少人工運營的介入,顯著提升用戶黏性,這已將人工智能的價值凸顯無遺。在自動駕駛領域,AI可進行智能分析、識別路況,滲透率穩步提升。自動駕駛汽車可以借助決策式AI技術,分析判別各種路況,對多種物體進行識別與跟蹤,提升行車安全。無須人工干預的自動駕駛汽車雖然現在并不成熟,但隨著技術的迭代升級,有望獲得更大的市場潛力。
對于生成式AI,ChatGPT的出現讓我們對其有了沖擊式的關注和理解。因生成式AI功能強大、應用范圍廣泛,文字、圖片、音視頻內容相關的從業者在面對“強大助手”上線時,也會感覺到焦慮,恐被其取代。從可能性來講,它可以進行文字生成語音、圖像智能編輯、視頻智能剪輯、文字續寫或糾錯等十分多樣的工作,讓大家擺脫機械勞動,把時間花在創意性工作上,給文字作者、翻譯人員、插畫師、視頻剪輯師等帶來極大的支持。不僅如此,生成式AI還能勝任部分由設計師、程序員甚至專業工程師從事的設計與編程類工作,在提升工作效率的同時讓這些專業人士更能發揮所長,減少在初級工作上的時間投入。與此同時,生成式AI對于從業人員的素質和技能,也提出了新的要求。總的來說,決策式AI和生成式AI均可以幫助用戶推進部分工作,如事件決策、創作內容等。可以說,人工智能的合理利用有助于提升客戶體驗,幫助企業降本增效,并抓住新的商業機會。
如前文所述,數據和模型分屬人工智能產業的基礎層和技術層,無論是決策式AI還是生成式AI的應用都離不開數據和模型,下面我們進一步了解“大數據”和“大模型”是如何重塑人工智能版圖的。
從大數據到大模型
無論是決策式AI還是生成式AI,以其現在的功能和潛力,都能為人類做很多工作,未來甚至有點萬能,那么這么萬能的技術,是怎么被“訓練”出來的呢?這就要說到大數據了,決策式AI和生成式AI,其實都離不開用大量數據來訓練模型。
對于大數據,大眾已經比較熟悉。顧名思義,大數據指的是海量的數據,但大數據并沒有看上去這么簡單,它還有多樣性和高速增長的特性。圖1-3展示了從2017年到2025年全球數據總量的增長趨勢及預測情況。收集、存儲、處理和分析各種形式和來源的大數據,可以幫助企業和組織迅速獲得有價值的信息,并做出正確的決策,它還可以用于商業活動的改善,如此能提升工作效率,降低工作成本,并推動企業實現更大的增長。就如人類通過經歷各類事件來積累經驗一般,在人工智能領域,我們通過大量的數據來訓練模型。

圖1-3 2017—2025年全球數據總量增長趨勢及預測情況
數據來源:國際數據公司發布的白皮書《數據時代2025》
而隨著深度學習的落地和發展,模型本身所需的存儲空間在近年有了顯著增長,最初的GPT就有1.17億個參數,ChatGPT有1750億個參數,最新的GPT-4參數數量更多,有報道稱可能達到1T(即10 000億),但OpenAI公司其實并沒有公布具體的參數數量,這些擁有海量參數的模型都被稱為“大模型”。如圖1-4,它展示了大模型參數數量變化趨勢。這里我們提到了深度學習,這是一種受人腦的生物神經網絡機制啟發,并模仿人腦來解釋、處理數據的機器學習技術,它能自動對數據進行特征提取、識別、決策和生成。你可能覺得這個詞有點耳熟,其實它大規模地應用于自然語言處理(NLP)、計算機視覺、機器翻譯等領域。深度學習的出現,為很多領域的工作帶來了前所未有的精度和效率。人工智能行業也因深度學習收獲了前所未有的發展速度,整個人工智能領域的發展都曾被它帶動。

圖1-4 大模型參數數量變化趨勢
大模型能分析處理海量的數據,在解決問題上取得更好的效果。本書的“主角”生成式AI就是大模型的產物。近年來,大模型在越來越多的行業和消費類應用中嶄露頭角,原因主要是它能夠迅速有效地處理海量的數據,幫助個人和企業提升效率。大模型與人工智能技術相輔相成,隨著人工智能技術的發展,大模型也會持續發展進步。另外,生活中日益普及的5G網絡和彈性計算等基礎設施,也會給大模型的發展創造更多可能性,使其成為不可或缺的內容生成工具。
生成式AI市場格局
2021年,高德納咨詢公司(Gartner)就曾預測,至2023年將有20%的內容被生成式AI創建,至2025年生成式AI產生的數據將占所有數據的10%(2021年不到1%)。2022年9月,紅杉資本官網發布的文章《生成式AI:充滿創造力的新世界》預測,生成式AI將產生數萬億美元的經濟價值。據預測,2025年,國內生成式AI應用規模有望突破2000億元,國內傳媒領域應用空間超1000億元。而且,生成式AI“八面玲瓏”,它的應用場景十分廣泛,目前不僅應用于文本、圖片、音視頻、游戲等數字媒體,還可以應用于制造業、建筑業等實體行業。
在文本生成方面,生成式AI可以通過語言模型、神經網絡和深度學習技術,快速創建大量有助于改善客戶體驗的內容,如新聞資訊、劇本、營銷文本、智能客服等。其中作為經典應用的AI生成營銷文本、智能客服等都已在許多行業廣泛地應用;AI生成新聞資訊和劇本等功能大家也可以期待一下,或許以后結合了ChatGPT等突破性的模型,文字性工作真的能依靠它變得輕松不少。
在圖片生成方面,生成式AI可以通過計算機視覺來分析圖片,生成營銷素材、設計方案和藝術作品等,幫助節省人力成本和時間。另外,生成式AI還能在音頻生成、視頻生成和跨模態生成領域大展拳腳。
在音頻生成方面,生成式AI可以幫助使用者更好地分析、編輯和生成音頻文件,從而幫助創作出優秀的音頻作品。例如,克隆真人的語音、文本生成特定語音、作曲編曲等,生成式AI都能代替人類去做,并均已經廣泛應用于市場。
視頻生成也是生成式AI的重要應用,它可以幫助使用者生成高質量的視頻,如檢測和刪除特定片段、跟蹤剪輯、生成特效、合成視頻等。另外,大火的AI數字人也是它的“拿手絕活”。在李安執導的《雙子殺手》中,工作人員就用AI創造了一個數字人物小克。威爾·史密斯在數字技術的幫助下同時出演了50歲特工亨利和23歲特工小克,該片實現了真實明星“年輕版”的數字化制作。
在跨模態生成中,生成式AI能夠根據文字生成創意圖片、根據圖片生成視頻、根據文字生成視頻,或根據圖片或視頻生成文字。對想象力豐富的朋友,或者影視行業從業者來說,這稱得上是“工作神器”。圖1-5就是一個根據文字“panda in a space suit”(穿著宇航服的熊貓)生成圖片的例子。在游戲方面,生成式AI可以用于游戲開發,實現自動化的游戲設計,同時能夠實現更好的游戲體驗,如人工智能NPC(非玩家控制角色)等,說不定以后你玩的游戲就有人工智能的深度參與。

圖1-5 根據“panda in a space suit”生成的圖片
生成式AI不光在這些數字經濟領域廣泛應用,在實體領域的潛力也非常大,如在建筑業等巨型垂直實體領域中,生成式AI所生成內容就不再僅局限于圖片和文字,而是進入了信息形式更為豐富的3D(三維)設計領域。例如構建數字建筑模型時,生成式AI能幫助建筑師們產出3D建筑模型,讓他們更好地理解項目。建筑師們能夠使用AI圖像生成應用來豐富建筑設計方案的細節,假如建筑師們向應用中輸入較為初級的建筑設計方案,AI就能夠在初級設計的基礎上,繼續產出較為細化的設計方案,以此來深化設計。建筑師們還可以隨手繪制一個潦草的建筑場景線圖,讓人工智能來生成對應的建筑實景圖。我們可以想象,隨著手繪信息的增加,生成式AI輸出的實景圖也越來越穩定。圖1-6所示的就是利用AI圖像生成工具生成的建筑設計圖。

圖1-6 由AI圖像生成工具生成的建筑設計圖
圖片來源:https://stability.ai/blog/stablediffusion2-1-release7-dec-2022
技術的浪潮層疊翻涌,人工智能已成為人類社會沖向未來世界的戰艦,產業前景十分廣闊。生成式AI更是一個突破性的產業發展方向,它不僅能給數字媒體和虛擬空間帶來價值,還能促進實體行業的發展,在提升行業效率的同時優化原有的流程,創造出新的價值增長點,可以說是實體行業升級不可多得的機遇。