- AI芯片:科技探索與AGI愿景
- 張臣雄
- 1261字
- 2025-08-07 17:50:36
1.1 生成式AI開創新時代
AI經過了從專家系統到神經網絡的起起伏伏的發展歷程。2017年Transformer模型的誕生和大模型的開發,促成了2022年11月ChatGPT的發布以及2023年3月GPT-4的橫空出世。雖然AI的發展經歷了多次起伏,但其智能水平和社會影響一直在提高(見圖1.1)。現在,與生成式AI相關的應用服務如雨后春筍般涌現,很多國內公司(如百度、騰訊和阿里云等)都已經成功開發出大模型,為大模型的應用提供了有力支持。
當今典型的大模型已經初步具備了人類的通識和邏輯推斷能力,這也是之前的AI所缺失的。多年前興起的以深度學習技術為支撐的AI(與生成式AI對應,被稱為判別式AI)已經相當成熟并得到了廣泛的應用,而生成式AI把這一次AI熱潮推向了新的高度。判別式AI主要在識別、翻譯、預測等方面的判別能力較強,可以被稱為某個領域的“專家”;而ChatGPT等大模型則可以被稱為各個領域的通用專家,這引發了公眾對AI的極大關注。

圖1.1 AI經歷了三次熱潮和兩次低谷
生成式AI的應用多種多樣,如DALL-E2、Midjourney、Stable Diffusion、Mini-Omni、Github Copliot和Sora等,它們不僅包括對話功能,還包括生成圖像、視頻、語音和程序代碼等功能。
在生成式AI基礎上發展起來的下一波熱潮將是代理式AI(Agentic AI[1])。生成式AI的核心是創建新的內容,比如文本、圖像、音樂等,而AI智能體則進一步發展了這一理念,將其擴展到更自動化并具互動性的領域:智能體不僅可以生成內容,還能夠自主執行復雜任務、做出決策并與外部環境或其他系統交互,同時不斷學習和適應。
[1] 常被稱為AI Agent、AI代理或AI智能體,本書統一稱為AI智能體或簡稱智能體。
目前主流大模型的參數量都是千億級、萬億級的水平,展現出了驚人的泛化能力、遷移能力,產出的內容質量也更高、更智能。同時,訓練這些大模型需要海量數據。OpenAI為了讓GPT-3的表現更接近人類,使用了45TB的數據、近1萬億個單詞來訓練它,這相當于約一千萬本牛津高階詞典的詞匯。
大模型的能力比以往的AI有了長足的進步,它可以根據人類的提示(Prompt)寫出大量文字,其內容與人類寫的經常無法區分。雖然目前的生成式AI仍不完美,并會出現錯誤,但它們已經可以回答棘手的技術問題,例如回答以往需要向律師和計算機程序員等專業人士提的問題。它們甚至可以幫助人們更好地訓練其他AI。
AI能力的提升,依靠的是大量的計算機和服務器集群,而這些設備的核心器件就是AI芯片。因此,高性能的AI芯片成為最搶手的半導體器件之一,尤其是用于AI訓練的高端GPU芯片,不僅價格飛漲,而且供不應求,甚至因為種種原因被限購。
為了能夠滿足日趨復雜、密集的AI運算需求,同時盡可能降低能耗,AI芯片必須使用最先進的半導體芯片設計和制造技術。這掀起了半導體行業的技術競爭熱潮,也激發了產業界、學術界對半導體芯片的研發熱情,從而促進了芯片技術的加速發展。
根據市場調研公司灼識咨詢的預測,在生成式AI需求的推動下,AI芯片的全球市場規模正在迅速擴大:預計到2027年,AI芯片市場的銷售額會比2023年翻一番還要多,達到約3089億美元,復合年增長率為23%,其中中國AI芯片市場的銷售額預計達到1150億美元。這些銷售額中的很大一部分將來自云端訓練所使用的GPU。而邊緣側的AI推理芯片將在未來5年內迎來需求的高峰。