- AI應用革命
- 何丹 靳毅 朝亮編著
- 406字
- 2025-08-14 17:25:33
第一章 大語言模型發展與DeepSeek的橫空出世
2022年發布的ChatGPT-3.5,開啟了人工智能的新紀元。ChatGPT的問世,不但在世界范圍掀起了一股新的技術浪潮,而且也標志著大語言模型(LLM)的興起。其間,國內外各大技術巨頭都在加快對大模型的開發。“百家爭鳴”的同時,也存在著一些問題,比如大模型的訓練成本太高、同等參數模型差異性不大等。
然而,事情的發展超出了許多人的預期。2025年,杭州深度求索人工智能基礎技術研究有限公司推出的DeepSeek大語言模型迅速崛起,成為全球科技領域的一次重大變革。DeepSeek推出的R1模型,其訓練成本僅為557.6萬美元(不足GPT-4o的十分之一),卻已達到與國際頂級閉源模型相當的水平。更為引人注目的是,其采用開源策略打破了算力壟斷,僅上線一個月便在全球140個國家的App Store榜單中奪冠,日活躍用戶突破3000萬,創下史上最快增長紀錄。
OpenAI首席執行官薩姆·奧特曼(Sam Altman)在X平臺上表示,DeepSeek的模型“令人印象深刻,尤其是考慮到它們能夠以這個價格提供”,這表明他對DeepSeek的成本效益感到驚訝。