- AI應用革命
- 何丹 靳毅 朝亮編著
- 630字
- 2025-08-14 17:25:35
第二章 DeepSeek的技術突破與創新
上一章我們了解了一下什么是大語言模型,以及大語言模型里的一些專業術語和技術。本章我們從DeepSeek的爆火來看看大語言模型的本質。
讓我們先回顧一下DeepSeek崛起過程的時間線。
2024年12月26日:DeepSeek發布基礎模型V3。
2025年1月15日:DeepSeek官方App上線。
2025年1月20日:DeepSeek推理模型R1發布。
2025年1月24日:DeepSeek App更新,加入深度思考功能。
2025年1月26日:游戲互動科技有限公司(簡稱游戲科學)CEO馮驥老師在微博推薦DeepSeek,引起國運級別的討論。
2025年1月28日:DeepSeek活躍用戶數首次超越豆包。
2025年2月1日:DeepSeek日活躍用戶數量突破3000萬大關,成為史上最快達成這一里程碑的應用。
2025年3月1日:DeepSeek獲全球AI應用排行榜第二。
這場持續數月的DeepSeek風暴,本質是技術理想主義對商業現實的降維打擊。從某種角度來看,DeepSeek爆火的核心原因是做了真正的技術創新,而且是在低成本情況下完成的,讓復雜技術成果成為大眾市場的受歡迎產品。它的成功證明:在AI研發的深水區,中國團隊并非只是跟隨者。當科技競爭進入“擠海綿”式的極致優化階段,那些能把百元安卓機調校出萬元旗艦性能的“民間高手”,或許才是真正擁有未來鑰匙的人。
而對于整個大語言模型行業來講,這無異是一場絕對的大地震,國內大廠所有玩家被迫扔掉原有籌碼重新學習規則。百度迅速將文心大語言模型轉免費,阿里云緊急下調應用程序編程接口(API)價格。而這些對創業者來說是好事,開源生態引發的樂觀情緒,讓所有人都知道時代要變了。
所以,從技術上看,DeepSeek在Transformer架構上進行了再進化。下面我們將詳細介紹DeepSeek的核心技術創新。