- DeepSeek實戰:操作攻略與商業應用
- 李寅
- 927字
- 2025-06-12 16:30:53
1.1.3 為什么DeepSeek能出圈
自DeepSeek誕生以來,全球用戶迅猛增長,獲得了個人用戶、開源社區、科研機構和各行業企業等多方面的認可,在短時間內迅速出圈。這與其背后的技術優勢與潛力密切相關。具體而言,以下3個原因驅動了DeepSeek破圈發展,如圖1-1所示。

圖1-1 DeepSeek出圈的原因
1.強大性能領跑全球
DeepSeek-R1在多項測試中的表現超越了業內領先模型OpenAI-o1,性能領跑全球。公開技術報告顯示,DeepSeek-R1在多個數學、編程測試集中取得優異成績,超越了OpenAI-o1d的得分。
同時,DeepSeek-R1在Chatbot Arena榜單中名列前茅,顯示了強大性能。Chatbot Arena是一個開放的大模型競技場,會對不同的模型進行比較并支持用戶進行投票。截至2025年2月9日,Chatbot Arena收到海量的用戶投票。雖然DeepSeek-R1上線時間較晚,收到的投票較少,但仍以1361分的Arena Elo分數位居前列,僅次于Gemini的兩款模型和ChatGPT-4o的模型,見表1-1。
表1-1 Chatbot Arena榜單排名(截至2025年2月9日)

續表

DeepSeek-R1在實際應用中也獲得了廣泛好評。海外科技媒體Ars Technica的編輯團隊曾對DeepSeek-R1、OpenAI-o1、OpenAI-o1-Pro等模型提出關于創意寫作、數學等方面的一系列問題,并評測這些模型給出的結果。基于正確性、主觀質量等因素,團隊最終評測出的結果為:DeepSeek-R1給出了更優回復。
2.技術突破解決瓶頸
DeepSeek-R1的核心技術特色在于它是在后訓練階段使用強化學習,讓大參數模型獲得推理能力。此前業內主流方向為通過過程獎勵模型(PRM)、蒙特卡洛樹搜索(MCTS)等進行模型訓練,讓模型獲得“深度思考”的能力。這一過程需要大量數據的支持。而DeepSeek-R1在訓練過程中跳過了指令優化的監督微調階段,通過強化學習得到基礎模型,并通過結合準確性獎勵和格式獎勵引導模型生成推理軌跡、獲得推理能力。
DeepSeek-R1的成功指出了一條不依賴大量訓練數據獲得更優模型的技術路線,解決了業內長期存在的“提升模型性能需大幅提升訓練數據量”的瓶頸。
3.全面開源便于體驗
DeepSeek采用開源策略,在降低用戶使用門檻的同時也為開發者社區、科研機構等的探索、協作提供了便利。相較于閉源且收費的OpenAI-o1,開源且免費的DeepSeek吸引了海內外開發者的廣泛關注,獲得了海外AI領域的認可。DeepSeek成為海內外用戶體驗AI的理想應用,用戶數量大幅增長。根據QuestMobile公布的數據,DeepSeek日活躍用戶數在2025年2月1日達到3000萬,成為史上最快達成這一里程碑的應用。
得益于以上3方面的優勢,DeepSeek迅速出圈,成為AI領域的佼佼者。未來,隨著技術的進一步突破,DeepSeek有望在全球范圍內產生更大的影響力。