- DeepSeek:打開財富密碼
- 陳根
- 1239字
- 2025-06-03 14:26:51
第1章 DeepSeek的前世今生
1.1 干翻GPT,DeepSeek爆火出圈
DeepSeek徹底火了——2025年一開年,被宣傳“干翻GPT”的DeepSeek幾乎成為全世界科技圈唯一熱議的焦點。
自2023年春節(jié)被OpenAI的ChatGPT引爆以來,人工智能這一話題在2024年春節(jié)依然火熱,那時圍繞的是OpenAI的Sora,而進入2025年春節(jié),出現(xiàn)了變與不變。不變的是,這個春節(jié)依然被人工智能所點燃,而變的是,這次的焦點由美國的科技公司變?yōu)榱酥袊目萍脊尽?/p>
DeepSeek的火爆程度超乎想象。美國當(dāng)?shù)貢r間1月27日,納斯達(dá)克指數(shù)出現(xiàn)3%的下跌,市場分析認(rèn)為,原因就是中國人工智能初創(chuàng)公司DeepSeek的最新突破,引發(fā)了美國投資者的關(guān)注,DeepSeek甚至被認(rèn)為動搖了美國科技行業(yè)的“無敵”地位。
具體而言,1月27日當(dāng)日,美國芯片巨頭英偉達(dá)(NVIDIA)股價暴跌約17%,半導(dǎo)體公司博通(Broadcom)股價下跌17%,超威半導(dǎo)體公司(AMD)股價下跌6%,微軟股價下跌2%。此外,人工智能領(lǐng)域的關(guān)聯(lián)行業(yè)企業(yè),如電力供應(yīng)商的股價也受到重創(chuàng),美國聯(lián)合能源公司股價下跌21%,Vistra股價下跌29%。
而與此同時,DeepSeek應(yīng)用登頂15個國家和地區(qū)的蘋果應(yīng)用商店免費App下載排行榜,超越了ChatGPT及Meta、谷歌、微軟等公司的生成式AI產(chǎn)品。
面對突然出圈的DeepSeek,很多人最好奇的問題就是:這個DeepSeek到底是什么?為什么突然這么火?
DeepSeek是一家中國人工智能公司,全稱是杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司,由著名量化私募幻方量化支持。幻方量化以其雄厚的資金實力,為DeepSeek提供了強大的資金支持。
2023年11月29日,DeepSeek發(fā)布了通用大模型DeepSeek LLM。不過,當(dāng)時市面上已經(jīng)有GPT-4、Claude-3.5、Gemini等國際頂尖模型,甚至在國內(nèi)曾經(jīng)的“百模大戰(zhàn)”中,它都屬于不起眼的小角色。因此,DeepSeek LLM的出現(xiàn)并未在市場上引起太多關(guān)注。
讓DeepSeek引發(fā)關(guān)注的,是五個月后的DeepSeek-V2。2024年5月7日,DeepSeek-V2發(fā)布,一發(fā)布就開源。
在中文綜合能力評測AlignBench中,DeepSeek-V2成為最強的開源模型,甚至與GPT-4 Turbo、文心4.0等閉源模型處于同一梯隊。而在英文評測MT-Bench中,它與當(dāng)時最強的開源模型Llama3-70B不相上下,甚至超越了Mixtral-8×22B等混合專家模型。在知識、數(shù)學(xué)、推理、編程等多個領(lǐng)域,DeepSeek-V2也都排名前列。更重要的是,它的API價格只有GPT-4o的2.7%,這直接引爆了國內(nèi)大模型的價格戰(zhàn),字節(jié)、阿里、百度、騰訊全部跟進降價。
而這只是DeepSeek掀起的第一波風(fēng)暴。2024年12月26日,DeepSeek-V3發(fā)布,再次開源,它的性能比V2版本更進一步,直接挑戰(zhàn)國際閉源大模型。無論是知識類任務(wù)、長文本理解、編程能力,還是數(shù)學(xué)運算,DeepSeek-V3的表現(xiàn)都已經(jīng)接近甚至超越了GPT-4o、Claude-3.5-Sonnet等頂級閉源大模型。更令人震撼的是,它的訓(xùn)練成本竟然只有557.6萬美元,遠(yuǎn)低于大廠動輒上億美元的訓(xùn)練開支。這次亮相讓DeepSeek的名字開始在海外科技社區(qū)瘋狂刷屏,眾多AI研究者和開發(fā)者爭相測試。
如果說DeepSeek-V3讓DeepSeek在全球AI行業(yè)站穩(wěn)了腳跟,那么2025年1月20日發(fā)布的DeepSeek-R1,就讓DeepSeek真正走上了神壇。
DeepSeek-R1——一個推理能力媲美OpenAI o1的模型,但API價格僅為o1的3.7%。可以說,DeepSeek再次用低價策略沖擊了市場,讓整個AI行業(yè)再次顫動。短短幾天,DeepSeek的影響力就突破了AI技術(shù)圈,甚至影響到了資本市場。1月27日,DeepSeek應(yīng)用同時登頂蘋果應(yīng)用商店中美兩區(qū)免費App下載排行榜,超越長期霸榜的ChatGPT,投資者開始動搖,英偉達(dá)股價大跌。從這個時候開始,DeepSeek徹底火遍全網(wǎng),被各大媒體爭相報道。
- 人工智能開發(fā)語言:Python
- 神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí):基于MATLAB的仿真與實現(xiàn)
- 深度學(xué)習(xí)之人臉圖像處理:核心算法與案例實戰(zhàn)
- ChatGPT速學(xué)通:文案寫作+PPT制作+數(shù)據(jù)分析+知識學(xué)習(xí)與變現(xiàn)
- Joy RL:強化學(xué)習(xí)實踐教程
- 從零開始:機器學(xué)習(xí)的數(shù)學(xué)原理和算法實踐
- 創(chuàng)造性思維:人工智能之父馬文·明斯基論教育
- 大模型工程化:AI驅(qū)動下的數(shù)據(jù)體系
- 機器人智能視覺感知與深度學(xué)習(xí)應(yīng)用
- 碼農(nóng)的零門檻AI課:基于fastai與PyTorch的深度學(xué)習(xí)
- 這就是ChatGPT
- 體感交互技術(shù)
- 大語言模型:基礎(chǔ)與前沿
- 智能計算系統(tǒng)實驗教程
- 移動機器人自主控制