專題:DeepSeek為何能震動(dòng)全球AI圈
炒股就看金麒麟分析師研報(bào),權(quán)威,專業(yè),及時(shí),全面,助您挖掘潛力主題機(jī)會(huì)!
烏鴉智能說
這兩天,中美AI領(lǐng)域發(fā)生了兩件大事:
在美國發(fā)布AI禁令后,特朗普隨即宣布了一項(xiàng)預(yù)算高達(dá)5000億美元的AGI計(jì)劃——星際之門,以保證其在AI領(lǐng)域的領(lǐng)先地位。
而在大洋彼岸的中國,一家名為Deepseek的中國創(chuàng)業(yè)公司,只用了2048塊顯卡,就訓(xùn)練出了一個(gè)能與頂級(jí)模型相媲美的Deepseek-V3模型。
Deepseek最引人注目的并不只是它的技術(shù)指標(biāo),而是其所代表的效率革命,僅依靠少量的硬件配置和幾十名年輕的博士生,就打破了美國的AI資源限制,完成了跨越式的技術(shù)突破。
更重要的是,Deepseek選擇了完全開源的路線,將代碼、模型權(quán)重和訓(xùn)練日志全部公開。沒有人會(huì)忘記開源的力量,雖然定義智能手機(jī)的是iOS,但安卓才是那個(gè)讓手機(jī)行業(yè)真正繁榮,普惠深入世界各個(gè)角落的人。
正如Perplexity CEO Aravind Srinivas所說:歷史告訴我們,一旦開源追上甚至超越閉源軟件,所有開發(fā)者都會(huì)轉(zhuǎn)向開源。
以此為轉(zhuǎn)折點(diǎn),DeepSeek不僅改變了AI原有的競爭規(guī)則,也讓美國和中國的AI路線走向了不同的兩個(gè)方向:巨額投入與追求效率、封閉與開源。
/ 01 /
DeepSeek突破的三層意義
之所以DeepSeek能夠引起如此廣泛的討論,不僅在于其技術(shù)指標(biāo),更在于其對于AI行業(yè)的重要意義。
首先,DeepSeek重新定義了大模型的競爭壁壘。過去兩年里,OpenAI每年要花費(fèi)上百億美金,來維持自己在AI領(lǐng)域的優(yōu)勢地位。
而現(xiàn)在游戲規(guī)則變了?!癉eepSeek”證明,數(shù)千萬美元的投資也能取得顯著成果。
不久前,UC伯克利博士生潘家怡和另兩位研究人員,在CountDown游戲中復(fù)現(xiàn)了DeepSeek R1-Zero。實(shí)驗(yàn)中,團(tuán)隊(duì)驗(yàn)證了通過強(qiáng)化學(xué)習(xí)RL,3B的基礎(chǔ)語言模型也能夠自我驗(yàn)證和搜索。
更夸張的是,整個(gè)實(shí)現(xiàn)成本僅不到30美金(約217元)。這意味著,低成本構(gòu)建具備推理能力的模型已成為可能,預(yù)訓(xùn)練模型的巨額投入不再是必需。
這背后也引出了一個(gè)深層次的問題:
當(dāng)一家公司能在缺乏頂級(jí)芯片的情況下,以極低成本建立突破性的 AI 模型時(shí),我們不得不重新思考:那些投入的數(shù)千億美元資本支出,真的物有所值嗎?
這是OpenAI需要回答的問題。
其次,與OpenAI的閉源路線不同,DeepSeek選擇完全開源的路線,將代碼、模型權(quán)重和訓(xùn)練日志全部公開。
當(dāng)開源模型性能媲美市場上最強(qiáng)大的模型,甚至在部分領(lǐng)域有所超越時(shí),會(huì)吸引越來越多的開發(fā)者參與。
原因很簡單,開源軟件成本低廉,成本越低,開發(fā)者的吸引力就越大。因?yàn)檫@將大大降低構(gòu)建應(yīng)用程序的成本。
這有點(diǎn)像蘋果和安卓的故事?;仡櫼苿?dòng)互聯(lián)網(wǎng)時(shí)代,定義智能機(jī)0到1的是iOS,但讓手機(jī)行業(yè)真正繁榮普惠深入世界各個(gè)角落的是安卓。
在Meta 副總裁兼首席人工智能科學(xué)家楊立昆看來,DeepSeek的成功,與其說是”中國超越美國”,倒不如說是開源模型正在超越專有模型。
第三,Deepseek的技術(shù)突破,背后是AI研發(fā)開放性的勝利,這與美國的AI封鎖形成了鮮明對比。
具體來說,在一個(gè)被GPU短缺和芯片禁運(yùn)困擾的環(huán)境中,一家從未被計(jì)入中國“AI 六小龍”的量化基金公司,用少量的硬件配置和幾十名年輕的博士生,就完成了跨越式的技術(shù)突破。
作為一個(gè)后來者,Deepseek的突破雖然離不開自身的努力,但更重要的是,開放的技術(shù)交流環(huán)境,包括論文、開源代碼和各種正式或非正式的人才交流,為創(chuàng)新突破創(chuàng)造了條件。
這揭示了AI行業(yè)的另一個(gè)關(guān)鍵特性:模型研發(fā)具有很強(qiáng)的外部性。特別是在蒸餾與合成數(shù)據(jù)等技術(shù)存在的情況下,后來者的追趕和學(xué)習(xí)效應(yīng)異常強(qiáng)勁。這種內(nèi)卷加外卷的結(jié)果,也是模型能力變好,而成本快速下降的原因。
英偉達(dá)科學(xué)家Jim Fan也提到了開放性對于AI發(fā)展的影響:
不管你喜歡與否,AI的未來不會(huì)是被“安全委員會(huì)”控制的瓶中精靈。每個(gè)互聯(lián)網(wǎng)用戶都將能在他們的“烤面包機(jī)筆記本”上運(yùn)行高階模型。這是歷史潮流,我們應(yīng)該順勢而為,而不是逆流而上。
當(dāng)美國不斷強(qiáng)化AI技術(shù)封鎖的當(dāng)下,Deepseek的突破又何嘗不是對于美國AI制裁的一種“反噬”。
/ 02?/
找到中國大模型的商業(yè)化答案
之前,李開復(fù)一直在表達(dá)一個(gè)觀點(diǎn):
中國做AI的優(yōu)勢從來不是在不設(shè)預(yù)算上限的情況下去做突破性研究,而是在好、快、便宜和可靠性之間找出最優(yōu)解。
在相當(dāng)長時(shí)間里,國內(nèi)大模型一直處于很尷尬的處境,訓(xùn)練階段不僅被技術(shù)封鎖,還容易被海外開源降維打擊。
如今,Deepseek的突破代表了一種新的可能性——即通過算力效率的提升,實(shí)現(xiàn)更繁榮的LLM應(yīng)用生態(tài)。
長期來看,AI應(yīng)用生態(tài)能否跑通,取決于每個(gè)國家的成本結(jié)構(gòu)、商業(yè)模式、經(jīng)濟(jì)模型、產(chǎn)品供給能力,大家各有不同,是個(gè)復(fù)雜的商業(yè)問題。
固然,中國買不到最新的芯片,單位Flops的推理成本永遠(yuǎn)比海外高,但這也倒逼中國infra出現(xiàn)了各種“工程式創(chuàng)新”,去探索更高效的算力優(yōu)化方式。
至少從目前看,國內(nèi)推理優(yōu)化進(jìn)展比大家想象要快。一旦算力優(yōu)化這事跑通,國內(nèi)大模型在商業(yè)層面建立良性循環(huán)也不是沒有可能。
也就是說,中美未來AI將是兩個(gè)完全不同的故事:美國押注模型能力提升,中國追求模型效率的極限。
一旦算力優(yōu)化這事跑通,國內(nèi)大模型在商業(yè)層面建立良性循環(huán)也不是沒有可能。
也就是說,中美未來AI將是兩個(gè)完全不同的故事:美國押注模型能力提升,中國追求模型效率的極限。
這就很像當(dāng)年互聯(lián)網(wǎng)所發(fā)生的故事。過去十年,中國和美國在互聯(lián)網(wǎng)領(lǐng)域講了兩個(gè)完全不同的故事:硅谷加倍投入企業(yè)軟件,而中國則將賭注押在消費(fèi)者應(yīng)用上。
自谷歌和Meta后,美國科技業(yè)幾乎放棄了在消費(fèi)互聯(lián)網(wǎng)上再造流量入口的嘗試,轉(zhuǎn)而選擇全面擁抱SaaS。軟件也完美接力上一個(gè)十年中的消費(fèi)移動(dòng)應(yīng)用,成為新十年的主流投資趨勢,也跑出了很多優(yōu)秀公司。
而中國在消費(fèi)互聯(lián)網(wǎng)展現(xiàn)了非凡的生命力,字節(jié)跳動(dòng)把短視頻生意做到了全世界,美團(tuán)把本地生活做成了一個(gè)千億美元的生意,而拼多多也成長為阿里、亞馬遜一外的電商新一極。
在GPT橫空出世之后,美國SaaS公司率先受益,紛紛開始向客戶提供AI功能,通過之前建立的客戶基礎(chǔ)和產(chǎn)品場景直接產(chǎn)生商業(yè)回報(bào),大大提升了在AI上創(chuàng)新投入的回報(bào)確定性。而中國的AI應(yīng)用卻因?yàn)槿狈鼍昂蜕虡I(yè)模式而進(jìn)展緩慢。
隨著AI應(yīng)用的逐漸落地,模型效率將會(huì)成為打通中國大模型商業(yè)化循環(huán)的一把“鑰匙”。
文/林白
PS:如果你對AI大模型領(lǐng)域有獨(dú)特的看法,歡迎掃碼加入我們的大模型交流群。
蘋果重奪“全球股王”:iOS 18.3默認(rèn)開啟AI DeepSeek送上助攻
AI界“拼多多”DeepSeek國內(nèi)外刷屏!龍頭20CM一字板,受益上市公司梳理
白宮AI顧問潑臟水:DeepSeek“很可能”竊取了美國技術(shù)
一文讀懂:對于AI基建產(chǎn)業(yè)鏈各環(huán)節(jié),DeepSeek利好哪些、又利空哪些?
中國AI陣營又一重要突破!阿里巴巴Qwen2.5-Max正式發(fā)布,性能超過DeepSeek V3
摩根士丹利:DeepSeek的成功可能會(huì)挑戰(zhàn)現(xiàn)狀,并促使人們重新評(píng)估已有的AI模型開發(fā)方法
“木頭姐”談DeepSeek啟示:在AI領(lǐng)域成功不用那么燒錢,加速了成本崩潰
還沒有評(píng)論,來說兩句吧...