專題:DeepSeek為何能震動(dòng)全球AI圈
每經(jīng)記者 蔡鼎????每經(jīng)編輯 高涵????
距離深度求索(DeepSeek)推理大模型DeepSeek-R1發(fā)布已經(jīng)過(guò)去近一周時(shí)間,開(kāi)源模型DeepSeek-V3也已經(jīng)發(fā)布了近一個(gè)月。然而,在海外社交媒體平臺(tái)上,乃至華爾街,DeepSeek的熱度才剛剛開(kāi)始。
1月24日,在國(guó)外大模型排名Arena上,DeepSeek-R1基準(zhǔn)測(cè)試已經(jīng)升至全類別大模型第三,其中在風(fēng)格控制類模型(StyleCtrl)分類中與OpenAI o1并列第一。
就在Arena放榜之后,全球關(guān)于DeepSeek的討論再次升級(jí),美股市場(chǎng)人工智能(AI)的狂歡,也開(kāi)始在DeepSeek的影響下顫動(dòng)。
DeepSeek-V3在僅使用2048塊H800 GPU的情況下,完成了6710億參數(shù)模型的訓(xùn)練,成本僅為557.6萬(wàn)美元,遠(yuǎn)低于其他頂級(jí)模型的訓(xùn)練成本(如GPT-4的10億美元)。因此,一些人認(rèn)為,DeepSeek可能會(huì)顛覆英偉達(dá)在AI硬件領(lǐng)域的主導(dǎo)地位。
而就在1月25日,英偉達(dá)的“老對(duì)手”AMD還火速為DeepSeek“站臺(tái)”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上。
美國(guó)私人投資基金Noah's Arc Capital Management認(rèn)為,DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比英偉達(dá)更具有成本效益的替代品,增強(qiáng)了AMD的市場(chǎng)地位。
OpenAI的成功來(lái)自“大力出奇跡”路線,以規(guī)模作為大模型的制勝法寶。但這也讓AI大模型的發(fā)展陷入了一個(gè)怪圈:為追求更高的性能,模型體積不斷膨脹,參數(shù)數(shù)量呈現(xiàn)指數(shù)級(jí)增長(zhǎng)。這種“軍備競(jìng)賽”型開(kāi)發(fā)模式,帶來(lái)了驚人的能源消耗和訓(xùn)練成本,難以為繼。受大模型訓(xùn)練的高昂成本拖累,OpenAI在2024年的虧損額可能達(dá)到50億美元,業(yè)內(nèi)專家預(yù)計(jì)到2026年其虧損將進(jìn)一步攀升至140億美元。
DeepSeek的低成本意味著,大模型對(duì)算力投入的需求可能會(huì)從訓(xùn)練側(cè)向推理側(cè)傾斜,即未來(lái)對(duì)推理算力的需求將成為主要驅(qū)動(dòng)力。而英偉達(dá)等硬件商的傳統(tǒng)優(yōu)勢(shì)更多集中在訓(xùn)練側(cè),這可能會(huì)對(duì)其市場(chǎng)地位和戰(zhàn)略布局產(chǎn)生影響。
海外媒體Vital Knowledge,德國(guó)世界報(bào)知名市場(chǎng)評(píng)論員Holger Zschaepitz,都不約而同地把DeepSeek稱之為“美國(guó)股市最大的威脅”。網(wǎng)絡(luò)社群里,越來(lái)越多的人把DeepSeek與近期英偉達(dá)的回調(diào)聯(lián)系在一起——1月24日,英偉達(dá)股價(jià)大跌3.12%,創(chuàng)下公司在年初CES展產(chǎn)品不及預(yù)期表現(xiàn)后的最大跌幅。
美股大V“THE SHORT BEAR”在社交媒體上表示,DeepSeek創(chuàng)造了一個(gè)AI巨頭們的痛苦時(shí)刻,而投資者必須對(duì)此敲響警鐘,“根據(jù)紅杉,美國(guó)AI公司每年必須產(chǎn)生約6000億美元收入來(lái)支付其AI硬件費(fèi)用。但現(xiàn)在看來(lái),這種冒險(xiǎn)行為變得越來(lái)越無(wú)利可圖?!?/p>
海外知名財(cái)經(jīng)博客Zerohedge1月24日撰文稱,DeepSeek的出現(xiàn)和其廉價(jià)的訓(xùn)練成本,正在對(duì)美國(guó)此前宣布的5000億美元AI基建計(jì)劃形成巨大的打擊。
1月26日(周日),擁有20年行業(yè)經(jīng)驗(yàn)的分析師Itai Levitan在一篇題為《中國(guó)DeepSeek會(huì)顛覆英偉達(dá)嗎?》的文章中稱,英偉達(dá)即將發(fā)布的財(cái)報(bào)將至關(guān)重要,投資者應(yīng)密切關(guān)注管理層的評(píng)論,特別是關(guān)于AI領(lǐng)域的競(jìng)爭(zhēng)風(fēng)險(xiǎn);如果DeepSeek是一個(gè)真正的威脅,那么其可能會(huì)出現(xiàn)在英偉達(dá)的業(yè)績(jī)指引或財(cái)報(bào)中,尤其是在其數(shù)據(jù)中心領(lǐng)域。Itai Levitan認(rèn)為,衡量DeepSeek影響的最佳方法便是觀察英偉達(dá)后續(xù)的股價(jià)。
Itai Levitan指出,如果把英偉達(dá)比作iPhone的話,那么DeepSeek便是“廉價(jià)智能手機(jī)”。在智能手機(jī)行業(yè),廉價(jià)替代品的出現(xiàn)無(wú)疑改變了蘋(píng)果的市場(chǎng)份額,尤其是在新興市場(chǎng),這同樣適用于英偉達(dá)。不過(guò),這取決于DeepSeek能否復(fù)制英偉達(dá)的生態(tài)系統(tǒng),還是僅僅在價(jià)格和性能上展開(kāi)競(jìng)爭(zhēng)。
對(duì)此,1月25日,摩根大通分析師Joshua Meyers在標(biāo)題為《通過(guò)DeepSeek的敘述思考——風(fēng)險(xiǎn)是真實(shí)的嗎?》的研報(bào)中寫(xiě)道,雖然目前還不清楚DeepSeek在多大程度上利用了High-Flyer的約50k hopper GPU(與OpenAI據(jù)信正在訓(xùn)練GPT-5的集群規(guī)模類似),但似乎很有可能的是,他們正在大幅降低成本(例如,其V2模型的推理成本據(jù)稱是GPT-4 Turbo的1/7)。DeepSeek顛覆性的主張是“更多的投資并不等于更多的創(chuàng)新”,這一主張開(kāi)始在美國(guó)AI領(lǐng)域引起關(guān)注。
不過(guò),在Joshua Meyers看來(lái),這(DeepSeek的低成本)并不意味著(AI領(lǐng)域)擴(kuò)張的終結(jié),也不意味著不再需要更多的算力,更不意味著投入最多資金的一方不會(huì)獲勝(24日扎克伯格還大幅提高了Meta人工智能的資本支出)。相反,這似乎將迫使中國(guó)的競(jìng)爭(zhēng)對(duì)手提高效率:“DeepSeek-V2能夠達(dá)到令人難以置信的訓(xùn)練效率,在所需算力只有Meta的Llama 3 70B 1/5的情況下,其性能比其他開(kāi)源模型更好。此外,DeepSeek-V2訓(xùn)練所需的算力是GPT-4的1/20,而性能卻相差不大。”如果DeepSeek能夠降低推理成本,那么其他公司也將不得不效仿。
就在1月25日(周六),英偉達(dá)的“老對(duì)手”AMD還火速為DeepSeek“站臺(tái)”,宣布全新的DeepSeek-V3模型已集成至AMD InstinctGPU上,并借助SGLang進(jìn)行了性能優(yōu)化。此次集成將助力加速前沿人工智能應(yīng)用與體驗(yàn)的開(kāi)發(fā)。
1月21日,美國(guó)私人投資基金Noah's Arc Capital Management發(fā)文稱,DeepSeek-V3模型的突破顯著降低了AI培訓(xùn)成本,使AMD GPU成為比英偉達(dá)更具有成本效益的替代品,增強(qiáng)了AMD的市場(chǎng)地位。在DeepSeek-V3開(kāi)發(fā)的關(guān)鍵階段,利用AMD ROCm軟件和AMD Instinct GPU加速器,進(jìn)一步鞏固了與AMD的長(zhǎng)期合作。
AMD還表示,將繼續(xù)基于AMD Instinct GPU上基于CK-tile的內(nèi)核,對(duì)DeepSeek-V3的性能進(jìn)行優(yōu)化。AMD Instinct是AMD的數(shù)據(jù)中心GPU品牌。Instinct產(chǎn)品線面向的是加速深度學(xué)習(xí)、人工神經(jīng)網(wǎng)絡(luò)和高性能計(jì)算/GPGPU應(yīng)用。
Noah's Arc Capital Management認(rèn)為,AMD今年(2025年)每股收益預(yù)計(jì)為4.99美元,這一預(yù)期處于AMD歷史預(yù)期市盈率區(qū)間的低端。市場(chǎng)預(yù)計(jì)AMD盈利增長(zhǎng)將遠(yuǎn)遠(yuǎn)慢于其規(guī)模更大的競(jìng)爭(zhēng)對(duì)手英偉達(dá),盡管AMD在GPU市場(chǎng)還沒(méi)有達(dá)到規(guī)模。
此外,AMD曾多次上調(diào)2024年AI GPU的銷售指引,將預(yù)測(cè)從20億美元提高到50億美元。這表明AMD在不斷增長(zhǎng)的AI GPU市場(chǎng)中的地位正在加速提升。雖然AMD的傳統(tǒng)業(yè)務(wù)(即CPU和GPU)仍然拖累著公司估值,但Noah's Arc Capital Management認(rèn)為,隨著更多輕量級(jí)的大模型訓(xùn)練和推理集群的建立,這個(gè)核心AI GPU業(yè)務(wù)部分將在未來(lái)5到10年內(nèi)非常有價(jià)值:“DeepSeek確實(shí)改變了GPU集群的設(shè)置方式,AMD應(yīng)該從中受益?!?/p>
Noah's Arc Capital Management還指出,DeepSeek證明,不再需要最先進(jìn)的芯片來(lái)訓(xùn)練大模型,“DeepSeek-V3模型是在英偉達(dá)H800上訓(xùn)練的,這是英偉達(dá)為中國(guó)客戶定制的速度較慢的GPU。然而,AMD的MI 300X GPU在關(guān)鍵基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)于H100。因此,DeepSeek可以在AMD GPU上支持最先進(jìn)的模型訓(xùn)練。”
免責(zé)聲明:本文內(nèi)容與數(shù)據(jù)僅供參考,不構(gòu)成投資建議,使用前請(qǐng)核實(shí)。據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。
AMD火速“站臺(tái)”DeepSeek,利空英偉達(dá)?美國(guó)私募:GPU市場(chǎng)格局或被改寫(xiě)!摩根大通也發(fā)文
摩根大通美國(guó)國(guó)債客戶空頭占比升至去年10月以來(lái)新高
摩根大通美國(guó)國(guó)債客戶多頭占比下降 轉(zhuǎn)向中性
摩根大通交易團(tuán)隊(duì):經(jīng)濟(jì)強(qiáng)勁增長(zhǎng)使得熊市出現(xiàn)的“可能性極小”
美國(guó)眾議院將投票表決:禁止大疆和道通這兩家中國(guó)企業(yè)在美國(guó)市場(chǎng)銷售新的無(wú)人機(jī)
美國(guó)WTI原油周四小幅收高 市場(chǎng)關(guān)注特朗普關(guān)稅威脅
也門(mén)胡塞武裝震驚世界!導(dǎo)彈精準(zhǔn)襲擊美國(guó)航母,揭示中東新格局
一覺(jué)醒來(lái),美國(guó)全境將哀悼,83歲拜登關(guān)閉聯(lián)邦政府,中方罕見(jiàn)發(fā)文哀悼
美國(guó)調(diào)查DeepSeek芯片來(lái)源
周末重磅利好!國(guó)務(wù)院發(fā)文!央行多次發(fā)聲,證監(jiān)會(huì)發(fā)布新規(guī)!影響一周市場(chǎng)的十大消息
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...