記者 沈怡然 2月13日,一位英偉達(dá)代理商告訴經(jīng)濟(jì)觀察網(wǎng)記者,春節(jié)后第一周,兩家中國科技企業(yè)為支撐開源大模型DeepSeek的推理服務(wù),緊急向他們公司采購了L20 GPU算力設(shè)備?!叭ツ?,客戶下單總要反復(fù)考慮和比價,現(xiàn)在連庫存的禁售型號都搶空了”。
DeepSeek的出現(xiàn)顛覆了市場將高性能GPU視為AI賽道核心的傳統(tǒng)認(rèn)知,導(dǎo)致作為高性能GPU壟斷者的英偉達(dá)率先被市場看空。
然而,更多產(chǎn)業(yè)人士發(fā)現(xiàn),近期,無論是高性能的H系列GPU,還是RTX 40系列的高端顯卡,英偉達(dá)的GPU重新變得供不應(yīng)求。
算力需求爆發(fā)
前述英偉達(dá)代理商目前正加緊為客戶調(diào)配英偉達(dá)的產(chǎn)品。他發(fā)現(xiàn),英偉達(dá)芯片在中國市場全線緊缺,一些已經(jīng)禁售的H800系列存貨一卡難求。
此時,接入DeepSeek的中外企業(yè)已達(dá)數(shù)百家,國內(nèi)云服務(wù)、互聯(lián)網(wǎng)、手機(jī)、芯片、金融、醫(yī)療、汽車等行業(yè)都在上線和部署DeepSeek。
迅速增長的用戶量為上述企業(yè)帶來“潑天富貴”:云服務(wù)借此兜售算力、芯片企業(yè)借此推廣產(chǎn)品、車企以更低成本升級自己的軟件、上市公司借此推升市值。
一家IT廠商對經(jīng)濟(jì)觀察網(wǎng)記者稱,其調(diào)用DeepSeek的平臺在上線首日增加了上萬個用戶,服務(wù)器幾乎崩潰,現(xiàn)有算力已經(jīng)跟不上用戶的需求。團(tuán)隊(duì)為緩解壓力,不得不緊急調(diào)配更多英偉達(dá)GPU。許多上線DeepSeek的平臺顯示服務(wù)器繁忙,實(shí)際上是平臺提供的算力跟不上飛速增長的用戶需求。
向金融、科研、航空航天等企業(yè)提供超算云服務(wù)的并行科技(839493.BJ)董事長陳健稱,模型的生命周期通常是先訓(xùn)練,然后部署為服務(wù),最后進(jìn)行推理。目前是企業(yè)在DeepSeek模型推理過程中爆發(fā)了大量算力需求。
據(jù)經(jīng)濟(jì)觀察網(wǎng)記者統(tǒng)計,英偉達(dá)在中國合法銷售的型號包括:H20、L20,T4;游戲顯卡涵蓋RTX 40系列(除RTX 4090外)和RTX 30系列及更早型號,還有新推出的RTX 5090限制版5090D。
目前市面上有十幾款國產(chǎn)GPU品牌,但普遍在性能、穩(wěn)定性和生態(tài)上與英偉達(dá)存在一定差距,英偉達(dá)卡仍是企業(yè)們的最優(yōu)選擇。
DeepSeek的R1模型發(fā)布后,英偉達(dá)股價遭遇過去一年來最大跌幅17%,但自2月3日開始出現(xiàn)反彈,目前回升了13%。
國內(nèi)某模型廠商一位人士對經(jīng)濟(jì)觀察網(wǎng)記者稱,DeepSeek的出現(xiàn)讓業(yè)界反思算力泡沫,AI訓(xùn)練是否可以不再依賴大規(guī)模的高端GPU集群,但是隨著提供模型和使用模型的個人和企業(yè)都在爆發(fā)式增長,大量的模型推理再一次推升了對英偉達(dá)卡的需求。
陳健認(rèn)為,DeepSeek帶給產(chǎn)業(yè)界的震動是AIGC大模型訓(xùn)練、推理算力消耗大幅降低。相比模型推理,模型訓(xùn)練的需求并沒有在短期內(nèi)出現(xiàn)爆發(fā)式增長。
算力需求可持續(xù)嗎?
DeepSeek展現(xiàn)出強(qiáng)大的推理能力與優(yōu)秀的文采,但是提供DeepSeek服務(wù)的代價也很大。
上述國內(nèi)模型廠商人士表示,目前DeepSeek滿血版對硬件配置要求非常高,至少需要兩臺H800卡才能運(yùn)行起來,而國內(nèi)大多數(shù)基礎(chǔ)模型只需要一臺4090卡就能運(yùn)行。
通常來說,模型能力與參數(shù)量和精度密切相關(guān),參數(shù)量影響AI的知識量,精度影響AI的準(zhǔn)確性和推理能力,這也是為什么很多平臺上線的DeepSeek看起來“智商”不足,因?yàn)楸澈蟮乃懔Σ蛔阋灾С帜P驮趨?shù)量和精度上達(dá)到最佳狀態(tài)。
不過,上述國內(nèi)模型廠商人士認(rèn)為,這種急迫的算力需求未必持續(xù)很久。在實(shí)際應(yīng)用中,開發(fā)者通常會將超過600B參數(shù)量的模型進(jìn)行蒸餾,壓縮到更低參數(shù)規(guī)模,再用于商業(yè)化。而DeepSeek發(fā)展得太快以至于團(tuán)隊(duì)還沒來得及完成蒸餾,可能后續(xù)幾個月蒸餾好后,那些上線DeepSeek的企業(yè)可以節(jié)約一些推理算力。
AMD火速“站臺”DeepSeek,利空英偉達(dá)?美國私募:GPU市場格局或被改寫!摩根大通也發(fā)文
AMD火速“站臺”DeepSeek,利空英偉達(dá)?美國私募:GPU市場格局或被改寫!摩根大通也發(fā)文
國泰君安:庫存維持降勢 繼續(xù)看好鋼鐵板塊投資機(jī)會
GPU大戰(zhàn)一邊倒?AMD股價重挫 分析師坦言:市場只認(rèn)英偉達(dá)
美AI公司CEO稱:不認(rèn)為DeepSeek是對手,但對華芯片出口管制更重要了
DeepSeek刺激太大!Altman“認(rèn)錯”,稱考慮OpenAI開源,上線O3 Mini,推理模型首次免費(fèi)
向DeepSeek提問券商哪家強(qiáng),“只開一個賬戶,選哪家券商”問題最火,部署也忙壞各券商
清華團(tuán)隊(duì)突破算力難題:4090顯卡單槍匹馬就能跑“滿血版”DeepSeek-R1!有用戶稱整套方案成本不到7萬元,直降95%以上
DeepSeek引熱議之際 “ChatGPT之父”發(fā)文感謝團(tuán)隊(duì):復(fù)制容易 創(chuàng)新很難
還沒有評論,來說兩句吧...