DeepSeek帶火英偉達(dá)GPU “庫存的禁售型號都搶空了”

君潔少爺 2025-02-15 最新資訊 7 次瀏覽 0個評論

記者沈怡然 2月13日，一位英偉達(dá)代理商告訴經(jīng)濟(jì)觀察網(wǎng)記者，春節(jié)后第一周，兩家中國科技企業(yè)為支撐開源大模型DeepSeek的推理服務(wù)，緊急向他們公司采購了L20 GPU算力設(shè)備?！叭ツ?，客戶下單總要反復(fù)考慮和比價，現(xiàn)在連庫存的禁售型號都搶空了”。

DeepSeek的出現(xiàn)顛覆了市場將高性能GPU視為AI賽道核心的傳統(tǒng)認(rèn)知，導(dǎo)致作為高性能GPU壟斷者的英偉達(dá)率先被市場看空。

然而，更多產(chǎn)業(yè)人士發(fā)現(xiàn)，近期，無論是高性能的H系列GPU，還是RTX 40系列的高端顯卡，英偉達(dá)的GPU重新變得供不應(yīng)求。

算力需求爆發(fā)

前述英偉達(dá)代理商目前正加緊為客戶調(diào)配英偉達(dá)的產(chǎn)品。他發(fā)現(xiàn)，英偉達(dá)芯片在中國市場全線緊缺，一些已經(jīng)禁售的H800系列存貨一卡難求。

此時，接入DeepSeek的中外企業(yè)已達(dá)數(shù)百家，國內(nèi)云服務(wù)、互聯(lián)網(wǎng)、手機(jī)、芯片、金融、醫(yī)療、汽車等行業(yè)都在上線和部署DeepSeek。

迅速增長的用戶量為上述企業(yè)帶來“潑天富貴”：云服務(wù)借此兜售算力、芯片企業(yè)借此推廣產(chǎn)品、車企以更低成本升級自己的軟件、上市公司借此推升市值。

一家IT廠商對經(jīng)濟(jì)觀察網(wǎng)記者稱，其調(diào)用DeepSeek的平臺在上線首日增加了上萬個用戶，服務(wù)器幾乎崩潰，現(xiàn)有算力已經(jīng)跟不上用戶的需求。團(tuán)隊(duì)為緩解壓力，不得不緊急調(diào)配更多英偉達(dá)GPU。許多上線DeepSeek的平臺顯示服務(wù)器繁忙，實(shí)際上是平臺提供的算力跟不上飛速增長的用戶需求。

向金融、科研、航空航天等企業(yè)提供超算云服務(wù)的并行科技（839493.BJ）董事長陳健稱，模型的生命周期通常是先訓(xùn)練，然后部署為服務(wù)，最后進(jìn)行推理。目前是企業(yè)在DeepSeek模型推理過程中爆發(fā)了大量算力需求。

據(jù)經(jīng)濟(jì)觀察網(wǎng)記者統(tǒng)計，英偉達(dá)在中國合法銷售的型號包括：H20、L20，T4；游戲顯卡涵蓋RTX 40系列（除RTX 4090外）和RTX 30系列及更早型號，還有新推出的RTX 5090限制版5090D。

展開全文

目前市面上有十幾款國產(chǎn)GPU品牌，但普遍在性能、穩(wěn)定性和生態(tài)上與英偉達(dá)存在一定差距，英偉達(dá)卡仍是企業(yè)們的最優(yōu)選擇。

DeepSeek的R1模型發(fā)布后，英偉達(dá)股價遭遇過去一年來最大跌幅17%，但自2月3日開始出現(xiàn)反彈，目前回升了13%。

國內(nèi)某模型廠商一位人士對經(jīng)濟(jì)觀察網(wǎng)記者稱，DeepSeek的出現(xiàn)讓業(yè)界反思算力泡沫，AI訓(xùn)練是否可以不再依賴大規(guī)模的高端GPU集群，但是隨著提供模型和使用模型的個人和企業(yè)都在爆發(fā)式增長，大量的模型推理再一次推升了對英偉達(dá)卡的需求。

陳健認(rèn)為，DeepSeek帶給產(chǎn)業(yè)界的震動是AIGC大模型訓(xùn)練、推理算力消耗大幅降低。相比模型推理，模型訓(xùn)練的需求并沒有在短期內(nèi)出現(xiàn)爆發(fā)式增長。

算力需求可持續(xù)嗎？

DeepSeek展現(xiàn)出強(qiáng)大的推理能力與優(yōu)秀的文采，但是提供DeepSeek服務(wù)的代價也很大。

上述國內(nèi)模型廠商人士表示，目前DeepSeek滿血版對硬件配置要求非常高，至少需要兩臺H800卡才能運(yùn)行起來，而國內(nèi)大多數(shù)基礎(chǔ)模型只需要一臺4090卡就能運(yùn)行。

通常來說，模型能力與參數(shù)量和精度密切相關(guān)，參數(shù)量影響AI的知識量，精度影響AI的準(zhǔn)確性和推理能力，這也是為什么很多平臺上線的DeepSeek看起來“智商”不足，因?yàn)楸澈蟮乃懔Σ蛔阋灾С帜Ｐ驮趨?shù)量和精度上達(dá)到最佳狀態(tài)。

不過，上述國內(nèi)模型廠商人士認(rèn)為，這種急迫的算力需求未必持續(xù)很久。在實(shí)際應(yīng)用中，開發(fā)者通常會將超過600B參數(shù)量的模型進(jìn)行蒸餾，壓縮到更低參數(shù)規(guī)模，再用于商業(yè)化。而DeepSeek發(fā)展得太快以至于團(tuán)隊(duì)還沒來得及完成蒸餾，可能后續(xù)幾個月蒸餾好后，那些上線DeepSeek的企業(yè)可以節(jié)約一些推理算力。

你可能想看：

AMD火速“站臺”DeepSeek，利空英偉達(dá)？美國私募：GPU市場格局或被改寫！摩根大通也發(fā)文