近日,美國人工智能數(shù)據(jù)基礎(chǔ)公司Scale AI創(chuàng)始人兼首席執(zhí)行官Alexandr Wang在接受CNBC采訪時(shí)稱,DeepSeek擁有大約五萬塊英偉達(dá)H100芯片,但因美國出口管制措施,他們不能公開談?wù)摗?
王在采訪中先夸贊了DeepSeek的性能稱,“我們發(fā)現(xiàn),DeepSeek(R1)是目前表現(xiàn)最好的,或者說與美國最好的模型(GPT o1)處于同一水平?!?
當(dāng)被問及中美兩國在人工智能領(lǐng)域的競爭時(shí),王表示:“長期以來,美國一直處于領(lǐng)先地位?!辈贿^,他補(bǔ)充說,DeepSeek最新的模型確實(shí)試圖改變這一局面。王認(rèn)為,“中國實(shí)驗(yàn)室在圣誕節(jié)發(fā)布一款驚天動(dòng)地的模型具有象征意義,要知道,我們其他人正在慶祝節(jié)日?!?
Alexandr Wang(王)CNBC
DeepSeek于2024年12月26日(美國時(shí)間12月25日)當(dāng)天發(fā)布了一款“震撼性的模型”——DeepSeek-V3,隨后又于1月20日推出了一款專注于推理的強(qiáng)大AI模型DeepSeek-R1,對(duì)標(biāo)OpenAI的o1模型。
DeepSeek利用較少且不夠先進(jìn)的芯片訓(xùn)練出了媲美ChatGPT的模型。DeepSeek在一份技術(shù)報(bào)告中稱,它使用超過2000個(gè)英偉達(dá)H800芯片集群來訓(xùn)練其參數(shù)為6710億的V3模型,而Meta訓(xùn)練參數(shù)量4050億的Llama 3,用了16384塊更強(qiáng)的H100顯卡,花了54天。Deepseek的訓(xùn)練效率為Meta的11倍。
DeepSeek表示,訓(xùn)練其最新模型之一的成本為560萬美元(約合人民幣4100萬元)。相比之下,人工智能開發(fā)商Anthropic的首席執(zhí)行官達(dá)里奧·阿莫迪 (Dario Amodei )去年提到的建立一個(gè)模型的成本為1億至10億美元。
CNBC曾發(fā)文稱:“DeepSeek-R1因其性能超越美國頂尖同類模型,且成本更低,算力消耗更少,引發(fā)了硅谷的恐慌。”
但王話鋒一轉(zhuǎn),談到了中國人工智能企業(yè)可能為人工智能模型配備的GPU數(shù)量。他稱,“中國的實(shí)驗(yàn)室擁有的H100芯片比人們想象的要多得多?!彼a(bǔ)充道, “據(jù)我了解,DeepSeek擁有大約五萬塊H100芯片?!蓖跽J(rèn)為,因?yàn)檫`反了美國實(shí)施的出口管制,所以DeepSeek不能談?wù)撨@些。
英偉達(dá)的Hopper架構(gòu)GPU如H100和H200,因其優(yōu)秀的算力,出口受到美國政府的管制。拜登政府于2022年通過一項(xiàng)規(guī)定禁止英偉達(dá)向中國出售性能遠(yuǎn)超其舊款GPU A100 的GPU系列,迫使英偉達(dá)開發(fā)了名為H800和A800的性能削減版芯片用以替代,但一年后的2023年10月,這兩款芯片也一并被禁止。目前,英偉達(dá)已在推廣其最新一代Blackwell架構(gòu)的GPU,其出口依然受到限制。
王將中美之間的人工智能競賽描述為一場“AI戰(zhàn)爭”,并補(bǔ)充道,“美國將需要大量的計(jì)算能力和基礎(chǔ)設(shè)施,我們需要釋放美國的能量以推動(dòng)這場AI繁榮。”
美AI公司CEO稱:不認(rèn)為DeepSeek是對(duì)手,但對(duì)華芯片出口管制更重要了
百融云-W早盤逆市漲超10% 公司AI技術(shù)處于行業(yè)領(lǐng)先水平
對(duì)話周鴻祎、方漢:DeepSeek能否改寫AI戰(zhàn)局?
Meta AI高管暗批OpenAI:閉源AI是荒謬的 開源是唯一出路
谷歌前CEO評(píng)Deepseek:它標(biāo)志著全球AI競賽的“轉(zhuǎn)折點(diǎn)”
智譜AI在珠海成立智譜領(lǐng)航科技公司 含多項(xiàng)AI業(yè)務(wù)
還沒有評(píng)論,來說兩句吧...