亚洲成AⅤ人片在线观看_亚洲性无码一区二区三区_无码综合天天久久综合网_四虎精品成人A在线观看

DeepSeek正打破算力為王行業(yè)規(guī)則

DeepSeek正打破算力為王行業(yè)規(guī)則

東海雨欣 2025-01-27 技術(shù)資訊 11 次瀏覽 0個(gè)評(píng)論

專題:DeepSeek為何能震動(dòng)全球AI圈

  【#DeepSeek正打破算力為王行業(yè)規(guī)則#】#AI算力股下挫# 中國AI大模型DeepSeek成功出圈讓行業(yè)產(chǎn)生了對(duì)于大規(guī)模AI算力投資邏輯的懷疑。

  作為目前全球AI大模型的領(lǐng)頭羊OpenAI提出Scaling Law,即計(jì)算規(guī)模越大,訓(xùn)練數(shù)據(jù)量越多,模型越智能。Scaling Law則成為了全球AI大模型廠商所信奉的圭臬。這促使英偉達(dá)等算力不斷研發(fā)擁有更加強(qiáng)大算力的產(chǎn)品,微軟等云廠商不斷加大對(duì)AI算力的資本投入。

  近期,微軟CEO薩蒂亞·納德拉(Satya Nadella)表示,微軟將在2025年投入800億美元建設(shè)AI智算中心,以支持AI大模型的開發(fā)和相關(guān)服務(wù)?,F(xiàn)任美國總統(tǒng)特朗普也公布了“星際之門”計(jì)劃,旨在未來4年內(nèi)投入5000億美元,在美國建設(shè)AI基礎(chǔ)設(shè)施。

  然而,近期中國AI大模型DeepSeek卻讓行業(yè)看到了不同的發(fā)展路徑。DeepSeek是國內(nèi)大模型公司深度求索開發(fā),深度求索的母公司是一家名為量化幻方的量化金融公司,在2024年12月推出的DeepSeek-V3,并于近期公布了DeepSeek-R1。

  據(jù)了解,DeepSeek-V3完整訓(xùn)練只需2.788M H800 GPU小時(shí),其訓(xùn)練成本僅為557萬美元,卻獲得了媲美OpenAI的最先進(jìn)模型GPT-4o的性能。當(dāng)時(shí)著名人工智能科學(xué)家卡帕西(Andrej Karpathy)就發(fā)文表示,這個(gè)模型是在一個(gè)非常有限的預(yù)算下訓(xùn)練的(2048個(gè)GPU運(yùn)行2個(gè)月,花費(fèi)600萬美元)。 作為參考,這種級(jí)別的能力通常需要接近16000個(gè)GPU的集群,而今天正在啟動(dòng)的集群則更接近100000個(gè)GPU。例如,Llama 3 405B使用了3080萬GPU小時(shí),而DeepSeek-V3看起來僅使用了280萬GPU小時(shí)。

  此外,DeepSeek-R1的訓(xùn)練成本還未公布。不過,從API定價(jià)可看出,定價(jià)是GPT o1的三十分之一。按照每輸出一百萬Token的價(jià)格來看,DeepSeek-R1為2.19美元,而GPT-o1為60美元??梢哉f,DeepSeek使用Open AI的一小部分的訓(xùn)練成本,卻達(dá)到了和Open類似的性能。據(jù)了解,R1在數(shù)學(xué)、編程等測(cè)試中的成績(jī)和o1相當(dāng)。

  這也引發(fā)了一種懷疑,要實(shí)現(xiàn)更好性能的AI大模型是否需要堆算力,堆投資才能達(dá)到?通過軟件架構(gòu)及算法的革新,可能也是一條通往更高性能AI大模型的思路。

  對(duì)于DeepSeek的火爆是否意味著利空AI算力,韋豪創(chuàng)芯合伙人王智告訴第一財(cái)經(jīng)記者:“短期內(nèi),在交易情緒的影響下,這起事件會(huì)利空AI算力。長(zhǎng)期來看,AI算力仍然必不可少,AI大模型的演進(jìn),需要更多新的架構(gòu)和算法,才能實(shí)現(xiàn)長(zhǎng)足進(jìn)步,這些需要AI算力的足夠支持。”他補(bǔ)充道:“這些算法和架構(gòu)還不得而知,但是必然會(huì)出現(xiàn)?!?/p>

你可能想看:

轉(zhuǎn)載請(qǐng)注明來自江蘇中陽智能廣告設(shè)備有限公司,本文標(biāo)題:《DeepSeek正打破算力為王行業(yè)規(guī)則》

每一天,每一秒,你所做的決定都會(huì)改變你的人生!

發(fā)表評(píng)論

快捷回復(fù):

評(píng)論列表 (暫無評(píng)論,11人圍觀)參與討論

還沒有評(píng)論,來說兩句吧...

Top
網(wǎng)站統(tǒng)計(jì)代碼