量化巨頭放大招！大模型性價(jià)比之王來了

努力啊大靈安 2024-12-28 技術(shù)資訊 12 次瀏覽 0個(gè)評論

　　12月26日晚，杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司（簡稱“深度求索”）宣布，全新系列模型 DeepSeek-V3 首個(gè)版本上線并同步開源，API服務(wù)已同步更新，接口配置無需改動(dòng)。

　　公開信息顯示，深度求索成立于2023年7月17日，由知名量化資管巨頭幻方量化創(chuàng)立，幻方量化創(chuàng)始人梁文峰在量化投資和高性能計(jì)算領(lǐng)域具有深厚的背景和豐富的經(jīng)驗(yàn)。

　　深度求索表示，DeepSeek-V3在知識類任務(wù)（MMLU， MMLU-Pro， GPQA， SimpleQA）上的水平相比前代 DeepSeek-V2.5顯著提升，接近當(dāng)前表現(xiàn)最好的模型Anthropic公司于10月發(fā)布的Claude-3.5-Sonnet-1022。

　　在美國數(shù)學(xué)競賽（AIME 2024， MATH）和全國高中數(shù)學(xué)聯(lián)賽（CNMO 2024）上，DeepSeek-V3大幅超過了其他所有開源閉源模型。另外，在生成速度上，DeepSeek-V3的生成吐字速度從20TPS（Transactions Per Second每秒完成的事務(wù)數(shù)量）大幅提高至60TPS，相比V2.5模型實(shí)現(xiàn)了3倍的提升，能夠帶來更加流暢的使用體驗(yàn)。?

　　據(jù)澎湃新聞報(bào)道，Meta AI研究科學(xué)家田淵棟對DeepSeek-V3各個(gè)方向上的進(jìn)展都表示贊賞，稱“這是一項(xiàng)了不起的工作”。

　　據(jù)官方技術(shù)論文披露，DeepSeek-V3模型的總訓(xùn)練成本為557.6萬美元，而GPT-4o等模型的訓(xùn)練成本約為1億美元。深度求索表示，“這是一個(gè)全新的開始?！?/p>

　　據(jù)財(cái)聯(lián)社報(bào)道，OpenAI的聯(lián)合創(chuàng)始人之一Andrej Karpathy也發(fā)文稱贊道：作為參考，要達(dá)到這種級別的能力，通常需要約1.6萬個(gè)GPU的計(jì)算集群。不僅如此，當(dāng)前業(yè)界正在部署的集群規(guī)模甚至已經(jīng)達(dá)到了10萬個(gè)GPU。比如，Llama 3 405B消耗了3080萬GPU小時(shí)，而看起來更強(qiáng)大的DeepSeek-V3卻只用了280萬GPU小時(shí)。

　　性能更強(qiáng)、速度更快的DeepSeek-V3上線，幻方量化給出的定價(jià)是多少呢？

　　深度求索表示，“我們的模型 API 服務(wù)定價(jià)也將調(diào)整為每百萬輸入 tokens 0.5 元（緩存命中）/ 2 元（緩存未命中），每百萬輸出 tokens 8 元?！睋?jù)財(cái)聯(lián)社報(bào)道，加總成本是10元人民幣。

　　上一代模型Deepseek-V2.5的價(jià)格是，輸入：0.14美元/百萬Token，輸出為：0.28美元/百萬Token，加總成本是0.14+0.28=0.42美元，大約3元人民幣。

　　這里的Token是大模型在處理數(shù)據(jù)時(shí)的最小單元，一般而言，100萬Token相當(dāng)于70萬-100萬英文單詞，或接近100萬中文漢字。列夫?托爾斯泰的名著《戰(zhàn)爭與和平》的英文版大約是大約有1200-1500頁、58萬英文單詞，把它翻譯為中文，大約有100-130萬字，讓DeepSeek-V3讀完全文只需要2元左右。

　　盡管提價(jià)，但與同類型模型相比，DeepSeek-V3依舊極具性價(jià)比。比如OpenAI的GPT 4o定價(jià)相當(dāng)高，輸入：5美元/百萬Token，輸出：15美元/百萬Token，加總成本是20美元，約合人民幣140元。

　　本文綜合DeepSeek微信公眾號、澎湃新聞、財(cái)聯(lián)社

　?。暶鳎何恼聝?nèi)容僅供參考，不構(gòu)成投資建議。投資者據(jù)此操作，風(fēng)險(xiǎn)自擔(dān)。）

你可能想看：

DeepSeek驚艷全球，美國大模型兩巨頭齊發(fā)聲：并不比我們先進(jìn)

大模型公司估值暴漲放大利益紛爭

“華裔天才”亞歷山大·王：DeepSeek的AI大模型發(fā)布可能會“改變一切”

吳永飛：人工智能大模型和量子科技在商業(yè)銀行的應(yīng)用研究

DeepSeek，為何出自量化基金公司？也交過學(xué)費(fèi)，“還需冷靜看待”

1.6萬億元市值芯片巨頭，計(jì)劃全球范圍內(nèi)裁員，過去一個(gè)月股價(jià)跌近20%！

英國保險(xiǎn)巨頭英杰華37億英鎊收購Direct Line

被國產(chǎn)大模型DeepSeek超越，ChatGPT表示：排名變化也許是暫時(shí)的