界面新聞記者 | 宋佳楠
2月26日,明星大模型公司DeepSeek宣布即日起在北京時間每日00:30至08:30的夜間空閑時段,大幅下調(diào)API調(diào)用價格,其中DeepSeek-V3降至原價的50%,DeepSeek-R1更是低至25%,降幅最高達(dá)75%。該公司稱,這一舉措旨在鼓勵用戶充分利用夜間時段,享受更經(jīng)濟(jì)、更流暢的服務(wù)體驗。
這并非DeepSeek首次調(diào)整API價格。去年8月,DeepSeek曾將API輸入費用下調(diào)至0.1元/百萬tokens,輸出費用為2元/百萬tokens,引發(fā)行業(yè)震動。
然而在2月初,由于服務(wù)器資源緊張,DeepSeek一度暫停API服務(wù)充值,直至2月25日才重新開放,并調(diào)整了DeepSeek-chat模型的調(diào)用價格,為每百萬輸入tokens 2元,每百萬輸出tokens 8元。
如果與豆包和通義千問的調(diào)用價格進(jìn)行對比,會發(fā)現(xiàn)正常時段下,豆包大模型的價格相對較低,通義千問不同模型價格有差異,而DeepSeek在標(biāo)準(zhǔn)時段價格相對較高,但在優(yōu)惠時段價格有較大幅度下降,具有一定競爭力。
以豆包通用模型pro-32k為例,后付費模式下,推理輸入0.0008元/千Tokens、推理輸出0.002元/千Tokens,模型推理的綜合價格為0.001元/千Tokens;預(yù)付費模式下,10K TPM的包月價格為2000元,平均價格為0.0046元/千Tokens。
通義千問的qwen1.5-110b-chat模型,輸入價格為0.007元/千Tokens,輸出價格為0.014元/千Tokens;qwen-72b-chat輸入和輸出價格均為0.02元/千Tokens;Qwen-VL-Plus輸入價格為0.0015元/千Tokens;Qwen-VL-Max輸入價格為0.003元/千Tokens。
參考之前DeepSeek的調(diào)用價格,優(yōu)惠時段內(nèi)DeepSeek-V3百萬Tokens輸入(緩存命中)為0.25元,百萬Tokens輸入(緩存未命中)為1元,百萬Tokens輸出為4元;DeepSeek-R1百萬Tokens輸入(緩存命中)為0.25元,百萬Tokens輸入(緩存未命中)為1元,百萬Tokens輸出為4元。
DeepSeek的降價策略有助于進(jìn)一步降低中小企業(yè)和個人開發(fā)者的使用門檻,推動AI技術(shù)的普及。此前,DeepSeek的降價曾引發(fā)行業(yè)連鎖反應(yīng),包括阿里云、百度、騰訊等頭部企業(yè)紛紛跟進(jìn),宣布各自的降價措施。此次夜間優(yōu)惠是否會再次掀起價格戰(zhàn),還要看其他大模型公司的進(jìn)一步動作。
DeepSeek推出優(yōu)惠措施之時,正值其“開源周”。首個開源的代碼庫為針對Hopper GPU優(yōu)化的FlashMLA,第二日是首個用于MoE模型訓(xùn)練和推理的開源EP通信庫DeepEP,26日則開源了一個支持密集和MoE GEMM的FP8 GEMM 庫,為V3/R1訓(xùn)練和推理提供支持。
另據(jù)媒體報道,DeepSeek計劃提前發(fā)布新一代AI模型R2,預(yù)計在編程能力、多語言推理等方面有所提升,還可能在圖像生成、語音識別和合成等多模態(tài)方面有所升級。R2模型的發(fā)布或進(jìn)一步鞏固DeepSeek在AI領(lǐng)域的地位,并推動新一輪的技術(shù)革新。
字節(jié)CEO反思DeepSeek:跟進(jìn)速度不夠,今年要追求智能上限
DeepSeek,“卷”瘋了!OpenAI、阿里云官宣!上新、降價、免費試用!
火山引擎譚待回應(yīng)沈抖:技術(shù)驅(qū)動大模型降價,行業(yè)應(yīng)像DeepSeek一樣聚焦基本功
谷歌子公司CEO:DeepSeek堪稱中國最好成果,但外界炒作過頭
醫(yī)生自嘲“天塌了”!患者查DeepSeek后“質(zhì)疑”治療方案,而且它對了!專家:短時間內(nèi)無法替代醫(yī)生
DeepSeek沖擊全球算力!納指跌超3%,英偉達(dá)狂泄12%,美元、美債收益率急跌
OpenAI宣稱DeepSeek違規(guī)“蒸餾”,但沒有給出證據(jù)
還沒有評論,來說兩句吧...