專(zhuān)題:DeepSeek為何能震動(dòng)全球AI圈
當(dāng)?shù)貢r(shí)間1月31日,OpenAI宣布推出新一代推理模型o3系列的mini版本。據(jù)OpenAI介紹,o3-mini是其最具成本效益的推理模型,在科學(xué)、數(shù)學(xué)、編程等領(lǐng)域的能力較強(qiáng),同時(shí)兼具o1-mini的低成本和低延遲特點(diǎn),o3-mini可與聯(lián)網(wǎng)搜索功能搭配使用,不過(guò)o3-mini還不支持視覺(jué)功能。
“o3-mini的能力可設(shè)置為低等、中等、高等。能力設(shè)置為中等的o3-mini與o1在數(shù)學(xué)、編程和科學(xué)方面的表現(xiàn)相當(dāng),但反應(yīng)速度更快。專(zhuān)家測(cè)試人員的評(píng)估表明,o3-mini給出的答案比o1-mini更準(zhǔn)確且清晰。測(cè)試者觀察到,在有關(guān)現(xiàn)實(shí)世界的難題上,o3-mini的主要錯(cuò)誤減少了39%?!監(jiān)penAI表示。
從能力上看,作為mini版本,o3-mini在一些測(cè)試中的表現(xiàn)略超o1。在數(shù)學(xué)測(cè)試AIME 2024、博士水平測(cè)試GPQA Diamond、競(jìng)賽編碼測(cè)試Codeforces、軟件工程測(cè)試sw -bench中,o3-mini得分分別為87.3、79.7、2130、49.3,高于o1的得分83.3、78、1891、48.9。
此外,o3-mini在編碼測(cè)試LiveBench中表現(xiàn)優(yōu)于o1,在一般知識(shí)測(cè)試General knowledge中表現(xiàn)優(yōu)于o1-mini。從速度上看,o3-mini在A/B測(cè)試(一種對(duì)比測(cè)試)中的平均響應(yīng)時(shí)間為7.7秒,響應(yīng)速度比o1-mini快24%。
此前國(guó)內(nèi)大模型公司DeepSeek發(fā)布DeepSeek-R1,并稱(chēng)該模型性能對(duì)標(biāo)OpenAI o1正式版,該模型不僅開(kāi)源,API(接口)價(jià)格還明顯低于o1。DeepSeek-R1輸入(緩存命中)、輸出定價(jià)分別為每百萬(wàn)tokens1元、6元,低于o1的55元、438元?;蚴瞧扔趬毫Γ琌penAI CEO山姆·奧爾特曼(Sam Altman)在當(dāng)?shù)貢r(shí)間1月23日宣布,OpenAI將推出新一代o3系列的o3-mini版本,且ChatGPT免費(fèi)用戶(hù)將能使用o3-mini。
此次OpenAI正式推出o3-mini后,OpenAI再次強(qiáng)調(diào),ChatGPT是首次向免費(fèi)用戶(hù)提供推理模型,用戶(hù)可以在消息編輯器中選擇“Reason”來(lái)嘗試使用OpenAI 3-mini。不過(guò),付費(fèi)用戶(hù)的使用范圍更廣,可以使用o3-mini的高等能力。ChatGPT Plus和Team用戶(hù)的流量限制從01 -mini的每日50條增加到03 -mini的每日150條,Pro用戶(hù)則可以無(wú)限制地使用o3-mini。
OpenAI也在提供越來(lái)越低的API調(diào)用價(jià)格,據(jù)其介紹,自GPT-4推出以來(lái),每個(gè)token的定價(jià)下降了95%。o3-mini輸入(緩存命中)、輸出每百萬(wàn)tokens的定價(jià)為0.55美元、4.4美元,仍高于DeepSeek-R1。
雖然DeepSeek并未公開(kāi)DeepSeek-R1的訓(xùn)練成本,但此前DeepSeek公開(kāi)了另一個(gè)模型DeepSeek-v3的訓(xùn)練預(yù)算為“2048個(gè)GPU、2個(gè)月、近600萬(wàn)美元”,外界認(rèn)為DeepSeek-R1在能力對(duì)標(biāo)o1的同時(shí),訓(xùn)練成本可能也偏低,這可能意味著DeepSeek團(tuán)隊(duì)的技術(shù)水平較高。隨著DeepSeek近期受到關(guān)注,OpenAI客觀上也承受了一定壓力。
OpenAI正在采取措施維持自身的優(yōu)勢(shì),除了推出o3-mini“應(yīng)戰(zhàn)”,近日還有消息稱(chēng),OpenAI正在就新一輪融資進(jìn)行談判,擬籌資金額高達(dá) 400 億美元,該輪融資將由軟銀集團(tuán)牽頭,使OpenAI的估值達(dá)到3000億美元,不過(guò)該傳言尚未得到OpenAI證實(shí)。
(本文來(lái)自第一財(cái)經(jīng))
最新!OpenAI上架推理模型o3-mini,首次向免費(fèi)用戶(hù)開(kāi)放!AIME測(cè)試中,o3-mini最高準(zhǔn)確率達(dá)87.3%
受DeepSeek影響?OpenAI上線O3 Mini,推理模型首次免費(fèi)
DeepSeek刺激太大!Altman“認(rèn)錯(cuò)”,稱(chēng)考慮OpenAI開(kāi)源,上線O3 Mini,推理模型首次免費(fèi)
外盤(pán)頭條:OpenAI發(fā)布模擬推理模型o3 特朗普計(jì)劃繼續(xù)向烏克蘭提供軍事援助 德國(guó)大眾勞資雙方達(dá)成協(xié)議
OpenAI“o3 mini”推理AI模型完成!將于幾周內(nèi)面世
DeepSeek開(kāi)卷性價(jià)比 OpenAI發(fā)布更便宜的模型03-Mini
隔夜要聞:美股收跌 納指金龍大漲逾8.5% 英偉達(dá)涉嫌違反反壟斷法 OpenAI發(fā)布視頻模型Sora 蘋(píng)果創(chuàng)歷史新高
視頻丨OpenAI推出性價(jià)比模型o3-mini對(duì)戰(zhàn)DeepSeek-R1,奧特曼反思開(kāi)源問(wèn)題
韓國(guó)法院首次發(fā)布針對(duì)現(xiàn)總統(tǒng)逮捕令,尹錫悅是否被捕7天內(nèi)見(jiàn)分曉?
2024年澳門(mén)正版資料免費(fèi)大全,使用動(dòng)態(tài)解析提高用戶(hù)體驗(yàn)的方法
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...