亚洲成AⅤ人片在线观看_亚洲性无码一区二区三区_无码综合天天久久综合网_四虎精品成人A在线观看

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

鳳凰院念凝 2025-02-20 最新資訊 7 次瀏覽 0個評論

近日,馬斯克與xAI團(tuán)隊,在直播中正式發(fā)布了最新版本Grok3。

此前,馬斯克將Grok-3描述為“地球上最聰明的AI”。他在X平臺上表示:“自己整個周末都在和團(tuán)隊打磨產(chǎn)品?!?/p>

然而據(jù)媒體報道,有人測試了最新的Beta版Grok3,并提出了那個經(jīng)典的用來刁難大模型的問題:“9.11與9.9哪個大?”遺憾的是,在不加任何定語以及標(biāo)注的情況下,號稱目前最聰明的Grok3,仍然無法正確回答這個問題。

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

值得一提的是,用同樣的問題詢問DeepSeek時,無論是否開啟深度思考(R1)模式,對方都給出了正確的答案:9.9大于9.11。

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

展開全文

“9.11和9.9哪個大”是AI領(lǐng)域的一個經(jīng)典問題。

艾倫研究機(jī)構(gòu)(Allen Institute)成員林禹臣曾在社交媒體平臺上發(fā)布的截圖顯示,ChatGPT-4o在回答中認(rèn)為13.11比13.8更大?!耙环矫鍭I越來越擅長做數(shù)學(xué)奧賽題,但另一方面常識依舊很難?!彼硎?。

隨后Scale AI的提示工程師萊利·古德賽德(Riley Goodside)基于此靈感變換了問法,拷問了可能是當(dāng)時最強(qiáng)的大模型ChatGPT-4o、谷歌Gemini Advanced以及Claude 3.5 Sonnet——9.11和9.9哪個更大?這幾家主流大模型通通答錯,他也成功將此話題傳播開來。

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

海外主流大模型答題。圖源:第一財經(jīng)

Grok-3發(fā)布會的背景板上,寫著"our mission is to understand universe(我們的使命是了解宇宙)"。馬斯克曾表示,xAI公司的目標(biāo)就是“了解宇宙”。

在一周前,馬斯克在直播中評論DeepSeek R1時,曾信心滿滿地表示“xAI即將推出更優(yōu)秀的AI模型”。從現(xiàn)場展示的數(shù)據(jù)來看,Grok3在數(shù)學(xué)、科學(xué)與編程的基準(zhǔn)測試上已經(jīng)超越了目前所有的主流模型,馬斯克甚至宣稱Grok 3未來將用于SpaceX火星任務(wù)計算,并預(yù)測“三年內(nèi)將實現(xiàn)諾貝爾獎級別突破”。

9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”

xAI在X平臺直播,馬斯克到場。圖源:中國新聞周刊

馬斯克強(qiáng)調(diào),Grok-3可以減少AI幻覺,方法是通過來回檢查數(shù)據(jù)并嘗試實現(xiàn)邏輯一致性。他還透露,訓(xùn)練Grok-3所使用的算力遠(yuǎn)多于此前的版本,并使用了大量合成數(shù)據(jù)。

不同于DeepSeek的算法優(yōu)化路徑(DeepSeek-V3用2048個H800 GPU,訓(xùn)練2788千小時),xAI透露,Grok-3的開發(fā)的得益于用8個月時間建成的Colossus超級計算機(jī),它由10萬個英偉達(dá)的H100 GPU驅(qū)動,為訓(xùn)練提供了2億個GPU小時,比Grok-2多十多倍。

此外,xAI宣布推出名為Deepsearch的Grok-3智能搜索引擎,名字和Deepseek頗有幾分相似。

來源:九派新聞綜合東方財經(jīng)、第一財經(jīng)、中國新聞周刊等

你可能想看:

轉(zhuǎn)載請注明來自江蘇中陽智能廣告設(shè)備有限公司,本文標(biāo)題:《9.11比9.9大?馬斯克聲稱“天下最聰明”的Grok3“翻車了”》

每一天,每一秒,你所做的決定都會改變你的人生!

發(fā)表評論

快捷回復(fù):

評論列表 (暫無評論,7人圍觀)參與討論

還沒有評論,來說兩句吧...

Top
網(wǎng)站統(tǒng)計代碼