來源:財(cái)聯(lián)社
面對DeepSeek、阿里巴巴、OpenAI、谷歌等全球AI巨頭近來“卷到飛起”的尖端大模型競爭,被視為歐洲AI“全村希望”的科創(chuàng)企業(yè)Mistral選擇了一條少有人走的路。
當(dāng)?shù)貢r(shí)間周一,總部位于巴黎的Mistral發(fā)布名為Mistral Saba的定制大模型,主要賣點(diǎn)是經(jīng)過專門訓(xùn)練的阿拉伯語交互能力。
官方介紹稱,Saba是一個(gè)240億參數(shù)的輕量級模型,能夠在本地單卡環(huán)境下部署,輸出響應(yīng)速度可以達(dá)到150個(gè)tokens/秒。這個(gè)模型使用特別挑選的中東和南亞數(shù)據(jù)集,所以與參數(shù)量多出幾倍的通用大模型相比,Mistral Saba在回應(yīng)阿拉伯語問題方面,能做到更高的準(zhǔn)確率和關(guān)聯(lián)性。
一般而言,參數(shù)量越小的模型,反應(yīng)速度越快;參數(shù)量更大的模型,回答準(zhǔn)確率會(huì)更高,但兩者之間并不是線性增長的關(guān)系。與同樣是240億參數(shù)的Mistral Small 3模型相比,Mistral Saba處理阿拉伯語問題的表現(xiàn)也明顯更優(yōu),顯示出專用數(shù)據(jù)集定制的優(yōu)勢。
作為一個(gè)有趣的現(xiàn)象,由于中東與南亞的文化交融,Saba對印度語也有很好的適配性,特別是源自南印度的語言,例如泰米爾語和馬拉雅拉姆語。
Mistral介紹稱,靈活、快捷的阿拉伯語專用大模型非常適合需要本地化語言響應(yīng)的場景,例如與阿拉伯語用戶進(jìn)行自然、實(shí)時(shí)的對話。通過微調(diào),Mistral Saba還能成為能源、金融、醫(yī)療等領(lǐng)域的專家,提供在阿拉伯語言和文化背景下的專業(yè)見解。
這款模型可以通過Mistral的API訪問,對數(shù)據(jù)敏感的金融、醫(yī)療等行業(yè)也可以在本地部署。
為吸引中東金主開發(fā)?
作為歐洲屈指可數(shù)的人工智能基礎(chǔ)模型開發(fā)企業(yè),Mistral的投資人里有不少是美國資本,例如微軟、a16z、General Catalyst等。公司上一輪融資是在去年6月,金額為6億歐元,估值達(dá)到58億歐元。
今年早些時(shí)候也有報(bào)道稱,Mistral正在尋求新一輪融資,同時(shí)也在考慮未來的IPO。
同時(shí)由于地緣政治的變化,這家歐洲AI企業(yè)可能會(huì)更加歡迎來自中東的資本。根據(jù)統(tǒng)計(jì),目前全球有約4億人是阿拉伯語母語用戶,其中不乏沙特、阿聯(lián)酋、卡塔爾這些在國際投資市場高度活躍的超級金主。
推出阿拉伯語專用模型,也進(jìn)一步展現(xiàn)出公司試圖與現(xiàn)有中美AI巨頭錯(cuò)位競爭的意圖。Mistral也表示,會(huì)把注意力轉(zhuǎn)向開發(fā)更多地區(qū)語言的大模型。
這項(xiàng)戰(zhàn)略也存在不確定性——Mistral能否靠這種打法占據(jù)獨(dú)特的生態(tài)位置,將取決于開發(fā)一款使用阿拉伯語(或其他語言)數(shù)據(jù)集訓(xùn)練的大模型到底有多么困難。
“華裔天才”亞歷山大·王:DeepSeek的AI大模型發(fā)布可能會(huì)“改變一切”
AI眼鏡又有新催化?多家公司發(fā)布新產(chǎn)品 機(jī)構(gòu)建議關(guān)注這些標(biāo)的
中國電信正式發(fā)布“天翼”AI手機(jī):內(nèi)置3B星辰大模型
風(fēng)投:2025年美股科技IPO將翻番 AI公司首次沖刺IPO
讓科學(xué)家們興奮不已?中國國產(chǎn)AI大模型受全球追捧
OpenAI連續(xù)12場直播來襲!一大堆東西要發(fā)布!AI應(yīng)用再迎催化,信創(chuàng)ETF基金(562030)盤中上探1.63%
業(yè)績+題材雙驅(qū)動(dòng),AI“三件套”集體上揚(yáng)!創(chuàng)業(yè)板人工智能ETF華寶(159363)放量勁漲2.41%,“智取”四連陽
傳公司與xAI接近達(dá)成50億美元AI服務(wù)器采購協(xié)議 戴爾科技漲近5%
還沒有評論,來說兩句吧...