春節(jié)期間,中國國產(chǎn)大模型DeepSeek持續(xù)引發(fā)熱議,意外地成為假期最熱門的科技話題。
1月20日,中國大模型公司深度求索正式發(fā)布推理大模型DeepSeek-R1,一經(jīng)推出就震撼了業(yè)界。1月27日,DeepSeek應(yīng)用登頂蘋果中國區(qū)和美國區(qū)應(yīng)用商店免費App下載排行榜。1月31日,英偉達(dá)、亞馬遜和微軟這三家美國科技巨頭,在同一天宣布接入DeepSeek-R1。
DeepSeek的成功,是AI的一次破圈。這一次DeepSeek引發(fā)的討論特別熱烈,一方面是因為它達(dá)到了國際先進(jìn)水平;另一方面,是因為它的可用程度、完成度超過了一定的水平,再加上熱烈的討論,引起了很多普通人的注意,也進(jìn)入了他們的生活和工作之中。
DeepSeek體現(xiàn)了國產(chǎn)大模型的能力,甚至有可能追趕、反超世界先進(jìn)水平。與此同時,DeepSeek大幅降低了AI模型的訓(xùn)練成本,其R1模型的訓(xùn)練成本僅為557.6萬美元。相比之下,OpenAI的GPT模型訓(xùn)練成本高達(dá)1億美元。
很多人對DeepSeek大模型表達(dá)了高度贊賞。面對如潮好評,深度求索(DeepSeek)創(chuàng)始人梁文鋒謙虛地回應(yīng):“我們不過是站在開源社區(qū)巨人們的肩膀上,給國產(chǎn)大模型這棟大廈多擰了幾顆螺絲。”
梁文鋒所說的這個“巨人”——開源社區(qū)(Open Source),全稱為開放源代碼,就是讓用戶利用源代碼,在其基礎(chǔ)上修改和學(xué)習(xí)。
開源,有世界大同的美好愿望,但毋庸諱言也有利益動機(jī)。開源策略可以吸引全球開發(fā)者和研究者的關(guān)注,形成一個強大的技術(shù)社區(qū)。這個技術(shù)社區(qū)具有敏捷性與協(xié)作優(yōu)勢,能形成“技術(shù)共享-生態(tài)繁榮-反哺創(chuàng)新”的正循環(huán)。正因為開源有這個優(yōu)勢,在競爭中處于弱勢的一方就可能選擇開源的方式,去扭轉(zhuǎn)自己的競爭弱勢。計算機(jī)行業(yè)的競爭,往往都是一個封閉的生態(tài),對應(yīng)著一個開放的、開源的生態(tài)。
開源如今已經(jīng)是AI迅猛發(fā)展的助推劑。Meta首席人工智能科學(xué)家、2018年圖靈獎得主楊立昆評價DeepSeek時就說:“與其說是中國在人工智能上超越美國,正確的看法應(yīng)該是開源代碼正在超越私有模式。DeepSeek從開放研究和開放源碼中受益(例如來自Meta的PyTorch和LLaMA)?!?/p>
實際上,AI大模型開源,最重要的推動力之一正是Meta。Meta開源的項目,從大模型LLaMA到圖像分割模型Segment-Anything,覆蓋了各種模態(tài)、各種場景。Meta的LLaMA是最強大的開源大模型之一。2023年7月,Meta發(fā)布的LLaMA2,開源協(xié)議從“僅研究可用”轉(zhuǎn)向“免費可商用”,雖造就了一大批“套殼大模型”,但也幫助Meta改變了大模型競爭OpenAl獨占鰲頭的格局。這當(dāng)中,最強大的正是DeepSeek。
DeepSeek驗證開源模型可接近閉源性能,又會反過來使得Meta等巨頭加碼開源AI。最近,Meta又開源了多個AI項目,包括圖像分割模型SAM 2.1、多模態(tài)語言模型Spirit LM、自學(xué)評估器和改進(jìn)的跨語言句子編碼器Mexma等,提升了AI在圖像處理和語音識別領(lǐng)域的能力。
雖然開源促進(jìn)了AI的迅猛發(fā)展,但應(yīng)該看到的是,開源的本質(zhì)是用開放促效率,而在當(dāng)今世界,效率在很多時候已經(jīng)不再是第一位的考慮。AI技術(shù)是由軟硬兩方面構(gòu)成的,在硬件逐漸走向封閉的同時,一個可能的隱憂則是,軟件的開源是否也會走向封閉。這就要求中國AI界提前做好應(yīng)對之策,用創(chuàng)新、開放去回應(yīng)封閉,正如DeepSeek也開源了自己的大模型。 □ 劉遠(yuǎn)舉
最好的新質(zhì)生產(chǎn)力是什么?王均豪:站在喜馬拉雅山頂獨孤求敗,找不到競爭對手
這個春節(jié),中方精銳盡出,全力阻擊針對Deepseek“網(wǎng)絡(luò)生化危機(jī)”
Altman因DeepSeek“認(rèn)錯”:在開源上OpenAI站在了歷史的錯誤一方
精準(zhǔn)三肖三期內(nèi)必中是什么,內(nèi)部資料的版本控制和追蹤
澳門王中王100%期期中,企業(yè)核心關(guān)注點是什么
2024澳門天天開好彩大全免費,理解落實的關(guān)鍵因素是什么
精準(zhǔn)三肖三期內(nèi)必中是什么,解析實施方案的最佳實踐
張仲麟:如果這個推斷成立,韓國空難很可能指向一個可怕的結(jié)論
還沒有評論,來說兩句吧...