亚洲成AⅤ人片在线观看_亚洲性无码一区二区三区_无码综合天天久久综合网_四虎精品成人A在线观看

剛剛！DeepSeek重大發(fā)布！梁文鋒參與共創(chuàng)！

您現(xiàn)在的位置：首頁最新資訊剛剛！DeepSeek重大發(fā)布！梁文鋒參與共創(chuàng)！

剛剛！DeepSeek重大發(fā)布！梁文鋒參與共創(chuàng)！

八荒新蕊 2025-02-19 最新資訊 8 次瀏覽 0個評論

2月18日，DeepSeek在海外社交平臺發(fā)布了一篇純技術論文報告，論文主要內(nèi)容是關于NSA（Natively Sparse Attention，原生稀疏注意力）。

據(jù)介紹，NSA專為長文本訓練與推理設計，能利用動態(tài)分層稀疏策略等方法，通過針對現(xiàn)代硬件的優(yōu)化設計，顯著優(yōu)化傳統(tǒng)AI模型在訓練和推理過程中的表現(xiàn)，特別是提升長上下文的推理能力，在保證性能的同時提升了推理速度，并有效降低了預訓練成本。

在這篇名為《原生稀疏注意力：硬件對齊且可原生訓練的稀疏注意力機制》（Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention）的論文署名中，DeepSeek創(chuàng)始人兼CEO梁文鋒也作為共創(chuàng)在列。

其他研究人員來自DeepSeek、北大和華盛頓大學，其中第一作者Jingyang Yuan（袁景陽）是在DeepSeek實習期間完成的這項研究。

值得一提的是，今日中午12點（太平洋時間17日晚8點），馬斯克旗下AI公司xAI發(fā)布了Grok 3及其精簡版Grok 3 mini。發(fā)布會采用視頻直播形式，觀看人數(shù)超過100萬人。

Grok 3是xAI對OpenAI的o3-mini和DeepSeek的R1等模型的回應，它可以分析圖像和回答問題，并為X上的許多功能提供支持。此前馬斯克在X上造勢稱，Grok 3是“地球上最聰明的人工智能”。

在此次直播中，馬斯克透露，實際上，到訓練進行到92天時，集群的規(guī)模已經(jīng)擴大到了20萬塊GPU。

編輯|金冥羽杜波

校對|陳柯名

封面圖片來源：視覺中國

每日經(jīng)濟新聞綜合自券商中國、財聯(lián)社、公開資料等

每日經(jīng)濟新聞

你可能想看：

中到大雪！西安剛剛發(fā)布！陜西發(fā)布重要天氣報告→

中國AI陣營又一重要突破！阿里巴巴Qwen2.5-Max正式發(fā)布，性能超過DeepSeek V3

廣州發(fā)布房票安置新政，全市新房都參與，利好樓市“回穩(wěn)”勢頭

-10 ℃！局部中雪！剛剛，煙臺發(fā)布重要天氣預報

剛剛宣布！重大資產(chǎn)重組，明日復牌！

德意志銀行發(fā)布報告：DeepSeek粉碎西方遏華幻想，中國正鯨吞世界

剛剛，利好來了！央行出手，重要數(shù)據(jù)將發(fā)布，證監(jiān)會最新發(fā)聲……影響一周市場的十大消息

DeepSeek開卷性價比 OpenAI發(fā)布更便宜的模型03-Mini

老胡剛剛問了DeepSeek一個很沉重的問題：它會不會被美國的聯(lián)合努力扼殺？

剛剛！俄羅斯，重大宣布！

轉載請注明來自江蘇中陽智能廣告設備有限公司，本文標題：《剛剛！DeepSeek重大發(fā)布！梁文鋒參與共創(chuàng)！》

八荒新蕊 69篇文章站點微博

每一天，每一秒，你所做的決定都會改變你的人生！

發(fā)表評論取消回復

評論列表（暫無評論，8人圍觀）參與討論

還沒有評論，來說兩句吧...

Top

網(wǎng)站統(tǒng)計代碼

<xmp id="8guay"><bdo id="8guay"></bdo></xmp>

<bdo id="8guay"><center id="8guay"></center></bdo>