中國AI陣營又一重要突破！阿里巴巴Qwen2.5-Max正式發(fā)布，性能超過DeepSeek V3

潛龍昆卉 2025-01-30 最新資訊 11 次瀏覽 0個評論

據通義千問Qwen微信公眾號消息，1月29日凌晨，阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max正式上線。

據悉，Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果，預訓練數據超過20萬億tokens。Qwen2.5-Max在知識（測試大學水平知識的MMLU-Pro）、編程（LiveCodeBench）、全面評估綜合能力的（LiveBench）以及人類偏好對齊（Arena-Hard）等主流權威基準測試上，展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩，甚至領先的性能。

值得一提的是，Qwen2.5-Max的發(fā)布，是繼DeepSeek之后中國AI陣營在高性能、低成本技術路線上的又一重要突破。

通義團隊分別對Qwen2.5-Max的指令（Instruct）模型版本和基座（base）模型版本性能進行了評估測試。指令模型是所有人可直接對話體驗到的模型版本，在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準測試中，Qwen2.5-Max比肩Claude-3.5-Sonnet，并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。

展開全文

在基座模型的對比中，由于無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型，阿里云將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B，以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。對比結果如下圖所示：

Qwen2.5-Max的基座模型在大多數基準測試中都展現(xiàn)出了顯著的優(yōu)勢。

市場人士分析稱，此前過度聚焦DeepSeek，卻忽視了包括阿里通義在內的中國AI整體性追趕。行業(yè)媒體《信息平權》表示，若阿里Qwen-2.5-max這次的確性能超過V3，可以對其RL推理模型給予更大期待。

農歷除夕夜，阿里巴巴股價在收盤前出現(xiàn)顯著異動——從漲幅1%快速拉升至6.71%，收盤報96.03美元，總市值2284億美元。

據悉，今年阿里云作為總臺春晚云計算AI獨家合作伙伴，首次亮相中央廣播電視總臺蛇年春晚，為春晚直播提供了強大的全球云基礎設施和通義大模型AI技術支持。

今年春晚主舞臺部署了阿里云通義大模型AI技術來呈現(xiàn)科幻電影中的“子彈時間”經典畫面。該系統(tǒng)以“天空環(huán)繞視角”對甄子丹領銜的《筆走龍蛇》武術表演進行云上多視角拍攝，為觀眾呈現(xiàn)“空中環(huán)繞、時空凝結”等創(chuàng)新觀看體驗。技術人員采用先進的AI技術對畫面進行3D模型重建，將拍攝畫面融合渲染，形成一個完整立體的3D視頻圖像，為觀眾呈現(xiàn)物理攝像機無法拍攝的影像。

阿里云通義AIGC技術成果也首次大規(guī)模應用在節(jié)目畫面中。在《在歲月里的花》節(jié)目尾聲，阿里云通義萬相將舞臺畫面瞬間轉化靜態(tài)油畫，為觀眾帶來一場虛實交融的視覺盛宴。在后續(xù)節(jié)目中，阿里云大模型AI技術還將為舞臺設計提供風格遷移、參考圖生成、風格化處理等技術能力，為節(jié)目創(chuàng)新提供技術支持。

來源：讀創(chuàng)財經綜合

你可能想看：

阿里巴巴續(xù)漲2.9% 發(fā)布新版通義千問Qwen 2.5-Max AI模型

中國電信正式發(fā)布“天翼”AI手機：內置3B星辰大模型

拉夫羅夫：中國DeepSeek AI模型超越了美國

阿里巴巴高開近5% 阿里云百煉qwen-max系列模型官宣降價

官宣！052D型Pro Max版正式亮相，中國海軍下一代驅逐艦何時亮相？

科創(chuàng)板又一重要核心指數入局南方基金等首批科創(chuàng)綜指ETF正式獲批

中國模型崛起！阿里Qwen2.5-Max數學及編程能力全球第一

“華裔天才”亞歷山大·王：DeepSeek的AI大模型發(fā)布可能會“改變一切”

不止 DeepSeek，中國"AI三叉戟"打破硅谷神話

中國大模型掀起滔天巨浪！華爾街頂級風投：“DeepSeek是AI的斯普特尼克時刻”