據通義千問Qwen微信公眾號消息,1月29日凌晨,阿里云通義千問超大規(guī)模的MoE模型Qwen2.5-Max正式上線。
據悉,Qwen2.5-Max模型是阿里云通義團隊對MoE模型的最新成果,預訓練數據超過20萬億tokens。Qwen2.5-Max在知識(測試大學水平知識的MMLU-Pro)、編程(LiveCodeBench)、全面評估綜合能力的(LiveBench)以及人類偏好對齊(Arena-Hard)等主流權威基準測試上,展現(xiàn)出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的性能。
值得一提的是,Qwen2.5-Max的發(fā)布,是繼DeepSeek之后中國AI陣營在高性能、低成本技術路線上的又一重要突破。
通義團隊分別對Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能進行了評估測試。指令模型是所有人可直接對話體驗到的模型版本,在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond及MMLU-Pro等基準測試中,Qwen2.5-Max比肩Claude-3.5-Sonnet,并幾乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B。
在基座模型的對比中,由于無法訪問 GPT-4o 和 Claude-3.5-Sonnet 等閉源模型的基座模型,阿里云將 Qwen2.5-Max 與目前領先的開源 MoE 模型 DeepSeek V3、最大的開源稠密模型 Llama-3.1-405B,以及同樣位列開源稠密模型前列的 Qwen2.5-72B 進行了對比。對比結果如下圖所示:
Qwen2.5-Max的基座模型在大多數基準測試中都展現(xiàn)出了顯著的優(yōu)勢。
市場人士分析稱,此前過度聚焦DeepSeek,卻忽視了包括阿里通義在內的中國AI整體性追趕。行業(yè)媒體《信息平權》表示,若阿里Qwen-2.5-max這次的確性能超過V3,可以對其RL推理模型給予更大期待。
農歷除夕夜,阿里巴巴股價在收盤前出現(xiàn)顯著異動——從漲幅1%快速拉升至6.71%,收盤報96.03美元,總市值2284億美元。
據悉,今年阿里云作為總臺春晚云計算AI獨家合作伙伴,首次亮相中央廣播電視總臺蛇年春晚,為春晚直播提供了強大的全球云基礎設施和通義大模型AI技術支持。
今年春晚主舞臺部署了阿里云通義大模型AI技術來呈現(xiàn)科幻電影中的“子彈時間”經典畫面。該系統(tǒng)以“天空環(huán)繞視角”對甄子丹領銜的《筆走龍蛇》武術表演進行云上多視角拍攝,為觀眾呈現(xiàn)“空中環(huán)繞、時空凝結”等創(chuàng)新觀看體驗。技術人員采用先進的AI技術對畫面進行3D模型重建,將拍攝畫面融合渲染,形成一個完整立體的3D視頻圖像,為觀眾呈現(xiàn)物理攝像機無法拍攝的影像。
阿里云通義AIGC技術成果也首次大規(guī)模應用在節(jié)目畫面中。在《在歲月里的花》節(jié)目尾聲,阿里云通義萬相將舞臺畫面瞬間轉化靜態(tài)油畫,為觀眾帶來一場虛實交融的視覺盛宴。在后續(xù)節(jié)目中,阿里云大模型AI技術還將為舞臺設計提供風格遷移、參考圖生成、風格化處理等技術能力,為節(jié)目創(chuàng)新提供技術支持。
來源:讀創(chuàng)財經綜合
還沒有評論,來說兩句吧...