春節(jié)假期期間,DeepSeek的爆火如“平地一聲雷”。這家于2023年成立的人工智能基礎(chǔ)技術(shù)研究企業(yè),在今年1月20日正式開(kāi)源其R1推理模型,該模型在數(shù)學(xué)、代碼、自然語(yǔ)言推理等任務(wù)上,性能比肩OpenAI-o1正式版,且開(kāi)發(fā)成本僅為600萬(wàn)美元,僅相當(dāng)于OpenAI-o1 模型開(kāi)發(fā)成本的1.2% 。DeepSeek于2024年12月26日宣布上線并同步開(kāi)源的DeepSeek-V3模型,以1/11的算力、僅2000個(gè)GPU芯片訓(xùn)練出性能超越GPT-4o的大模型,且訓(xùn)練成本僅相當(dāng)于GPT-4o的5.6%。
業(yè)內(nèi)人士表示,DeepSeek此舉開(kāi)拓出高性能模型訓(xùn)練的新思路,其以低成本實(shí)現(xiàn)大模型訓(xùn)練,也引發(fā)了業(yè)界對(duì)海外AI企業(yè)耗費(fèi)巨量算力資源訓(xùn)練模型必要性的懷疑。近日,多家中外算力芯片企業(yè)紛紛發(fā)布適配DeepSeek模型的消息。
龍芯中科:宣布實(shí)現(xiàn)DeepSeek大模型本地化部署
DeepSeek成功部署于誠(chéng)邁信創(chuàng)電腦
2月7日,龍芯中科宣布,搭載龍芯3號(hào)CPU的設(shè)備成功啟動(dòng)運(yùn)行DeepSeek R1 7B模型,實(shí)現(xiàn)本地化部署,可為廣大用戶提供更快、更強(qiáng)、更省的訓(xùn)推體驗(yàn)。日前,龍芯聯(lián)合太初元碁等產(chǎn)業(yè)伙伴,僅用2小時(shí)即在太初T100加速卡上完成DeepSeek-R1系列模型的適配工作,快速上線包含DeepSeek-R1-Distill-Qwen-7B在內(nèi)的多款大模型服務(wù)。此外,采用龍芯3A6000處理器的誠(chéng)邁信創(chuàng)電腦和望龍電腦已實(shí)現(xiàn)本地部署DeepSeek,部署后無(wú)需依賴云端服務(wù)器,避免了因網(wǎng)絡(luò)波動(dòng)或服務(wù)器過(guò)載導(dǎo)致的服務(wù)中斷,可高效完成文檔處理、數(shù)據(jù)分析、內(nèi)容創(chuàng)作等工作。目前,龍芯正積極攜手太初元碁、寒武紀(jì)、天數(shù)智芯、算能科技、openEuler等合作伙伴,全力打造DeepSeek系列模型的多形態(tài)推理平臺(tái),助力企業(yè)用戶實(shí)現(xiàn)智能化轉(zhuǎn)型。
燧原科技:實(shí)現(xiàn)全國(guó)各地智算中心DeepSeek的全量推理服務(wù)部署
2月6日,燧原科技宣布,完成了對(duì)DeepSeek全量模型的高效適配,包括DeepSeek-R1/V3 671B原生模型、DeepSeek-R1-Distill-Qwen-1.5B/7B/14B/32B、DeepSeek R1-Distill-Llama-8B/70B等蒸餾模型。截至目前,DeepSeek的全量模型已在慶陽(yáng)、無(wú)錫、成都等智算中心完成了數(shù)萬(wàn)卡的快速部署。
華為:支持DeepSeek系列模型“一鍵獲取”、“開(kāi)箱即用”
2月5日,華為技術(shù)有限公司宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上線昇騰社區(qū),支持一鍵獲取DeepSeek系列模型,支持昇騰硬件平臺(tái)上開(kāi)箱即用。
DeepSeek系列模型上線昇騰社區(qū)
海光信息:DCU適配三大模型,相關(guān)模型已正式上線
2月4日,海光信息宣布,其技術(shù)團(tuán)隊(duì)成功完成DeepSeek V3和R1模型與海光DCU(深度計(jì)算單元)的適配,并正式上線。2月5日,海光信息宣布其技術(shù)團(tuán)隊(duì)成功完成DeepSeek-Janus-Pro多模態(tài)大模型與海光DCU的適配優(yōu)化,并正式上線。因DCU采用了GPGPU通用加速計(jì)算架構(gòu),DeepSeek模型可直接在DCU上運(yùn)行,并不需要大量適配工作,技術(shù)團(tuán)隊(duì)的主要工作是進(jìn)行精度驗(yàn)證和持續(xù)的性能優(yōu)化。本次適配優(yōu)化的DeepSeek-Janus-Pro模型具備跨模態(tài)理解與生成能力,專注于結(jié)合視覺(jué)與語(yǔ)言理解能力,旨在處理更復(fù)雜的跨模態(tài)任務(wù)。
Janus-Pro生成示例(圖源:海光信息)
天數(shù)智芯:一天完成DeepSeekR1適配
2月4日,天數(shù)智芯與 Gitee AI 聯(lián)合發(fā)布消息,成功完成了與 DeepSeek R1 的適配工作,并且已正式上線多款大模型服務(wù),其中包括 DeepSeek R1-Distill-Qwen-1.5B、DeepSeek R1-Distill-Qwen-7B、DeepSeek R1-Distill-Qwen-14B等,其過(guò)程僅耗時(shí)1天。
天數(shù)智芯上線多個(gè)DeepSeek大模型服務(wù)
摩爾線程:已部署DeepSeek蒸餾模型推理服務(wù)
2月4日,摩爾線程宣布實(shí)現(xiàn)了對(duì)DeepSeek蒸餾模型推理服務(wù)的部署?;贠llama開(kāi)源框架,完成了對(duì)DeepSeek-R1-Distill-Qwen-7B蒸餾模型的部署,并在多種中文任務(wù)中展現(xiàn)了優(yōu)異的性能。用戶也可以基于MTT S80和MTT S4000進(jìn)行DeepSeek-R1蒸餾模型的推理部署。
英特爾:支持AI PC本地部署
1月31日,英特爾宣布,DeepSeek目前能夠在英特爾產(chǎn)品上運(yùn)行,更可以在AI PC上實(shí)現(xiàn)離線使用,強(qiáng)調(diào)DeepSeek的本地部署能力。DeepSeek的蒸餾模型在至強(qiáng)和Gaudi平臺(tái)上得到了支持,能夠幫助客戶實(shí)現(xiàn)更低的成本和單價(jià)性能優(yōu)勢(shì)。例如,在最新發(fā)布的酷睿Ultra 200H(Arrow Lake H)平臺(tái)上,DeepSeek-R1-1.5B模型能夠順利運(yùn)行,且能夠解決數(shù)學(xué)難題。DeepSeek最新的Janus-Pro圖像生成和理解模型能夠在英特爾酷睿Ultra 200V系列處理器(Lunar Lake)上運(yùn)行。
酷睿Ultra 200H可本地運(yùn)行DeepSeek-R1-1.5B解數(shù)學(xué)題
英偉達(dá):推理微服務(wù)支持DeepSeek-R1
1月30日,英偉達(dá)宣布,其開(kāi)發(fā)者網(wǎng)站現(xiàn)已提供6710 億參數(shù)的 DeepSeek-R1 模型微服務(wù)預(yù)覽版。單個(gè) NVIDIA HGX H200 系統(tǒng)上每秒可為DeepSeek-R1 提供多達(dá) 3872 個(gè)tokens。開(kāi)發(fā)人員可以測(cè)試和試驗(yàn)可下載的NIM微服務(wù)應(yīng)用程序編程接口(API)。通過(guò)將 NVIDIA AI Foundry 與 NVIDIA NeMo 軟件結(jié)合使用,企業(yè)還將能夠?yàn)閷S?AI 代理創(chuàng)建自定義的 DeepSeek-R1 NIM 微服務(wù)。
三大運(yùn)營(yíng)商全面接入DeepSeek以后……
工信部數(shù)據(jù):2024年我國(guó)集成電路產(chǎn)量同比增22.2%
作者丨姬曉婷
編輯丨張心怡
美編丨馬利亞
監(jiān)制丨連曉東
A股芯片公司宣布并購(gòu),今日收漲7.5%!最新回應(yīng)
美AI公司CEO稱:不認(rèn)為DeepSeek是對(duì)手,但對(duì)華芯片出口管制更重要了
DeepSeek太火熱!集體漲停后,多家A股公司緊急發(fā)聲:無(wú)關(guān)
多家美國(guó)公司“擁抱”DeepSeek,爆火對(duì)數(shù)據(jù)中心有何影響?
多家銀行理財(cái)公司調(diào)降旗下理財(cái)產(chǎn)品費(fèi)率 最低費(fèi)率:0
可能退市!又一A股公司提示風(fēng)險(xiǎn),此前已有多家預(yù)警,涉超15萬(wàn)股民!
中微公司尹志堯:芯片越做越小,我們?cè)綉?zhàn)越強(qiáng)
美媒:拜登宣布阻止日本新日鐵公司收購(gòu)美國(guó)鋼鐵公司
還沒(méi)有評(píng)論,來(lái)說(shuō)兩句吧...