圖源:Pixabay
DeepSeek引發(fā)的蝴蝶效應還在持續(xù)。
1月20日,DeepSeek公司正式發(fā)布了其推理模型DeepSeek-R1的完整版本。該模型通過算法優(yōu)化,以較低的訓練成本實現(xiàn)了與OpenAI推理模型o1相媲美的性能,并且開源。
傳統(tǒng)AI訓練對算力的需求巨大,當業(yè)內(nèi)普遍為AGI(通用人工智能)貼上“大力出奇跡”的標簽,DeepSeek卻開辟了一片“無人區(qū)”,吸引一眾企業(yè)爭相接入。企業(yè)接入DeepSeek,即企業(yè)通過硬件設(shè)備連接DeepSeek的訪問地址,從而獲取DeepSeek的模型服務。
據(jù)不完全統(tǒng)計,接入DeepSeek-R1模型的國內(nèi)上市公司已經(jīng)超過100家,其中不乏阿里、騰訊、百度、三大運營商這類擁有自研模型和AI應用的企業(yè)。
時代周報記者采訪多位業(yè)內(nèi)人士發(fā)現(xiàn),企業(yè)選擇DeepSeek的原因主要集中在兩方面。一是DeepSeek-R1開源較徹底,部署方便,且在特定場景下展示了強大的處理和推理能力;另一方面,DeepSeek聲量走高,意味著接入方有機會承接其外溢的流量。QuestMobile數(shù)據(jù)顯示,DeepSeek的日活躍用戶數(shù)在2月1日突破3000萬大關(guān)。
不過, 大廠接入DeepSeek模型也可能面臨巨大的虧損壓力。近期,AI Infra(連接硬件和上層應用的中間層基礎(chǔ)設(shè)施)企業(yè)潞晨科技CEO尤洋指出,滿血版DeepSeek-R1每百萬token(輸出)定價16元,如果每日輸出1000億token,一個月算下來接入方企業(yè)可獲得4800萬元收入。據(jù)他測算,完成1000億token的輸出,需要約4000臺搭載H800的機器,以目前H800的市價或者折舊來計算,每月僅機器成本就達4.5億元,因此企業(yè)方可能面臨每月4億元的虧損,“用戶越多,服務成本越高,虧損越多”。
AI Infra廠商市場負責人張迪(化名)告訴時代周報記者,離DeepSeek瘋狂發(fā)酵僅有數(shù)周,軟硬件適配、測試、上架等工程都需要時間,目前公司對外合作的項目還未落地,因此具體成本數(shù)據(jù)暫不清晰。
在AI的潮汐效應下,接入DeepSeek是否一本萬利,還需讓子彈再飛一會兒。
接入模型并非“量”的比拼
目前來看,企業(yè)接入DeepSeek的程度有所不同。
2月13日,繼微信、騰訊文檔、QQ瀏覽器等業(yè)務側(cè)產(chǎn)品先后接入DeepSeek-R1后,騰訊自研的AI助手“騰訊元寶”也正式接入DeepSeek-R1,支持用戶切換使用混元大模型和DeepSeek-R1。
相比騰訊近乎全面擁抱DeepSeek的決心,阿里等公司對DeepSeek的接入主要體現(xiàn)在自己的主營業(yè)務側(cè)產(chǎn)品,給自研的大模型產(chǎn)品保留了一部分空間。如阿里的1688、釘釘、阿里云相繼接入DeepSeek,其旗下全能AI助手通義APP尚未表態(tài)。
不難發(fā)現(xiàn),接入DeepSeek的企業(yè),率先將DeepSeek應用在了AI能力運用場景較多的業(yè)務上。
“接入模型并非‘量’的比拼,需求方應該充分考慮模型與業(yè)務場景適配性。”值得買科技CTO王云峰在接受時代周報記者采訪時表示,當下大模型的應用模式愈發(fā)多樣,不同模型有各自適配場景。
此前,值得買科技自研了130億參數(shù)消費大模型,也接入了一些主流模型,談及接入DeepSeek的原因,王云峰解釋稱,值得買科技的自研模型在商品理解、價格預測等垂直領(lǐng)域能力出色,但AI技術(shù)的復雜性,決定了單一模型無法覆蓋所有場景。例如做檢索增強時,內(nèi)部工具流程需AI合理調(diào)度,外部通用模型難以適配,此時自研模型就負責內(nèi)部流程調(diào)度、用戶意圖理解等關(guān)鍵任務,而通用模型則用于站內(nèi)文章生成這類通用場景。
從實際落地效果來看,DeepSeek-R1的問題處理和推理能力表現(xiàn)出色。王云峰告訴時代周報記者,和包括DeepSeek-V3在內(nèi)的其他模型相比,DeepSeek-R1生成內(nèi)容的行文邏輯更清晰,文學性也更突出。其強大的語言處理能力,讓公司內(nèi)容生產(chǎn)的效率有了明顯提升,“如果使用通用模型,還需要進行垂類數(shù)據(jù)微調(diào)才能更好發(fā)揮作用。”
網(wǎng)絡(luò)安全公司知道創(chuàng)宇是DeepSeek更早期的受益者。
去年12月,知道創(chuàng)宇旗下的網(wǎng)絡(luò)空間測繪引擎ZoomEye國際版同步上線了對DeepSeek的調(diào)用支持。知道創(chuàng)宇CSO(首席戰(zhàn)略官)周景平向時代周報記者表示,從接入DeepSeek到現(xiàn)在,ZoomEye國際版的平臺注冊量增長28.5%,平臺活躍度增長121.6%,AI 搜索功能使用率達35.8%。
周景平在接受時代周報記者采訪時難掩興奮。他稱,DeepSeek被公司應用在包括漏洞挖掘、數(shù)據(jù)情報分析、規(guī)則轉(zhuǎn)化處理、自動化安全運營等多個細分業(yè)務場景中。在數(shù)據(jù)情報分析上,受益于DeepSeek等大模型數(shù)據(jù)分析及推理能力,公司可高效補齊之前所依賴的分析師知識框架之外的細節(jié)點。
“相比GPT,DeepSeek聚焦通過低成本高性能的技術(shù)路線,降低企業(yè)接入門檻,并通過開源策略促進技術(shù)普及和產(chǎn)業(yè)鏈協(xié)同,這為國內(nèi)企業(yè)級應用的爆發(fā)提供了更大的可能性?!痹谥芫捌娇磥?,DeepSeek-V3和DeepSeek-R1利好接入企業(yè)的意義在于性價比高。他說,DeepSeek開源較為徹底,同時發(fā)布了蒸餾模型的本地量化版,這使得企業(yè)進行本地化部署的性價比大幅度提升。
適配商等來春天?
企業(yè)扎堆接入DeepSeek,也忙壞了位于大模型產(chǎn)業(yè)鏈中間層的適配廠商。
張迪向時代周報記者表示,DeepSeek爆火后,公司往來的咨詢者日益增多?!耙郧耙粌蓚€月才有一位前來咨詢業(yè)務的客戶,現(xiàn)在我們每天要接待十幾個。”張迪稱,現(xiàn)在幾乎每天都需要加班,除了應對業(yè)務咨詢,還要參與直播、客戶驗收、商務對接等工作,公司和小組的會議往往被安排在晚上8點和9點。
張迪稱,DeepSeek大火之前,大家對私有化部署僅僅停留在探討產(chǎn)品功能的層面,而如今公司的咨詢者,或許在焦慮的驅(qū)使下,合作目的更加明確,雙方談話主題大致鎖定在為提需求、了解產(chǎn)品性能、給報價三個方面。
另一AI Infra廠商的創(chuàng)始人趙欣向時代周報記者表示,需求大漲,行業(yè)工作節(jié)奏普遍加快,“有人手里拿著錢排隊等你的產(chǎn)品,肯定要比沒事做的時候興奮。”他表示,產(chǎn)品走向市場,真正地為人所用,也是個人價值層面的正向反饋。
此前,有分析人士向時代周報記者稱,因國產(chǎn)算力適配成本較高,在英偉達的芯片稀缺情況下,使用國產(chǎn)算力的企業(yè)接入DeepSeek可能要面臨一定財務壓力,繼而影響到中間層廠商的發(fā)展前景。
尤洋向時代周報記者拆解了企業(yè)接入DeepSeek的路徑,他表示,DeepSeek是開源模型,接入方只要有算力就可以部署運行。
尤洋說,算力的主流提供方式一般有兩種,一種是企業(yè)自有算力,比如有本地的一體機或者機房;另一種是公有云上的算力,企業(yè)可以按月租用。除此之外,有一些云廠商還提供MaaS(Model as a Service)的模式,也就是將DeepSeek模型部署到公有云上后,需求企業(yè)再調(diào)用DeepSeek API,按實際使用的token量付費,適合早期的輕量化探索需求。
企業(yè)接入DeepSeek的成本主要分硬件和部署成本兩部分。
硬件成本方面,不同規(guī)格的硬件價格差異較大,相同規(guī)格不同規(guī)模的硬件價格也十分不同?!皩τ趦H需要使用模型的企業(yè)來說,選擇推理芯片會有效降低硬件成本;而對于有微調(diào)和訓練要求的企業(yè),可能在購買或租賃硬件時需要使用訓練芯片。另外,對于并發(fā)數(shù)量或者輸出速度要求較高的企業(yè),需要選擇有充足算力和顯存的芯片,這類芯片的價格會偏高?!庇妊蟊硎?。
而部署成本的區(qū)別除了體現(xiàn)在不同規(guī)格芯片的部署難度上,還和企業(yè)的具體要求有關(guān)。比如,如果企業(yè)需要高并發(fā)、接入知識庫、接入聯(lián)網(wǎng)功能等,都會存在較大的工作量。
“對于滿血DeepSeek-R1 671B模型來說,本地化部署的硬件成本在百萬級別,一般來說是遠高于部署成本的。有些中小型企業(yè)會使用蒸餾版的模型,或者是直接調(diào)用云廠商的API,這樣適配成本就會低很多?!庇妊笱a充道。
對于業(yè)內(nèi)的成本擔憂,趙欣稱,目前公司客戶以中小型企業(yè)和傳統(tǒng)行業(yè)的大型企業(yè)為主,雖公司體量、業(yè)務不同,所牽涉的成本數(shù)據(jù)也存在較大差異,但從目前的適配案例來看,客戶企業(yè)一般都具備承擔該項成本的能力。
本網(wǎng)站上的內(nèi)容(包括但不限于文字、圖片及音視頻),除轉(zhuǎn)載外,均為時代在線版權(quán)所有,未經(jīng)書面協(xié)議授權(quán),禁止轉(zhuǎn)載、鏈接、轉(zhuǎn)貼或以其他 方式使用。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責任。如其他媒體、網(wǎng)站或個人轉(zhuǎn)載使用,請聯(lián)系本網(wǎng)站丁先生:[email protected]
還沒有評論,來說兩句吧...