亚洲成AⅤ人片在线观看_亚洲性无码一区二区三区_无码综合天天久久综合网_四虎精品成人A在线观看

李飛飛空間智能模型引關(guān)注 多家大廠跟進(jìn)布局

李飛飛空間智能模型引關(guān)注 多家大廠跟進(jìn)布局

癡旋子 2024-12-14 技術(shù)資訊 41 次瀏覽 0個(gè)評(píng)論

  來源:中國經(jīng)營報(bào)

  本報(bào)記者 秦梟 北京報(bào)道

  近日,被稱為“AI教母”的李飛飛創(chuàng)立的World Labs首次官宣空間智能模型,World Labs團(tuán)隊(duì)展示了他們?nèi)绾翁剿?D生成式世界,僅用一張圖,即可生成一個(gè)3D世界。李飛飛說道:“無論怎樣理論化這個(gè)想法,都很難用語言描述一張照片或一句話生成3D場景的互動(dòng)體驗(yàn)?!彼龔?qiáng)調(diào),大自然中存在著一種視覺與行動(dòng)之間的良性互動(dòng),而空間智能正是這種互動(dòng)的核心。

  多位業(yè)內(nèi)人士在接受《中國經(jīng)營報(bào)》記者采訪時(shí)表示,從自然語言處理到圖像和視頻生成,再到空間智能,生成式人工智能在短短兩年內(nèi)正以前所未有的速度認(rèn)知、理解、模擬并創(chuàng)造出人類所處的物理世界。盡管圖片生成3D技術(shù)在AR眼鏡這一場景上已有實(shí)踐,但李飛飛發(fā)布的“空間智能”模型標(biāo)志著AI從2D像素平面邁向了完整的3D世界,并且該模型生成的3D世界具有高度的交互性和真實(shí)性,用戶可以在其中自由移動(dòng)相機(jī),探索虛擬環(huán)境,體驗(yàn)更真實(shí)的物理效果和視覺效果。

  雖然World Labs發(fā)布的空間智能大模型落地場景與應(yīng)用方面仍存在諸多挑戰(zhàn),但業(yè)界相信其未來的潛力。記者在采訪中了解到,目前除了World Labs外,國內(nèi)外的多家科技公司也在空間智能領(lǐng)域開始布局。相信未來競爭將愈發(fā)激烈,也將進(jìn)一步拓展AI技術(shù)的邊界,同時(shí)也會(huì)為多個(gè)行業(yè)帶來變革機(jī)遇。

  邁向空間智能的第一站

  World Labs于今年9月13日成立,是一家空間智能AI公司,試圖構(gòu)建大型世界模型(LWM)來感知、生成3D世界并與之交互。李飛飛擔(dān)任公司CEO。

  實(shí)際上,早在今年年初便有消息傳出,李飛飛創(chuàng)立了一家從事空間智能相關(guān)業(yè)務(wù)的AI初創(chuàng)企業(yè),其將利用類人視覺數(shù)據(jù)處理技術(shù),讓 AI 可以實(shí)現(xiàn)高級(jí)推理。

  根據(jù)World Labs的官方網(wǎng)站信息,該公司已經(jīng)成功募集到超過2.3億美元的資金。此次融資的領(lǐng)投機(jī)構(gòu)包括硅谷著名的風(fēng)險(xiǎn)投資公司Andreessen Horowitz、NEA以及專注于人工智能的風(fēng)投基金Radical Ventures。參與投資的其他知名公司有Adobe、AMD以及英偉達(dá)等,同時(shí),個(gè)人投資者中也不乏重量級(jí)人物,包括被譽(yù)為“AI教父”的杰弗里·辛頓(Geoffrey Hinton)、特斯拉人工智能和自動(dòng)駕駛部門(Autopilot)原負(fù)責(zé)人Andrej Karpathy以及谷歌的首席科學(xué)家Jeff Dean。

  不過,在星光熠熠下,外界對(duì)“空間智能”一直沒有統(tǒng)一的定義。在溫哥華TED大會(huì)的演講中,李飛飛提到,當(dāng)前最先進(jìn)的算法已經(jīng)能夠合理推斷圖像和文字在三維環(huán)境中的呈現(xiàn)方式,并據(jù)此做出行動(dòng),這種算法所依托的便是所謂的空間智能。

  在進(jìn)一步闡述空間智能這一概念時(shí),她使用了一張極具啟發(fā)性的圖片作為輔助工具:一只貓正伸出爪子,意圖將玻璃杯推向桌子的邊緣。她隨后詳盡地解析了這一過程,指出人類大腦具備在極短時(shí)間內(nèi)對(duì)玻璃杯的幾何構(gòu)型、它在三維空間中的位置,以及它與桌子、貓和其他物體的相互關(guān)系進(jìn)行綜合評(píng)估的能力。在此基礎(chǔ)上,大腦能夠預(yù)測接下來可能發(fā)生的情境,并采取相應(yīng)措施來預(yù)防潛在的風(fēng)險(xiǎn)。

  經(jīng)過一年時(shí)間的努力,李飛飛終于將更“具象”的空間智能展示出來。在World Labs 發(fā)布的模型上,用戶僅需上傳一張圖片,系統(tǒng)即可依據(jù)圖片中的環(huán)境信息,自動(dòng)生成一個(gè)相應(yīng)范圍內(nèi)的3D虛擬世界。用戶可以直接在網(wǎng)頁端,通過鼠標(biāo)或鍵盤操作,輕松地瀏覽這個(gè)3D世界。此外,生成的3D世界具備交互性,用戶能夠像在游戲里一樣,自由地移動(dòng)相機(jī),探索這個(gè)3D世界,包括景深、變焦等操作都可輕松完成。

  中國投資協(xié)會(huì)上市公司投資專業(yè)委員會(huì)副會(huì)長支培元評(píng)價(jià)道:“‘空間智能’模型的問世,標(biāo)志著AI在深度學(xué)習(xí)、計(jì)算機(jī)視覺領(lǐng)域取得了里程碑式的進(jìn)步,尤其在3D圖形合成、環(huán)境映射、目標(biāo)檢測等關(guān)鍵任務(wù)上展現(xiàn)出了超越常規(guī)的強(qiáng)大效能,預(yù)期將掀起VR/AR、交互娛樂、建筑可視化等行業(yè)的根本變革。無論是電子商務(wù)平臺(tái)的沉浸式購物體驗(yàn)、房產(chǎn)市場的遠(yuǎn)程實(shí)景導(dǎo)覽,抑或影視后期制作的特效創(chuàng)作,還是教育培訓(xùn)領(lǐng)域的虛擬實(shí)訓(xùn)基地,皆可成為該技術(shù)的用武之地。”

  不過,記者在體驗(yàn)過程中注意到,該模型構(gòu)建的3D場景探索范圍有限,一旦移動(dòng)一小段距離,系統(tǒng)便會(huì)提示已觸達(dá)邊界。而且,該模型還會(huì)出現(xiàn)“幻覺”,理解不夠準(zhǔn)確。

  World Labs也表示,以上成果還偏早期,他們正在努力提高生成世界的大小和擬真度,也正在試驗(yàn)用戶與它們交互的新方式。

  世界院士專家聯(lián)合會(huì)執(zhí)行秘書長、中國民協(xié)新質(zhì)生產(chǎn)委員會(huì)秘書長吳高斌指出,盡管李飛飛發(fā)布的模型具有巨大潛力,但要實(shí)現(xiàn)理想的落地場景仍面臨一定困難。首先,在技術(shù)層面,模型在生成3D世界的精度和速度上還需進(jìn)一步提高。其次,在應(yīng)用層面,如何將這一模型與現(xiàn)有產(chǎn)業(yè)相結(jié)合,實(shí)現(xiàn)商業(yè)化落地,仍需克服諸多挑戰(zhàn)。

  國內(nèi)已有涉及

  實(shí)際上,在空間智能領(lǐng)域,李飛飛并不是第一個(gè)“吃螃蟹的人”。英偉達(dá)、Meta等多家公司也有所布局,只不過,它們稱之為3D生成。美國當(dāng)?shù)貢r(shí)間12月4日,谷歌DeepMind發(fā)布了大型基礎(chǔ)世界模型Genie 2,可通過單張圖片或文字描述生成3D場景。

  不只是海外,國內(nèi)的AI廠商也在著手布局空間智能。幾乎與World Labs同一時(shí)間,國內(nèi)智源研究院推出了首個(gè)利用大規(guī)模無標(biāo)注的互聯(lián)網(wǎng)視頻學(xué)習(xí)的3D生成模型See3D——See Video, Get 3D。

  不同于傳統(tǒng)依賴相機(jī)參數(shù)(pose-condition)的3D生成模型,See3D采用全新的視覺條件(visual-condition)技術(shù),僅依賴視頻中的視覺線索,生成相機(jī)方向可控且?guī)缀我恢碌亩嘁暯菆D像。

  在今年11月初,有傳聞指出阿里巴巴正在測試一款名為“Animode”的人工智能視頻創(chuàng)作工具。根據(jù)官方的描述,該工具是一款專業(yè)的3D軟件,旨在創(chuàng)造栩栩如生的二次元角色和具有電影大片般效果的視覺內(nèi)容。緊接著在11月5日,騰訊旗下的混元實(shí)驗(yàn)室也宣布了其最新研發(fā)的MoE模型“混元Large”以及3D生成大模型“Hunyuan3D-1.0”的開源。

  然而,在中關(guān)村物聯(lián)網(wǎng)產(chǎn)業(yè)聯(lián)盟副秘書長袁帥看來,World Labs的空間智能模型之所以受到外界的廣泛關(guān)注和“吹捧”,原因在于其獨(dú)特的技術(shù)優(yōu)勢和廣泛的應(yīng)用前景。該模型不僅支持實(shí)時(shí)渲染和用戶自由控制視角,還具有高度的交互性和場景持久性,為用戶提供了更加豐富和真實(shí)的體驗(yàn)。此外,該模型還能夠適應(yīng)不同的場景和藝術(shù)風(fēng)格,為創(chuàng)作者提供了更多的創(chuàng)意空間和個(gè)性化體驗(yàn)。

  支培元表示,相較同類方案,該模型兼具計(jì)算效率與圖像質(zhì)量優(yōu)勢,能在保持細(xì)節(jié)豐富度的基礎(chǔ)上,極大程度地壓縮處理時(shí)間,解決當(dāng)前三維內(nèi)容生成的技術(shù)難題。兼容主流硬件平臺(tái),從移動(dòng)終端到高性能服務(wù)器,確保技術(shù)無縫對(duì)接,有利于快速市場化部署,支撐多元場景應(yīng)用。盡管面臨技術(shù)挑戰(zhàn)和商業(yè)化落地的難題,但獨(dú)特的技術(shù)優(yōu)勢和廣泛的應(yīng)用前景使其成為業(yè)界關(guān)注的焦點(diǎn)。隨著國內(nèi)外多家大廠的布局,空間智能領(lǐng)域正迎來一個(gè)全新的發(fā)展階段。

你可能想看:

轉(zhuǎn)載請(qǐng)注明來自江蘇中陽智能廣告設(shè)備有限公司,本文標(biāo)題:《李飛飛空間智能模型引關(guān)注 多家大廠跟進(jìn)布局》

每一天,每一秒,你所做的決定都會(huì)改變你的人生!

發(fā)表評(píng)論

快捷回復(fù):

評(píng)論列表 (暫無評(píng)論,41人圍觀)參與討論

還沒有評(píng)論,來說兩句吧...

Top
網(wǎng)站統(tǒng)計(jì)代碼