來源:財(cái)聯(lián)社
《科創(chuàng)板日報(bào)》2月5日訊(編輯 宋子喬)繼黃仁勛在英偉達(dá)年會(huì)上表演熱門舞蹈APT后,機(jī)器人也能跳這支舞了,表演者為宇樹科技G1人形機(jī)器人。
不僅如此,英偉達(dá)團(tuán)隊(duì)還展示了能模仿C羅、詹姆斯和科比的G1人形機(jī)器人。
這些動(dòng)作均為慢動(dòng)作演示,基于一個(gè)名為ASAP(Aligning Simulation and Real Physics,對齊模擬與真實(shí)物理)的real2sim2real模型,由卡內(nèi)基梅隆大學(xué)(CMU)和英偉達(dá)的研究團(tuán)隊(duì)共同提出,可運(yùn)用強(qiáng)化學(xué)習(xí)和真實(shí)世界的數(shù)據(jù)來訓(xùn)練delta動(dòng)作模型,有效縮小了仿真與現(xiàn)實(shí)之間的差距,讓人形機(jī)器人掌握非常流暢且動(dòng)感的全身控制動(dòng)作。
該項(xiàng)目的論文和代碼已開源,華人學(xué)者依然占據(jù)相關(guān)論文的大部分作者席位。
新模型如何讓機(jī)器人擁有更強(qiáng)的行動(dòng)能力?
據(jù)英偉達(dá)高級研究科學(xué)家Jim Fan介紹,ASAP采用了“真實(shí)→仿真→真實(shí)”方法,“在網(wǎng)上看到的多數(shù)機(jī)器人演示視頻都是經(jīng)過加速處理的,而我們特意放慢動(dòng)作速度,讓你能清晰觀賞每個(gè)流暢的動(dòng)作細(xì)節(jié)?!?/p>
訓(xùn)練過程主要可拆解成兩步:
1、在仿真環(huán)境對機(jī)器人進(jìn)行預(yù)訓(xùn)練
在預(yù)訓(xùn)練階段,研究團(tuán)隊(duì)將真人運(yùn)動(dòng)視頻作為數(shù)據(jù)來源,在仿真環(huán)境中訓(xùn)練動(dòng)作跟蹤策略。先將這些運(yùn)動(dòng)數(shù)據(jù)重定向到人形機(jī)器人上,然后訓(xùn)練一個(gè)基于相位條件的運(yùn)動(dòng)跟蹤策略,讓機(jī)器人模仿重定向后的動(dòng)作。隨后,在仿真環(huán)境中回放這些數(shù)據(jù),動(dòng)力學(xué)差異就會(huì)以跟蹤誤差的形式表現(xiàn)出來。
2、后訓(xùn)練階段進(jìn)一步校準(zhǔn)機(jī)器人動(dòng)作
訓(xùn)練一個(gè)delta動(dòng)作模型,通過縮小真實(shí)世界和仿真狀態(tài)的差異,學(xué)習(xí)如何補(bǔ)償這些偏差,縮小仿真環(huán)境和真實(shí)世界中的動(dòng)力學(xué)差異。然后,ASAP把這個(gè)delta動(dòng)作模型集成到仿真器中,對預(yù)訓(xùn)練策略進(jìn)行微調(diào),讓它和現(xiàn)實(shí)世界的動(dòng)力學(xué)更匹配。
ASAP框架的意義或在于優(yōu)化機(jī)器人訓(xùn)練成本,在仿真虛擬環(huán)境中訓(xùn)練出來的機(jī)器人也能解鎖真實(shí)世界的物理動(dòng)態(tài)。Jim Fan表示,通過額外神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)差異參數(shù),本質(zhì)上是對傳統(tǒng)物理引擎進(jìn)行“動(dòng)態(tài)校準(zhǔn)”,使機(jī)器人能依托GPU的并行計(jì)算能力,在仿真環(huán)境中獲得近乎真實(shí)的大規(guī)模訓(xùn)練體驗(yàn),“未來屬于混合仿真時(shí)代?!彼€樂觀表示,2030年的“人形機(jī)器人奧運(yùn)會(huì)”會(huì)很精彩。
英偉達(dá)已經(jīng)成立GEAR(通用智能體研究實(shí)驗(yàn)室)并入股FigureAI,從軟件平臺到硬件本體,全面切入人形機(jī)器人賽道。
在今年1月剛剛結(jié)束的2025 CES上,黃仁勛發(fā)布開幕演講稱“通用機(jī)器人領(lǐng)域的ChatGPT時(shí)刻即將到來”,英偉達(dá)正在積極推動(dòng)機(jī)器人技術(shù)的發(fā)展,致力于打造全方位的機(jī)器人生態(tài)系統(tǒng)。
同月,黃仁勛在北京參加例行年會(huì)時(shí),會(huì)見了多家國內(nèi)頭部機(jī)器人公司的代表,宇樹科技CEO王興興、銀河通用創(chuàng)始人兼CTO王鶴、深涌智能Emerging AI創(chuàng)始人黃可鋮等創(chuàng)業(yè)者皆到場,到場的機(jī)器人企業(yè)還包括逐際動(dòng)力、加速進(jìn)化等。
英偉達(dá)機(jī)器人技術(shù)業(yè)務(wù)副總裁Deepu Talla一行還在1月份到訪了北京國家地方共建具身智能機(jī)器人創(chuàng)新中心。
宇樹H1人形機(jī)器人則在2025央視春晚中表演了扭秧歌,展現(xiàn)良好運(yùn)控性能及AI訓(xùn)練成果。
東吳證券表示,機(jī)器人當(dāng)前類比2014年電動(dòng)車,即將量產(chǎn),開啟10年產(chǎn)業(yè)大周期。并且,電動(dòng)車與機(jī)器人均由特斯拉引領(lǐng),初創(chuàng)公司和人工智能在人形機(jī)器人領(lǐng)域布局激進(jìn),與特斯拉差距縮小,如華為、英偉達(dá)、智元、宇樹等,投資主線從1放大至1+N。
該機(jī)構(gòu)進(jìn)一步表示,最看好三個(gè)方向:
1)綁定龍頭供應(yīng)鏈:特斯拉人形機(jī)器人進(jìn)展最確定,產(chǎn)品性能軟硬件最優(yōu),放量最早,特斯拉供應(yīng)鏈彈性最大。其次為潛力廠商,如英偉達(dá)、華為(或提供整體解決方案授權(quán)方式)、智元、宇樹等;
2)壁壘最高的核心環(huán)節(jié):零部件來看,壁壘排序滾柱絲杠>傳感器>諧波減速器>空心杯電機(jī);
3)產(chǎn)業(yè)趨勢和方向:靈巧手方案變化、傳感器方案變化。
?。苿?chuàng)板日報(bào) 宋子喬)
谷歌、Anthropic和OpenAI齊陷“僵局” AI模型開發(fā)瓶頸如何破?
DeepSeek開卷性價(jià)比 OpenAI發(fā)布更便宜的模型03-Mini
天能動(dòng)力早盤漲超5% 鉛酸電池動(dòng)力車輛占比顯著上升
突發(fā)大跌,華為人形機(jī)器人概念牛股,最新透露!
機(jī)器人概念股上漲 Palladyne AI漲超28%
剛剛,DeepMind最強(qiáng)「基礎(chǔ)世界模型」誕生!單圖生1分鐘游戲世界,解鎖下一代智能體
最新!OpenAI上架推理模型o3-mini,首次向免費(fèi)用戶開放!AIME測試中,o3-mini最高準(zhǔn)確率達(dá)87.3%
還沒有評論,來說兩句吧...