8月14日消息,據(jù)媒體報道,智元機器人正式推出業(yè)內(nèi)首個開源的機器人世界模型平臺——Genie Envisioner (GE)。
GE 平臺顛覆了傳統(tǒng)機器人學習流程,創(chuàng)新性地構(gòu)建了一個以統(tǒng)一視頻生成世界模型為核心的閉環(huán)系統(tǒng)。該系統(tǒng)整合了未來幀預測、策略學習與仿真評估,使機器人能夠在單一模型中完成從感知環(huán)境、思考決策到執(zhí)行動作的端到端處理。
平臺的核心優(yōu)勢在于其無縫集成的閉環(huán)設計:GE-Base 模型基于超百萬條數(shù)據(jù)訓練,擅長解析環(huán)境布局與動作意圖;GE-Act 動作解碼器負責將理解轉(zhuǎn)化為具體動作指令;而GE-Sim 則作為基于動作條件的神經(jīng)仿真器,利用分層機制實現(xiàn)精準視覺預測。三者協(xié)同工作,驅(qū)動整個平臺高效運行。
為構(gòu)建這一強大平臺,智元機器人利用了約3000小時的真實機器人操控視頻數(shù)據(jù)。這些寶貴數(shù)據(jù)幫助 GE 建立了從語言指令到視覺空間的直接映射,完整保留了交互的時空信息,為模型的準確性和實用性奠定了堅實基礎。
在實際測試中,搭載 GE-Act 組件的機器人已成功完成制作三明治、倒茶、擦拭桌面等多項任務。這有力驗證了 GE 平臺的性能,并展示了其在提升機器人智能交互與任務執(zhí)行能力方面的廣闊應用前景。
本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。