智元(AGIBOT)在“AI發(fā)布周”第四日,發(fā)布了世界模型的重磅迭代版本——Genie Envisioner World Simulator 2.0(GE-Sim 2.0)。該版本首次構(gòu)建出可交互、可訓(xùn)練、可評(píng)估的“物理進(jìn)化引擎”,推動(dòng)世界模型從“理解世界”向“成為世界”躍遷。
GE-Sim 2.0 的核心突破在于將世界模型由單一表征轉(zhuǎn)化為具備環(huán)境級(jí)能力的系統(tǒng)基礎(chǔ)設(shè)施。針對(duì)機(jī)器人訓(xùn)練高度依賴真實(shí)環(huán)境、試錯(cuò)成本高昂的痛點(diǎn),GE-Sim 2.0 提供了一個(gè)能夠嚴(yán)格響應(yīng)機(jī)器人動(dòng)作信號(hào)、遵循物理與語義邏輯的可操作世界。通過“模型生成世界”,機(jī)器人可以在模擬環(huán)境中完成大規(guī)模閉環(huán)訓(xùn)練,而不再受限于現(xiàn)實(shí)數(shù)據(jù)獲取的效率瓶頸。
在技術(shù)架構(gòu)上,GE-Sim 2.0 實(shí)現(xiàn)了多項(xiàng)關(guān)鍵能力的飛躍:首創(chuàng)動(dòng)作驅(qū)動(dòng)的高保真環(huán)境生成,支持分鐘級(jí)長時(shí)序穩(wěn)定推演,并統(tǒng)一多視角視覺、跨視角3D一致性與本體狀態(tài),構(gòu)建出完整的具身交互空間。另外,系統(tǒng)內(nèi)置激勵(lì)模型(General Reward Model)賦予系統(tǒng)自評(píng)估能力,使訓(xùn)練閉環(huán)得以首次內(nèi)嵌于模型世界本身,實(shí)現(xiàn)“模型內(nèi)強(qiáng)化學(xué)習(xí)”(RL in WM)。
目前,GE-Sim 2.0 已具備近實(shí)時(shí)運(yùn)行能力,全面支持評(píng)估、強(qiáng)化學(xué)習(xí)與遙操作等交互模式。配合 Real2Edit2Real 數(shù)據(jù)范式,真實(shí)數(shù)據(jù)可被轉(zhuǎn)化為可編輯、可擴(kuò)展的訓(xùn)練資源,極大地提升了算法迭代的 Scaling Law 上限。
從真實(shí)數(shù)據(jù)集、仿真平臺(tái)、基座模型到今日發(fā)布的物理進(jìn)化引擎,智元已初步構(gòu)筑起具身智能的完整底座。智元表示,GE-Sim 2.0 的發(fā)布讓機(jī)器人能夠擺脫單純的經(jīng)驗(yàn)復(fù)現(xiàn),轉(zhuǎn)而在模型構(gòu)建的世界中不斷探索與進(jìn)化,重新定義具身智能的邊界。
揚(yáng)子晚報(bào)/紫牛新聞?dòng)浾? 徐曉風(fēng)
校對(duì) 吉啟雷