應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊個(gè)人注冊登錄

智元機(jī)器人 GO-1 通用具身基座大模型開源

2025-09-24 09:54 IT之家

導(dǎo)讀:智元機(jī)器人宣布,繼今年 1 月 AgiBot World 具身智能百萬真機(jī)數(shù)據(jù)集開源后,通用具身基座大模型 GO-1(Genie Operator-1)也正式在 GitHub 開源。

9 月 23 日消息,智元機(jī)器人宣布,繼今年 1 月 AgiBot World 具身智能百萬真機(jī)數(shù)據(jù)集開源后,通用具身基座大模型 GO-1(Genie Operator-1)也正式在 GitHub 開源。

智元機(jī)器人稱,這標(biāo)志著全球首個(gè)采用 Vision-Language-Latent-Action (ViLLA) 架構(gòu)的通用具身智能模型向全球開發(fā)者免費(fèi)開放,將極大降低具身智能的技術(shù)門檻,推動(dòng)行業(yè)快速發(fā)展。

附官方對(duì) GO-1 的介紹如下:

01、技術(shù)突破:ViLLA 架構(gòu)引領(lǐng)具身智能新范式

GO-1 采用的 Vision-Language-Latent-Action (ViLLA) 架構(gòu)是具身智能領(lǐng)域的重大技術(shù)突破。與傳統(tǒng)的 Vision-Language-Action (VLA) 架構(gòu)相比,ViLLA 通過引入隱式動(dòng)作標(biāo)記,成功彌合了圖像-文本輸入與機(jī)器人執(zhí)行動(dòng)作之間的語義鴻溝。這一創(chuàng)新使得機(jī)器人能夠更好地理解人類意圖,并將其轉(zhuǎn)化為精確的動(dòng)作執(zhí)行。

ViLLA 架構(gòu)的核心在于其三層協(xié)同設(shè)計(jì)。VLM 多模態(tài)理解層基于 InternVL-2B 構(gòu)建,能夠處理多視角視覺圖片、力覺信號(hào)、語言輸入等多模態(tài)信息,為整個(gè)系統(tǒng)提供強(qiáng)大的場景感知和指令理解能力。Latent Planner 隱式規(guī)劃器通過預(yù)測隱式動(dòng)作標(biāo)記,實(shí)現(xiàn)了對(duì)復(fù)雜操作任務(wù)的高層次規(guī)劃和理解。Action Expert 動(dòng)作專家則基于擴(kuò)散模型,能夠生成高頻率、高精度的連續(xù)動(dòng)作序列,確保機(jī)器人能夠執(zhí)行精細(xì)的操控任務(wù)。

02、平臺(tái)支持:Genie Studio 一站式開發(fā)平臺(tái)

Genie Studio 是智元機(jī)器人專為具身智能場景打造的一站式開發(fā)平臺(tái),為開發(fā)者和合作伙伴提供全棧式解決方案,覆蓋數(shù)據(jù)采集、數(shù)據(jù)管理、模型訓(xùn)練與微調(diào)、仿真評(píng)測、模型構(gòu)建與部署等全流程。平臺(tái)提供開箱即用的 GO-1 基座模型,集成 Video Traning 方案和統(tǒng)一訓(xùn)練框架,內(nèi)置完整的開發(fā)工具鏈,可實(shí)現(xiàn)真機(jī)一鍵編譯 & 部署,顯著提升開發(fā)效率,助力具身智能技術(shù)的快速落地與應(yīng)用。

官網(wǎng)入口

https://genie.agibot.com/geniestudio

購買咨詢

https://www.zhiyuan-robot.com/Contact/Business

03、社區(qū)共建:打造開源社區(qū)生態(tài)

雖然 GO-1 僅基于 AgiBot G1 機(jī)器人數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,但該模型已經(jīng)在松靈機(jī)器人、方舟機(jī)器人、Franka 機(jī)械臂等不同本體上進(jìn)行了充分的驗(yàn)證測試。這些跨本體驗(yàn)證結(jié)果表明,GO-1 具備良好的可移植性,能夠適應(yīng)不同機(jī)器人的運(yùn)動(dòng)學(xué)特性和控制接口。

在仿真環(huán)境測試方面,GO-1 在 Genie Sim 和 Libero 等主流仿真平臺(tái)上均取得了領(lǐng)先的性能表現(xiàn)。

針對(duì)真機(jī)部署場景,GO-1 模型充分考慮了用戶多樣化的機(jī)器人平臺(tái)需求,不僅提供了 Genie Studio 一站式開發(fā)平臺(tái)來支持 Genie G1 本體的數(shù)據(jù)采集、模型微調(diào)和部署,同時(shí)特別集成了通用 LeRobot 數(shù)據(jù)格式,支持其他機(jī)器人本體的數(shù)據(jù)采集、模型微調(diào)和部署。

通過 Genie Studio,在 Genie G1 真機(jī)實(shí)驗(yàn)中,GO-1 相比于其他 SOTA 模型也取得了領(lǐng)先的性能。