智元机器人GO-1(GenieOperator-1)通用具身基座大模型宣布全面开源。“这标志着全球首个采用Vision-Language-Latent-Action(ViLLA)架构的通用具身智能模型向全球开发者免费开放...
智元机器人 go-1 (genie operator-1)通用具身基座大模型宣布全面开源。
“这标志着全球首个采用Vision-Language-Latent-Action (ViLLA)架构的通用具身智能模型向全球开发者免费开放,将极大降低具身智能的技术门槛,推动行业快速发展。”
根据介绍,GO-1采用的Vision-Language-Latent-Action (ViLLA)架构是具身智能领域的重大技术突破。与传统的Vision-Language-Action (VLA)架构相比,ViLLA通过引入隐式动作标记,成功弥合了图像-文本输入与机器人执行动作之间的语义鸿沟。这一创新使得机器人能够更好地理解人类意图,并将其转化为精确的动作执行。
ViLLA架构的核心在于其三层协同设计。VLM多模态理解层基于InternVL-2B构建,能够处理多视角视觉图片、力觉信号、语言输入等多模态信息,为整个系统提供强大的场景感知和指令理解能力。Latent Planner隐式规划器通过预测隐式动作标记,实现了对复杂操作任务的高层次规划和理解。Action Expert动作专家则基于扩散模型,能够生成高频率、高精度的连续动作序列,确保机器人能够执行精细的操控任务。
智元方面表示,虽然GO-1仅基于AgiBot G1机器人数据进行预训练,但该模型已经在松灵机器人、方舟机器人、Franka机械臂等不同本体上进行了充分的验证测试。这些跨本体验证结果表明,GO-1具备良好的可移植性,能够适应不同机器人的运动学特性和控制接口。
在*环境测试方面,GO-1在Genie Sim和Libero等主流*平台上均取得了领先的性能表现。
针对真机部署场景,GO-1模型提供了Genie Studio一站式开发平台来支持Genie G1本体的数据采集、模型微调和部署,同时特别集成了通用LeRobot数据格式,支持其他机器人本体的数据采
集、模型微调和部署。
通过Genie Studio,在Genie G1真机实验中,GO-1相比于其他SOTA模型也取得了领先的性能。
Genie Studio是智元机器人专为具身智能场景打造的一站式开发平台。平台提供开箱即用的GO-1基座模型,集成Video Traning方案和统一训练框架,内置完整的开发工具链,可实现真机一键编译&部署。
相关推荐:
自动写文章的AI,提升效率的创作利器
SEO中关键词的定义与重要性:如何精准选择关键词提升网站流量
ChatGPT在处理文本时可能无法完全理解上下文的复杂性,ai军职
AI提供的阅读书目对学生的专业知识有多大帮助,变脸AI变脸
AI文件全称解析AI文件背后的无限潜力,ai古装皇后
“GPT4.0下载:开启智能未来,无限可能”,ps保存为ai格式路径
SEO什么技术?这些,你也能成为搜索引擎优化高手
SEO占位:如何在竞争激烈的市场中占得先机?,梁平区省心全网营销推广
如何选择适合你的AI工具?全面解析AI工具哪个好用
SEO优化如何提升网站排名,驾驭搜索引擎流量,三亚网站推广方法
AI写作免费一键生成在线,让创作更高效
AI写作技巧,让创作事半功倍!
SEO实际:如何在竞争激烈的市场中脱颖而出,dz论坛seo如何设置
AI网页生成:轻松构建智能网站,提升品牌竞争力,信息 ai
手机网站关键词优化:提升搜索排名,赢得用户青睐!,ai画大帝
AI测SEO:让网站排名提升的智能利器,新疆ai人物
AI缩写文档:革新文档管理与自动化的未来,ai画厘米
SEO设置化学品关键词时是否需要带缩写?,ai进dcs几根线
在线AI文章生成:智能写作的无限可能
用AI写文章查重率高吗?揭秘AI写作与查重检测的关系
“ChatGPT不能使用的国家:为何这些地区无法体验人工智能的魅力?”,什么叫ai ai
自动写文章AI:高效创作工具,开启写作新纪元
文字生成AI:开启创意写作的新纪元
ChatGPT手机下载后打不开?可能是这些问题导致的,解决方法在这里!,ai比赛高清
AI代谢文章:从灵感到成果的创作革命
蒙文章在线制作:轻松创建高质量文章,释放你的写作潜能,ai怎么设置默认颜色
AI写作在线生成器免费智能时代的创作利器
Chat8免费版在线网页:开启智能对话新时代,ros和ai
ChatGPT怎么有梯子?突破网络限制,轻松畅享AI智能,ai剪辑踩点
WordPress批量导入文章详细教程轻松高效地管理你的内容库,ai落地技术