机器人模型GEN-1可靠性达99%,处理复杂精细任务

张开发
2026/4/20 20:52:16 15 分钟阅读

分享文章

机器人模型GEN-1可靠性达99%,处理复杂精细任务
机器人机器学习公司Generalist宣布推出GEN-1这是一款新型物理AI系统。该公司表示GEN-1在广泛的物理技能方面达到了生产级别的成功率这些技能过去需要人类双手的灵巧性和肌肉记忆才能完成。Generalist还称赞这款新模型能够通过即兴创造新动作来应对干扰并连接不同领域的想法来解决新问题。GEN-1基于Generalist之前的GEN-0模型构建。该公司在11月份将GEN-0作为概念验证进行推广证明了缩放定律在机器人训练中的适用性展示了更多的预训练数据和计算时间如何提高训练后的性能。但是虽然大语言模型能够有效处理互联网上集体写作的数万亿词汇作为训练的一部分但机器人模型没有类似的、易于获取的关于人类如何操作物体的高质量数据源。为了帮助解决这个问题Generalist依赖于数据手套——一套可穿戴的钳形设备在人类执行手工任务时捕获微小动作和视觉信息。Generalist现在声称已经收集了超过50万小时和PB级的物理交互数据来帮助训练其物理模型。结果是一个自主系统既精确到能够把钱放进钱包又适应性强到能够叠衣服或分拣汽车零件。据Generalist称该模型现在在重复性但精细的机械任务如折叠盒子、包装手机和维修机器人吸尘器上达到了99%的成功率速度约为之前GEN-0模型的三倍。根据该公司的说法GEN-1在仅花费约一小时将其预训练适应到适用于其特定机器人实体的机器人数据后就能达到这些指标。从错误中恢复过去复杂的机器人系统通常依赖于精心预编程的动作或者被训练专注于变化很少的单一任务。Generalist表示GEN-1的与众不同之处在于单一模型能够基于以前的经验进行即兴发挥并自然地响应干扰即使这些干扰完全超出了训练分布范围。例如在接受《福布斯》采访时Generalist工程师描述了模型给塑料袋轻轻摇晃让毛绒玩具滑入其中尽管这样的动作在训练数据中没有明确编程。Generalist发布的视频还显示当柔性物体弹出预期位置时机器人手臂能够智能调整或者在衬衫在折叠任务中途被移动时重新折叠。Generalist还描述了当小垫圈被推出位置时模型会调整和重新抓取使用双手将它们插入所需位置。没有人编程让机器人犯错因此也没有人编程让机器人从错误中恢复Generalist工程师Felix Wang在视频中说。这种能力是免费获得的。Generalist并不是唯一一家将机器学习技术引入物理领域的公司。去年Google展示了其Gemini机器人模型的视觉学习行动能力可以理解和响应人类的一般行动提示。Physical Intelligence也凭借在轮式平台上的一对机器人手臂引起轰动该系统在专门设计的模拟家庭环境中接受训练执行从清理溢出物到铺床等任务。还有特斯拉它在2024年底首次推出了人形Optimus机器人但展示的演示实际上是由远程人类操作员遥控的。今年1月特斯拉CEO马斯克承认目前的Optimus机器人仍然没有在特斯拉做有用的工作尽管此前声称情况并非如此。不过通过GEN-1Generalist表示其物理模型已经达到了类似GPT-3的拐点一些任务开始跨越在经济有用环境中部署所需的性能水平并且我们可以期待每一代新模型都会产生一套新的、日益复杂的可以掌握的任务。我们满怀希望地认为这意味着我们终于走上了在不久的将来拥有价格合理的家用叠衣机器人的道路。QAQ1GEN-1机器人模型有什么特别之处AGEN-1是Generalist公司开发的物理AI系统在重复性但精细的机械任务上达到99%成功率速度是前代模型的三倍。它能够处理折叠盒子、包装手机、维修吸尘器等任务并具备从错误中自动恢复的能力。Q2GEN-1如何获得训练数据AGeneralist使用数据手套——一套可穿戴的钳形设备来收集训练数据。这些设备在人类执行手工任务时捕获微小动作和视觉信息公司已收集超过50万小时和PB级的物理交互数据。Q3GEN-1与其他机器人系统有什么不同A传统机器人系统通常依赖预编程动作或专注单一任务。GEN-1的特别之处在于能够基于经验即兴发挥自然响应干扰甚至处理训练范围外的情况并且能够自动从错误中恢复。

更多文章