盖世汽车讯 近年来,机器人专家开发了各种各样的系统,旨在解决不同的现实世界任务,如完成家务、递送包裹,或在指定环境中寻找目标物体。该领域的一个关键目标是,开发算法以支持在具有不同体型和特征的机器人之间可靠地转移特定技能。这将有助于快速训练机器人完成新任务,从而拓展其能力。
据外媒报道,加州大学伯克利分校的研究人员开发出RoVi-Aug。这是一种新的计算框架,旨在增强机器人数据并促进不同机器人之间实现技能转移。该研究发表在预印本服务器arXiv上。该方法利用先进的生成模型来增强图像数据,并为不同的机器人创建具有不同摄像视图的合成视觉任务演示。
研究人员表示,“当代机器学习系统成果表现出卓越的泛化能力,特别是生成模型,并激励研究人员探索如何在机器人技术中实现类似的泛化能力。自今年年初以来,我们一直在研究跨视点和跨机器人泛化的问题。”
在之前进行研究时,研究人员发现了在不同机器人之间进行学习泛化的一些挑战。具体来说,他们发现当机器人数据集中包含的场景分布不均匀时,例如其中特定机器人视觉效果和摄像角度占主导地位,这使得它们在向不同机器人教授相同技能时效果较差。
有趣的是,研究人员发现,许多现有机器人训练数据集具有不平衡性,包括一些最完善的数据集。例如,即使是Open-X Embodiment数据集,其中一些机器人的数据也更多,例如Franka和xArm机械手。
数据集的这种偏差,使机器人策略模型倾向于过度拟合特定的机器人类型和视点。研究人员表示:“为了缓解这一问题,2024年2月,我们提出了一种测试时间适应算法Mirage。该算法通过交叉绘制,在训练期间将看不见的目标机器人转化为能看见的源机器人,从而创建源机器人在测试时执行任务的假象。”