机器人通过观察少量演示来学习执行新任务 如自动驾驶
想象一下机器人是否可以从观看演示中学习:您可以向家用机器人展示如何做日常杂务或摆好餐桌。在工作场所中,您可以像新员工一样训练机器人,向他们展示如何执行许多职责。在旅途中,您的无人驾驶汽车可以通过观察您在附近的社区开车来学习如何安全驾驶。
为了实现这一愿景,南加州大学的研究人员设计了一种系统,该系统可使机器人从演示中自主学习复杂的任务。11月18日,在机器人学习会议(CoRL)上发表了题为从演示中学习使用信号时态逻辑的论文。
研究人员的系统通过评估每个演示的质量来工作,因此可以从看到的错误以及成功中学习。虽然当前的最先进方法至少需要100次演示才能完成特定任务,但这种新方法仅允许机器人从少量演示中学习。它还使机器人能够更直观地学习人类彼此学习的方式-您观看某人甚至不完美地执行任务,然后尝试自己。对于人类来说,从彼此观看中收集知识并不一定是“完美”的示范。
主要作者Aniruddh Puranic说:“许多机器学习和强化学习系统都需要大量的数据和数百个演示,如果您一个人反复演示,这是不可行的。” USC维特比工程学院计算机科学专业的学生。
“而且,大多数人没有编程知识来明确说明机器人需要做什么,而人类可能无法展示机器人需要知道的一切。如果机器人遇到了以前从未见过的东西怎么办?这就是一个关键的挑战。”
向示范学习
在为复杂任务获取有效的机器人控制策略(控制机器人的运动)时,从演示中学习变得越来越受欢迎。但是它很容易在演示中出现瑕疵,并且由于机器人可能会学习到不安全或不良行为而引起安全隐患。
此外,并非所有演示都是相等的:某些演示比其他演示更好地指示了所需的行为,并且演示的质量通常取决于提供演示的用户的专业知识。
为了解决这些问题,研究人员集成了“信号时态逻辑”或STL来评估演示的质量,并自动对它们进行排名以产生内在的奖励。
换句话说,即使演示的某些部分基于逻辑要求没有任何意义,使用这种方法,机器人仍然可以从不完善的部分中学习。从某种意义上说,该系统就演示的准确性或成功得出了自己的结论。
“如果说机器人从不同类型的演示中学习(可能是动手演示,视频或模拟),如果我做的事情很不安全,标准方法将做以下两件事之一:或者,它们将完全忽视它,甚至更糟的是,机器人将学到错误的东西,”南加州大学维特比分校计算机科学助理教授Stefanos Nikolaidis说。
“相反,这项工作以一种非常聪明的方式,以逻辑形式使用了一些常识性推理,以了解演示的哪些部分是好的,哪些部分是不好的。本质上,这正是人类所做的。”
例如,有人跳过停车标志的驾驶示范。在系统上,这要比在好的驾驶员方面的排名低。但是,如果在演示过程中,驾驶员执行了一些智能操作(例如,踩下刹车以避免撞车),机器人仍然会从这种智能操作中学习。
适应人类的喜好
信号时态逻辑是一种表达性的数学符号语言,可用于对当前和将来的结果进行机器人推理。前丰田工程师,南加州大学维特比分校计算机科学助理教授Jyo Deshmukh说,虽然以前在该领域的研究使用的是“线性时间逻辑”,但在这种情况下最好使用STL。
“当我们进入对时间至关重要的机器人和自动驾驶汽车之类的网络物理系统世界时,线性时间逻辑变得有点麻烦,因为它会导致变量的真/假值序列出现,而STL可以推理关于物理信号。”
在Deshmukh的建议下,Puranic在与Nikolaidis进行了动手机器人课程之后提出了这个想法,Nikolaidis一直在研究开发机器人以从YouTube视频中学习。三人决定进行测试。他们三人都对系统的成功程度感到惊讶,教授们都对普兰尼奇的辛勤工作表示赞赏。
尼古拉迪斯说:“与在许多机器人应用中广泛使用的最新算法相比,您看到所需的演示数量有一个数量级的差异。”
该系统已经使用Minecraft风格的游戏模拟器进行了测试,但是研究人员表示,该系统还可以从驾驶模拟器甚至视频中学习。接下来,研究人员希望在真实的机器人上进行尝试。他们说,这种方法非常适合事先知道地图但地图中存在动态障碍的应用:家庭环境中的机器人,仓库甚至太空探索漫游者。
尼古拉迪斯说:“如果我们希望机器人成为好的队友并帮助人们,首先,他们需要非常有效地学习并适应人们的喜好。” “我们的方法可以做到这一点。”
“我很高兴将此方法集成到机器人系统中,以帮助他们有效地从演示中学习,同时也可以有效地帮助人类队友完成协作任务。”
相关新闻推荐
-
弹性聚合物自愈机器人 受到损害能自动愈合
-
亚马逊将解雇无人机项目员工 转向外部采购
-
这个机器人手臂“学会了”局部去除软组织术
-
DOANet:让无人机更有效的搜索救援,更精准的声源定位!
-
观察魔方受到启发,研究出新颖的可重构关节的设计!
-
安徽首个APOTECA配药机器人正式“上岗” 全程配药不用人工操作
-
信息系统中的机器人技术,让我们生活更便利
-
万物皆可机器人:新型电磁喷雾可以将物体转化为微型机器人
-
蜘蛛机器人开始太空维修工作 将用于NASA的在轨维修任务
-
Rapid Robotics推出“开箱即用”的操作机器人
-
有关人员测试机器人集成系统,方法有趣并且覆盖信息更广阔
-
对激光雕刻“改头换面”,有效地提高了效率节省了能源!
-
人形机器人Pepper 在捷克医院成功上岗
-
OnRobot推出适用于苛刻应用的新型夹持器
-
GDU新型无人机Saga 搭载红外摄像头承受2.2磅负载
-
ABB推出全新“紧凑型”喷漆机器人 主要针对汽车制造业
-
新型折纸机器人:既能牢牢抓住重物,又能轻轻抓取易碎物品
-
Rapid Robotics为编程机器人筹集550万美元种子轮融资
-
曲面折纸让机器人“刚柔并济”,像猫一样灵活性
-
光云科技拟认购实在智能11.67%股权 7000万加码RPA领域
-
为工人减轻负担,深度学习可帮助机器人轻松抓取和移动物体
-
仅巴掌大的仿生两栖机器人 可用于农业、搜救以及挖掘
-
当传感器运用在海洋机器人中时,可以更好的监视水下的空间!
-
芒果开采中,看机器人如何选测出优质芒果!
-
物以类聚,机器人以群分,通过控制器将同种机器人聚集到一起!
-
远程操作的机器人竟能通过社交技术影响驾驶员?
-
利用这种方法对腹腔视觉分析,可以大大提高手术室操作效率!
-
一个可以跟踪特定人群并与之互动的机器人
-
2020全球人机体育大赛:为残疾人展示改变生活的技术
-
140个机器人为美国FBI工作 用以检索敏感信息
还没有人评论哦,抢沙发吧~