加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 访谈 > 正文

狗的训练方法可帮助研究人员教机器人学习新技巧

发布时间:2020-11-03 16:41:53 所属栏目:访谈 来源:网络整理
导读:约翰霍普金斯大学的计较机科学家回收一种凡是用于教狗坐下和坐下的实习技能,向呆板人展示了一种怎样自学几种新能力的呆板人,包罗堆砌块。通过这种要领,名为Spot的呆板人可以在几天内进修凡是必要一个月的时刻。 通过行使起劲强化,这是任何行使过的看待

约翰霍普金斯大学的计较机科学家回收一种凡是用于教狗坐下和坐下的实习技能,向呆板人展示了一种怎样自学几种新能力的呆板人,包罗堆砌块。通过这种要领,名为Spot的呆板人可以在几天内进修凡是必要一个月的时刻。

狗的实习要领可辅佐研究职员教呆板人进修新能力

通过行使起劲强化,这是任何行使过的看待改变狗的举动的人都认识的要领,团队极大地进步了呆板人的手艺,而且很快地完成了实习,使实习实际天下中的呆板人成为更可行的企业。这些发明新颁发在名为“ Good Robot!”的论文中。

“这里的题目是我们怎样让呆板人进修手艺?”约翰霍普金斯大学计较交互与呆板人尝试室的博士生安德鲁·洪特说。“我有狗,以是我知道嘉奖的事变,这就是我计划进修算法的灵感。”

与生成具有高度直觉的大脑的人和动物差异,计较机是空缺板,必需从新开始进修统统。可是,真正的进修凡是是通过重复试验来完成的,呆板人专家仍在研究怎样从错误中有用进修。

该团队在这里通过计一律种嘉奖体系来实现这一方针,该嘉奖体系可以像看待狗一样看待呆板人,为呆板人事变。狗也许会由于做得好的事变而获得饼干,而呆板人则得到了数字积分。

洪特回想说,他曾经教过他的小泼皮小狗叫利亚(Leah)呼吁“分开它”,这样她就可以无视步行中的松鼠。他行使两种范例的零食,平凡的锻练零食和更好的对象,譬喻奶酪。当莉亚欢快而无所事事时,她一无全部。可是当她沉着下来并移开视线时,她获得了好对象。“当时辰我给了她奶酪,然后说,'分开!好呀!'”

狗的实习要领可辅佐研究职员教呆板人进修新能力

同样,要会萃块,发明呆板人必要进修怎样专注于建树性动作。当呆板人试探积木时,它很快相识到正确的堆叠举动可以赚取高分,而错误的堆叠则不能赚到高分。伸脱手,但不领略障碍?没有分数敲一堆?绝对没有分。通过将最后一个区块放在四个区块的仓库之上,Spot得到了最大的收益。

实习计策不只有用,并且花了几天的时刻来汇报呆板人已往必要数周的时刻。通过起首实习相同于视频游戏的模仿呆板人,然后行使Spot运行测试,该团队可以或许镌汰操练时刻。

亨特说:“呆板人想要更高的分数。”“它可以敏捷进批改确的举动以得到最佳回报。现实上,呆板人已往凡是要花一个月的时刻才气到达100%的精度。我们可以或许在两天内做到这一点。”

起劲的强化不只可以辅佐呆板人自学积木,并且通过点体系,呆板人也可以很快地学会其他几项使命,乃至包罗怎样玩模仿的导航游戏。在全部环境下都可以从错误中进修,这对付计一律种可以顺应新情形的呆板人至关重要。

狗的实习要领可辅佐研究职员教呆板人进修新能力

洪特说:“早先,呆板人不知道本身在做什么,可是每次操练城市越来越好。它永久不会放弃,而且会不绝实行堆叠,而且可以或许100%地完成使命。”

该团队以为,这些发明可以辅佐实习家用呆板人去洗衣服和洗碗-这些使命在果真市场上很风行,而且可以辅佐晚年人独立糊口。它还可以辅佐计划改造的自动驾驶汽车。

哈格说:“我们的方针是最终开拓出可以在实际天下中完成伟大使命的呆板人,譬喻产物组装,照顾老人和手术。”“我们今朝不知道怎样编程这样的使命-天下太伟大了。可是像这样的事变向我们表白,呆板人可以进修怎样故安详且安详的方法完成此类实际使命的设法是有但愿的有用的方法。”

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章
      热点阅读