加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

OpenAI机器手“进修”解开三阶魔方技能

发布时间:2019-10-16 17:32:12 所属栏目:移动互联 来源:王隼
导读:中关村在线动静:克日据外媒报道,OpenAI是一家以人工智能和呆板进修研究而有名的公司,其周二展示了能解开三阶魔方的机器手。 OpenAI机器手“进修”解开三阶魔方技能 名为Dactyl的机器手是通过行使称为自动域随机化(ADR)和强化进修的新技能举办实习的。

中关村在线动静:克日据外媒报道,OpenAI是一家以人工智能和呆板进修研究而有名的公司,其周二展示了能解开三阶魔方的机器手。

OpenAI机器手“进修”解开三阶魔方技能

OpenAI机器手“进修”解开三阶魔方技能
OpenAI机器手“进修”解开三阶魔方技能

名为Dactyl的机器手是通过行使称为自动域随机化(ADR)和强化进修的新技能举办实习的。在已往的Dota 2中,Dactyl所回收的强化进修算法已经证明白它可以反抗人类敌手。

新技能ADR通过天生越来越难以实习的Dactyl实习场景来辅佐教机器手办理迂腐的困难。自动域随机化的方法如下:

ADR从单一的非随机情形开始,在该情形中,神经收集进修了怎样解开三阶魔方。跟着神经收集在使命中变得更好并到达机能阈值,域随机化的数目会自动增进。

因为神经收集此刻必需学会将其推广到更随机的情形,因此这使使命越发难题。神经收集不绝进修,直到再次高出机能阈值,然后再举办更多随机化,然后一再该进程。

团队以为,ADR是一项重大前进,由于慢慢坚苦的实习模仿的成立“使我们挣脱了对真实天下的精确模子的约束,并使在模仿中进修到的神经收集的转移可以或许应用于真实天下。 ” 

最后,在使神经收集顺应各类环境后,Dactyl可以或许纯熟地顺应各类物理环境,包罗手指被绑住,戴上橡胶手套等远景。

(文中图片来自互联网)

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读