加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 业界 > 正文

AAAI 2021最「严」一届放榜:录取率仅21%,网易伏羲9篇论文入选

发布时间:2020-12-08 02:57:51 所属栏目:业界 来源:网络整理
导读:克日,国际人工智能顶级集会会议AAAI 2021发布论文登科功效。网易伏羲尝试室再创佳绩,共有9篇论文入选,研究偏向涉及强化进修、假造人、天然说话处理赏罚(NLP)、图像动画、用户画像等规模。科研成就的齐集发作,充实表现网易伏羲在人工智能的多个规模已经具备国

在这项事变中,我们发明首要缘故起因来自于对大梯度地区的不正确的深度预计,从而使双线性插值偏差跟着判别率的进步而逐渐消散。为了在大的梯度地区中得到更精确的深度预计,必需得到具有空间和语义信息的高判别率特性。

因此,我们提出了一种改造的DepthNet HR-Depth,它具有两种有用的计策:(1)从头计划DepthNet中的跳跃毗连以镌汰编码器息争码器之间的语义鸿沟;(2)提出特性融合Squeeze-and-Excitation(fSE)模块以更有用地融合特性。行使Resnet-18作为编码器,HR-Depth在高判别率和低判别率场景中都逾越了全部现有技能,同时具有更少的参数。另外,早年的最新要领是基于相等伟大的深度收集,具有大量参数从而限定了它们的现实应用。因此,我们还构建了一个行使MobileNetV3作为编码器的轻量级收集。

AAAI 2021最「严」一届放榜:登科率仅21%,网易伏羲9篇论文入选

(收集布局图示)

AAAI 2021最「严」一届放榜:登科率仅21%,网易伏羲9篇论文入选

(预计功效图示)

尝试表白,轻量级收集可以以仅20%的参数与很多大型模子(如Monodepth2)以高判别率相媲美。

6、团结解耦通用值函数的强化进修商品保举

(Reinforcement Learning with a Disentangled Universal Value Function for Item Recommendation)

要害词:强化进修、商品保举

连年来,将强化进修团结到保举体系中,引起了人们极大的乐趣,也带来了新的挑衅。本文总结了基于强化进修的大局限保举体系在现实应用中面对的三大挑衅,并研发了一种基于 goal-based 的强化进修框架 GoalRec。

AAAI 2021最「严」一届放榜:登科率仅21%,网易伏羲9篇论文入选

(解耦值函数的强化进修保举框架)

本文团结world model和值函数的头脑,提出了一种基于模子的值函数情势化方法,可以或许将情形演变和嘉奖分分开来。通过行使浓密的保举情形数据而非嘉奖信号,我们有用地进修了一个与嘉奖无关的、高模子容量的world model。

差异于只猜测下一步状态的传统world model,我们通过引入goal-based 强化进修框架,通过对强化进修计策的参数化序列建模,将world model扩展到了用户轨迹维度。由于传统的基于模子的筹划要领服从较低,我们进一步将world model融入到值函数中,且必然水平上辅佐值函数规避了高方差情形与稀少嘉奖信号带来的进修题目。

在网易热点游戏《碰见逆水寒》隐秘市肆场景中,我们陈设了这一算法,验证了该算法对比之前的监视进修与平凡强化进修算法能带来较大的营业收益。

7、NeuralAC:用于角逐功效猜测的进修相助与竞争效应

(NeuralAC: Learning Cooperation and Competition Effects for Match Outcome Prediction)

要害词:神经收集,角逐猜测、相助竞争

猜测集体角逐的胜败是一项重要且有挑衅的使命。因为人具有社会属性,角逐中的成员不行停止地会与其他成员发生交互,影响角逐下场。现有的事变首要存眷于进修团队成员的个别手段,可能建模团队内部的交互。然而,群体角逐中存在多种伟大的交互,包罗团队内部交互(即相助效应)和团队间交互(即竞争效应)。同时,差异重要性的成员还会在群体角逐中受到差异水平的存眷,影响角逐功效。

AAAI 2021最「严」一届放榜:登科率仅21%,网易伏羲9篇论文入选

(游戏对战中的相助与竞争相关)

为此,本文提出了 NeuralAC,它能进修带权重的竞争相助效应,用于角逐功效的猜测。详细来说,NeuralAC起首将个别成员投影到多个隐空间,行使神经收集作为交互函数来建模对友间的相助和敌手间的竞争效应。随后,我们行使两种留意力机制来捕获团队内部以及团队间的留意力漫衍,这同时进步了角逐猜测的精确性和可表明性。

AAAI 2021最「严」一届放榜:登科率仅21%,网易伏羲9篇论文入选

(NeuralAC模子框架)

在多个电子集体竞技的数据集上的尝试功效都表白NeuralAC优于其余要领。该要领还可以很轻易地推广到其他使命中,如团队组建、MOBA游戏均衡性检测等。

8、基于气魄威风凛凛化的非平行语料的气魄威风凛凛化对话回覆活成

(Stylized Dialogue Response Generation Using Stylized Unpaired Texts)

要害词:天然说话处理赏罚、对话天生、天然说话天生、预实习说话模子、数据加强

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读