2019自然语言处理前沿论坛:聚焦机器“读、写、说、译”,探寻NLP未来之路
人工智能的本质是让呆板像人一样感知天下、认知天下。以说话和常识为研究工具的天然说话处理赏罚(NLP)技能是人工智能的焦点题目之一。5月26日,百度、中国计较机学会中文信息技能专委会和中国中文信息学会青工委连系举行“2019天然说话处理赏罚前沿论坛”。 百度高级副总裁、ACL Fellow王海峰博士为论坛做开场致辞。他暗示,“说话是人类思想和交换的载体,同时也是人类常识凝练和传承的载体。天然说话处理赏罚技能不只仅必要算法、算力和数据,同时也必要不绝地凝练常识,必要说话处理赏罚跟我们熟悉天下、改革天下的进程相团结,以是如故有许多创新打破的空间。”他但愿通过本次论坛,青年学者们可以或许增长交换,碰撞新的火花,一路敦促天然说话处理赏罚的成长及财富化的历程,在人工智能期间辅佐我们的糊口变得越发柔美。 本届论坛主题为“呆板之‘读、写、说、译’—— 探寻NLP将来之路”,包括语义计较、自动问答、说话天生、人机对话和呆板翻译5场专题陈诉,以及环绕上述专题的高朋对话环节。本论坛搜集学术界和家产界的青年专家学者,配合切磋NLP规模的最新技能盼望、财富应用及成长趋势,旨在促进产学研深度融合,敦促天然说话处理赏罚技能前进。 “语义计较”研究怎样操作计较机对天然说话的语义举办暗示、说明和计较,使呆板具备语义领略手段。哈工大车万翔传授先容了动态词向量的技能盼望,该技能可以按照上下文更好地处理赏罚一词多义征象,大幅进步天然说话处理赏罚多个使命的精确率;复旦大学邱锡鹏副传授先容了暗示进修的最新盼望,说明和比拟了当前主流模子的根基道理和优弱点,切磋了怎样更好地融合局部和非局部的语义相关,怎样更好地插手先验常识,以及针对今朝伟大收集模子的简化和加快。北京大学孙栩研究员开展了关于稀少化深度进修的研究,提出简朴有用的算法来简化神经收集,仅用全梯度的子集来更新模子参数,大幅低落了实习息争码伟大度。百度主任架构师孙宇先容了百度最近提出的常识加强语义暗示模子ERNIE,基于实体、短语等常识举办建模,在说话揣度、语义相似度等多个使命上取得了大幅晋升。 “自动问答”专题切磋呆板的“阅读”手段,让呆板阅读文本,然后答复和阅读内容相干的题目。呆板阅读领略可以使呆板具备从文本数据中获取常识并运用常识的手段,是问答规模的要害技能之一。中科院自动化所副研究员刘康先容了文本阅读领略的根基框架和要领。他暗示,构建公道的数据集对付阅读领略使命很是重要,而怎样更好的融合常识是将来的重要研究偏向。百度资深研发工程师刘璟先容了深度融合文本暗示与常识暗示的模子KT-NET,以及百度宣布的面向真实应用的中文阅读领略数据集DuReader 2.0。基于此数据集,百度、中国计较机学会和中文信息学会持续两年举行了呆板阅读领略评测,配合敦促中文阅读领略技能的前进。 “说话天生”专题聚焦怎样让计较机像人一样行使天然说话举办表达和创作。北京大学万小军传授先容了天然说话天生(NLG)技能和应用的最新盼望,指出天然说话天生今朝面对两大挑衅,起首是对天生文本的质量评估,其次是平行数据的缺失。假如这些题目办理了,将极大地敦促天然说话天生的成长。他同时也暗示,今朝的文本天生与人类尚有较大差距,尤其是在综合操作常识的方面。百度主任架构师肖欣延先容了百度在说话天生技能方面的创新和应用,提出了基于筹划、基于信息选择、端到端等多种模子,在文章天生、择要天生、诗歌天生等使命上取得精采结果。另外,百度还推出了智能写作平台,通过提供自动写作和帮助写作手段,晋升内容创作的服从和质量,为智能创作规模提供更多也许。 “人机对话”专题切磋怎样让计较机和人类举办对话交换。清华大学副传授黄民烈回首了人机对话的成长过程,经典的对话体系大多回收强语义要领,而当代神经收集要领例成长了弱语义要领,基于数据驱动和概率统计。语义领略始终是人机对话中必要攻陷的困难,怎样更好的团结数据和常识,是该规模必要配合全力的偏向。百度主任研发架构师孙珂先容了百度最新宣布的智能对话体系实习与处事平台UNIT 3.0,从搭建手艺、构建常识、整合手艺与常识三方面着眼,宣布了多个焦点技能和器材,大幅低落了对话体系的定制本钱。 “呆板翻译”是指操作计较机举办差异说话之间的转换和天生,是天然说话处理赏罚规模中弥补说话鸿沟的重要技能。清华大学副传授刘洋起首先容了神经收集呆板翻译的根基道理,并指出,尽量该要领取得了较大前进,可是如故面对很多挑衅。刘洋先容了他们在常识驱动、可表明性、鲁棒性神经收集呆板翻译方面的最新盼望。百度人工智能技能委员会主席何中军先容了呆板同传的首要挑衅和最新盼望,指出今朝呆板同传面对技能、数据、评价三个方面的挑衅。团结百度的研究成就,在现场行使了最新研发的百度翻译AI同传。现场听众行使手机扫描集会会议二维码,可以及时收听译文。 5大专题切磋竣事后,车万翔、邱锡鹏、黄民烈、刘洋以及百度高级科学家吕雅娟、百度PaddlePaddle总架构师于佃海就“NLP的将来之路”睁开高端对话。环绕“最近5年NLP的打破盼望”、“NLP的成长趋势及将来5-10年的打破偏向”等内容举办了出色的分享。他们以为5年来,NLP在数据、模子、算法等多方面取得了打破性盼望。中国NLP在学术界的研究及家产化应用处于国际前沿,连年来入选规模国际顶级集会会议的论文数目急剧增进,论文质量也在不绝上升。同时,我们也必要进一步增强前瞻性和原创性的事变,中国NLP的成长潜力不行小觑。谈及将来成长趋势,高朋们暗示将来进一步融合常识、多模态、试探更类人的进修机制等会带来NLP规模的进一步晋升。 天然说话处理赏罚被誉为人工智能皇冠上的明珠。跟着天然说话处理赏罚手段的不绝成长,人工智能也在不绝的前进。天然说话处理赏罚技能被普及应用于智能搜刮、深度问答、对话体系、智能写作、呆板翻译等规模,为宽大用户提供更智能的体验,满意用户对信息和处事的需求,同时也越来越多地在金融、处事、零售、制造业等行业中应用,促进财富智能化成长。NLP的将来之路是什么?或者没有尺度谜底。可是我们一向信托技能的力气。试探将来无穷的也许,正如王海峰所言,跟着技能成长,人们会越来越深入地领略天然说话、把握常识,敦促人工智能施展更大的代价,为人类社会成长提供更大的助力。
(编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |