加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长百科 > 正文

2020国际呆板翻译大赛:火山翻译力夺五项冠军

发布时间:2020-12-03 12:19:20 所属栏目:站长百科 来源:网络整理
导读:在11月下旬竣事的天然说话处理赏罚顶级学术集会会议EMNLP2020上,国际呆板翻译大赛(WMT20)发布了赛事最终功效,来自字节跳动火山引擎旗下的火山翻译(Volctrans)在39支参

  短视频,自媒体,达人种草一站处事

在11月下旬竣事的天然说话处理赏罚顶级学术集会会议EMNLP2020上,国际呆板翻译大赛(WMT20)发布了赛事最终功效,来自字节跳动火山引擎旗下的火山翻译(Volctrans)在39支参赛步队中杀出重围,以明显上风在「中文-英语」语向翻译项目上拿下了冠军。

另外,火山翻译团队还拿下了「德语 -英语」和「德语-法语」语向呆板翻译项目标冠军,更斩获了平行语料过滤对齐项目普什图语和高棉语的两项第一。

39支步队竞赛国际顶级呆板翻译大赛WMT

国际呆板翻译大赛(WMT)由国际计较说话学协会 (ACL) 举行,是环球学术界公认的国际顶级呆板翻译角逐,也是各大科技公司、顶尖院校与学术机构展示自身呆板翻译气力的较劲舞台。

自2006年至今,国际呆板翻译大赛(WMT)已经乐成举行15届,本届角逐共有39支步队参赛,包罗微软、Facebook、Google DeepMind、腾讯、小牛翻译、华为、滴滴等气力雄厚的参赛团队。

组委会按照中英、英中、英德等22个差异翻译使命提供测试数据集,并引入科学的说话专家人工评估流程。每个参赛体系起首由多名履历富厚的说话学家举办评估,然后对最终分数举办尺度化加权,最后举办排名。整个评估进程历时四个月,评价功效有很是高的置信度。

说话专家评估得分第一 火山翻译拿下「中文-英语」语向冠军

积年角逐中,「中文-英语」语向的翻译使命都是参赛步队最多、竞争最为剧烈的呆板翻译使命之一,本年更胜往年。

火山翻译团队介入了非受限场景的角逐,也就是在给定测试集的环境下,可以行使任何数据和要领试探翻译结果极限的角逐方法,组织方也引入了四个势力巨子的在线呆板翻译贸易体系(Online-A、G、Z、B)作为比拟,这也是最能浮现翻译团队数据和算法综合手段的场景。在人工评估中,火山翻译团队(Volctrans) 力压群雄,以明明的上风夺得了冠军。

(图:WMT2020 中英翻译前几名体系得分。Ave.z代表人工评估尺度化分数,也是今朝呆板翻译最受承认的指标。)

对比「中文-英语」,「德语-英语」在 WMT 角逐上是传统项目,也是欧洲国度最存眷的语向。在最后的人工评价中,火山翻译依然示意精彩,取得了第一名的后果。国际呆板翻译大赛组委会给出了很高的评价,“作为新的参加者,火山翻译示意尤为精彩(particularly well),逾越了许多传统步队”。

复旦大学计较机学院传授、EMNLP2021大会措施主席黄萱菁暗示:“WMT长短常硬核的角逐,火山翻译取得了精彩后果。火山翻译的LightSeq、mRASP等技能让人面前一亮,呆板翻译有辽阔的成长空间,很是等候火山翻译为呆板翻译的技能研究和产物应用试探更多也许性。”

领先的背后:火山翻译致力于打造前沿研究、产物研发和用户反馈的闭环

火山翻译(Volctrans)是由字节跳动计较机研究科学家、工程师、产物司理、产物运营和说话专家构成的专业团队研发,其基于自主研发的呆板进修技能,蕴蓄了百亿多种说话语料,已支持高出50个语种、2500个语对之间的互译,翻译结果和速率业界领先。

(图:火山翻译官网。可以通过 https://translate.volcengine.cn/ 体验火山翻译,并相识更多产物手段。)

今朝,火山翻译具备文本翻译、语音翻译、图像翻译、语种辨认四种手段,在办公、娱乐、消息等场景示意优秀。

基于这些手段,火山翻译推出了一系列形态多样的产物与处事,包罗呆板翻译云处事、智能视频翻译、智能同传、翻译赏识器插件等。另外,火山翻译支持API、SDK、私有陈设等多种接入方法,且支持垂直规模的快速模子定制,可以或许满意差异群体和差异行业的翻译需求。

在视频翻译场景,火山翻译提供简朴高效的视频“转写-打轴-翻译”全流程处事,轻松听译、智能打轴、高效编辑、专业审校,集四大手段于一身,辅佐创作者轻松高效地应对跨说话视频创作。

在语音翻译规模,火山翻译的智能同传技能也示意卓越,可以或许按照现场讲话提供高品格、低延时的及时语音辨认字幕功效,同时提供人工字幕保障方案,让集会会议现场以及直播字幕更精准流通。

火山翻译的技能来历于字节跳动团队多年呆板进修和天然说话处理赏罚规模的深耕。团队拥有百余项技能发现专利,在人工智能顶级国际学术集会会议颁发50余篇学术论文。在呆板翻译技能上更是独创了mRASP多说话预逊?с法,把几十种说话语料融合在一路实习,得到的模子在详细语对上微调取得了44个语对的业界最佳机能,整体结果力压Facebook研发的mBART要领。同时,火山翻译研发的LUT和COSTT语音到文本翻译算法,从语音输入(譬喻英语)可以直接输出方针说话笔墨(譬喻中文),镌汰了错误累积,在结果上取得了业界领先。

字节跳动精巧科学家、人工智能尝试室总监李磊称:“火山翻译焦点上风在打造前沿研究、产物研发和用户反馈的闭环,研发团队漫衍全天下多个国度,事变中也在行使本身打造的产物来跨说话雷同,在迭代中快速前进。”

火山翻译团队还研发了多项呆板翻译前沿技能,今朝已经集成到火山翻译系列产物中,譬喻镜像式天生模子MGNMT、CTNMT算法、交互式翻译算法CAMIT、胶囊翻译收集、并行翻译算法PNAT和GLAT等。火山翻译还回收了自研的高机能序列推理引擎LightSeq,推理速率业界最快,比原生体系进步10倍,可以到达每秒两万词的翻译速率。

李磊暗示:“火山翻译已经为飞书、今天头条等多款国表里产物提供不变和高质量的翻译处事,天天处理赏罚数亿次翻译哀求,为来自环球的过亿用户群体提供优质的翻译体验。将来,火山翻译但愿为更多用户提供处事,辅佐用户更高效地实现国际信息无障碍交换。”

申请创业报道,分享创业好点子。点击此处,配合切磋创业新机会!

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读