微软语音辨认堕落率达5.1%创新低:比肩专业速录员
日前,微软公司公布,其对话式语音辨认体系的堕落率到达5.1%,创下今朝为止的最低程度,高出了客岁微软人工智能及研究奇迹部一组研究职员所实现的5.9%堕落率,到达了专业速录员的平等程度。 在此次研究中,专业速录员具备一再收听灌音等上风。这两次研究转录的是Switchboard语料库中的灌音。Switchboard语料库包括了2400段电话对话,自上世纪90年月以来一向被研究职员作为测试语音辨认体系的样本。 ![]() 新研究由微软人工智能及研究奇迹部的一组研究职员实验,方针是在堕落率上到达一组速录员的平等程度,后者可以重复收听灌音样本,,相识对话语境,与其他速录员相助。 整体来说,通过改造微软语音辨认体系中基于神经收集的听觉和说话模子,实验最新研究的研究职员可以或许在客岁基本上把堕落率低落约莫12%。 显然,他们还可以让语音辨认器相识整体对话,顺应灌音样本的语境,猜测对话中很也许呈现的下一个词汇或短语。这正是人类在与其他人对话时的做法。 微软的语音辨认体系已被用于语音助手“小娜”、及时翻译字幕成果Presentation Translator以及微软认知处事中。 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |