加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 运营 > 正文

DeepMind和谷歌用人工智能重现了前NFL后卫蒂姆肖的声音

发布时间:2019-12-20 20:52:23 所属栏目:运营 来源:站长网
导读:本年8月,谷歌人工智能研究职员与ALS治疗成长研究所相助,分享了一个针对有措辞障碍的人的语音到文本转录处事Euphonia项目标细节。他们表白,行使母语和非母语英语行使者的音频数据集和帕罗特龙(一种针对有障碍人群的人工智能器材)的技能,可以大大进步

DeepMind和谷歌用人工智能重现了前NFL后卫蒂姆肖的声音

本年8月,谷歌人工智能研究职员与ALS治疗成长研究所相助,分享了一个针对有措辞障碍的人的语音到文本转录处事Euphonia项目标细节。他们表白,行使母语和非母语英语行使者的音频数据集和帕罗特龙(一种针对有障碍人群的人工智能器材)的技能,可以大大进步语音合成和天生的质量。

最近,在一个案例研究中,谷歌研究职员和Alphabet的DeepMind团队雇佣了Euphonia,试图重现蒂姆·肖(Tim Shaw)的原始声音,他曾是NFL足球队的后卫,在2013年退休前曾效力于卡罗莱纳黑豹队、杰克逊维尔美洲虎队、芝加哥熊队和田纳西泰坦队。约莫六年前,肖被诊断出患有肌萎缩性侧索硬化症,这必要他行使轮椅,在没有辅佐的环境下,,他无法措辞、无法吞咽,乃至,无法呼吸。

在六个月的时刻里,连系研究小组回收了一个可天生的人工智能模子WaveNet,来完成从肖被诊断为肌萎缩性脊髓侧索硬化症之前的声音样本中合成语音的使命——WaveNet可以或许仿照重音和语调。

DeepMind和谷歌用人工智能重现了前NFL后卫蒂姆肖的声音

与之前的语音天生模子对比,它天生的语音片断更有说服力。谷歌暗示,基于均匀意见评分,它已经将人类语音的质量差距缩小了70%——并且它的服从更高。它在谷歌的张量处理赏罚单位(TPUs)上运行时,一个1秒的语音样本只必要50毫秒就能建设出来。

WaveNet早已经被用于为谷歌的会话平台、谷歌助理天生定制语音,最近,它还被用于在谷歌云平台上为谷歌的云文本到语音处事天生数十个新的语音和语音变体——仅8月份就有38种。

微调被证明是从起码的实习数据中得到高质量合成的要害。为了重现肖的声音,谷歌和DeepMind团队回收了客岁颁发的一篇研究论文中提出的一种要领(“样本有用的自顺应文本到语音”),该要领包罗在几天内对多达数千个扬声器的大型WaveNet模子举办预实习,直到它可以或许发生天然发声的根基语音。在这一点上,该模子从方针措辞人哪里获得一小部门数据,使得其天生的语音具有该措辞人的特性。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读