1分钟常识锦囊 | 舆图软件是怎么做到让林志玲、郭德纲为你指路的?
原问题:1分钟常识锦囊 | 舆图软件是怎么做到让林志玲、郭德纲为你指路的? 提问:@Megan 今天锦囊答主:科大讯飞研究院合成组 语音合成也叫文语转换(Text-To-Speech),简称TTS,简朴领略就是“让呆板说人话”。合成技能的结果有四个考量维度:示意力、音质、伟大度和天然度。今朝的技能演进,天然度和音质都有了明明晋升,各大技能提供商更多的是在研究怎样进步合成音的示意力,出格是语气和情绪方面,很典范的案例产物的就是高德用林志玲和郭德纲的声音播报路况。 那么一条音频是怎样合成出来的?这个进程包罗了两个步调:起首是建造语音库,然后是行使语音库将文本酿成音频的进程。 建造语料库必要录制用户数小时的干声,对灌音开展数据标注,再举办特性实习和技能优化,才气使韵律、音色、音质及天然度越发贴近,让合成的声音越发天然、流通。以高德舆图中林志玲的导航声音为例,在开始合成之前,起首是请志玲姐姐录了一些音频。这些音频不是随意说说就可以的,科大讯飞研究团队为林志玲做了出格计划——除了计划平衡的发音组合、黑白语句外,还专门为浮现她的“娃娃音”增加了语气词,并团结导航应用做了方向计划。以是能用最短的语料做出最好的结果。 之后就是把文本合成成语音。输入文本后,起首必要凭证辞书法则对文本举办说话处理赏罚,好比模仿人对天然说话的领略进程,包罗文本规整、词的切分、语法语义说明,使计较机对输入的文本能完全领略,并给出后续步调所必要的各类发音提醒。然后是韵律处理赏罚,就是为合成语音筹划出音段特性,如音高、音长和音强等,使合成语音能正确表达语意,听起来越发天然。最后按照前两部门处理赏罚功效的要求输出语音,即合成语音。 将来不只仅是明星,身边的统统声音理论上皆可合成。 而语音合成技能的应用范畴也很广。汽车导航内嵌的语音体系、智妙手机语音助手、念书软件等等,这些应用的实现都离不开语音合成,时下热点的AR、呆板人、可穿着装备等也为语音合成技能落地提供了更辽阔的市场。 1分钟常识锦囊是36氪的日更问答新栏目,旨在天天以一分钟为限,快问快答一个重要的贸易题目。本日我们解答的是人工智能相干的题目。假如你对近期的贸易天下尚有什么疑问,接待在评述区给我们留言,锦囊认真找好手为你解答 (编辑:湖南网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |