2019深度学习语音合成指南（下）

发布时间：2019-12-24 01:06:37 所属栏目：运营来源：站长网

导读：副问题#e# 前文回首：2019深度进修语音合成指南（上） Deep Voice 3: 操作卷积序列进修将文本转换为语音文章链接：https://arxiv.org/abs/1710.07654 作者提出了一种全卷积字符到谱图的框架，可以实现完全并行计较。该框架是基于留意力的序列到序列模子。

它由一个轮回的的序列到序列特性猜测收集构成，该收集将字符嵌入到梅尔标度图谱中。然后是一个修改后的WaveNet模子，这个模子充当声码器，操作频谱图来合成时域波。模子的均匀意见评分(MOS)为4.53分。

2019深度进修语音合成指南（下）

这个模子团结了Tacconon和WaveNet的最佳特点。下面是它与其他模子的机能比拟：

2019深度进修语音合成指南（下）

结论：

此刻的语音合成技能成长很快，我们但愿可以或许尽快追遇上最前沿的研究。以上这几篇文章是当前语音合陋习模最重要的盼望代表，论文、以及其代码实现都可在网上找到，等候你能去下载下来举办测试，并可以或许得到祈望的功效。

让我们一路缔造一个富厚多彩的语音天下。

原文链接：https://heartbeat.fritz.ai/a-2019-guide-to-speech-synthesis-with-deep-learning-630afcafb9dd

（编辑：湖南网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

3/3

首页

等等党又赢了，iPhone	450W高功耗卡皇名不虚
群联 PCIe 5.0 SSD一定	微星Modern 14 15笔记