欢迎访问生活随笔！

生活随笔

生活随笔是一个全网技术分享平台，涵盖前端开发（HTML/CSS/JavaScri...

生活随笔

当前位置：首页 > 编程资源 > 编程问答 >内容正文

编程问答

语音合成：transformer tts 论文复现以及dockerfile

发布时间：2024/3/13 编程问答 50 豆豆

生活随笔收集整理的这篇文章主要介绍了语音合成：transformer tts 论文复现以及dockerfile 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Transformer-TTS

基于pytorch复现的论文 Neural Speech Synthesis with Transformer Network
这个模型合成速度比tacotron快3-4倍，合成质量也比较高。每步大概需要0.5秒。
没有使用wavenet声码器，使用tacotron的CBHG模型，使用griffin-lim算法将频谱图转换为原始波。
model结构

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tL3EG5JP-1593704300755)(https://i.loli.net/2020/07/01/QB5aAbrcLNtTuFR.png)]

Requirements

Install python 3
Install pytorch == 0.4.0
Install requirements:

falcon==1.2.0 inflect==0.2.5 librosa==0.7.1 scipy==1.0.0 Unidecode==0.4.21 pandas numpy tensorboardX tqdm

Data

LJspeech

Pretrained Model

总结

以上是生活随笔为你收集整理的语音合成：transformer tts 论文复现以及dockerfile的全部内容，希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错，欢迎将生活随笔推荐给好友。

上一篇：如何评价腾讯发布的区块链游戏《一起来捉妖
下一篇： 3位Committer，12场国内外技术