语音合成:transformer tts 论文复现以及dockerfile
生活随笔
收集整理的这篇文章主要介绍了
语音合成:transformer tts 论文复现以及dockerfile
小编觉得挺不错的,现在分享给大家,帮大家做个参考.
Transformer-TTS
- 基于pytorch复现的论文 Neural Speech Synthesis with Transformer Network
- 这个模型合成速度比tacotron快3-4倍,合成质量也比较高。每步大概需要0.5秒。
- 没有使用wavenet声码器,使用tacotron的CBHG模型,使用griffin-lim算法将频谱图转换为原始波。
- model结构
- [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tL3EG5JP-1593704300755)(https://i.loli.net/2020/07/01/QB5aAbrcLNtTuFR.png)]
Requirements
- Install python 3
- Install pytorch == 0.4.0
- Install requirements:
Data
- LJspeech
Pretrained Model
总结
以上是生活随笔为你收集整理的语音合成:transformer tts 论文复现以及dockerfile的全部内容,希望文章能够帮你解决所遇到的问题。
- 上一篇: 如何评价腾讯发布的区块链游戏《一起来捉妖
- 下一篇: 3位Committer,12场国内外技术