欢迎访问 生活随笔!

生活随笔

当前位置: 首页 > 编程资源 > 编程问答 >内容正文

编程问答

语音合成:transformer tts 论文复现以及dockerfile

发布时间:2024/3/13 编程问答 50 豆豆
生活随笔 收集整理的这篇文章主要介绍了 语音合成:transformer tts 论文复现以及dockerfile 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

Transformer-TTS

  • 基于pytorch复现的论文 Neural Speech Synthesis with Transformer Network
  • 这个模型合成速度比tacotron快3-4倍,合成质量也比较高。每步大概需要0.5秒。
  • 没有使用wavenet声码器,使用tacotron的CBHG模型,使用griffin-lim算法将频谱图转换为原始波。
  • model结构
  • [外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-tL3EG5JP-1593704300755)(https://i.loli.net/2020/07/01/QB5aAbrcLNtTuFR.png)]

Requirements

  • Install python 3
  • Install pytorch == 0.4.0
  • Install requirements:
falcon==1.2.0 inflect==0.2.5 librosa==0.7.1 scipy==1.0.0 Unidecode==0.4.21 pandas numpy tensorboardX tqdm

Data

  • LJspeech

Pretrained Model

总结

以上是生活随笔为你收集整理的语音合成:transformer tts 论文复现以及dockerfile的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得生活随笔网站内容还不错,欢迎将生活随笔推荐给好友。