基于Transformer TTS的语音合成方法研究任务书

 2022-01-09 06:01

全文总字数:1512字

1. 毕业设计(论文)主要内容:

本论文题目参考学术论文成果。语音合成在人机交互中具有重要的地位,基于文本能够直接生成音频数据是语音合成的目标。本论文使用序列到序列模型实现由文本生成梅尔频谱图,随后使用声码器,实现从梅尔频谱图生成音频。

本论文的主要研究内容包括:

(1)综合Tacotron2以及Transformer模型两者的优点,得到Transformer TTS模型,实现由文本生成梅尔频谱图;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

2. 毕业设计(论文)主要任务及要求

1.查阅15篇相关文献(不少于3篇外文文献),并每篇书写200—300字文献摘要(装订成册,带封面);

2.认真填写周记,完成至少1500字开题报告(“设计的目的及意义”至少800汉字;“基本内容和技术方案”至少400汉字;进度安排应尽可能详细);

3.完成5000中文字以上的相关英文专业文献翻译,并装订成册(中英文一起,带封面);

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

(1)2020/1/13—2020/2/28:确定选题,查阅文献,外文翻译和撰写开题报告;

(2)2020/3/1—2020/4/30:系统架构、程序设计与开发、系统测试与完善;

(3)2020/5/1—2020/5/25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1]Shen J, Pang R, Weiss R J, et al. Natural tts synthesis byconditioning wavenet on mel spectrogram predictions[C]//2018 IEEE InternationalConference on Acoustics, Speech and Signal Processing (ICASSP). IEEE, 2018:4779-4783.

[2]VASWANI A, SHAZEER N, PARMAR N, et al. Attention is all youneed[C]//31st Annual Conference on Neural Information Processing Systems. NIPS,2017: 5998-6008.

[3]Li N , Liu S , Liu Y , et al. Neural Speech Synthesis withTransformer Network[J]. 2018.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。