
 2021-12-16 10:12


1. 毕业设计(论文)主要内容:





2. 毕业设计(论文)主要任务及要求

  1. 完成深度学习络结构搭建使python语或matlab完成声纹识别的代码编写,可以使现有机器学习类库(Pytorch\Tensorflow\Matlab\Kaldi)进编写。

  2. 查询文本相关声纹识别的相关国内外文献,声纹识别技术包括前端的语音处理部分和后端的网络结构,前端主要是语音特征提取,提取用于辨别说话人的特征,后端核心为训练说话人识别模型。



    3. 毕业设计(论文)完成任务的计划与安排

    1. 2020年1月11日-2020年1月31日 查看相关国内外文献 。

    2. 2020年2月1日-2020年2月28日 针对性的学习Python编程语言;完成Tensorflow、MATLAB或kaldi框架搭建;熟悉声纹识别流程;尝试实现已阅读文献中的方法;完成开题报告。

    3. 2020年3月1日-2020年3月31日 处理原始数据集,数据集分为训练集、测试集和验证集,提取声纹特征(特征工程)。


    4. 主要参考文献

    1. ChaoLi et al. “Deep Speaker: an End-to-End Neural Speaker Embedding System”. In: arXiv e-prints,arXiv:1705.02304 (2017), arXiv:1705.02304.
    2. Xingang Pan et al. “Two at Once:Enhancing Learning and Generalization Capacities via IBN-Net”. In:ECCV2018.
    3. Jie Hu et al. “Squeeze-and ExcitationNetwork”. In:CVPR2018.David Snyder et al. “X-vectors: Robust dnn embeddings forspeaker recognition”. In: Proc. of ICASSP. IEEE. 2018, pp. 5329–5333.
    4. G. Bhattacharya, J. Alam, and P. Kenny.“Deep Speaker Embeddings for Short-Duration Speaker Verification”. In: Proc.Interspeech. 2017, pp. 1517–1521.
    5. Koji Okabe, Takafumi Koshinaka, andKoichi Shinoda. “Attentive Statistics Pooling for Deep Speaker Embedding”. In: Proc. Interspeech.2018, pp. 2252–2256.
    6. Chunlei Zhang and Kazuhito Koishida.“End-to-End Text-Independent Speaker Verificationwith Triplet Loss on Short Utterances”. In: Proc. Interspeech. 2017, pp.1487–1491.
    7. Li Wan et al. “Generalized end-to-endloss for speaker verification”. In: Proc. of ICASSP. 2018, pp. 4879–4883.
    8. Weicheng Cai, Jinkun Chen, and Ming Li.“Exploring the Encoding Layer and Loss Functionin End-to-End Speaker and LanguageRecognition System”. In: Proc. Speaker Odyssey. 2018, pp. 74–81.
    9. Zili Huang, Shuai Wang, and Kai Yu.“Angular Softmax for Short-Duration Text-independentSpeaker Verification.” In: Proc. of Interspeech. 2018, pp. 3623–3627.
    10. Joon Son Chung, Arsha Nagrani, andAndrew Zisserman. “VoxCeleb2: Deep SpeakerRecognition”. In: Proc. INTERSPEECH. 2018, pp. 1086–1090.

    剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付
