• 学习时长

    8周/建议每周至少8小时

  • 答疑服务

    专属微信答疑群/讲师助教均参与

  • 作业批改

    每章节设计作业/助教及时批改评优

课程价格: 899.00

支持花呗分期

  • 第1章: 语音合成综述
  • 第1节: 语音合成的定义、历史及应用
  • 第2节: 基本的语音合成系统构成
  • 第3节: 语音合成中的关键技术及评价标准
  • 第4节: 语音合成的资源
  • 第5节: 课程介绍
  • 第2章: 语音合成中的前端文本分析
  • 第1节: 文本分析基础知识
  • 第2节: 文本分析的模块构成与方法
  • 第3节: 基于CRF的前端文本析模型
  • 第4节: 基于NN的前端文本分析模型
  • 第5节: 实践1:实现基于CRF的分词
  • 第6节: 实践2:实现基于ngram/rnnlm的g2p多音字模型
  • 第3章: 传统语音合成算法
  • 第1节: 传统语音合成概述
  • 第2节: 基于HMM的统计参数语音合成
  • 第3节: 语音合成中的时长建模
  • 第4节: 基于NN的统计参数语音合成
  • 第5节: 传统声码器技术
  • 第6节: 单元拼接语音合成
  • 第7节: 实践1:World vocoder参数提取与合成
  • 第8节: 实践2:实现基于LSTM/GRU的声学与时长模型
  • 第4章: 基于序列到序列的语音合成
  • 第1节: Sequence-to-Sequence 和 Attention机制
  • 第2节: 基于Tacotron的端到端语音合成
  • 第3节: 端到端语音合成的变体(一)
  • 第4节: 实践:实现基于Tacotron的声学模型
  • 第5章: 端到端语音合成进阶
  • 第1节: 端到端语音合成变体(二)
  • 第2节: attention机制探索
  • 第3节: FastSpeech和DurIAN
  • 第4节: 实践:实现基于LSA的attention机制的语音合成
  • 第6章: 神经网络声码器
  • 第1节: 概述
  • 第2节: 基于Normalizing Flow的神经声码器:WaveNet, WaveRNN, LPCNet, WaveGlow
  • 第3节: 基于GAN的神经声码器:Parallel WaveGAN, MelGAN
  • 第4节: 实践1:实现基于Mel特征的WaveRNN
  • 第5节: 实践2:声学模型与神经声码器的对接
  • 第8章: 总结展望
  • 第1节: 课程回顾
  • 第2节: 语音合成的挑战
  • 第3节: 语音合成前沿展望

相关推荐

自然语言处理 知识图谱 进阶
智能语音 智能语音 基础