• 学习时长

    8周/建议每周至少8小时

  • 答疑服务

    专属微信答疑群/讲师助教均参与

  • 作业批改

    每章节设计作业/助教及时批改评优

  • 课程有效期

    一年/告别拖延,温顾知新

限时特价: 849
优惠名额仅剩: 10个

原价: ¥899.00

*下期课程原价将调整至999元

支持花呗分期

  • 第1章: 语音合成综述
  • 第1节: 语音合成的定义、历史及应用
  • 第2节: 基本的语音合成系统构成
  • 第3节: 语音合成中的关键技术及评价标准
  • 第4节: 语音合成的资源
  • 第5节: 课程介绍
  • 第2章: 语音合成中的前端文本分析
  • 第1节: 文本分析基础知识
  • 第2节: 文本分析的模块构成与方法
  • 第3节: 基于 CRF 的前端文本析模型
  • 第4节: 基于 NN 的前端文本分析模型
  • 第5节: RNN与LSTM(额外补充)
  • 第6节: 基于NN的文本分析
  • 第7节: 【实践1】实现基于 CRF 的分词
  • 第8节: 【实践2】实现基于 ngram/rnnlm 的 g2p 多音字模型
  • 第3章: 传统语音合成算法
  • 第1节: 传统语音合成概述
  • 第2节: 基于HMM的统计参数语音合成
  • 第3节: 语音合成中的时长建模
  • 第4节: 基于NN的统计参数语音合成
  • 第5节: 传统声码器技术
  • 第6节: 单元拼接语音合成
  • 第7节: 【实践1】World vocoder 参数提取与合成
  • 第8节: 【实践2】实现基于 LSTM/GRU 的声学与时长模型
  • 第4章: 基于seq2seq的语音合成
  • 第1节: Sequence-to-Sequence 和 Attention机制
  • 第2节: 基于Tacotron的端到端语音合成及变体
  • 第3节: 端到端语音合成的变体(一)
  • 第4节: 【实践】实现基于Tacotron的声学模型
  • 第5章: 端到端语音合成进阶
  • 第1节: 端到端语音合成的变体(二)
  • 第2节: Attention机制探索
  • 第3节: 序列到序列的模型变体
  • 第4节: Attention机制探索
  • 第5节: FastSpeech和DurIAN
  • 第6节: 【实践】实现基于LSA的attention机制的语音合成
  • 第6章: 神经网络声码器
  • 第1节: 概述
  • 第2节: 基于 Normalizing Flow 的神经声码器:WaveNet, WaveRNN, LPCNet, WaveGlow
  • 第3节: 基于GAN的神经声码器:Parallel WaveGAN, MelGAN
  • 第4节: 【实践1】实现基于 Mel 特征的 WaveRNN
  • 第5节: 【实践2】声学模型与神经声码器的对接
  • 第8章: 总结展望
  • 第1节: 课程回顾
  • 第2节: 语音合成的挑战
  • 第3节: 语音合成前沿展望

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》

请完善资料,让我们更好的为您服务!

+86  (手机号已绑定)

未注册验证后自动登录,注册/登录则视为同意

《服务协议》《隐私协议》

请选择自己感兴趣的领域

智能语音

三维视觉

计算机视觉

移动机器人

推荐系统

工业机器人

知识图谱

深度学习

自然语言处理