课程价格 :
¥599.00
剩余名额
0
-
学习时长
5周/建议每周至少6小时
-
答疑服务
专属微信答疑群/讲师助教均参与
-
作业批改
每章节设计作业/助教及时批改评优
-
课程有效期
一年/告别拖延,温故知新
- 1:【课件】开课仪式
- 第1章: 语音识别综述
- 2-1:【课件】第一章语音识别综述
- 2-2:【补充】课件中的视频/音频
- 3:【视频】语音识别任务介绍
- 第1节: 什么是语音
- 4:【视频】什么是语音
- 第2节: 语音识别的挑战
- 5:【视频】语音识别的挑战
- 第3节: 语音识别框架
- 6:【视频】语音识别框架
- 第2章: 语音信号处理与特征提取
- 7-1:【课件】语音信号处理与特征提取
- 7-2:【补充】课件中的动图
- 8:【视频】章节内容引入
- 第1节: 数字信号处理基础
- 9:【视频】数字信号处理基础
- 第2节: 常用特征提取
- 10:【视频】FBank特征提取
- 第3节: Torchaudio介绍与使用
- 11:【视频】TorchAudio介绍与使用
- 第4节: Project I 语音特征提取
- 12-1:【附件】Project1 FBank语音特征提取
- 12-2:Project1 语音特征提取
- 12-3:【作业】Project 1 FBank语音特征提取
- 12-4:【作业思路】Project 1
- 第3章: 端到端语音识别基础知识
- 13-1:【课件】端到端语音识别基础知识
- 13-2:【补充】课件中的动图
- 第1节: 章节内容引入
- 14:【视频】本章内容介绍
- 第2节: Transformer中的Attention与multi-head attention
- 15-1:【视频】自注意力与交叉注意力
- 15-2:【视频】多头注意力
- 15-3:【视频】自注意力的缺陷与位置编码
- 第3节: 自回归解码
- 16:【视频】自回归解码
- 第4节: Transducer基础
- 17:【视频】Transducer基础:CTC与RNNT
- 第5节: 小结
- 18:【视频】小结
- 第6节: Project II 特征提取器Transformer在语音中的应用
- 19-1:【附件】Project2 Speech-Transformer
- 19-2:【作业说明】Project 2 实践作业说明
- 19-3:【作业】Project2 Speech-Transformer
- 第4章: FunASR理论、前沿与实战
- 第1节: FunASR与魔搭社区介绍
- 第2节: FunASR核心非自回归模型
- 第3节: FunASR创新技术
- 第4节: FunASR实战:Python推理与微调
- 第5节: Project III FunASR热词模型推理优化实战
- 第5章: FunASR服务部署
- 第1节: FunASR服务部署介绍
- 第2节: 离线文件转写服务
- 第3节: 实时语音听写服务
- 第4节: Project IV 语音识别服务部署