• 课程中心
  • 公开课
  • 面试题库
  • 企业服务
    • 企业内训
    • 企业招聘
  • 高校合作
  • 课程中心
  • 公开课
  • 面试题库
  • 企业服务
    • 企业内训
    • 企业招聘
  • 高校合作
    • 登录/注册
  • 登录/注册
    • 登录/注册
  • 登录 /注册
    • 课程中心
    • 公开课
    • 面试题库
    • 企业服务
      • 企业内训
      • 企业招聘
    • 高校合作

    HangLyu

    暂无个性签名

    西北工业大学ASLP实验室博士生,主要研究兴趣包括基于WFST的解码器、说话人自适应、置信度、关键词检测与唤醒及端到端语音识别。曾在约翰霍普金斯大学进行为期近3年的访问,师从开源语音识别系统之父DanielPovey教授和COE主任SanjeevKhudanpur教授,并在出门问问AILab(西雅图)进行短期交流。在领域内重要的期刊和会议,如ICASSP,Interspeech等联合发表学术论文10余篇。目前为开源语音工具—Kaldi和Espresso(e2e)的主要贡献者。
    • 0
      粉丝
      关注 已关注
    • 0
      关注
    • Ta的课程
    • Ta的在教课程
    • Ta的课程
    • 课程讨论
    • Ta的话题
    • Ta的问答
    • Ta发布的
    • Ta参与的
    • 请问,第七章作业里,thchs30里language model的训练语料在哪里?

      ——来自《语音识别:从入门到精通- 第一期》·41浏览

      训练集的标注就是你训练语言模型的数据。

    • 请问,第七章作业里,thchs30里language model的训练语料在哪里?

      ——来自《语音识别:从入门到精通- 第一期》·41浏览

      实际中看情况。比如说你在做标准数据集和别人比结果,那你就只能用那数据集合(比如说swbd,如果只是比这个数据集,那通常只用原本语料;但是也可以用swbd+fisher数据,这样效果更好。看task)。但是如果你是大公司的线上系统,你能收集多少数据就收集多少数据,一般来说,越多越好。

      只要你注意不把test集合加进去就好。

      这个主要是让你们体验一下流程,熟悉一下工具包。因为实际工程对于成熟的算法,你用现成工具多;有新idea,才需要自己写。

    • kaldi资料共享

      ——来自《语音识别:从入门到精通- 第一期》·84浏览

      http://kaldi-asr.org/doc/,可以看看官方文档。里面对术语,coding风格,io机制,HMM设计,等等等等都有介绍。

      当然看多少博客都不如看看代码。

    • 关于GMM-HMM训练的基本框架

      ——来自《语音识别:从入门到精通- 第一期》·69浏览

      yes

    深蓝学院是专注于前沿科技的教育平台,目前在人工智能、机器人与自动驾驶领域搭建了完善的课程体系,并在积极探索嵌入式、物联网、增强现实领域的教育模式。学院致力于为企业培养踏实上进的工匠型人才,也愿与企业共同探索人才教育方案。

    关于我们 版权声明 联系电话:010-86226736
    服务协议 反馈建议 联系邮箱:service@shenlanxueyuan.com
    友情链接:
    • 中科院自动化所
    • 中国科学院大学
    官方微信公众号
    扫码下载APP
    ©2025 深蓝学院

    课程内容版权均归 北京深蓝前沿科技有限公司所有

    京ICP备19029074号| 京公网安备 11011402010666号
    在线咨询
    常见问题
    证书查询
    返回顶部