约翰霍普金斯大学博士,清华大学本科。博士主要研究方向是语音识别以及关键词检索方向,师从语音识别开源工具Kaldi的主要开发者Dr. Daniel Povey,以及约翰霍普金斯大学语言语音处理中心教授Dr. Sanjeev Khudanpur。
他目前于香港中文大学攻读博士学位,师从贾佳亚教授。研究方向是计算机视觉,三维深度学习,在CVPR/ICCV/ECCV上发表多篇论文。代表工作如: STD / 3DSSD等。
他是香港大学MaRS Lab博士生, 师从导师张富。他的研究方向是激光雷达SLAM以及多传感器(激光雷达-惯导-视觉)融合,先后以第一作者的身份在机器人顶刊顶会IROS,ICRA和RA-L上发表了5篇论文。此外,他还是开源社区的积极贡献者,其读博期间的所有研究工作都有对应的开源代码公开,其开源项目在github社区累计获得了超过4.6K的star,他的代表性工作R3LIVE, R2LIVE, FAST-LIO以及loam-livox已广泛应用于业界。
苏黎世大学Robotics and Perception Group博士生,导师为Davide Scaramuzza教授。博士期间主要的研究方向为视觉SLAM及其在移动机器人导航中的应用,具体涉及到多传感器融合、主动视觉和算法评估等方面,在RAL, ICRA, IROS, TRO等期刊会议发表论文多篇,曾获ICRA 2019 workshop on SLAM Benchmarking最佳论文奖。
美国俄勒冈州立大学助理教授,2009年获中科院自动化研究所获工学博士学位。博士毕业后,先后在德国波恩大学和美国佐治亚理工学院任研究职务,研究方向为机器学习和计算机视觉。曾于2009-2012年在图像物体识别界最重要的PASCAL VOC竞赛的分割项目上连续四年获得冠军,并获得美国自然科学基金CAREER award,已在ICML、NeurIPS、ICLR、CVPR、ICCV、ICRA等国际著名的杂志和会议上发表40余篇论文。
腾讯CSIG智能平台部算法工程师,西北工业大学计算机学院工学博士,主要研究兴趣包括鲁棒语音识别、语音降噪和对抗学习。曾在新加坡南洋理工大学、美国华盛顿大学以及出门问问AI Lab(西雅图)交流访问研究,在领域内重要的期刊和会议,如ICASSP,Interspeech,ASRU和TASLP上发表学术论文多篇,谷歌学术引用200余次。
西北工业大学ASLP实验室博士生,主要研究兴趣包括基于WFST的解码器、说话人自适应、置信度、关键词检测与唤醒及端到端语音识别。曾在约翰霍普金斯大学进行为期近3年的访问,师从开源语音识别系统之父Daniel Povey教授和COE主任Sanjeev Khudanpur教授,并在出门问问AI Lab(西雅图)进行短期交流。在领域内重要的期刊和会议,如ICASSP,Interspeech等联合发表学术论文10余篇。目前为开源语音工具—Kaldi和Espresso(e2e)的主要贡献者。
出门问问语音识别工程师,目前主要从事语音识别相关算法和相关产品研发。西北工业大学硕士,研究方向为语音识别,就读期间曾在百度、地平线语音组实习;毕业后加入微软,任Speech Scientist,从事声学模型及其相关算法研究;2018年8月加入出门问问。
智能语音算法工程师,清华大学计算机系硕士,Wenet社区核心开发者,参与多领域大规模中文语音识别开源数据集WenetSpeech的开发。曾先后任职于出门问问、地平线等公司,从事语音识别算法和产品研发。
香港科技大学机器人研究所博士生,师从香港科技大学机器人与多感知实验室主任刘明教授,研究方向为基于可见光通信(visible light communication)和机会信号(signals of opportunity)的室内定位。目前在T-ASE、IROS等期刊会议发表一作论文数篇,并获2018年IROS最佳学生论文奖提名和2019年室内定位与室内导航国际会议(IPIN)最佳论文奖第三名。
中国科学院声学研究所博士、美国佐治亚理工学院访问学者、中国科学院认证高级工程师,长期从事大语言模型、多模态、语音识别等领域研究,曾获多项顶会竞赛冠亚军奖项,已发表顶会论文十余篇,拥有专利多项。深度参与了小米自研大模型从零到一的研发过程,荣获2024年度CCF计算机应用创新技术一等奖。近期和Daniel Povey等提出SUBLLM新架构,被量子位等科技媒体报道。
佐治亚理工学院计算机博士,主要研究方向包括机器人学,以及机器人领域相关的感知问题。已于IJRR、IEEE Control Systems等期刊,以及RSS、ICRA等国际会议发表多篇论文,并获得IJRR 2018年度论文奖。