
2014年硕士毕业于西北工业大学音频、语音与语言处理研究组(ASLP@NPU), 先后在微软、思必驰和出门问问等公司从事语音助手、企业服务和智能客服等产品中的语音和NLP技术研发。目前在地平线公司从事智能座舱语音交互相关工作。

许修为,清华大学自动化系四年级直博生,导师为鲁继文教授,研究方向为三维场景感知和具身决策规划。以第一作者/共同一作在TPAMI/CVPR/NeurIPS/ECCV等顶级期刊会议上发表论文6篇,担任IJCV/TIP/CVPR/ICCV/ECCV/NeurIPS/ICLR审稿人。获得国家自然科学基金青年学生基础研究项目(博士研究生)资助、博士生国家奖学金等荣誉

潘越,德国波恩大学在读博士生,导师为Cyrill Stachniss 教授,研究方向为SLAM,三维重建以及农业机器人应用,研究成果在TRO, RAL, CVPR, ICRA, IROS 等期刊,会议上发表。

目前在辰稻资本担任投资经理,进行自动驾驶相关领域的早期项目投资。曾先后任职在易控智驾、亿咖通等自动驾驶公司担任车端算法负责人与感知负责人,擅长感知、定位及规划决策等技术方向。新加坡南洋理工大学控制专业博士,主要研究为AI应用方向。

约翰霍普金斯大学博士,清华大学本科。博士主要研究方向是语音识别以及关键词检索方向,师从语音识别开源工具Kaldi的主要开发者Dr. Daniel Povey,以及约翰霍普金斯大学语言语音处理中心教授Dr. Sanjeev Khudanpur。

他目前于香港中文大学攻读博士学位,师从贾佳亚教授。研究方向是计算机视觉,三维深度学习,在CVPR/ICCV/ECCV上发表多篇论文。代表工作如: STD / 3DSSD等。

吴迪,香港中文大学(深圳)在读博士生,研究方向为模块化自重构机器人的约束建模及高维空间约束规划方法,相关研究成果发表于IJRR,RAL,ICRA,IROS等知名机器人期刊会议上。

他是香港大学MaRS Lab博士生, 师从导师张富。他的研究方向是激光雷达SLAM以及多传感器(激光雷达-惯导-视觉)融合,先后以第一作者的身份在机器人顶刊顶会IROS,ICRA和RA-L上发表了5篇论文。此外,他还是开源社区的积极贡献者,其读博期间的所有研究工作都有对应的开源代码公开,其开源项目在github社区累计获得了超过4.6K的star,他的代表性工作R3LIVE, R2LIVE, FAST-LIO以及loam-livox已广泛应用于业界。

苏黎世大学Robotics and Perception Group博士生,导师为Davide Scaramuzza教授。博士期间主要的研究方向为视觉SLAM及其在移动机器人导航中的应用,具体涉及到多传感器融合、主动视觉和算法评估等方面,在RAL, ICRA, IROS, TRO等期刊会议发表论文多篇,曾获ICRA 2019 workshop on SLAM Benchmarking最佳论文奖。

美国俄勒冈州立大学助理教授,2009年获中科院自动化研究所获工学博士学位。博士毕业后,先后在德国波恩大学和美国佐治亚理工学院任研究职务,研究方向为机器学习和计算机视觉。曾于2009-2012年在图像物体识别界最重要的PASCAL VOC竞赛的分割项目上连续四年获得冠军,并获得美国自然科学基金CAREER award,已在ICML、NeurIPS、ICLR、CVPR、ICCV、ICRA等国际著名的杂志和会议上发表40余篇论文。

腾讯CSIG智能平台部算法工程师,西北工业大学计算机学院工学博士,主要研究兴趣包括鲁棒语音识别、语音降噪和对抗学习。曾在新加坡南洋理工大学、美国华盛顿大学以及出门问问AI Lab(西雅图)交流访问研究,在领域内重要的期刊和会议,如ICASSP,Interspeech,ASRU和TASLP上发表学术论文多篇,谷歌学术引用200余次。

西北工业大学ASLP实验室博士生,主要研究兴趣包括基于WFST的解码器、说话人自适应、置信度、关键词检测与唤醒及端到端语音识别。曾在约翰霍普金斯大学进行为期近3年的访问,师从开源语音识别系统之父Daniel Povey教授和COE主任Sanjeev Khudanpur教授,并在出门问问AI Lab(西雅图)进行短期交流。在领域内重要的期刊和会议,如ICASSP,Interspeech等联合发表学术论文10余篇。目前为开源语音工具—Kaldi和Espresso(e2e)的主要贡献者。

出门问问语音识别工程师,目前主要从事语音识别相关算法和相关产品研发。西北工业大学硕士,研究方向为语音识别,就读期间曾在百度、地平线语音组实习;毕业后加入微软,任Speech Scientist,从事声学模型及其相关算法研究;2018年8月加入出门问问。

智能语音算法工程师,清华大学计算机系硕士,Wenet社区核心开发者,参与多领域大规模中文语音识别开源数据集WenetSpeech的开发。曾先后任职于出门问问、地平线等公司,从事语音识别算法和产品研发。