黄学东

更新时间:2024-10-06 16:25

黄学东(Xuedong Huang),原籍湖南省长沙市华裔美国人,电气与电子工程师协会会士(IEEE Fellow),美国计算机协会会士(ACM Fellow),美国国家工程院院士美国艺术与科学院院士,微软全球技术院士,ZOOM首席技术官(CTO)。

人物经历

1978年,黄学东考入湖南大学

1982年,考入清华大学,在计算机系攻读人工智能方向研究生。

1987年,以清华和爱丁堡大学联合培养的博士项目出国深造。

1989年,拿到博士学位之后加盟了美国卡内基梅隆大学致力于语言识别研究。

1993年,加入微软研究院并负责组建微软公司语音识别技术研究团队。

2000年—2004年,担任微软公司Speech Platforms Group总经理。

2017年2月,当选微软全球技术院士(Technical Fellow)。

2020年—2023年6月,被提拔为微软全球人工智能首席技术官,领导新统一的AI认知服务工程和研究团队。

2023年,当选为美国国家工程院院士、美国艺术与科学院院士。

2023年6月,任ZOOM首席技术官(CTO)。

主要成就

科研成就

黄学东领导开发了Sphinx Ⅱ,该系统的单词量在世界上首次达到了60000个,进入微软研究院伊始,黄学东的小组在Sphinx Ⅱ的基础上建立了一套名为Whisper的连续语音引擎,同时语音技术组(STG)还开发了语音应用程序接口(SAPI)来访问这个新的语音引擎。黄学东带领的语音组首先在微软Office XP中完成了语音识别技术的开发,然后又为Tablet PC开发了一个增强版本,后者的精确度是前者的两倍。

2016年9月14日,黄学东带领的微软语音团队在产业标准Switchboard语音识别基准测试中实现了对话语音识别词错率(word error rate,简称WER)低至6.3%的突破 ,创造当时该领域内错误率最低纪录。一个月后的10月18日,黄学东团队进一步将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现。

2017年8月,在黄学东的带领下,其团队在产业标准Switchboard语音识别基准测试中实现了对话语音识别词错率(word error rate,简称WER),低至5.1%,创造了当时该领域内错误率最低纪录,首次达成与专业速记员持平而优于绝大多数人的表现。

2018年3月份,黄学东带领的团队在机器翻译领域拿下一项里程碑式的成就:其研发的机器翻译系统在通用新闻报道的newstest2017中译英测试集上,达到了人工翻译水平。这是首个在新闻报道的翻译质量和准确率上媲美人工翻译的翻译系统。

2022年年5月,黄学东领衔的团队发布了“视觉-语言-语音”多模态预训练模型i-Code,在5项多模态视频理解任务以及GLUE NLP任务上树立了业界新标杆。

据2023年2月微软官网显示,黄学东获得美国专利170多项。

截至2015年10月,黄学东发表期刊或会议论文100余篇,并合著出版2本专著。

据2023年2月微软官网显示,黄学东参与的科研项目有5项。

荣誉表彰

社会任职

截至2015年10月,黄学东担任湖南省信息化领导小组顾问,湖南大学客座教授,湖南大学软件学院名誉院长等职务。

人物评价

黄学东不仅是一个创新者,而且是一个有力的执行者。(湖南大学融媒体中心评)

黄学东是在美华人的杰出代表之一。(《清华人》2004年第三期评)

黄学东是AI领域全球顶尖专家之一。(湖南大学教育基金会评)

黄学东因在软件和人工智能行业的贡献而被公认为(该领域的)管理者和领导者(Huang is a recognized executive and scientific leader from his contributions in the software and AI industry.)。(清华大学智能产业研究院评)

黄学东是领导微软公司人工智能认知服务从技术初创到商业落地的主要技术贡献人和产品领导者。(湖南大学信息科学与工程学院评)

黄学东是推动建立微软亚洲研究院的幕后英雄之一。(清华大学计算机系校友会评)

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}