Table of Contents generated with DocToc

Speech-Resource

Speech-Resource

语音方向实验室/公司/资源/实习等，欢迎推荐或自荐（排名不分先后）

国内高校

清华大学

电子工程系

吴及：电子工程系副系主任，研究方向侧重于语音语言智能与医学结合
张超：加入清华前为谷歌语音组Senior Research Scientist

电子工程系语音与音频技术实验室(SATLab)

刘加：原实验室主任
张卫强：实验室主任，语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

欧志坚

清华大学信息技术研究院语音和语言技术研究中心(CSLT)

该实验室以声纹识别为特色，对应北京得意音通公司。

计算机系

贾珈：人机语音交互，偏向多媒体方向

清华大学人机语音交互实验室(THUHCSI)

吴志勇

北京大学

计算机科学技术研究所数字音频实验室

该实验室以多媒体音视频内容的检索与挖掘为主，很多内容涉及音频方向。

陈晓鸥
杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

邹月娴

上海交通大学

计算机系跨媒体语言智能实验室(现X-Lance，前SpeechLab)

对应思必驰公司。

俞凯：实验室主任，思必驰首席科学家，语音识别与合成，语音软硬件协同
钱彦旻：实验室副主任，鲁棒性、多语言、低资源语音识别，Kaldi唯一的亚洲作者
吴梦玥：语音感知与生成、多模态语音
陈谐：端到端语音识别，加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

王钰

**科学院

自动化所模式识别国家重点实验室

徐波
陶建华
刘文举
刘斌

声学所

颜永红

**科学技术大学

语音及语言信息处理国家工程实验室

对应科大讯飞，国内领先水平。

刘庆峰
胡郁
戴礼荣
王仁华
陈恩红
凌震华
杜俊

西北工业大学

音频语音与语言处理研究组(ASLP)

谢磊

智能声学与临境通信研究中心(CIAIC)

陈景东：前贝尔实验室资深研究员，信号和信息处理做的很好

天津大学

智能与计算学部

党建武
王龙标

厦门大学

智能科学与技术系

洪青阳：天聪智能创始人，主要研究语音识别、声纹识别

昆山杜克大学

大数据研究中心(SMIIPLab)

李明

浙江大学

计算机科学与技术学院

赵洲

哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

韩纪庆

香港中文大学

Human-Computer Communications Laboratory (HCCL)

香港中文大学电子工程系

香港中文大学（深圳）数据科学学院

李海洲
武执正

香港科技大学

计算机科学与工程系

Brain Mak

香港理工大学

电子信息工程系

Man-Wai Mak

**大学

Speech Processing and Machine Learning Laboratory

海外高校

剑桥大学

Machine Intelligence Laboratory - Speech Research Group

Steve Young: The HTK book 一作
Phil Woodland
Mark Gales

牛津大学

Visual Geometry Group

Andrew Zisserman

爱丁堡大学

The Centre for Speech Technology Research

Simon King
Steve Renals
Peter Bell
Hao Tang

谢菲尔德大学

Speech and Hearing Group

蒙特利尔大学

Mila - Quebec AI Institute

Yoshua Bengio

麻省理工大学

MIT CSAIL

James Glass
Antonio Torralba

卡耐基梅隆大学

Shinji Watanabe

约翰霍普金斯大学

Center for Language and Speech Processing

Sanjeev Khudanpur

布尔诺理工大学

Faculty of Information Technology

Lukas Burget
Jan Cernocky

俄亥俄州立大学

DeLiang Wang

新加坡国立大学

Human Language Technology Laboratory

Haizhou Li

南洋理工大学

Eng-Siong Chng

新加坡科技设计大学

Berrak Sisman

国立情报学研究所（Tokyo）

Junichi Yamagishi

国内企业

MSRA-NLC组
MSRA-ML组
腾讯AILAB语音技术中心
腾讯天籁实验室
阿里达摩院智能语音实验室
阿里天猫精灵
字节跳动SAMI组
科大讯飞
搜狗
百度小度
小米小爱
小米k2
思必驰
云知声
出门问问WeNet
标贝科技

期刊&会议

TPAMI（IEEE Trans on Pattern Analysis and Machine Intelligence）
TASLP（IEEE Transactions on Audio, Speech, and Language Processing）
TSLP（ACM Transactions on Speech and Language Processing）
ICASSP（IEEE International Conference on Acoustics, Speech and Signal Processing）
INTERSPEECH（Conference of the International Speech Communication Association）
ASRU（IEEE Automatic Speech Recognition and Understanding Workshop）
SLT（IEEE Spoken Language Technology Workshop）
SPL（IEEE Signal Processing Letters）
ISCSLP（International Symposium on Chinese Spoken Language Processing）
JSLHR（Journal of Speech, Language, and Hearing Research）
Computer Speech and Language
Speaker Odyssey
JASA（Journal of the Acoustical Society of America）
Signal Processing
Speech Communication

竞赛

CHiME
VCC
DCASE
NIST SRE
Blizzard Challenge
OLR东方语种识别
VoxSRC

公众号

语音杂谈
谈谈语音技术
WeNet步行街
CCF语音对话与听觉专委会
语音之家
智能语音青年
低调奋进
新一代Kaldi

知乎专栏

常用资源

ddlbojack / speech-resources Goto Github PK

speech-resources's Introduction