GithubHelp home page GithubHelp logo

speech-resources's Introduction

Table of Contents generated with DocToc

Speech-Resource

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)

国内高校

清华大学

电子工程系

  • 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
  • 张超:加入清华前为谷歌语音组Senior Research Scientist

电子工程系语音与音频技术实验室(SATLab)

  • 刘加:原实验室主任
  • 张卫强:实验室主任,语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

清华大学信息技术研究院语音和语言技术研究中心(CSLT)

该实验室以声纹识别为特色,对应北京得意音通公司。

计算机系

  • 贾珈:人机语音交互,偏向多媒体方向

清华大学人机语音交互实验室(THUHCSI)

北京大学

计算机科学技术研究所数字音频实验室

该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。

  • 陈晓鸥
  • 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

  • 邹月娴

上海交通大学

计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)

对应思必驰公司。

  • 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
  • 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
  • 吴梦玥:语音感知与生成、多模态语音
  • 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

  • 王钰

**科学院

自动化所模式识别国家重点实验室

  • 徐波
  • 陶建华
  • 刘文举
  • 刘斌

声学所

  • 颜永红

**科学技术大学

语音及语言信息处理国家工程实验室

对应科大讯飞,国内领先水平。

  • 刘庆峰

  • 胡郁

  • 戴礼荣

  • 王仁华

  • 陈恩红

  • 凌震华

  • 杜俊

西北工业大学

音频语音与语言处理研究组(ASLP)

智能声学与临境通信研究中心(CIAIC)

  • 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好

天津大学

智能与计算学部

  • 党建武
  • 王龙标

厦门大学

智能科学与技术系

  • 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别

昆山杜克大学

大数据研究中心(SMIIPLab)

  • 李明

浙江大学

计算机科学与技术学院

  • 赵洲

哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

香港中文大学

Human-Computer Communications Laboratory (HCCL)

香港中文大学电子工程系

香港中文大学(深圳)数据科学学院

香港科技大学

计算机科学与工程系

香港理工大学

电子信息工程系

**大学

Speech Processing and Machine Learning Laboratory

海外高校

剑桥大学

Machine Intelligence Laboratory - Speech Research Group

  • Steve Young: The HTK book 一作

  • Phil Woodland

  • Mark Gales

牛津大学

Visual Geometry Group

  • Andrew Zisserman

爱丁堡大学

The Centre for Speech Technology Research

谢菲尔德大学

Speech and Hearing Group

蒙特利尔大学

Mila - Quebec AI Institute

麻省理工大学

MIT CSAIL

卡耐基梅隆大学

约翰霍普金斯大学

Center for Language and Speech Processing

  • Sanjeev Khudanpur

南加州大学

德克萨斯州大学达拉斯分校

罗切斯特大学

布尔诺理工大学

Faculty of Information Technology

  • Lukas Burget
  • Jan Cernocky

俄亥俄州立大学

新加坡国立大学

Human Language Technology Laboratory

南洋理工大学

新加坡科技设计大学

国立情报学研究所(Tokyo)

国内企业

  • MSRA-NLC组
  • MSRA-ML组
  • 腾讯AILAB语音技术中心
  • 腾讯天籁实验室
  • 阿里达摩院智能语音实验室
  • 阿里天猫精灵
  • 字节跳动SAMI组
  • 科大讯飞
  • 搜狗
  • 百度小度
  • 小米小爱
  • 小米k2
  • 思必驰
  • 云知声
  • 出门问问WeNet
  • 标贝科技

期刊&会议

  • TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
  • TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
  • TSLP(ACM Transactions on Speech and Language Processing)
  • ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
  • INTERSPEECH(Conference of the International Speech Communication Association)
  • ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
  • SLT(IEEE Spoken Language Technology Workshop)
  • SPL(IEEE Signal Processing Letters)
  • ISCSLP(International Symposium on Chinese Spoken Language Processing)
  • JSLHR(Journal of Speech, Language, and Hearing Research)
  • Computer Speech and Language
  • Speaker Odyssey
  • JASA(Journal of the Acoustical Society of America)
  • Signal Processing
  • Speech Communication

竞赛

  • CHiME
  • VCC
  • DCASE
  • NIST SRE
  • Blizzard Challenge
  • OLR东方语种识别
  • VoxSRC

公众号

  • 语音杂谈

  • 谈谈语音技术

  • WeNet步行街

  • CCF语音对话与听觉专委会

  • 语音之家

  • 智能语音青年

  • 低调奋进

  • 新一代Kaldi

知乎专栏

谈谈语音技术

自监督语音识别

Kaldi源码解析

espnet--一个端到端语音识别工具箱

新一代Kaldi

常用资源

语音识别数据集汇总

语音识别 benchmark

语音预训练 paper list

语音合成 paper list

语音增强 paper list

speech-resources's People

Contributors

ddlbojack avatar echo-hmwang avatar lingweimeng avatar mortyzhou-shef-bit avatar pkufool avatar rookiejunchen avatar xcmyz avatar yfyeung avatar

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

speech-resources's Issues

【开源自荐】轻快图床:基于Koa2 + Vue3.x + Vite3.x + typescript开发的轻量级快捷图片管理系统、图床系统

  • 项目名称:轻快图床
    基于Koa2 + Vue3.x + Vite3.x + typescript开发的轻量级快捷图片管理系统、图床系统

  • 项目地址:

  • 项目简介 (100 字以内):
    程序员日常就是写博客,当然写博客时就会涉及到在博文中插入图片,所以往往会使用图床来进行图片资源管理,市面上较流行的图床系统是PicGo,是使用electron-vue开发的桌面应用程序,每次换电脑或者重装系统后都需要重新下载安装并配置图床,比较麻烦。所以开发了这款轻快图片管理系统,是基于vue3.x + typescript + vite + koa + mysql开发的前后端分离图床系统,使用该系统可以不需要每次都配置图床。

  • 项目截图 (6张以内):

    • 上传区
      202211101718307.png
    • 图片管理
      202211101719274.png
    • 存储桶管理
      202211101719413.png
    • 字典管理
      202211101725334.png
    • 相册管理
      202211101720094.png
    • 存储桶插件开发
      202302201023375.png

JHU?

Cool!
Maybe JHU should be included?

update the QR code

hello, can you update the QR code? It has expired. Thanks for your help.

国内语音公司添加

滴滴语音Didi
深声科技deepsound
大象声科Elevoc
声希科技SpeechX
声智科技SoundAI
国音智能speakIn
捷通华声sinovoice
楼氏电子knowles
地平线horizon
清微智能tsingmicro
快商通

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.