TTS english
| 数据 | 描述 | 链接 | |
| 1 | LibriTTS | multispeakers,大约585小时 | Link |
| 2 | LJ Speech | 大约24小时 | Link |
| 3 | VCTK | 109发音人,每人400句 | Link |
| 4 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
| 5 | HiFi-TTS | 291.6小时,10发音人 | Link |
| 6 | open speech corpora | 各类数据搜集 | Link |
| 7 | RyanSpeech | 10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation | Link |
| Link |
TTS emotion
| 数据 | 描述 | 链接 | |
| 1 | ESD | 10位英语和10位中文发音人5种情感,主要应用VC,TTS | Link |
| 2 | IEMOCAP | 12小时音视频情感 | Link |
| 3 | EmoV_DB | english and french 5种情感 | Link |
| 4 | Thorsten Müller | single german speaker dataset (Neutral, Disgusted, Angry, Amused, Surprised, Sleepy, Drunk, Whispering) 175分钟 | Link |
| 5 | TAL_SER | 4541条语音,总时长12.5小时,愉悦度和激情度两个维度。 | Link |
TTS frontend
| 数据 | 描述 | 链接 | |
| 1 | polyphone | 14 top多音字 | Link |
ASR mandarin
| 数据 | 描述 | 链接 | |
| 1 | WenetSpeech | 10000小时,强烈推荐 | Link |
| 2 | Aishell-1 | 178小时 | Link |
| 3 | Aishell-2 | 1000小时 | Link |
| 4 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
| 5 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
| 6 | open speech corpora | 各类数据搜集 | Link |
| 7 | AiShell-4 | 211场会议,120小时 | Link |
| 8 | AliMeeting | 118.75小时会议数据 | Link |
| 9 | Free ST Chinese Mandarin Corpus | 855发音人102600句手机录制 | Link |
| 10 | aidatatang_200zh | 200小时600发音人文本准确98% | Link |
| 11 | magicData-RAMC | 180小时中文spontaneous conversation | Link Link |
| 12 | TAL_CSASR | 中英混合587小时 | Link |
| 13 | TAL_ASR | 100小时讲课 | Link |
ASR english
| 数据 | 描述 | 链接 | |
| 1 | GigaSpeech | 10000小时,强烈推荐 | Link |
| 2 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
| 3 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
| 4 | Chime-4 | Link | |
| 5 | People's speech | 30000小时英文 | Link |
| 6 | LibriSpeech | 1000小时audiobooks | Link |
| 7 | earnings21 | 39小时电话会议 | Link |
| 8 | MLS | 50000小时多语言语料 | Link |
| 9 | open speech corpora | 各类数据搜集 | Link |
| 10 | TED-LIUM 3 | 452小时 | Link |
| 11 | VoxForge | 讲话转录 | Link |
ASR other language
| 数据 | 描述 | 链接 | |
| 1 | M-AILABS | 1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,Polish | Link |
| 2 | mozilla common voice | 提供各种语言的音频,目前14122小时87中语言 | Link |
| 3 | OpenSLR | 提供各种语言的合成、识别等语料 | Link |
| 4 | CI-AVSR | cantonese粤语车内auido-visual数据.8.3小时 | Link |
| 5 | open speech corpora | 各类数据搜集 | Link |
| 6 | Hindi | 1111小时 | Link |
| 7 | Samrómur Queries 21.12 | Samrómur Icelandic Speech corpus 20小时 | Link |
| 8 | Samrómur Children 21.09 | Icelandic Speech from children | Link |
| 9 | Golos | 1240小时Russian | Link |
| 10 | MediaSpeech | 10小时French, Arabic, Turkish and Spanish media speech | Link |
| Link |
Speech translation
| 数据 | 描述 | 链接 | |
| 1 | Fisher--CALLHOME | Es→En 160hrs | Link |
| 2 | STC | En↔Jp 22hrs | Link |
| 3 | How2 | En→Pt 300hrs | Link |
| 4 | IWSLT 2018 | En→De 273hrs | Link |
| 5 | LIBRI-TRANS | En→Fr 236hrs | Link |
| 6 | MuST-C | En→ 14 lang. (237-504hrs) | Link |
| 7 | CoVoST | En→15 lang. (929hrs), 21 |
Link |
| 8 | Europarl-ST | 9 lang. (72 dir., 10-90hrs) | Link |
| 9 | LibriVoxDeEn | De→En 100hrs | Link |
| 10 | MaSS | 8 lang. (56 dir.) 20hrs | Link |
| 11 | BSTC | Zh→En 50hrs | Link |
| 12 | Multilingual TEDx | 8 lang.→6 lang. 11-69hrs | Link |