Director

TTS mandarin
数据 描述 链接
1 baker标贝女声 12小时 Link
2 Aishell-3 85小时88035句多说话人数据 Link
3 DiDiSpeech 500人60小时 Link
4 OpenSLR 提供各种语言的合成、识别等语料 Link
5 zhvoice 3200说话人900小时,用于声音复刻,合成,识别等 Link
TTS english
数据 描述 链接
1 LibriTTS multispeakers,大约585小时 Link
2 LJ Speech 大约24小时 Link
3 VCTK 109发音人,每人400句 Link
4 OpenSLR 提供各种语言的合成、识别等语料 Link
5 HiFi-TTS 291.6小时,10发音人 Link
6 open speech corpora 各类数据搜集 Link
7 RyanSpeech 10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation10小时conversation Link
Link
TTS emotion
数据 描述 链接
1 ESD 10位英语和10位中文发音人5种情感,主要应用VC,TTS Link
2 IEMOCAP 12小时音视频情感 Link
3 EmoV_DB english and french 5种情感 Link
4 Thorsten Müller single german speaker dataset (Neutral, Disgusted, Angry, Amused, Surprised, Sleepy, Drunk, Whispering) 175分钟 Link
5 TAL_SER 4541条语音,总时长12.5小时,愉悦度和激情度两个维度。 Link
TTS dialect
数据 描述 链接
1 RuSLAN 31小时高质量俄语 Link
2 M-AILABS 1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,Polish Link
3 OpenSLR 提供各种语言的合成、识别等语料 Link
4 css10 greek,spanish,finish,french,hungarian,japanese,dutch,russian,chinese数据 Link
TTS frontend
数据 描述 链接
1 polyphone 14 top多音字 Link
ASR mandarin
数据 描述 链接
1 WenetSpeech 10000小时,强烈推荐 Link
2 Aishell-1 178小时 Link
3 Aishell-2 1000小时 Link
4 mozilla common voice 提供各种语言的音频,目前14122小时87中语言 Link
5 OpenSLR 提供各种语言的合成、识别等语料 Link
6 open speech corpora 各类数据搜集 Link
7 AiShell-4 211场会议,120小时 Link
8 AliMeeting 118.75小时会议数据 Link
9 Free ST Chinese Mandarin Corpus 855发音人102600句手机录制 Link
10 aidatatang_200zh 200小时600发音人文本准确98% Link
11 magicData-RAMC 180小时中文spontaneous conversation Link   Link
12 TAL_CSASR 中英混合587小时 Link
13 TAL_ASR 100小时讲课 Link
ASR english
数据 描述 链接
1 GigaSpeech 10000小时,强烈推荐 Link
2 mozilla common voice 提供各种语言的音频,目前14122小时87中语言 Link
3 OpenSLR 提供各种语言的合成、识别等语料 Link
4 Chime-4 Link
5 People's speech 30000小时英文 Link
6 LibriSpeech 1000小时audiobooks Link
7 earnings21 39小时电话会议 Link
8 MLS 50000小时多语言语料 Link
9 open speech corpora 各类数据搜集 Link
10 TED-LIUM 3 452小时 Link
11 VoxForge 讲话转录 Link
ASR other language
数据 描述 链接
1 M-AILABS 1000小时,German,English,Spanish,Italian,Ukrainian,Russsian,French,Polish Link
2 mozilla common voice 提供各种语言的音频,目前14122小时87中语言 Link
3 OpenSLR 提供各种语言的合成、识别等语料 Link
4 CI-AVSR cantonese粤语车内auido-visual数据.8.3小时 Link
5 open speech corpora 各类数据搜集 Link
6 Hindi 1111小时 Link
7 Samrómur Queries 21.12 Samrómur Icelandic Speech corpus 20小时 Link
8 Samrómur Children 21.09 Icelandic Speech from children Link
9 Golos 1240小时Russian Link
10 MediaSpeech 10小时French, Arabic, Turkish and Spanish media speech Link
Link
Noise
数据 描述 链接
1 Demand 各种各样的噪声 Link
2 Noisex-92 噪声 Link
3 MUSAN music, speech, and noise Link
4 Room Impulse Response and Noisee Room Impulse Response and Noise Database Link
Sing
数据 描述 链接
1 Opencpop 100首专业录制的歌,44khz音频 Link
2 OpenSinger 93 singers 50小时 Link
3 PopCS 127首中文歌曲 Link
4 ctmsa 7000小时音乐 Link
Speech2Speech
数据 描述 链接
1 cvss 21种语言转英语 Link
Link
Speaker diarisation
数据 描述 链接
1 AiShell-4 211场会议,120小时 Link
2 AliMeeting 118.75小时会议数据 Link
3 magicData-RAMC 180小时中文spontaneous conversation Link
WakeUp
数据 描述 链接
1 WakeUp-1 中英文1561小时 Link
2 HI-MIA 340说话人,智能家居 Link
3 MobvoiHotwords 每词36k句 Link
4 hey snips Link
Speech translation
数据 描述 链接
1 Fisher--CALLHOME Es→En 160hrs Link
2 STC En↔Jp 22hrs Link
3 How2 En→Pt 300hrs Link
4 IWSLT 2018 En→De 273hrs Link
5 LIBRI-TRANS En→Fr 236hrs Link
6 MuST-C En→ 14 lang. (237-504hrs) Link
7 CoVoST En→15 lang. (929hrs),
21
Link
8 Europarl-ST 9 lang. (72 dir., 10-90hrs) Link
9 LibriVoxDeEn De→En 100hrs Link
10 MaSS 8 lang. (56 dir.) 20hrs Link
11 BSTC Zh→En 50hrs Link
12 Multilingual TEDx 8 lang.→6 lang. 11-69hrs Link
Other
数据 描述 链接
1 SEP-28k 口吃语料 Link
2 FluencyBank 口吃语料 Link

本站内容源自互联网,如有内容侵犯了你的权益,请联系删除相关内容,联系邮箱:yongqiangli@alumni.hust.edu.cn

Copyright © 2015-2035 li yongqiang All Rights Reserved