大规模(1000小时)阅读英语语音的语料库。 http://www.openslr.org/12/
由Librispeech数据生成的语音分离数据集
LibriSpeech_test
大型数据集,其中包含来自50个不同城市的街道场景中记录的各种立体声视频序列集,此外,还有较大的20000个弱注释帧集以及5000个帧的高质量像素级注释。 https://www.cityscapes-dataset.com/