Repositories

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

基于mscoc的大规模场景文本数据集。COCO Text V2.0包含63686个图像和239506个带注释的文本实例。分段掩码为每个单词添加了注释,允许精细的级别检测。 https://bgshih.github.io/cocotext/

Updated 4 months ago

斯坦福汽车数据集包含196类汽车的16,185张图像。数据被分为8,144个训练图像和8,041个测试图像,其中每个类别已大致分为50-50个分割。 https://ai.stanford.edu/~jkrause/cars/car_dataset.html

Updated 4 months ago

该数据集包含照片和视频的列表。该列表是根据Yahoo!上可用的数据编译而成的。Flickr列表中提供的所有照片和视频均已获得Creative Commons版权许可之一的许可。根据具体需要自行前往注册下载。

Updated 4 months ago

Updated 4 months ago

介绍了RISE,第一个用于识别工业烟雾排放的大规模视频数据集。我们的数据集包含12,567个剪辑,其中19个不同的视角来自三个监控三个不同工业设施的站点。

Updated 4 months ago

Paris500k数据集包含从Flickr和Panoramio收集的501,356个带有地理标签的图像。 数据集是从地理边界框而不是使用关键字查询收集的。 https://www.vision.rwth-aachen.de/page/paris500k

Updated 4 months ago

一个大规模的视频数据集,包含有详细字幕的电影片段。超过3000部不同类型、不同国家和不同年代的电影。

Updated 4 months ago

从IMDb网站上列出的最受欢迎的100,000名演员列表中(自动)从其出生日期,姓名,性别和与该人相关的所有图像中检索其面孔。 来自IMDb的20,284名名人和Wikipedia的62,328名名人共460,723张人脸图像,因此总计523,051张。

Updated 4 months ago

fer2013_dataset

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

启智章鱼项目(OPENI-OCTOPUS)是一个集群管理和资源调度系统,支持在GPU集群中运行AI任务作业(比如深度学习任务作业)。平台提供了一系列接口,能够支持主流的深度学习框架。

Updated 4 months ago

DDAD是丰田汽车研究所(TRI)针对具有挑战性和多样性的城市条件下的长距离(最长250米)和密集深度估计的一项新的自主驾驶基准。

Updated 4 months ago

sym-connectome

Updated 4 months ago

Updated 4 months ago

大型数据集,其中包含来自50个不同城市的街道场景中记录的各种立体声视频序列集,此外,还有较大的20000个弱注释帧集以及5000个帧的高质量像素级注释。 https://www.cityscapes-dataset.com/

Updated 4 months ago