仅显示平台推荐
imagenet-1K
${starItems[0]}

ImageNet是根据WordNet层次结构组织的图像数据集。在ImageNet中,目标是为了说明每个synset提供平均1000幅图像。 每个concept图像都是质量控制和人为标注的(quality-controlled and human-annotated)。 在完成之后,希望ImageNet能够为WordNet层次结构中的大多数concept提供数千万个干净整理的图像。 数据集目录可参看本项目代码仓ReadMe(https://git.openi.org.cn/Open_Dataset/imagenet)

2022-04-13 3643 198
COCO
${starItems[1]}

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

2020-11-09 58 94
MNISTData_mindspore
${starItems[2]}

MNISTData数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。 对于想要在现实世界数据上尝试学习技术和模式识别方法,同时在预处理和格式化上花费最少的精力的人来说,这是一个很好的数据库。

2021-12-08 209 68
MNIST_PytorchExample_GPU
${starItems[3]}

MNISTData数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。

2022-03-30 250 49
OpenI_Learning_datasets
${starItems[4]}

MNISTData数据集为模型训练数据集

2021-10-29 46 131
CIFAR-10
${starItems[5]}

CIFAR-10数据集包含10个类别的60000个32x32彩色图像,每个类别6000个图像。 有50000张训练图像和10000张测试图像。http://www.cs.toronto.edu/~kriz/cifar.html?usg=alkjrhjqbhw2llxlo8emqns-tbk0at96jq

2020-11-09 0 30
CIFAR-100
${starItems[6]}

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

2020-11-02 0 17
WordView-2
${starItems[7]}

WordView-2 data set.

2022-07-21 0 6
PLabel
${starItems[8]}

(1) minio为linux下的minio 可以执行性文件,下载到本地后,执行如下命令即可启动: chmod 755 minio export MINIO_ACCESS_KEY=minio export MINIO_SECRET_KEY=miniominio nohup ./minio server /data2/miniodata/ & (2) plabel_20210629_v2.tar 为标注系统PLabel2.0基于mmdection的GPU镜像,内里搭建了mmdetection 2.3.0版本的环境,支持基于mmdetection的模型重训。 (3) gitea.tar 开源社区后端编译及运行环境镜像。 (4)retinanet_free_anchor_r50_fpn_1x_epoch_12.pth 基于mmdetction 2.3.0,使用所有开源数据集行人数据训练的行人检测模型。 (5)pcl_label_hand_v3.tar为封装好的最新PLabel3.0标注系统,运行容器后,进入容器,运行server.sh即可使用。用来接入yolov5_auto_label_v1.tar及yolov5_auto_track_v1.tar中的算法 (6)yolov5_auto_label_v1.tar为基于CPU的自动标注算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar, (7)yolov5_auto_track_v1.tar为基于CPU的目标跟踪算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar,

2021-07-23 12 490
GoEmotions
${starItems[9]}

情感类别包括钦佩、娱乐、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、不赞成、厌恶、尴尬、兴奋、恐惧、感激、悲伤、喜悦、爱、紧张、乐观、骄傲、实现、解脱、悔恨、悲伤、惊

2020-11-18 0 7
WIDERFace
${starItems[10]}

32,203张图像,并对393,703张像样本图像中所描述的在尺度、姿势和遮挡方面具有高度可变性的面孔进行标记。较宽的人脸数据集基于61个事件类进行组织。 http://shuoyang1213.me/WIDERFACE/

2021-01-11 1 11
CelebA
${starItems[11]}

CelebFaces属性数据集(CelebA)是一个大规模的面部属性数据集,其中包含超过200K名人图像,每个图像都有40个属性注释。 该数据集中的图像涵盖了较大的姿势变化和背景杂波。 http://mmlab.ie.cuhk.edu.hk/projects/CelebA.html

2021-01-18 5 15
BIMCV-COVID19
${starItems[12]}

BIMCV-COVID19+:COVID19患者RX和CT图像的大注释数据集。数据库的第一次迭代包括1380个CX,885个DX和163个CT研究。

2020-11-18 2056 5
KITTI
${starItems[13]}

来自大众旅行车,用于移动机器人和自动驾驶研究。以10-100Hz记录了6个小时的交通场景。场景范围从农村的高速公路到具有许多静态和动态对象的市中心。 http://www.cvlibs.net/datasets/kitti/index.php

2020-12-07 4 25
mirror
${starItems[14]}

本页面建立了SpikingJelly中集成的部分数据集的下载镜像。 只有原始数据集所使用的协议允许分发,或原始数据集作者已经同意分发的数据集才会被建立镜像。

2020-11-09 8 152
Networks-For-AI
${starItems[15]}

PNAS 论文 communication-efficient federated learning 实验 figure movement detection 数据集1、2

2021-10-22 0 2
DBPediaAmazonYelpYahooSogouAG
${starItems[16]}

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

2021-01-04 5 8
SNLI
${starItems[17]}

SNLI语料库(1.0版)是一组570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,带有包含,矛盾和中立的标签,支持NLI(RTE)。https://nlp.stanford.edu/projects/snli/

2020-11-09 0 0
MSeg
${starItems[18]}

MSeg:一个用于多域语义分割的复合数据集。80000多张图片中有超过220000个物体任务。

2020-11-18 10 3
LibriSpeech
${starItems[19]}

大规模(1000小时)阅读英语语音的语料库。 http://www.openslr.org/12/

2020-12-17 0 4
CNNandDailyMailSummarization
${starItems[20]}

使用新闻文章进行问答研究的两个数据集。 每个数据集包含许多文档(每个90k和197k),每个文档平均约有4个问题。 https://cs.nyu.edu/~kcho/DMQA/

2020-12-07 0 3
VIOLIN
${starItems[21]}

VIOLIN(视频和语言推理),由来自15887个视频片段的95322个视频假设对组成,跨越582个小时的视频(YouTube和电视节目)。

2020-11-18 2 0
BillionWords
${starItems[22]}

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

2020-11-09 0 4
SVHNStreetViewHouseNumbers
${starItems[23]}

SVHN是一个现实世界的图像数据集,用于开发机器学习和对象识别算法,超过600,000位数的图像。SVHN是从Google街景图像中的门牌号获得的。http://ufldl.stanford.edu/housenumbers/

2020-11-09 0 0
TAO
${starItems[24]}

TAO是一个用于跟踪任何对象的联邦数据集,包含2907个高分辨率视频,在不同的环境中捕获,这些视频的平均长度为半分钟。

2020-11-18 0 1
VisualGenome
${starItems[25]}

视觉基因组是一个数据集,一个知识库,将结构化图像概念与语言联系在一起的持续努力。 它包含:108,077张图像540万个区域描述170万个视觉问题解答380万个对象实例。 http://visualgenome.org/

2020-11-30 0 2
RISE_Video_Dataset
${starItems[26]}

介绍了RISE,第一个用于识别工业烟雾排放的大规模视频数据集。我们的数据集包含12,567个剪辑,其中19个不同的视角来自三个监控三个不同工业设施的站点。

2020-11-19 0 0
LargeMovieReviewDataset
${starItems[27]}

用于二进制情感分类的数据集,提供了25,000张极地电影评论供培训,25,000张用于测试也有其他未标记的数据可供使用。 http://ai.stanford.edu/~amaas/data/sentiment/

2020-11-02 0 2
Condensed_Movies
${starItems[28]}

一个大规模的视频数据集,包含有详细字幕的电影片段。超过3000部不同类型、不同国家和不同年代的电影。

2020-11-18 0 1
WIDER
${starItems[29]}

WIDER包含61个事件类别和大约50574个用事件类标签注释的图像。 http://yjxiong.me/event_recog/WIDER/

2021-01-11 0 1