仅显示平台推荐
Open_Dataset / imagenet 55
${starItems[0]}
imagenet

ImageNet是根据WordNet层次结构组织的图像数据集。在ImageNet中,目标是为了说明每个synset提供平均1000幅图像。 每个concept图像都是质量控制和人为标注的(quality-controlled and human-annotated)。 在完成之后,希望ImageNet能够为WordNet层次结构中的大多数concept提供数千万个干净整理的图像。

创建于:2022-04-13 17:29:28
Open_Dataset / COCO 14
${starItems[1]}
COCO

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

创建于:2020-11-09 10:42:39
MNISTData_mindspore

MNISTData数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。 对于想要在现实世界数据上尝试学习技术和模式识别方法,同时在预处理和格式化上花费最少的精力的人来说,这是一个很好的数据库。

创建于:2021-12-08 11:16:12
avadesian / CodeSearchNet 1
${starItems[3]}
CodeSearchNet

CodeSearchNet由GitHub和Microsoft Research-Cambridge研究团队合作推出,该语料库是一个庞大的程序代码和自然语言批注数据集,让研究人员可以用来训练机器学习模型,并且GitHub推出了CodeSearchNet评估环境和排行榜。

创建于:2022-03-29 10:05:56
MNIST_PytorchExample_GPU

MNISTData数据集是由10类28∗28的灰度图片组成,训练数据集包含60000张图片,测试数据集包含10000张图片。

创建于:2022-03-30 11:08:14
zeizei / OpenI_Learning 56
${starItems[5]}
OpenI_Learning datasets

MNISTData数据集为模型训练数据集; cifar为CIFAR-10图像识别项目实战数据集

创建于:2021-10-29 14:56:52
Open_Dataset / CIFAR-100 11
${starItems[6]}
CIFAR-100

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

创建于:2020-11-02 13:03:08
OpenIOSSG / PLabel 317
${starItems[7]}
PLabel

(1) minio为linux下的minio 可以执行性文件,下载到本地后,执行如下命令即可启动: chmod 755 minio export MINIO_ACCESS_KEY=minio export MINIO_SECRET_KEY=miniominio nohup ./minio server /data2/miniodata/ & (2) plabel_20210629_v2.tar 为标注系统PLabel2.0基于mmdection的GPU镜像,内里搭建了mmdetection 2.3.0版本的环境,支持基于mmdetection的模型重训。 (3) gitea.tar 开源社区后端编译及运行环境镜像。 (4)retinanet_free_anchor_r50_fpn_1x_epoch_12.pth 基于mmdetction 2.3.0,使用所有开源数据集行人数据训练的行人检测模型。 (5)pcl_label_hand_v3.tar为封装好的最新PLabel3.0标注系统,运行容器后,进入容器,运行server.sh即可使用。用来接入yolov5_auto_label_v1.tar及yolov5_auto_track_v1.tar中的算法 (6)yolov5_auto_label_v1.tar为基于CPU的自动标注算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar, (7)yolov5_auto_track_v1.tar为基于CPU的目标跟踪算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar,

创建于:2021-07-23 17:47:42
Open_Dataset / GoEmotions 3
${starItems[8]}
GoEmotions

情感类别包括钦佩、娱乐、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、不赞成、厌恶、尴尬、兴奋、恐惧、感激、悲伤、喜悦、爱、紧张、乐观、骄傲、实现、解脱、悔恨、悲伤、惊

创建于:2020-11-18 10:09:40
Open_Dataset / BIMCV-COVID19 3
${starItems[9]}
BIMCV-COVID19

BIMCV-COVID19+:COVID19患者RX和CT图像的大注释数据集。数据库的第一次迭代包括1380个CX,885个DX和163个CT研究。

创建于:2020-11-18 10:24:46
Open_Dataset / CIFAR-10 8
${starItems[10]}
CIFAR-10

CIFAR-10数据集包含10个类别的60000个32x32彩色图像,每个类别6000个图像。 有50000张训练图像和10000张测试图像。http://www.cs.toronto.edu/~kriz/cifar.html?usg=alkjrhjqbhw2llxlo8emqns-tbk0at96jq

创建于:2020-11-09 14:33:44
AINET / Networks-For-AI 0
${starItems[11]}
Networks-For-AI

PNAS 论文 communication-efficient federated learning 实验 figure movement detection 数据集1、2

创建于:2021-10-22 14:40:29
DBPediaAmazonYelpYahooSogouAG

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

创建于:2021-01-04 18:00:25
Open_Dataset / SNLI 0
${starItems[13]}
SNLI

SNLI语料库(1.0版)是一组570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,带有包含,矛盾和中立的标签,支持NLI(RTE)。https://nlp.stanford.edu/projects/snli/

创建于:2020-11-09 11:16:09
Open_Dataset / MSeg 2
${starItems[14]}
MSeg

MSeg:一个用于多域语义分割的复合数据集。80000多张图片中有超过220000个物体任务。

创建于:2020-11-18 10:25:40
Open_Dataset / LibriSpeech 0
${starItems[15]}
LibriSpeech

大规模(1000小时)阅读英语语音的语料库。 http://www.openslr.org/12/

创建于:2020-12-17 00:41:46
CNNandDailyMailSummarization

使用新闻文章进行问答研究的两个数据集。 每个数据集包含许多文档(每个90k和197k),每个文档平均约有4个问题。 https://cs.nyu.edu/~kcho/DMQA/

创建于:2020-12-07 09:36:51
Open_Dataset / VIOLIN 0
${starItems[17]}
VIOLIN

VIOLIN(视频和语言推理),由来自15887个视频片段的95322个视频假设对组成,跨越582个小时的视频(YouTube和电视节目)。

创建于:2020-11-18 10:27:01
Open_Dataset / BillionWords 2
${starItems[18]}
BillionWords

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

创建于:2020-11-09 09:56:57
SVHNStreetViewHouseNumbers

SVHN是一个现实世界的图像数据集,用于开发机器学习和对象识别算法,超过600,000位数的图像。SVHN是从Google街景图像中的门牌号获得的。http://ufldl.stanford.edu/housenumbers/

创建于:2020-11-09 08:56:04
Open_Dataset / TAO 1
${starItems[20]}
TAO

TAO是一个用于跟踪任何对象的联邦数据集,包含2907个高分辨率视频,在不同的环境中捕获,这些视频的平均长度为半分钟。

创建于:2020-11-18 11:15:01
Open_Dataset / VisualGenome 1
${starItems[21]}
VisualGenome

视觉基因组是一个数据集,一个知识库,将结构化图像概念与语言联系在一起的持续努力。 它包含:108,077张图像540万个区域描述170万个视觉问题解答380万个对象实例。 http://visualgenome.org/

创建于:2020-11-30 08:41:00
RISE_Video_Dataset

介绍了RISE,第一个用于识别工业烟雾排放的大规模视频数据集。我们的数据集包含12,567个剪辑,其中19个不同的视角来自三个监控三个不同工业设施的站点。

创建于:2020-11-19 19:31:03
LargeMovieReviewDataset

用于二进制情感分类的数据集,提供了25,000张极地电影评论供培训,25,000张用于测试也有其他未标记的数据可供使用。 http://ai.stanford.edu/~amaas/data/sentiment/

创建于:2020-11-02 13:13:24
Open_Dataset / Condensed_Movies 1
${starItems[24]}
Condensed_Movies

一个大规模的视频数据集,包含有详细字幕的电影片段。超过3000部不同类型、不同国家和不同年代的电影。

创建于:2020-11-18 11:17:59
Open_Dataset / WIDERFace 3
${starItems[25]}
WIDERFace

32,203张图像,并对393,703张像样本图像中所描述的在尺度、姿势和遮挡方面具有高度可变性的面孔进行标记。较宽的人脸数据集基于61个事件类进行组织。 http://shuoyang1213.me/WIDERFACE/

创建于:2021-01-11 09:57:27
Open_Dataset / WIDER 1
${starItems[26]}
WIDER

WIDER包含61个事件类别和大约50574个用事件类标签注释的图像。 http://yjxiong.me/event_recog/WIDER/

创建于:2021-01-11 09:58:55
Open_Dataset / ACTIVITYNET 1
${starItems[27]}
ACTIVITYNET

ActivityNet是用于了解人类活动的新的大型视频基准。 ActivityNet提供203个活动类别的样本,每个类别平均137个未修整视频,每个影片1.41个活动实例,总共849个视频小时。 http://activity-net.org/

创建于:2020-12-07 08:26:46
Open_Dataset / IMDB-WIKI_faces 2
${starItems[28]}
IMDB-WIKI_faces

来自IMDb的20,284名名人和Wikipedia的62,328名名人共460,723张人脸图像,因此总计523,051张。 https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

创建于:2020-11-24 14:58:02
StanfordSentimentTreebank

用于情感分析的数据集,其中包含11855个句子的语法分析树中215154个短语的细粒度情感标签,并为情感组成提出了新挑战。https://nlp.stanford.edu/sentiment/code.html

创建于:2020-11-09 09:46:55