Datasets

opendata / dataset
task. category. 3

Updated 1 year ago

opendata / AVSpeech
task. speech processing 0

AVSpeech是一种新的、大规模的音视频数据集,它包含无干扰背景噪声的语音视频片段。该数据集总共包含约4700个小时的视频片段,来自YouTube总共29万个视频片段,涵盖了各种人群、语言和面部姿

Updated 1 year ago

opendata / SQuAD
question answering system natural language processing 3

斯坦福问答数据集——应用广泛的问答和阅读理解数据集,其中每个问题的答案都以文本形式呈现。 https://rajpurkar.github.io/SQuAD-explorer/

Updated 1 year ago

opendata / The_Examiner
text categorization natural language processing 0

新闻网站The Examiner上的新闻汇编,包含超过6年的21000多位作者撰写的300万篇文章的标题 https://www.kaggle.com/therohk/examine-the-examiner

Updated 1 year ago

opendata / DROP
question answering system natural language processing 1
opendata / CLEVR
task. category. 1

数据集包括图片和问题,以及对应回答问题标准的 Program https://cs.stanford.edu/people/jcjohns/clevr/

Updated 1 year ago

opendata / cocotext
task. computer vision 2

基于mscoc的大规模场景文本数据集。COCO Text V2.0包含63686个图像和239506个带注释的文本实例。分段掩码为每个单词添加了注释,允许精细的级别检测。 https://bgshih.github.io/cocotext/

Updated 1 year ago

guomy / DogVsCat
task. category. 6

传统的图二分类问题

Updated 11 months ago

opendata / MultiWOZ
question answering system natural language processing 10

MultiWOZ数据集是跨越多个域和主题的人类书面对话的完全标记集合。在10k个对话的情况下,它至少比以前所有带注释的面向任务的语料库大一个数量级。 https://www.repository.cam.ac.uk/handle/1810/280608

Updated 11 months ago

Open_Dataset / GoEmotions
task. natural language processing 1

情感类别包括钦佩、娱乐、愤怒、烦恼、赞同、关心、困惑、好奇、渴望、失望、不赞成、厌恶、尴尬、兴奋、恐惧、感激、悲伤、喜悦、爱、紧张、乐观、骄傲、实现、解脱、悔恨、悲伤、惊

Updated 10 months ago

BIMCV-COVID19+:COVID19患者RX和CT图像的大注释数据集。数据库的第一次迭代包括1380个CX,885个DX和163个CT研究。

Updated 10 months ago

Open_Dataset / MSeg
task. computer vision 0

MSeg:一个用于多域语义分割的复合数据集。80000多张图片中有超过220000个物体任务。

Updated 10 months ago

Open_Dataset / VIOLIN
task. computer vision 0

VIOLIN(视频和语言推理),由来自15887个视频片段的95322个视频假设对组成,跨越582个小时的视频(YouTube和电视节目)。

Updated 10 months ago

Open_Dataset / TAO
task. computer vision 0

TAO是一个用于跟踪任何对象的联邦数据集,包含2907个高分辨率视频,在不同的环境中捕获,这些视频的平均长度为半分钟。

Updated 10 months ago

Open_Dataset / Condensed_Movies
task. computer vision 1

一个大规模的视频数据集,包含有详细字幕的电影片段。超过3000部不同类型、不同国家和不同年代的电影。

Updated 10 months ago

Open_Dataset / VGG-Sound
task. category. 0

vggi - sound是一个视听对应的数据集,由从上传到YouTube的视频中提取的音频片段组成

Updated 10 months ago

Open_Dataset / RISE_Video_Dataset
task. computer vision 0

介绍了RISE,第一个用于识别工业烟雾排放的大规模视频数据集。我们的数据集包含12,567个剪辑,其中19个不同的视角来自三个监控三个不同工业设施的站点。

Updated 10 months ago

Open_Dataset / SciTLDR
task. natural language processing 0

在“OpenReview”出版平台上,有将近4000名tldr撰写的关于人工智能研究论文。对于每篇论文,SciTLDR包含至少两个高质量的tldr。

Updated 10 months ago

Open_Dataset / CIFAR-100
image classification computer vision 5

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

Updated 10 months ago

Open_Dataset / CIFAR-10
task. category. 3

CIFAR-10数据集包含10个类别的60000个32x32彩色图像,每个类别6000个图像。 有50000张训练图像和10000张测试图像。http://www.cs.toronto.edu/~kriz/cifar.html?usg=alkjrhjqbhw2llxlo8emqns-tbk0at96jq

Updated 10 months ago