Datasets

opendata / dataset
task. category. 3

Updated 1 year ago

guomy / DogVsCat
task. category. 6

传统的图二分类问题

Updated 11 months ago

opendata / AVSpeech
task. speech processing 0

AVSpeech是一种新的、大规模的音视频数据集,它包含无干扰背景噪声的语音视频片段。该数据集总共包含约4700个小时的视频片段,来自YouTube总共29万个视频片段,涵盖了各种人群、语言和面部姿

Updated 1 year ago

opendata / CLEVR
task. category. 1

数据集包括图片和问题,以及对应回答问题标准的 Program https://cs.stanford.edu/people/jcjohns/clevr/

Updated 1 year ago

opendata / SQuAD
question answering system natural language processing 3

斯坦福问答数据集——应用广泛的问答和阅读理解数据集,其中每个问题的答案都以文本形式呈现。 https://rajpurkar.github.io/SQuAD-explorer/

Updated 1 year ago

opendata / The_Examiner
text categorization natural language processing 0

新闻网站The Examiner上的新闻汇编,包含超过6年的21000多位作者撰写的300万篇文章的标题 https://www.kaggle.com/therohk/examine-the-examiner

Updated 1 year ago

opendata / DROP
question answering system natural language processing 1
opendata / cocotext
task. computer vision 2

基于mscoc的大规模场景文本数据集。COCO Text V2.0包含63686个图像和239506个带注释的文本实例。分段掩码为每个单词添加了注释,允许精细的级别检测。 https://bgshih.github.io/cocotext/

Updated 1 year ago

opendata / MultiWOZ
question answering system natural language processing 10

MultiWOZ数据集是跨越多个域和主题的人类书面对话的完全标记集合。在10k个对话的情况下,它至少比以前所有带注释的面向任务的语料库大一个数量级。 https://www.repository.cam.ac.uk/handle/1810/280608

Updated 11 months ago

Open_Dataset / AVID
task. natural language processing 4

AViD数据集:来自不同国家的匿名视频,AViD是一个大型视频数据集,包含467k个视频和887个动作类。所收集的视频具有知识共享许可证。 https://github.com/piergiaj/AViD

Updated 10 months ago

Open_Dataset / CIFAR-100
image classification computer vision 5

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

Updated 10 months ago

Open_Dataset / LargeMovieReviewDataset
emotion analysis natural language processing 1

用于二进制情感分类的数据集,提供了25,000张极地电影评论供培训,25,000张用于测试也有其他未标记的数据可供使用。 http://ai.stanford.edu/~amaas/data/sentiment/

Updated 10 months ago

Open_Dataset / SVHNStreetViewHouseNumbers
image classification computer vision 0

SVHN是一个现实世界的图像数据集,用于开发机器学习和对象识别算法,超过600,000位数的图像。SVHN是从Google街景图像中的门牌号获得的。http://ufldl.stanford.edu/housenumbers/

Updated 10 months ago

Open_Dataset / TheGermanTrafficSignRecognitionBenchmark
image classification computer vision 4

德国交通标志基准测试是在IJCNN 2011上举行的多类,单图像分类挑战。数据集包含:40多个类,总共50,000多张图像。http://benchmark.ini.rub.de/?section=gtsrb

Updated 10 months ago

Open_Dataset / StanfordSentimentTreebank
emotion analysis natural language processing 1

用于情感分析的数据集,其中包含11855个句子的语法分析树中215154个短语的细粒度情感标签,并为情感组成提出了新挑战。https://nlp.stanford.edu/sentiment/code.html

Updated 10 months ago

Open_Dataset / BillionWords
language modeling natural language processing 0

该项目的目的是为语言建模实验提供标准的培训和测试设置,包含10亿字。http://www.statmt.org/lm-benchmark/

Updated 10 months ago

Open_Dataset / Paris500k
target detection computer vision 2

Paris500k数据集包含从Flickr和Panoramio收集的501,356个带有地理标签的图像。 数据集是从地理边界框而不是使用关键字查询收集的。 https://www.vision.rwth-aachen.de/page/paris500k

Updated 10 months ago

Open_Dataset / StanfordCars
3Dreconstruction computer vision 2

斯坦福汽车数据集包含196类汽车的16,185张图像。数据被分为8,144个训练图像和8,041个测试图像,其中每个类别已大致分为50-50个分割。 https://ai.stanford.edu/~jkrause/cars/car_dataset.html

Updated 10 months ago

Open_Dataset / COCO
target detection computer vision and natural language processing 9

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

Updated 9 months ago

OpenI / mirror
task. computer vision and natural language processing 67

本页面建立了SpikingJelly中集成的部分数据集的下载镜像。 只有原始数据集所使用的协议允许分发,或原始数据集作者已经同意分发的数据集才会被建立镜像。

Updated 4 months ago