Repositories

CIFAR-10数据集包含10个类别的60000个32x32彩色图像,每个类别6000个图像。 有50000张训练图像和10000张测试图像。http://www.cs.toronto.edu/~kriz/cifar.html?usg=alkjrhjqbhw2llxlo8emqns-tbk0at96jq

Updated 4 months ago

ActivityNet是用于了解人类活动的新的大型视频基准。 ActivityNet提供203个活动类别的样本,每个类别平均137个未修整视频,每个影片1.41个活动实例,总共849个视频小时。 http://activity-net.org/

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

广泛的八个数据集,用于文本分类。 来自DBPedia,Amazon,Yelp,Yahoo!,Sogou和AG的数据集。样本大小为120K至3.6M,范围从二进制到14类问题。 https://drive.google.com/drive/u/0/folders/0Bz8a_Dbh9Qhbfll6bVpmNUtUcFdjYmF2SEpmZUZUcVNiMUw1TWN6RDV3a0JHT3kxLVhVR2M

Updated 4 months ago

新闻网站The Examiner上的新闻汇编,包含超过6年的21000多位作者撰写的300万篇文章的标题 https://www.kaggle.com/therohk/examine-the-examiner

Updated 4 months ago

Updated 4 months ago

TCIA托管了大量癌症医学图像的存档,数据被组织为集合,通常是与常见疾病(如肺癌),图像形式(MRI,CT等)或研究重点相关的患者。根据具体需要自行前往下载。https://www.cancerimagingarchive.net

Updated 4 months ago

shimy / Test_Openl
Jupyter Notebook 1 0

Updated 4 months ago

检测开源算法工具包

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

Updated 4 months ago

来自不同国家的匿名视频,AViD是一个大型视频数据集,包含467k个视频和887个动作类。所收集的视频具有知识共享许可证。

Updated 4 months ago

SNLI语料库(1.0版)是一组570k人工编写的英语句子对的集合,这些句子对经过手动标记以实现平衡分类,带有包含,矛盾和中立的标签,支持NLI(RTE)。https://nlp.stanford.edu/projects/snli/

Updated 4 months ago

Updated 4 months ago

TAO是一个用于跟踪任何对象的联邦数据集,包含2907个高分辨率视频,在不同的环境中捕获,这些视频的平均长度为半分钟。

Updated 4 months ago