Datasets

PCL-Platform.Intelligence / 盘古α
task. natural language processing 1248

2000亿开源中文预训练语言模型「鹏程·盘古α」

Updated 4 months ago

PanGu-Alpha 模型在 GPU 上推理和训练

Updated 1 month ago

OpenI / mirror
task. computer vision and natural language processing 67

本页面建立了SpikingJelly中集成的部分数据集的下载镜像。 只有原始数据集所使用的协议允许分发,或原始数据集作者已经同意分发的数据集才会被建立镜像。

Updated 4 months ago

启智社区开源技术讲座及分享

Updated 1 week ago

xupike / DynaQuestions
knowledge graph natural language processing 31

构建了面向军事领域的动态知识图谱 DynaBase,并发布了KBQA 数据集 DynaQuestions。DynaQuestions 包含了2829 条问答对, 其中针对动态知识的问题600条,每个问答对标注了问题类型、Cypher 语句以及答案,能够从新的复杂维度对问答系统的表现进行评价。DynaQuestions 中的问题类型更加多样,其中静态类型的问题能够评测传统问答模型。

Updated 3 months ago

中文长下文词语预测(Chinese WPLC)数据集

Updated 1 week ago

weixx / iNaturalist2017_federated
image classification computer vision 30

Updated 4 months ago

MIC / SEEG_Database
task. category. 17

Updated 1 month ago

OpenIOSSG / PLabel
task. category. 15

(1) minio为linux下的minio 可以执行性文件,下载到本地后,执行如下命令即可启动: chmod 755 minio export MINIO_ACCESS_KEY=minio export MINIO_SECRET_KEY=miniominio nohup ./minio server /data2/miniodata/ & (2) plabel_20210629_v2.tar 为标注系统最新的镜像,内里搭建了mmdetection 2.3.0版本的环境。 (3) gitea.tar 开源社区后端编译及运行环境镜像。 (4)retinanet_free_anchor_r50_fpn_1x_epoch_12.pth 基于mmdetction 2.3.0,使用所有开源数据集行人数据训练的行人检测模型。

Updated 1 month ago

opendata / MultiWOZ
question answering system natural language processing 10

MultiWOZ数据集是跨越多个域和主题的人类书面对话的完全标记集合。在10k个对话的情况下,它至少比以前所有带注释的面向任务的语料库大一个数量级。 https://www.repository.cam.ac.uk/handle/1810/280608

Updated 11 months ago

liaomx / TransUnet
task. category. 10

Updated 5 months ago

Open_Dataset / COCO
target detection computer vision and natural language processing 9

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

Updated 9 months ago

提取Common Crawl 的中文文本,并清洗

Updated 1 month ago

海星HiStar:联邦深度学习中间件

Updated 2 months ago

chenjm / KoNvid-1K
task. category. 8

Open dataset for KoNvid-1K

Updated 7 months ago

guomy / DogVsCat
task. category. 6

传统的图二分类问题

Updated 11 months ago

gzq / cat_dog
task. computer vision 6

数据集的详细描述,在这里显示

Updated 2 months ago

Open_Dataset / CIFAR-100
image classification computer vision 5

该数据集有100个类别,每个类别包含600张图像。 每个课程有500张训练图像和100张测试图像, CIFAR-100中的100个类别分为20个超类。 https://www.cs.toronto.edu/~kriz/cifar.html

Updated 10 months ago

duh / duh-sentiment
task. category. 5

情感分析测试428

Updated 3 months ago

GT_ZhangAcer / test
task. category. 4

Updated 3 months ago