Datasets

PCL-Platform.Intelligence / PanGu-Alpha
natural language processing 1568

2000亿开源中文预训练语言模型「鹏程·盘古α」

Updated 1 week ago

PanGu-Alpha 模型在 GPU 上推理和训练

Updated 2 months ago

启智社区开源技术讲座及分享

Updated 1 month ago

OpenIOSSG / PLabel
target detection computer vision 133

(1) minio为linux下的minio 可以执行性文件,下载到本地后,执行如下命令即可启动: chmod 755 minio export MINIO_ACCESS_KEY=minio export MINIO_SECRET_KEY=miniominio nohup ./minio server /data2/miniodata/ & (2) plabel_20210629_v2.tar 为标注系统最新的镜像,内里搭建了mmdetection 2.3.0版本的环境。 (3) gitea.tar 开源社区后端编译及运行环境镜像。 (4)retinanet_free_anchor_r50_fpn_1x_epoch_12.pth 基于mmdetction 2.3.0,使用所有开源数据集行人数据训练的行人检测模型。 (5)pcl_label_hand_v3.tar为封装好的标注系统,运行容器后,进入容器,运行server.sh即可使用。用来接入yolov5_auto_label_v1.tar及yolov5_auto_track_v1.tar中的算法 (6)yolov5_auto_label_v1.tar为基于CPU的自动标注算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar, (7)yolov5_auto_track_v1.tar为基于CPU的目标跟踪算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar,

Updated 23 minutes ago

OpenI / spikingjelly
computer vision and natural language processing 119

本页面建立了SpikingJelly中集成的部分数据集的下载镜像。 只有原始数据集所使用的协议允许分发,或原始数据集作者已经同意分发的数据集才会被建立镜像。

Updated 8 months ago

提取Common Crawl 的中文文本,并清洗

Updated 2 weeks ago

中文长下文词语预测(Chinese WPLC)数据集

Updated 4 months ago

xupike / DynaQuestions
knowledge graph natural language processing 31

构建了面向军事领域的动态知识图谱 DynaBase,并发布了KBQA 数据集 DynaQuestions。DynaQuestions 包含了2829 条问答对, 其中针对动态知识的问题600条,每个问答对标注了问题类型、Cypher 语句以及答案,能够从新的复杂维度对问答系统的表现进行评价。DynaQuestions 中的问题类型更加多样,其中静态类型的问题能够评测传统问答模型。

Updated 8 months ago

weixx / iNaturalist2017_federated
image classification computer vision 30

Updated 4 months ago

鹏程系列大模型的应用技术,从基本技术到应用提供baseline,包括模型的训练推理、finetune\promptune\fewshot learning、模型压缩以及下游任务应用等,促进预训练模型的应用创新。

Updated 2 months ago

Updated 3 months ago

Updated 6 months ago

鹏城实验室名家讲堂系列讲座

Updated 4 months ago

TensorLayer3.0一款兼容多深度学习框架后端的深度学习库, 目前可以用TensorFlow、MindSpore、PaddlePaddle作为后端计算引擎。

Updated 4 weeks ago

Updated 3 days ago

Updated 10 months ago

opendata / MultiWOZ
question answering system natural language processing 10

MultiWOZ数据集是跨越多个域和主题的人类书面对话的完全标记集合。在10k个对话的情况下,它至少比以前所有带注释的面向任务的语料库大一个数量级。 https://www.repository.cam.ac.uk/handle/1810/280608

Updated 1 year ago

Open_Dataset / COCO
target detection computer vision and natural language processing 9

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

Updated 1 year ago

This is an open-source toolkit for Heterogeneous Graph Neural Network(OpenHGNN) based on DGL.

Updated 1 week ago

Updated 10 months ago