仅显示平台推荐
COCO
${starItems[0]}

COCO是大规模的对象检测,分割和字幕数据集。 它包含:330K图像(标为> 200K),150万个对象实例,80个对象类别。https://cocodataset.org/

2020-11-09 58 94
PLabel
${starItems[1]}

(1) minio为linux下的minio 可以执行性文件,下载到本地后,执行如下命令即可启动: chmod 755 minio export MINIO_ACCESS_KEY=minio export MINIO_SECRET_KEY=miniominio nohup ./minio server /data2/miniodata/ & (2) plabel_20210629_v2.tar 为标注系统PLabel2.0基于mmdection的GPU镜像,内里搭建了mmdetection 2.3.0版本的环境,支持基于mmdetection的模型重训。 (3) gitea.tar 开源社区后端编译及运行环境镜像。 (4)retinanet_free_anchor_r50_fpn_1x_epoch_12.pth 基于mmdetction 2.3.0,使用所有开源数据集行人数据训练的行人检测模型。 (5)pcl_label_hand_v3.tar为封装好的最新PLabel3.0标注系统,运行容器后,进入容器,运行server.sh即可使用。用来接入yolov5_auto_label_v1.tar及yolov5_auto_track_v1.tar中的算法 (6)yolov5_auto_label_v1.tar为基于CPU的自动标注算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar, (7)yolov5_auto_track_v1.tar为基于CPU的目标跟踪算法镜像,使用docker加载之后,运行容器,进入容器的/javaapp目录,使用java -jar labelSystemForDocker.jar,

2021-07-23 12 490
MSeg
${starItems[2]}

MSeg:一个用于多域语义分割的复合数据集。80000多张图片中有超过220000个物体任务。

2020-11-18 10 3
VisualGenome
${starItems[3]}

视觉基因组是一个数据集,一个知识库,将结构化图像概念与语言联系在一起的持续努力。 它包含:108,077张图像540万个区域描述170万个视觉问题解答380万个对象实例。 http://visualgenome.org/

2020-11-30 0 2
ACTIVITYNET
${starItems[4]}

ActivityNet是用于了解人类活动的新的大型视频基准。 ActivityNet提供203个活动类别的样本,每个类别平均137个未修整视频,每个影片1.41个活动实例,总共849个视频小时。 http://activity-net.org/

2020-12-07 0 1
Paris500k
${starItems[5]}

Paris500k数据集包含从Flickr和Panoramio收集的501,356个带有地理标签的图像。 数据集是从地理边界框而不是使用关键字查询收集的。 https://www.vision.rwth-aachen.de/page/paris500k

2020-11-09 0 3
PETA
${starItems[6]}

远距离行人属性识别数据集。PETA数据集包含19000张图像,分辨率范围为17×39到169×365像素,包括8705个人,每个人都带有61个二进制和4个多类属性。 http://mmlab.ie.cuhk.edu.hk/projects/PETA.html

2020-12-07 0 4
URPC2020_dataset
${starItems[7]}

URPC 2020(大连)水下目标检测算法赛由国家自然科学基金委员会、大连市人民政府和鹏城实验室共同主办,大连市科技局、大连理工大学、大连金普新区管委会、大连金石滩国家旅游度假区管委会承办。本次比赛紧扣水下目标检测算法领域,创新的将人工智能与水下机器人进行有机结合,把真实水下环境的光学图像开放给更广泛的人工智能和算法研究群体,树立了一个目标检测和识别的新领域。

2022-03-10 0 50
URPC_sonarimage_dataset
${starItems[8]}

下目标检测算法赛是由国家自然基金委、鹏城实验室和湛江市人民政府联合主办全国水下机器人(湛江)大赛的第一阶段。本次比赛紧扣水下目标检测算法领域,创新的将人工智能与水下机器人进行有机结合,把真实水下环境的光学图像和声学图像开放给更广泛的人工智能和算法研究群体,树立了一个目标检测和识别的新领域。比赛分为「光学图像目标检测」和「声学图像目标检测」两个赛项。 本项目收集了「声学图像目标检测」赛项的相关数据集,希望这些数据能够对相关领域的研究者有所帮助。

2022-03-10 0 33
URPC_opticalimage_dataset
${starItems[9]}

水下目标检测算法赛是由国家自然基金委、鹏城实验室和湛江市人民政府联合主办全国水下机器人(湛江)大赛的第一阶段。本次比赛紧扣水下目标检测算法领域,创新的将人工智能与水下机器人进行有机结合,把真实水下环境的光学图像和声学图像开放给更广泛的人工智能和算法研究群体,树立了一个目标检测和识别的新领域。比赛分为「光学图像目标检测」和「声学图像目标检测」两个赛项。 本项目收集了「光学图像目标检测」赛项的相关数据集,希望这些数据能够对相关领域的研究者有所帮助。

2022-03-10 2 61
COCO2017
${starItems[10]}

coco2017 dataset

2022-03-21 1316 30
SKU110K_fixed
${starItems[11]}

此数据集中的图像包含密密麻麻的物体,用于精确目标检测。 Sku110k数据集提供11762张图像,其中包含在密集场景中获取的170多万个带注释的边界框,包括用于训练的8233张图像、用于验证的588张图像和用于测试的2941张图像。总共大约有1733678个实例。这些图像来自数千家超市商店,具有不同的比例、视角、照明条件和噪音水平。所有图像的分辨率都调整为100万像素。 参考: [1] Eran Goldman*, Roei Herzig*, Aviv Eisenschtat*, Jacob Goldberger, Tal Hassner, Precise Detection in Densely Packed Scenes, 2019. [2] Tsung-Yi Lin, Priyal Goyal, Ross Girshick, Kaiming He, Piotr Dollar, Focal loss for dense object detection, 2018. 引用: @inproceedings{goldman2019dense, author = {Eran Goldman and Roei Herzig and Aviv Eisenschtat and Jacob Goldberger and Tal Hassner}, title = {Precise Detection in Densely Packed Scenes}, booktitle = {Proc. Conf. Comput. Vision Pattern Recognition (CVPR)}, year = {2019}} 官方地址: https://github.com/eg4000/SKU110K_CVPR19

2022-07-20 64 2
yolofMindrecord
${starItems[12]}

coco2017根据yolof模型需要生成的mindrecord

2022-09-06 48 9
MixData
${starItems[13]}

totaltext", "scut-eng-char","icdar2013","icdar2015" "SynthText_full"

2022-07-19 268 10
2022-8-14
${starItems[14]}

【VOC,COCO-2017】

2022-08-09 437 7
PCSOD
${starItems[15]}

Dataset for Salient Object Detection for Point Clouds

2022-07-26 0 36
Intelligent-retail-product-identification
${starItems[16]}

【第六届信也科技杯图像算法大赛】智能零售结算系统,其目的旨在于利用计算机视觉领域中国的图像识别及目标检测技术,精准地对顾客购买的商品进行智能化、自动化的价格结算。当顾客将自己选购的商品放置在制定区域的时候,一个理想的智能零售结算系统应当能够精准地识别每一个商品,并且能够返回完整地购物清单及顾客应付的实际商品总价格。

2022-07-18 16 0
coco_2014
${starItems[17]}

coco 2014

2022-05-26 1 13
Jester
${starItems[18]}

Jester手势识别数据集包括148092个带有标签的视频剪辑,其中人类在笔记本电脑摄像头或网络摄像头前执行基本的预定义手势。它是为训练机器学习模型来识别人类手势而设计的,例如向下滑动两个手指、向左或向右滑动以及敲击手指。

2022-09-23 30 3
URPC2022_sonar_images_dataset
${starItems[19]}

目标类别:包括 3 类规则几何结构物体(立方体、球体、圆柱体)与其他 7 类水下物体(人体模型、轮胎、圆形地笼、方形地笼、铁桶、飞机模型、ROV)等。

2022-09-22 1 10
MindRecord_COCO
${starItems[20]}

COCO的全称是Common Objects in COntext,是微软团队提供的一个可以用来进行图像识别的数据集。

2022-09-15 1 0
test
${starItems[21]}

test

2022-09-13 0 0
SODFormer
${starItems[22]}

Models in 'SODFormer: Streaming Object Detection with Transformers Using Events and Frames'

2022-09-09 0 2
PKU-DAVIS-SOD
${starItems[23]}

The PKU-DAVIS-SOD dataset is a large-scale multimodal neuromorphic object detection dataset with some challenging scenarios (e.g., low-light and high-speed motion blur) included. This dataset is recorded using DAVIS346 whose resolution is of 346 * 260. Our PKU-DAVIS-SOD dataset contains 3 traffic scenarios by considering velocity distribution, light condition, category diversity and object scale, etc. We use the DAVIS346 to record 220 sequences including RGB frames and DVS events. In each sequence, we collect approximately 1 min as the raw data pool with 25 FPS of RGB frames. Manual annotations in the recordings are provided at a frequency of 25 Hz. As a result, this dataset has 276k labeled timestamps and 1080.1k labels in total. Compared to other similar datasets, it has an overwhelming advantage in aspect of scale.

2022-07-22 5 8
mnist
${starItems[24]}

mnist

2022-09-05 14 1
PKU-Vidar-DVS-Dataset
${starItems[25]}

PKU-Vidar-DVS dataset is a large-scale multimodal neuromorphic object detection dataset with temporally continuous labels. This dataset is recorded using our hybrid camera system, which includes a Vidar (resolution 400*250) and a DAVIS346. This dataset contains 9 indoor and outdoor challenging scenarios by considering velocity distribution, illumination change, category diversity, and object scale, etc. We use the hybrid camera system to record 490 sequences including Vidar spikes and DVS events. In each sequence, we collect approximately 5 seconds as the raw data pool. Manual annotations in the recordings are provided at a frequency of 50 Hz. As a result, this dataset has 103.3k labeled timestamps and 229.5k labels in total. It is the first work to build a neuromorphic multimodal object detection dataset involving high-speed and low-light scenarios.

2022-07-17 5 30
yolov5_helmet
${starItems[26]}

yolov5安全帽

2022-08-26 34 3
dataset
${starItems[27]}

2021-08-26 0 6
crowded
${starItems[28]}

bytetrack dataset

2022-08-17 31 0
VOC2012
${starItems[29]}

VOC2012

2022-08-16 5 9