14 KiB

Raw Permalink Blame History

SSD说明

SSD将边界框的输出空间离散成一组默认框，每个特征映射位置具有不同的纵横比和尺度。在预测时，网络对每个默认框中存在的对象类别进行评分，并对框进行调整以更好地匹配对象形状。此外，网络将多个不同分辨率的特征映射的预测组合在一起，自然处理各种大小的对象。

论文： Wei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg.European Conference on Computer Vision (ECCV), 2016 (In press).

模型架构

SSD方法基于前向卷积网络，该网络产生固定大小的边界框集合，并针对这些框内存在的对象类实例进行评分，然后通过非极大值抑制步骤进行最终检测。早期的网络层基于高质量图像分类的标准体系结构，被称为基础网络。后来通过向网络添加辅助结构进行检测。

数据集

使用的数据集： COCO2017

数据集大小：19 GB
- 训练集：18 GB，118000张图像
- 验证集：1 GB，5000张图像
- 标注：241 MB，实例，字幕，person_keypoints等
数据格式：图像和json文件
- 注意：数据在dataset.py中处理

环境要求

安装MindSpore。
下载数据集COCO2017。
本示例默认使用COCO2017作为训练数据集，您也可以使用自己的数据集。
1. 如果使用coco数据集。执行脚本时选择数据集coco。
  安装Cython和pycocotool，也可以安装mmcv进行数据处理。
```
pip install Cython
pip install pycocotools
```
  并在config.py中更改COCO_ROOT和其他您需要的设置。目录结构如下：
```
.
└─cocodataset
  ├─annotations
    ├─instance_train2017.json
    └─instance_val2017.json
  ├─val2017
  └─train2017
```
2. 如果使用自己的数据集。执行脚本时选择数据集为other。
  将数据集信息整理成TXT文件，每行如下：
```
train2017/0000001.jpg 0,259,401,459,7 35,28,324,201,2 0,30,59,80,2
```
  每行是按空间分割的图像标注，第一列是图像的相对路径，其余为[xmin,ymin,xmax,ymax,class]格式的框和类信息。我们从IMAGE_DIR（数据集目录）和ANNO_PATH（TXT文件路径）的相对路径连接起来的图像路径中读取图像。在config_ssd_resnet34.py中设置IMAGE_DIR和ANNO_PATH。

快速入门

通过官方网站安装MindSpore后，您可以按照如下步骤进行训练和评估：

Ascend处理器环境运行

# Ascend分布式训练
sh scripts/run_distribute_train.sh [RANK_TABLE_FILE] [DATASET] [DATASET_PATH] [MINDRECORD_PATH] [TRAIN_OUTPUT_PATH][PRE_TRAINED_PATH](optional)

# Ascend单卡训练
sh scripts/run_standalone_train.sh [DEVICE_ID] [DATASET] [DATASET_PATH] [MINDRECORD_PATH] [TRAIN_OUTPUT_PATH][PRE_TRAINED_PATH](optional)

# Ascend处理器环境运行eval
sh scripts/run_eval.sh [DEVICE_ID] [DATASET] [DATASET_PATH] [CHECKPOINT_PATH] [MINDRECORD_PATH]

脚本说明

脚本及样例代码

  └─ ssd_resnet34
    ├─ ascend310_infer
    ├─ scripts
      ├─ run_distribute_train.sh      ## Ascend 910分布式shell脚本
      ├─ run_standalone_train.sh      ## Ascend 910单卡shell脚本
      ├─ run_infer_310.sh             ## Ascend 310评估shell脚本
      └─ run_eval.sh                  ## Ascend910 评估shell脚本
    ├─ src
      ├─ __init__.py                  ## 初始化文件
      ├─ anchor_generator.py          ## anchor生成器
      ├─ box_util.py                  ## bbox工具
      ├─ callback.py                  ## 用于边训练边推理的callback
      ├─ config.py                    ## 总配置
      ├─ config_ssd_resnet34.py       ## ssd_resnet34配置
      ├─ dataset.py                   ## 创建并处理数据集
      ├─ eval_utils.py                ## eval工具
      ├─ init_params.py               ## 参数工具
      ├─ lr_schedule.py               ## 学习率生成器
      ├─ resnet34.py                  ## resnet34架构
      ├─ ssd.py                       ## SSD架构
      └─  ssd_resnet34.py              ## ssd_resnet34架构
    ├─ eval.py                        ## 评估脚本
    ├─ export.py                      ## 将checkpoint文件导出为mindir用于310推理
    ├─ postprocess.py                 ## Ascend 310 评估
    ├─ README.md                      ## SSD英文相关说明
    ├─ README_CN.md                   ## SSD中文相关说明
    ├─ requirements.txt               ## 需求文档
    └─ train.py                       ## 训练脚本

脚本参数

train.py和config_ssd_resnet34.py中主要参数如下：

  "device_num": 1                            # 使用设备数量
  "lr": 0.075                                # 学习率初始值
  "dataset": coco                            # 数据集名称
  "epoch_size": 500                          # 轮次大小
  "batch_size": 32                           # 输入张量的批次大小
  "pre_trained": None                        # 预训练检查点文件路径
  "pre_trained_epoch_size": 0                # 预训练轮次大小
  "save_checkpoint_epochs": 10               # 两个检查点之间的轮次间隔。默认情况下，每10个轮次都会保存检查点。
  "loss_scale": 1024                         # 损失放大

  "class_num": 81                            # 数据集类数
  "image_shape": [300, 300]                  # 作为模型输入的图像高和宽
  "mindrecord_dir": "/data/MindRecord_COCO"  # MindRecord路径
  "coco_root": "/data/coco2017"              # COCO2017数据集路径
  "voc_root": ""                             # VOC原始数据集路径
  "image_dir": ""                            # 其他数据集图片路径，如果使用coco或voc，此参数无效。
  "anno_path": ""                            # 其他数据集标注路径，如果使用coco或voc，此参数无效。

训练过程

运行train.py训练模型。如果mindrecord_dir为空，则会通过coco_root（coco数据集）或image_dir和anno_path（自己的数据集）生成MindRecord文件。注意，如果mindrecord_dir不为空，将使用mindrecord_dir代替原始图像。

Ascend上训练

分布式

   sh scripts/run_distribute_train.sh [RANK_TABLE_FILE] [DATASET] [DATASET_PATH] [MINDRECORD_PATH] [TRAIN_OUTPUT_PATH][PRE_TRAINED_PATH](optional)

此脚本需要五或六个参数。

RANK_TABLE_FILE：rank_table.json的路径。最好使用绝对路径。
DATASET：分布式训练的数据集模式。
DATASET_PATH：分布式训练的数据集路径。
MINDRECORD_PATH：分布式训练的mindrecord文件。
TRAIN_OUTPUT_PATH：训练输出的检查点文件路径。最好使用绝对路径。
PRE_TRAINED_PATH：预训练检查点文件的路径。最好使用绝对路径。

训练结果保存在train路径中，文件夹名为"log"。您可在此文件夹中找到检查点文件以及结果，如下所示。

epoch: 1 step: 458, loss is 4.185711
epoch time: 138740.569 ms, per step time: 302.927 ms
epoch: 2 step: 458, loss is 4.3121023
epoch time: 47116.166 ms, per step time: 102.874 ms
epoch: 3 step: 458, loss is 3.2209284
epoch time: 47149.108 ms, per step time: 102.946 ms
epoch: 4 step: 458, loss is 3.5159926
epoch time: 47174.645 ms, per step time: 103.001 ms
...
epoch: 497 step: 458, loss is 1.0916114
epoch time: 47164.002 ms, per step time: 102.978 ms
epoch: 498 step: 458, loss is 1.157409
epoch time: 47172.836 ms, per step time: 102.997 ms
epoch: 499 step: 458, loss is 1.2065268
epoch time: 47155.245 ms, per step time: 102.959 ms
epoch: 500 step: 458, loss is 1.1856415
epoch time: 47666.430 ms, per step time: 104.075 ms

评估过程

Ascend处理器环境评估

sh scripts/run_eval.sh [DEVICE_ID] [DATASET] [DATASET_PATH] [CHECKPOINT_PATH] [MINDRECORD_PATH]

此脚本需要五个参数。

DEVICE_ID: 评估的设备ID。
DATASET：评估数据集的模式。
DATASET_PATH：评估的数据集路径。
CHECKPOINT_PATH：检查点文件的绝对路径。
MINDRECORD_PATH：评估的mindrecord文件。

推理结果保存在eval路径中，文件夹名为“log”。您可以在日志中找到类似以下的结果。

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.240
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.360
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.258
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.016
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.229
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.446
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.256
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.389
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.427
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.077
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.439
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.734

========================================

mAP: 0.24011857000302622

推理过程

导出MindIR

python export.py --ckpt_file [CKPT_PATH] --file_name [FILE_NAME] --file_format [FILE_FORMAT]

参数ckpt_file为必填项，
EXPORT_FORMAT 必须在 ["AIR", "MINDIR"]中选择。

在Ascend310执行推理

在执行推理前，mindir文件必须通过export.py脚本导出。以下展示了使用minir模型执行推理的示例。
目前仅支持batch_Size为1的推理。精度计算过程需要70G+的内存，否则进程将会因为超出内存被系统终止。

# Ascend310 inference
bash run_infer_310.sh [MINDIR_PATH] [DATA_PATH] [DVPP] [ANNO_FILE] [DEVICE_ID]

DVPP 为必填项，需要在["DVPP", "CPU"]选择，大小写均可。需要注意的是ssd_vgg16执行推理的图片尺寸为[300, 300]，由于DVPP硬件限制宽为16整除，高为2整除，因此，这个网络需要通过CPU算子对图像进行前处理。
DEVICE_ID 可选，默认值为0。

结果

推理结果保存在脚本执行的当前路径，你可以在acc.log中看到以下精度计算结果。

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.250
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.374
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.266
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.018
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.241
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.462
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.260
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.399
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.435
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.090
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.449
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.739
0.249879750926743

模型描述

性能

训练性能

参数	Ascend
模型版本	SSD_ResNet34
资源	Ascend 910 CPU 2.60GHz，192 cores；Memory 755 G
上传日期	2021-08-31
MindSpore版本	1.3
数据集	COCO2017
训练参数	epoch：500 batch_size：32
优化器	Momentum
损失函数	Sigmoid Cross Entropy,SmoothL1Loss
速度	101 ms/step
总耗时	8.34小时

推理性能

参数	Ascend
模型版本	SSD_ResNet34
资源	Ascend 910
上传日期	2021-08-31
MindSpore版本	1.3
数据集	COCO2017
输出	mAP
准确率	IoU=0.50: 24.0%
推理模型	98.77M（.ckpt文件）

随机情况说明

dataset.py中设置了“create_dataset”函数内的种子，同时还使用了train.py中的随机种子。

ModelZoo主页

请浏览官网主页。

14 KiB Raw Permalink Blame History

目录