11 KiB

Raw Permalink Blame History

DETR将输入图像首先通过ResNet特征提取模块，提取特征信息，然后结合位置信息进行编码，送入Transformer模块进行Encode&Decode，两个模块的特征维度均为512、中间传播维度均为2048、采用8头注意力模块、堆叠次数均为6层、中间激活函数为relu、dropout概率为0.1。对特征进行编码解码得到高纬特征向量后，进行类别编码和回归框编码，得到类别概率和类别回归框信息。在训练时，针对不同的目标，使用匈牙利算法将其与类别概率和类别回归框信息进行匹配，再去计算相应的loss。

数据集

使用的数据集： COCO 2017

数据集大小：19 GB
- 训练集：18 GB，118000张图片
- 验证集：1GB，5000张图片
- 标注：241 MB，包含实例，字幕，person_keypoints等
数据格式：图片和json文件
- 标注：数据在dataset.py中处理。
目录结构如下所示:

.
├── annotations  # 标注jsons
├── train2017    # 训练数据集
└── val2017      # 推理数据集

环境要求

硬件（Ascend处理器）
- 准备Ascend处理器搭建硬件环境。
框架
- MindSpore>1.9
如需查看详情，请参见如下资源：
- MindSpore教程
- MindSpore Python API
其他
- 若执行Ascend静态图模式，则需要mindspore.scipy.optimize.linear_sum_assignment算子
- GPU只支持动态图模式
- Ascend支持动态图和静态图模式

快速开始

通过官方网站安装MindSpore后，您可以按照如下步骤进行训练和评估：

Ascend处理器环境运行

训练

# 单卡训练（不建议）
bash scripts/run_standalone_train_ascend.sh [DEVICE_ID] [DATASET_PATH] [BACKBONE_PRETRAIN] [CONTEXT_MODE]

# 8卡训练
bash scripts/run_distribute_train_ascend.sh [RANK_TABLE_FILE] [DATASET_PATH] [BACKBONE_PRETRAIN] [CONTEXT_MODE]

案例:

# 8卡训练
# RANK_TABLE_FILE - 分布式json文件
# DATASET_PATH - COCO数据集目录
# BACKBONE_PRETRAIN - backbone预训练权重
# CONTEXT_MODE - 执行模式（GRAPH、PYNATIVE）目前只支持动态图

bash scripts/run_distribute_train_ascend.sh hccl_8p_01234567_127.0.0.1.json /opt/npu/data/coco2017 ms_resnet_50.ckpt PYNATIVE

验证

# 验证
bash scripts/run_eval_ascend.sh [DATASET_PATH] [RESUME] [DEVICE_TARGET] [DEVICE_ID] [MAX_SIZE]

案例:

# 验证
# DATASET_PATH - 数据位置
# RESUME - 权重路径
# DEVICE_TARGET - 设备
# DEVICE_ID - 设备ID
# MAX_SIZE - 图片最大尺寸
bash scripts/run_distribute_train_ascend.sh /opt/npu/data/coco2017 ./ms_detr_sota.ckpt "Ascend" 0 1280

GPU处理器环境运行

训练

# 8卡训练
bash scripts/run_distribute_train_gpu.sh [DATASET_PATH] [BACKBONE_PRETRAIN] [CONTEXT_MODE]

案例:

# 8卡训练
# DATASET_PATH - 数据位置
# BACKBONE_PRETRAIN - backbone预训练权重
# CONTEXT_MODE - 执行模式，目前只支持动态图

bash scripts/run_distribute_train_gpu.sh /opt/npu/data/coco2017 ms_resnet_50.ckpt PYNATIVE

验证

# 验证
bash scripts/run_eval_ascend.sh [DATASET_PATH] [RESUME] [DEVICE_TARGET] [DEVICE_ID] [MAX_SIZE]

案例:

# 验证
# DATASET_PATH - 数据位置
# RESUME - 权重路径
# DEVICE_TARGET - 设备
# DEVICE_ID - 设备ID
# MAX_SIZE - 图片最大尺寸
bash scripts/run_eval_ascend.sh /opt/npu/data/coco2017 ./ms_detr_sota.ckpt "GPU" 0 1280

脚本说明

脚本及样例代码

|- ascend310_infer                         # 310推理代码
|- scripts                                  
|    |- env_npu.sh                         # npu环境变量
|    |- run_distribute_train_ascend.sh     # 8pNPU训练 
|    |- run_distribute_train_gpu.sh        # 8pGPU训练
|    |- run_eval_ascend.sh                 # 单卡验证
|    |- run_infer_310.sh                   # 310推理
|    |- run_standalone_train_ascend.sh     # 单卡NPU、GPU训练
|- src
|    |- data
|    |    |- __init__.py 
|    |    |- coco_eval.py                  # coco验证脚本
|    |    |- dataset.py                    # 数据集加载脚本
|    |    |- transform.py                  # 数据增强脚本
|    |- DETR
|    |    |- __init__.py
|    |    |- backbone.py                   # 骨干网络实现脚本
|    |    |- criterion.py                  # 损失函数实现脚本
|    |    |- detr.py                       # detr模型
|    |    |- init_weights.py               # 模型参数初始化
|    |    |- matcher.py                    # 匈牙利算法实现脚本
|    |    |- matcher_np.py                 # 匈牙利算法np实现脚本 
|    |    |- position_encoding.py          # 位置编码实现脚本
|    |    |- resnet.py                     # resnet实现脚本
|    |    |- transformer.py                # transformer实现脚本
|    |    |- util.py                       # 其他工具
|    |- tools
|    |    |- __init__.py
|    |    |- average_meter.py              # 平均值
|    |    |- cell.py                       # 训练cell脚本
|    |    |- hccl_tools.py                 # 分布式脚本
|    |    |- merge_hccl.py                 # 分布式合并脚本
|    |    |- pth2ckpt.py                   # torch权重迁移脚本
|    |- __init__.py                        # 初始化脚本
|- eval.py                                 # 验证脚本
|- export.py                               # 模型导出脚本
|- infer.py                                # 推理脚本
|- main.py                                 # 训练脚本
|- postprocess.py                          # 310后处理脚本
|- requirements.txt                        # 依赖环境

脚本参数

"lr": 0.0001,                                   # 学习率
"lr_backbone": 0.00001,                         # backbone的学习率
"epochs": 300,                                  # 总轮次
"lr_drop": 200,                                 # 学习率下降轮次
"weight_decay": 0.0001,                         # weight decay
"batch_size": 4,                                # 批次
"clip_max_norm": 0.1,                           # 梯度裁剪
"max_size": 960                             	# 图片最大尺寸

训练过程

Ascend上训练

分布式训练 (8p)

bash scripts/run_distribute_train_ascend.sh hccl_8p_01234567_127.0.0.1.json /opt/npu/data/coco2017 ms_resnet_50.ckpt PYNATIVE

日志位置： outputs/train0.log

训练过程：

epoch[0/300], iter[0/3664], loss:68.2397, fps:0.02 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[73/3664], loss:47.9165, fps:4.67 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[146/3664], loss:41.4048, fps:4.54 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[219/3664], loss:38.1338, fps:4.54 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[292/3664], loss:36.3088, fps:4.57 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[365/3664], loss:35.1795, fps:4.74 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[438/3664], loss:34.1690, fps:4.66 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[511/3664], loss:33.3878, fps:4.64 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[584/3664], loss:32.9090, fps:4.61 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[657/3664], loss:32.4188, fps:4.64 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[730/3664], loss:32.0672, fps:4.67 imgs/sec, lr:[1e-05/0.0001]
epoch[0/300], iter[803/3664], loss:31.6295, fps:4.59 imgs/sec, lr:[1e-05/0.0001]

评估过程

Ascend评估

bash scripts/run_eval_ascend.sh /opt/npu/data/coco2017 ./ms_detr_sota.ckpt "Ascend" 0 1280

结果:

 Average Precision  (AP) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.409
 Average Precision  (AP) @[ IoU=0.50      | area=   all | maxDets=100 ] = 0.620
 Average Precision  (AP) @[ IoU=0.75      | area=   all | maxDets=100 ] = 0.430
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.193
 Average Precision  (AP) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.448
 Average Precision  (AP) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.607
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=  1 ] = 0.329
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets= 10 ] = 0.523
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=   all | maxDets=100 ] = 0.564
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= small | maxDets=100 ] = 0.305
 Average Recall     (AR) @[ IoU=0.50:0.95 | area=medium | maxDets=100 ] = 0.619
 Average Recall     (AR) @[ IoU=0.50:0.95 | area= large | maxDets=100 ] = 0.802

导出MINDIR

python export.py --resume=ms_detr_sota.ckpt \
                 --no_aux_loss \
                 --device_id=3 \
                 --device_target="Ascend" \
                 --batch_size=1 \
                 --file_name='detr_bs1' \
                 --file_format='MINDIR'\
                 --max_size=1280

模型描述

性能

参数	DETR (8p)
资源	8x Ascend910
上传日期	2023.01.18
Mindspore 版本	1.9.0
数据集	COCO2017
训练参数	epoch=300, lr=0.0001, lr_backbone=0.00001, weight_decay=0.0001, batch_size=4
优化器	AdamWeightDecay
损失函数	L1, GIOU loss, SoftmaxCrossEntropyWithLogits
速度	37(PYNATIVE)
mAP0.5:0.95	0.409
mAP0.5	0.620

随机情况说明

在main.py中，我们设置了“create_dataset”函数内的种子。同时还使用了train.py中的随机种子。

ModelZoo 主页

请浏览官网主页。

11 KiB

Raw Permalink Blame History

目录

DETR描述

模型架构

数据集

环境要求

快速开始

Ascend处理器环境运行

训练

验证

GPU处理器环境运行

训练

验证

脚本说明

脚本及样例代码

脚本参数

训练过程

Ascend上训练

分布式训练 (8p)

评估过程

Ascend评估

导出MINDIR

模型描述

性能

随机情况说明

ModelZoo 主页

11 KiB Raw Permalink Blame History

目录

训练

验证

训练

验证

分布式训练 (8p)

Ascend评估

11 KiB

Raw Permalink Blame History