|
|
@@ -0,0 +1,63 @@ |
|
|
|
# 小白训练营第20课-NPU智算网络演示案例 |
|
|
|
## 介绍如何使用智算网络进行NPU训练 |
|
|
|
|
|
|
|
智算网络集群上线啦~大家可以使用智算网络集群的资源进行NPU训练 |
|
|
|
这对以前总为算力资源排长长的队而苦恼的小伙伴们来说,一定是个非常不错的消息! |
|
|
|
今天,我们就来演示一下如何使用智算网络集群资源,看看它跟启智的自有资源又有哪些不同的地方~ |
|
|
|
|
|
|
|
#### Part1、创建云脑任务 |
|
|
|
|
|
|
|
首先,点击云脑页签,选择训练任务,点击【创建训练任务】 |
|
|
|
|
|
|
|
> 没有项目的童鞋,可以先将平台的案例项目[【手写数字识别NPU版本_MindsporeExample】](https://git.openi.org.cn/OpenIOSSG/MNIST_Example)进行派生或克隆。 |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-3.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
|
|
|
|
#### Part2、配置任务参数 |
|
|
|
|
|
|
|
进入任务创建页面后,我们在基本信息部分的“算力集群”处选择【智算网络集群】,如果想使用启智自有的资源,可以选择【启智集群】,计算资源目前仅支持昇腾NPU |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-4.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
在参数设置部分的“镜像”选择“mindspore_1.3.0”版本 |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-5.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
启动文件处可以通过查看右侧的样例自行选择项目的启动文件,如果是本文中的案例项目,可以选择“train_for_c2net.py”文件; |
|
|
|
> 基于智算网络进行训练的话,启动文件中无需下载数据集以及上传模型的操作,如果是基于启智集群,请选择“train.py”文件 |
|
|
|
|
|
|
|
数据集选择已上传到NPU集群的项目数据集,如果是本文中的案例项目,请选择“MNISTData.zip”数据集,然后点击【创建任务】完成创建 |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-6.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
#### Part3、自动训练任务 |
|
|
|
|
|
|
|
创建完任务之后,将自动启动训练。 |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-7.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
接下来,我们点击任务名称,查看配置信息,可以发现我们使用的是来自【成都智算】中心的算力资源 |
|
|
|
|
|
|
|
<div align="center"> |
|
|
|
<img src= ../img/L21-8.png width=100%> |
|
|
|
</div> |
|
|
|
<br> |
|
|
|
|
|
|
|
从本次训练的waiting时间来看,仅用了10秒左右,可谓真香,大家快去试试吧~ |
|
|
|
|