启智社区最近又发版了,新增模型推理功能,欢迎大家体验>>>
You can not select more than 25 topics Topics must start with a chinese character,a letter or number, can include dashes ('-') and can be up to 35 characters long.

4.8 kB

小白训练营第8课-云脑(基于Ascend NPU调试和训练任务)

如何使用云脑2调试和训练任务

前一节课我们讲解了云脑1的功能,本节课我们一起来学习云脑2。

虽然云脑2与云脑1一样具有调试任务的功能,但在操作方面存在很大区别,同时云脑2还具备训练任务的功能,我们一起来看看吧~

Part1-调试任务

1. 上传数据集

要使用云脑,需先上传数据集,我们先点击【数据集】页面,选择【Ascend NPU】,将备用的数据集直接拖入到上传框

云脑1和云脑2数据集无法共用,所以调试使用的数据集也应上传到对应的环境,否则调试任务无法创建成功


2. 新建调试任务

点击【云脑】页面,点击右侧按钮【新建调试任务】


3. 完成新建任务

在新建任务的页面中,计算资源选择【Ascend NPU】,数据集选择该项目调试相关的数据集,然后点击【新建任务】完成创建


稍等十秒左右,待状态由CREATING变为RUNNING后,点击右侧操作栏的【调试】


4. 同步数据到OBS

点击【调试】后,跳转至Jupyter环境界面,其中:

【Files】显示该项目内所有代码文件及数据集

【Running】显示所有正在运行的代码文件

点击顶部右侧按钮【Open JupyterLab】按钮可直接进入JupyterLab调试环境

右侧【Upload】可上传文件,【New】可创建新的文件


选择相应文件后,可进行同步到OBS,复制,重命名,移动,下载,预览,编辑及删除等操作。

比如,选择数据集,点击【Sync OBS】将数据集同步到OBS,页面弹出确认框,点击【YES】后待提示成功,关闭窗口即可。


5. 创建代码文件

点击右侧【New】,在弹出的窗口中根据自身项目需求及算法框架,选择想要创建的代码文件,比如这里选择以MindSpore为框架的Notebook


6. 代码调试

选择文件后,自动跳转到代码调试环境,可根据项目实际情况输入相关代码进行调试啦~

比如,我们输入!unzip +数据集名称,即可解压数据集


好啦~云脑2的调试任务功能就讲解到这里啦,大家可以上传自己的项目多体验,接下来我们一起来学习云脑2的训练任务功能。

Part2-训练任务

1. 创建训练任务

在【云脑】主界面,下拉【CPU/GPU】选择【Ascend NPU】,点击左侧【训练任务】,进入到训练任务的管理页面


点击右侧【新建训练任务】,进入任务创建页面,其中【启动文件】和【数据集】为必填项,需选择该项目相关的文件,且启动文件必须为.py格式的文件(可以点击右侧的查看样例了解如何进行模型训练的详情),所以需先上传代码文件,因前面已经上传过数据集,此处也不再赘述,其他选项默认即可


2. 训练任务

点击新建任务后,待状态由INIT变更为RUNNING后(由于需要申请算力资源,此过程可能会持续一定时间,稍候即可),项目将开始启动训练


3. 查看配置信息

点击任务名称,进入到版本管理页面,默认查看配置信息,比如任务运行时长及状态,还有相关参数信息等


4. 查看训练日志

点击配置信息旁边选项【日志】可以查看相关训练日志,尤其当训练任务失败时,状态会显示为“FAILED”,此时我们可以通过查询日志了解训练失败的原因


好啦~本节课关于云脑2的功能讲解到这里啦,大家也可以参考第13课 -CIFAR-10图像识别项目实战了解更多云脑的相关操作,大家记得多体验练习哦~

简介

启智社区AI协同平台小白操作指南~~~~ 社区新童鞋们可以参考本项目下的小白训练课程,从单个功能讲解到项目实战,手把手带你了解和上手平台的代码、数据集、云脑、任务等各功能,好用到根本停不下来~!!更有免费的算力哦~!!

Python Markdown

贡献者 (1)