Are you sure you want to delete this task? Once this task is deleted, it cannot be recovered.
wec 06f913d83d | 5 months ago | |
---|---|---|
MMonitor | 5 months ago | |
example | 6 months ago | |
README.md | 6 months ago |
大模型训练过程涉及数据配比、训练超参数、网络架构等多方面因素,如何从这些因素中选择合适的组合以最大化模型学习速度,对于理解模型训练过程及降低成本具有重要意义。因此,目前在该技术研究方向上可能还存在从以下挑战问题供研究者们探索研究:
针对这些挑战问题,本项目从演化工具、脑海模型训练过程中的详细参数、日志等方面进行开源,为研究者们在基于人类反馈的模型优化方法研究工作方面提供研究参考。具体的,开源内容包括以下内容:
MMonitor
MMonitor
是一个即插即用、易于扩展的插件。它可以在训练过程中批量跟踪特定子模块中的特定统计指标,并将其可视化。细粒度、高自由度是它的显著特点。
例如,如果想跟踪 Conv2d 层的权重二范数 (WeightNorm) ,在必要的导入工作以外,只需添加如下步骤
在训练开始前设置MMonitor跟踪目标模型并可视化
monitor = Monitor(model, config={'Conv2d': ['WeightNorm']})
vis = Visualization(monitor, wandb)
在训练迭代中更新MMonitor状态
# original code
loss.backward()
optimizer.step()
optimizer.zero_grad()
lr_scheduler.step()
# additional code
monitor.track(step) # 将monitor的更新放在 loss.backward() 之后
vis.show(step) # 将跟踪数据可视化
step += 1
在训练完成后关闭可视化窗口并保存数据
vis.close()
monitor.get_output()
更详细的使用说明请参考MMonitor使用手册
目前MMonitor
仅支持pytorch模型的训练监控,基于Mindspore等其他框架的模型需要先转换为pytorch模型。
MMonitor
将很快支持Mindspore等国产训练框架
如果你对本项目的使用和代码有任何问题,可以提交issue。同时你也可以通过邮箱 xuchx@pcl.ac.cn 直接联系我们
鹏城实验室,北京航空航天大学。
大模型训练过程版本演化分析及工具开源问题:Open Issues in Analysis and Tools for the Evolution of LLM Version in Training Process
Python
Dear OpenI User
Thank you for your continuous support to the Openl Qizhi Community AI Collaboration Platform. In order to protect your usage rights and ensure network security, we updated the Openl Qizhi Community AI Collaboration Platform Usage Agreement in January 2024. The updated agreement specifies that users are prohibited from using intranet penetration tools. After you click "Agree and continue", you can continue to use our services. Thank you for your cooperation and understanding.
For more agreement content, please refer to the《Openl Qizhi Community AI Collaboration Platform Usage Agreement》