#314 建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。

Closed
created 1 year ago by crayon · 6 comments
crayon commented 1 year ago
<!-- 为了更有效地识别与解决您的问题,请尽可能的补充如下信息 --> ### 问题描述 大家选择显卡时一般都会选择性能最高的GPU,有一些GPU没有充分利用,显示每种显卡排队数可以充分利用平台资源。 ### 相关环境(GPU/NPU) GPU ### 相关集群(启智/智算) ### 任务类型(调试/训练/推理) 训练 ### 任务名 ### 日志说明或问题截图 ### 期望的解决方案或建议
crayon changed title from 建议显示每种显卡的排队数,让开发者可以自由选择空余的显卡。 to 建议显示每种GPU的排队数,让开发者可以自由选择空余的显卡。 1 year ago
crayon changed title from 建议显示每种GPU的排队数,让开发者可以自由选择空余的显卡。 to 建议显示每种GPU的排队数,让开发者可以自由选择空余的GPU。 1 year ago
由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量
由于目前的机制是,建立创建任务后GPU和环境绑定任务的。 而如果需要根据空余情况和调试、训练的需要,切换不同种类GPU。 (比如有时是先编辑测试代码,不需要GPU时就可以切换到CPU,需要尝试训练时就能切换到响应的GPU。) 则需要先把之前任务中的资料下载出来,重新创建。 所以最好是gpu、任务、环境可以解耦合,在界面中切换。 比如在重新调试按键附近切换,或者jupter终端中切换 并且在切换按钮旁边,可以显示当前排队量
+1,同时希望能显示预计排队用时
crayon commented 1 year ago
Poster
> +1,同时希望能显示预计排队用时 排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。
> > +1,同时希望能显示预计排队用时 > > 排队用时可能比较难,因为跑代码不能预知结束时间,就是如果能把每一种空闲GPU都显示出来就可以了,不用都挤着最高级别的GPU。 嗯嗯,在创建调试任务界面显示空闲GPU/CPU数目确实挺好的,有些CPU能跑的东西用GPU跑太浪费资源了
lewis was assigned by zeizei 1 year ago
liuzx commented 6 months ago
Collaborator
此issue将关闭,若有问题请重提issue。
liuzx closed this issue 6 months ago
Sign in to join this conversation.
Loading…
There is no content yet.