#1097 训练的时候,IP 为192.3.143.169的设备上训练都失败

Closed
created 9 months ago by lld2002 · 4 comments
lld2002 commented 9 months ago
<!-- 为了更有效地识别与解决您的问题,请尽可能的补充如下信息 --> ### 问题描述 训练的时候,IP 为192.3.143.169的设备上训练都失败 ### 相关环境(GPU/NPU) NPU ### 相关集群(启智/智算) 智算 ### 任务类型(调试/训练/推理) 训练 ### 任务名 lld20202307202160275 lld20202307202160051 ### 日志说明或问题截图 ![image]() ![image]() ![image](/attachments/a6327807-6d67-477a-ab09-cc5799b63348) ### 期望的解决方案或建议
831 KiB
879 KiB
912 KiB
liuzx commented 9 months ago
Collaborator
这个机器可能有网络问题
liuzx added the
待确认
label 9 months ago
lld2002 commented 9 months ago
Poster
> 这个机器可能有网络问题 为什么不把信息反馈给你们的运维?
lld2002 commented 9 months ago
Poster
好像都是广州中心的,成都中心的结节就 OK
liuzx commented 9 months ago
Collaborator
已确认是网络问题,智算npu部分智算中心不提供网络服务。
liuzx removed the
待确认
label 9 months ago
lld2002 closed this issue 9 months ago
Sign in to join this conversation.
No Milestone
No Assignees
2 Participants
Notifications
Due Date

No due date set.

Dependencies

This issue currently doesn't have any dependencies.

Loading…
There is no content yet.