This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] EDGE-AI-STUDIO:模型训练过程中出错

Guru**** 2480055 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1451280/edge-ai-studio-error-during-model-training

器件型号:EDGE-AI-STUDIO

工具与软件:

尊敬的先生/女士:

在训练在 EdgeAi Studio 中具有7400个物体检测图像的模型(Yolox_s_lite)时、我们遇到了一个问题。  以下错误消息出现在训练日志文件中

CUDA 可用:false

MMCV CUDA 编译器:不可用  

 在 Edge AI Studio 中、最多可用于训练的图像数量是多少?

我们如何解决上述问题?

期待您的指导。

此致、

Ani Sowntharya a.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    我已将该主题提请 Edge AI Studio 团队的注意、因为他们可以最好地提供帮助。

    谢谢

    Ki

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我想我们需要更多详细信息来帮助解决您的问题。   您正在使用什么工具?  您是否正在使用模型编写器?是否正在使用 GitHub 中的命令行工具?   

    Martin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    我们将使用模型编写器。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    ANI:

    我不认为"CUDA"相关的输出是错误消息、但请务必 提供您遇到问题的会话的完整日志。  训练框架不使用 AWS 上的 GPU 加速。    

    使用数据集训练给定模型所需的资源将因 图像数量及其数据集中的平均大小而异。   我目前使用具有28K 图像的数据集训练分类模型(regnet_x_400mf)。

     

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Martin:

    请分享您的公司电子邮件 ID、以便我可以将日志发送给您参考、因为这与工业项目相关。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    请使用日志向我发送私人消息。   

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Ani:

    感谢您的耐心。 我不知道该怎么说。"

    您出错的根本原因是您的数据集中没有名为00151_a_jpg.rf.e0c41aafc8e0e08cdff024b1b9e125fe.jpg 的文件。 但您的数据集批注属性文件会引用它。 请查看 instances.json 文件中引用的文件、并确保数据集中存在所有引用的文件。

    此致、

    Martin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢 Ki 和 Martin

    ANI