This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:edgeai-modelmaker 10.1r CPU 中的编译失败

Guru**** 2416270 points
Other Parts Discussed in Thread: TMDSCNCD28379D

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1525683/tda4vm-compilation-failure-in-edgeai-modelmaker-10-1r-cpu

器件型号:TDA4VM

工具/软件:

我在训练和编译方面遇到问题:

  • 使用的型号:yolox-s-lite(已附加培训日志)

  • Run (1).log

  • 在培训过程中实现了>90%的准确度

  • 但是、编译模型时、精度会降至 0%(附加了编译日志)

  • 2821.run.log

  • artifacts 文件夹确实包含 CPU 训练后预期的.bin 文件

您能帮助我确定导致此问题的原因吗? 谢谢!

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Wang:

    我会尝试重新创建,并尽快回到你。  

    此致、

    Christina

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Wang:


    请为 yolox-s-lite 发送您的确切 onnx 型号。
    同时、config_detection.yaml 中的任何其他模型是否适用于您(例如:yolox_nano、yolox_tiny)?

    此致、

    Rohit

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    嗨、Rohit、
    感谢您的联系。 YOLOX-S-Lite 的 ONNX 模型包含在我使用 edgeai-modelmaker.e2e.ti.com/.../yolox_5F00_s_5F00_lite.zip 生成的整套文件中, 您应该能够在目录中找到它。 至于中列出的其他型号config_detection.yaml,我确实尝试了使用 YOLOX-Nano 进行训练,但不幸的是,精度也是零。
    如果您需要进一步的详细信息、或者我可以为您提供有关车型的任何具体帮助、请告诉我。
    此致、
    Wang
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢王。

    我们一直在尝试重新创建、并将在获得更多信息时更新您。

    此致、

    Christina

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Wang:

     

    我一直在努力重新创建您的问题。 您能否向我们提供有关您如何设置环境的更多信息? 您如何解决安装依赖项以编译模型的问题? 详细分步说明您所做的工作将帮助我重新创建您的问题。
     

    我想在此澄清您是在运行 GPU 还是 CPU 设置、因为您的日志证明正在使用 GPU。

     

    此致、

    Rohit

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Rohit、

    感谢您的跟进。 以下是我用于设置环境的详细步骤:

    e2e.ti.com/.../6170.txt

    我使用创建了一个虚拟环境  pyenv  在 Python 3.10 中激活它、然后通过运行 ./setup_gpu.sh 中的脚本来安装依赖项  edgeai-modelmaker  TMDSCNCD28379D 文件夹。 尽管此脚本以 GPU 设置为目标、但我明确配置了在其上运行的训练  模块  通过 num_gpus: 0 在 YAML 文件中进行设置。 在安装过程中、我遇到了一个循环版本冲突 onnxscript 、它似乎无法解决、因此我继续忽略它、假设它不会严重影响工作流。

    此致、
    Wang  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Wang:

    感谢您提供详细信息。 我将尝试重新创建环境并对设置进行故障排除。 我会尽快回复您的调查结果。

    此致、
    Rohit

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    嗨、Rohit、
    希望您做得好。 我想跟进您提到的环境娱乐和故障排除。  如果您能提供任何更新、我将不胜感激。
    最好的、Wang
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、王

    我尝试重现您的错误、相信 modelmaker 堆栈有多个潜在问题。 我们希望与开发团队一起解决这些问题、但由于存在这些问题的带宽、您的 modelmaker 问题很可能需要一些时间才能得到解决。

    作为替代方法,我已经为您的自定义数据创建了一个培训脚本使用 YOLO 9 和更低的体系结构。 无论您使用 conda 还是仅使用 pyenv 环境、都可以将以下 python 笔记本与任何 python 环境配合使用。

    经过训练和导出的 onnx 模型后、您可以使用 edgeai-tidltools 来处理所有器件的编译。

    edgeai-tidltools 存储库: github.com/.../

    如果您需要有关此新工作流程的任何帮助、请告诉我。
     

    我们最新版本发布时、edgeai-tidltools 目前不支持 YOLOX。 因此,我们建议您使用 Yolo 9 及更低版本。

    注意:对数据进行更多的周期培训可能会提高平均精度。 我还建议您按照如下所示的确切 COCO 数据集设置:

    示例文件结构:

    ##根目录

    *注释:此目录包含数据集的注释文件。

       + instances_train2017.json:训练集的实例注释 (2017)。

       + instances_val2017.json:验证集的实例注释 (2017)。

    *图像:此目录包含数据集的图像文件。

       + train2017:训练图像(2017 年)。

       + val2017:验证图像(2017 年)。

       + test2017:测试图像(2017 年)。

    对于其他 E2E、可以尝试将其用作替代解决方案。  

    e2e.ti.com/.../tda4vm-edgeai-modelmaker-compile-issue-invalid-layer-name-error-on-tiscapes2017_driving-model-0-accuracy

    e2e.ti.com/.../7178.trainYOLO.ipynb

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好 Rohit、
    感谢您的及时回复、并为我创建了一个替代培训脚本。 感谢您努力解决 modelmaker 堆栈问题、我明白由于开发团队的带宽问题、开发团队可能需要一些时间来解决这些问题。
    我一定会尝试您提供的新训练脚本、然后按照您的建议使用 edgeai-tidltools 进行编译。  
    如果对 modelmaker 进行了任何更改或改进、请随时更新我。 准备好后、我很想尝试一下。
    再次感谢您的帮助和支持。
    此致、Wang
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    听起来不错、我们会让您在 modelmaker 上不断更新。

    此致、

    Rohit