[参考译文] TDA4VM：edgeai-modelmaker 10.1r CPU 中的编译失败

admin

Other Parts Discussed in Thread: TMDSCNCD28379D

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1525683/tda4vm-compilation-failure-in-edgeai-modelmaker-10-1r-cpu

器件型号：TDA4VM

工具/软件：

我在训练和编译方面遇到问题：

使用的型号：yolox-s-lite（已附加培训日志）
Run (1).log
在培训过程中实现了>90%的准确度
但是、编译模型时、精度会降至 0%（附加了编译日志）
2821.run.log
artifacts 文件夹确实包含 CPU 训练后预期的.bin 文件

您能帮助我确定导致此问题的原因吗？谢谢！

5 个月前

0 admin 5 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

尊敬的 Wang：

我会尝试重新创建,并尽快回到你。

此致、

Christina

0 admin 5 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

尊敬的 Wang：

请为 yolox-s-lite 发送您的确切 onnx 型号。
同时、config_detection.yaml 中的任何其他模型是否适用于您（例如：yolox_nano、yolox_tiny）？

此致、

Rohit

0 admin 5 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

嗨、Rohit、

感谢您的联系。 YOLOX-S-Lite 的 ONNX 模型包含在我使用 edgeai-modelmaker.e2e.ti.com/.../yolox_5F00_s_5F00_lite.zip 生成的整套文件中, 您应该能够在目录中找到它。至于中列出的其他型号config_detection.yaml,我确实尝试了使用 YOLOX-Nano 进行训练,但不幸的是,精度也是零。

如果您需要进一步的详细信息、或者我可以为您提供有关车型的任何具体帮助、请告诉我。

此致、

Wang

0 admin 5 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

谢谢王。

我们一直在尝试重新创建、并将在获得更多信息时更新您。

此致、

Christina

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

尊敬的 Wang：

我一直在努力重新创建您的问题。您能否向我们提供有关您如何设置环境的更多信息？您如何解决安装依赖项以编译模型的问题？详细分步说明您所做的工作将帮助我重新创建您的问题。

我想在此澄清您是在运行 GPU 还是 CPU 设置、因为您的日志证明正在使用 GPU。

此致、

Rohit

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

嗨、Rohit、

感谢您的跟进。以下是我用于设置环境的详细步骤：

e2e.ti.com/.../6170.txt

我使用创建了一个虚拟环境 pyenv 在 Python 3.10 中激活它、然后通过运行 ./setup_gpu.sh 中的脚本来安装依赖项 edgeai-modelmaker TMDSCNCD28379D 文件夹。尽管此脚本以 GPU 设置为目标、但我明确配置了在其上运行的训练模块通过 num_gpus: 0 在 YAML 文件中进行设置。在安装过程中、我遇到了一个循环版本冲突 onnxscript 、它似乎无法解决、因此我继续忽略它、假设它不会严重影响工作流。

此致、
Wang

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

尊敬的 Wang：

感谢您提供详细信息。我将尝试重新创建环境并对设置进行故障排除。我会尽快回复您的调查结果。

此致、
Rohit

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

嗨、Rohit、

希望您做得好。我想跟进您提到的环境娱乐和故障排除。如果您能提供任何更新、我将不胜感激。

最好的、Wang

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

您好、王

我尝试重现您的错误、相信 modelmaker 堆栈有多个潜在问题。我们希望与开发团队一起解决这些问题、但由于存在这些问题的带宽、您的 modelmaker 问题很可能需要一些时间才能得到解决。

作为替代方法,我已经为您的自定义数据创建了一个培训脚本使用 YOLO 9 和更低的体系结构。无论您使用 conda 还是仅使用 pyenv 环境、都可以将以下 python 笔记本与任何 python 环境配合使用。

经过训练和导出的 onnx 模型后、您可以使用 edgeai-tidltools 来处理所有器件的编译。

edgeai-tidltools 存储库： github.com/.../

如果您需要有关此新工作流程的任何帮助、请告诉我。

我们最新版本发布时、edgeai-tidltools 目前不支持 YOLOX。因此,我们建议您使用 Yolo 9 及更低版本。

注意：对数据进行更多的周期培训可能会提高平均精度。我还建议您按照如下所示的确切 COCO 数据集设置：

示例文件结构：

##根目录

*注释:此目录包含数据集的注释文件。

+ instances_train2017.json：训练集的实例注释 (2017)。

+ instances_val2017.json：验证集的实例注释 (2017)。

*图像:此目录包含数据集的图像文件。

+ train2017:训练图像（2017 年）。

+ val2017:验证图像（2017 年）。

+ test2017:测试图像（2017 年）。

对于其他 E2E、可以尝试将其用作替代解决方案。

e2e.ti.com/.../tda4vm-edgeai-modelmaker-compile-issue-invalid-layer-name-error-on-tiscapes2017_driving-model-0-accuracy

e2e.ti.com/.../7178.trainYOLO.ipynb

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

您好 Rohit、

感谢您的及时回复、并为我创建了一个替代培训脚本。感谢您努力解决 modelmaker 堆栈问题、我明白由于开发团队的带宽问题、开发团队可能需要一些时间来解决这些问题。

我一定会尝试您提供的新训练脚本、然后按照您的建议使用 edgeai-tidltools 进行编译。

如果对 modelmaker 进行了任何更改或改进、请随时更新我。准备好后、我很想尝试一下。

再次感谢您的帮助和支持。

此致、Wang

0 admin 4 个月前

TI__Guru**** 2473270 points

请注意，本文内容源自机器翻译，可能存在语法或其它翻译错误，仅供参考。如需获取准确内容，请参阅链接中的英语原文或自行翻译。

听起来不错、我们会让您在 modelmaker 上不断更新。

此致、

Rohit

处理器（参考译文帖）

处理器（参考译文帖）(Read Only)

[参考译文] TDA4VM：edgeai-modelmaker 10.1r CPU 中的编译失败