工具/软件:
我在训练和编译方面遇到问题:
-
使用的型号:yolox-s-lite(已附加培训日志)
-
在培训过程中实现了>90%的准确度
-
但是、编译模型时、精度会降至 0%(附加了编译日志)
-
artifacts 文件夹确实包含 CPU 训练后预期的.bin 文件
您能帮助我确定导致此问题的原因吗? 谢谢!
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
工具/软件:
我在训练和编译方面遇到问题:
使用的型号:yolox-s-lite(已附加培训日志)
在培训过程中实现了>90%的准确度
但是、编译模型时、精度会降至 0%(附加了编译日志)
artifacts 文件夹确实包含 CPU 训练后预期的.bin 文件
您能帮助我确定导致此问题的原因吗? 谢谢!
config_detection.yaml,我确实尝试了使用 YOLOX-Nano 进行训练,但不幸的是,精度也是零。 嗨、Rohit、
感谢您的跟进。 以下是我用于设置环境的详细步骤:
我使用创建了一个虚拟环境 pyenv 在 Python 3.10 中激活它、然后通过运行 ./setup_gpu.sh 中的脚本来安装依赖项 edgeai-modelmaker TMDSCNCD28379D 文件夹。 尽管此脚本以 GPU 设置为目标、但我明确配置了在其上运行的训练 模块 通过 num_gpus: 0 在 YAML 文件中进行设置。 在安装过程中、我遇到了一个循环版本冲突 onnxscript 、它似乎无法解决、因此我继续忽略它、假设它不会严重影响工作流。
此致、
Wang
您好、王
我尝试重现您的错误、相信 modelmaker 堆栈有多个潜在问题。 我们希望与开发团队一起解决这些问题、但由于存在这些问题的带宽、您的 modelmaker 问题很可能需要一些时间才能得到解决。
作为替代方法,我已经为您的自定义数据创建了一个培训脚本使用 YOLO 9 和更低的体系结构。 无论您使用 conda 还是仅使用 pyenv 环境、都可以将以下 python 笔记本与任何 python 环境配合使用。
经过训练和导出的 onnx 模型后、您可以使用 edgeai-tidltools 来处理所有器件的编译。
edgeai-tidltools 存储库: github.com/.../
如果您需要有关此新工作流程的任何帮助、请告诉我。
我们最新版本发布时、edgeai-tidltools 目前不支持 YOLOX。 因此,我们建议您使用 Yolo 9 及更低版本。
注意:对数据进行更多的周期培训可能会提高平均精度。 我还建议您按照如下所示的确切 COCO 数据集设置:
示例文件结构:
##根目录
*注释:此目录包含数据集的注释文件。
+ instances_train2017.json:训练集的实例注释 (2017)。
+ instances_val2017.json:验证集的实例注释 (2017)。
*图像:此目录包含数据集的图像文件。
+ train2017:训练图像(2017 年)。
+ val2017:验证图像(2017 年)。
+ test2017:测试图像(2017 年)。
对于其他 E2E、可以尝试将其用作替代解决方案。