This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] PROCESSOR-SDK-AM62A:由 edgeai-Benchmark 编译的 AM62A 模型在 AM62A 板上输出所有零

Guru**** 2434430 points
Other Parts Discussed in Thread: AM68A

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1541539/processor-sdk-am62a-the-am62a-model-compiled-by-edgeai-benchmark-outputs-all-zeros-on-am62a-board

器件型号:PROCESSOR-SDK-AM62A
主题:AM68A 中讨论的其他器件

工具/软件:

使用 edgeai-benchmark 编译 AM62A 和 AM68A 的语义分割模型、然后在带有 edgeai-gst-apps 的开发板上运行这些模型时、AM68A 模型在 j721s2 板上正常工作、但 AM62A 模型在 AM62A 板上输出全零。 如何解决此问题?

edgeai-Benchmark 版本为:09_02_00_06
EVM SDK 版本为:09_02_00_05

编译的命令是:
./run_custom_pc_seg.sh

配置文件位于 e2e.ti.com/.../seg_5F00_sample.tar.gz

e2e.ti.com/.../seg_5F00_sample.tar.gz

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Yue、

    我们很高兴为您提供帮助。  

    请尝试以下操作:

    • 在 EVM 上使用./run_custom_pc_seg.sh、以便我们在推理中使用相同的代码。 目标是确保使用相同代码以良好的精度编译模型本身。  
    • 另一个实验是在 EVM 的 ARM 内核上运行模型、看看将获得什么样的输出。 这是为了测试您获得的错误结果是 来自模型本身还是由编译引起的。 要使用 edgeai-gst-apps 在 ARM 内核上运行模型、请在 configs/gst_plugins_map.yaml 中将目标值设置为 ARM 而不是 DSP: https://github.com/TexasInstruments/edgeai-gst-apps/blob/main/configs/gst_plugins_map.yaml#L211 

    请提供以上实验结果的更多详细信息。  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您发送编修。 ‌我听从了您的建议、进行了两次单独的实验。

    ‌第一次实验: ‌
    在 EVM 上运行用于推理的./run_custom_pc_seg.sh 脚本、但未生成正确的结果。 输出图像如下所示:

    ‌第二次实验: ‌
    将 configs/gst_plugins_map.yaml 中的目标值修改为 ARM、这次将生成正确的结果。 输出图像如下所示:

    ‌现在、您能告诉我问题是什么吗? ‌当目标设置为 DSP 时、我应该修改什么以获得正确的结果?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Yue Lee:

    感谢您提供该实验的结果。 我运行了您与我分享的模型、我能够重现您看到的问题。

    调试模型表明、最后一层存在问题。 模型中的所有层都具有非零输出、但最后一层具有零输出。

    解决此问题的一种快速方法是使用 16 位而不是 8 位对最后几层进行编译。 为了进行快速测试、我建议使用 16 位重新编译整个模型、以确保模型可以正常工作。 之后、尝试查看是否仅编译具有 16 位的最后几层才可行。  

    以下是一些资源为您提供的资源:

    请分享您可能遇到的任何结果或问题。  

    此致、

    Qutaiba