This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TMS320F28P550SJ:TMS320F28P550SC:NPU 性能问题:针对 NPU 编译的同一模型与针对 CPU 编译的模型相比性能最差

Guru**** 2386620 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/microcontrollers/c2000-microcontrollers-group/c2000/f/c2000-microcontrollers-forum/1463713/tms320f28p550sj-tms320f28p550sc-npu-performance-issue-same-model-compiled-for-npu-shows-worst-performance-compare-to-the-model-compiled-for-cpu

器件型号:TMS320F28P550SJ

工具与软件:

团队、
客户正在使用自定义模型评估 NPU。
对于基本基准测试、他们创建了两个模型(两个未经训练的模型、具有通用架构和随机参数、并将其编译为仅 CPU 和 NPU)。

然后,他们在推理期间检查执行时间(被称为 对于 CPU 和 困难 (用于 NPU)。
版本执行速度比 困难 修补程序版本。

您能帮助说明原因吗?

我将提供软/硬示例脱机。

提前感谢、

Anthony