This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] J784S4XEVM:定制 DNN 模型的性能测量

Guru**** 2555630 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1571305/j784s4xevm-performance-measurement-of-custom-dnn-model

器件型号:J784S4XEVM


工具/软件:

我想在电路板上部署一个定制的物体检测模型。 我使用 OSRT Python 为模型生成工件 (github.com/.../osrt_python)。 我的目标是测试板载性能、例如测量推理延迟、使用的 DSP 数量、总体利用率和相关指标。

我找到了 perf_stats 工具 (github.com/.../perf_stats)、它打印的利用率数据类似于 Nvidia-SMI。 但是、输出不是平滑的、并且由于每个推理只需要几毫秒、我无法清楚地解释性能结果。 我还尝试通过缩短睡眠间隔来提高刷新率、但仍然无法完全捕捉到性能。

我的问题是:

-为了获得更流畅的统计数据,我是否需要更改任何配置?

-有没有另一种方法来获取自定义模型的性能和利用率信息?

谢谢你