请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
器件型号:J784S4XEVM工具/软件:
我想在电路板上部署一个定制的物体检测模型。 我使用 OSRT Python 为模型生成工件 (github.com/.../osrt_python)。 我的目标是测试板载性能、例如测量推理延迟、使用的 DSP 数量、总体利用率和相关指标。
我找到了 perf_stats 工具 (github.com/.../perf_stats)、它打印的利用率数据类似于 Nvidia-SMI。 但是、输出不是平滑的、并且由于每个推理只需要几毫秒、我无法清楚地解释性能结果。 我还尝试通过缩短睡眠间隔来提高刷新率、但仍然无法完全捕捉到性能。
我的问题是:
-为了获得更流畅的统计数据,我是否需要更改任何配置?
-有没有另一种方法来获取自定义模型的性能和利用率信息?
谢谢你