This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:为什么 TDA4VM 加速器不支持名为 MTCNN 的某些 AI 模型层。 这会造成延迟问题吗?

Guru**** 2419530 points
Other Parts Discussed in Thread: TDA4VM

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1536556/tda4vm-why-some-of-the-layers-of-ai-model-named-mtcnn-is-not-supported-in-tda4vm-accelerator-is-this-creates-latency-issue

器件型号:TDA4VM

工具/软件:

我正在处理一个在 TDA4VM 器件上使用 MTCNN 的项目。 此模型包含大量层、如卷积、池化等 大多数层都受 TDA4VM 加速器支持。 但 TDA4VM 加速器不支持整形、NMS 等一些层。 如果在 A72 内核上实现这些不受支持的层、那么由于一个输入帧需要在 A72 内核和加速器内核之间多次流动到 MTCNN、这是否会导致延迟增加、从而导致性能问题?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Vishnu:

    您是对的。  与 C7X 相比、TIDL 中未实施的层在 A 内核上运行所需的时间要长得多。  延迟不仅是存储器数据流造成的、而且 ARM 内核比 C7x 慢约 30 倍。   TIDL 开发团队会在每个新版本中添加更多层、但仍缺少一些层。  支持的图层的完整列表 可 从  https://github.com/TexasInstruments/edgeai-tidl-tools/blob/master/docs/supported_ops_rts_versions.md 获得  

    同样、TIDL 团队在每个版本中添加了更多层、以匹配可用的 ONNX 层。  

    此致、

    Chris