This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM69A:具有矩形内核的卷积层支持

Guru**** 2465890 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1472695/am69a-convolution-layer-support-with-rectangular-kernels

器件型号:AM69A

工具与软件:

您好!

我注意到 edgeai_tidl_tools 提供的文档(edgeai-tidl-tools/docs/supported_ops_rts_versions.md位于 master TexasInstruments/edgeai-tidl-tools··GitHub)之间存在差异

我在文件 mmalib_cnn_convolve_row_ixx_ixx_oxx 中找到的一个:  

在  mmalib_cnnn_convolve_row_ixx_ixx_oxx 中,我注意到矩形内核不受支持,而在 edgeai_tidl_tools 中,没有写任何内容:  

那么、我的问题是、在配置内核的使用时、不支持矩形内核(例如5*7)的原因是什么?

谢谢。此致、

Azer

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Azer:

    mmalib_cnn_convolve_row_ixx_ixx_oxx 是在 MMA (TI 的矩阵加速器)上实现 CNN 样式2D 卷积的函数。  它本身仅支持文档中描述的卷积形状。   

    你纠正了在 edgeai-tidl-tools 上可以提到的相同限制、但如果你真的需要矩形滤波器尺寸、有几个选项可以选择。  如果使用开源运行时(即 ONNX)、则 可以将计算保留在 ARM 上(较慢)。  为了提高计算效率、请将转换为支持的大小。  例如、可以将5x7滤波器操作为7x7滤波器、额外系数设置为零(无需再培训!) 并在 MMA 上运行。  

    此致!

    会的

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    感谢您的有趣回答。

    我尝试了以下操作: 例如,您的5x7滤波器可以被操纵为7x7滤波器,其中额外系数设置为零(无需再培训!) 并在 MMA 上运行。  

    但是、模型的精度明显较低(0.32)。  您能告诉我、您是如何将其操作为7x7滤波器的?

    您是否有任何改进的提示或建议?

    谢谢。此致、

    Azer

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Azer:

    在 TI 工具进行任何处理之前、我会先取您的原始模型、然后直接编辑模型、将5x7权重更改为7x7权重、在额外的位置加零。  然后、我将在您的现有框架内运行修改后的模型、并比较准确度、以验证准确度是否相同(其中未使用 TI 工具/处理)。  运行完成后、我会将模型通过 TI 工具传递给大家。

    请告诉我如何发展。

    此致!

    会的