This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM275-FREERTOS-SDK:DSPLIB 级联双二阶滤波器性能

Guru**** 2644735 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1589268/am275-freertos-sdk-dsplib-cascadebiquad-performance

e2e.ti.com/.../test_2E00_.cI下载了 freertos_sdk_am275x_11_01_00_16、并根据 DSPLIB_cascadeBiquad_DDC 修改了一些参数 目前,15 波段 iir 的声音效果是正常的,但循环计数没有减少。 它几乎与我在 C 代码中的实现相同。 请参阅 test.c 获取代码。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zhong:
    您是否还可以共享您设置的链接器脚本和编译器标志? 同时、我也在尝试对您的代码进行基准测试。

    谢谢、
    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    e2e.ti.com/.../5327.linker.cmd.txte2e.ti.com/.../C7000-Compiler-flags.txt

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zhong:
    看起来您正在针对单通道对其进行测试。 级联双二阶滤波器实现方案对前一个输出具有线性依赖性、在这种情况下无法使用 SE/SA、因此对于单通道、与自然 C 代码相比、您不会看到任何显著优势。 我希望内核在增加通道数时表现更好。 本质上、由于跨通道矢量化、单通道和 8 通道输入将需要相同的时间量。

    谢谢、

    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    复制,谢谢。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Shreyansh:

    按照我们在内部电子邮件中讨论的内容。 我们知道进行多通道并行计算可以得到进一步的优化(即对齐)。 但是、从我们支持其他客户的经验来看、基于单通道架构、我们仍然可以通过应用优化的“CI"模“模块来替换 Natural C 进行一些优化。因此、我们需要弄清楚在这种情况下、为什么客户在使用“CI"模“模块后没有看到改进、应该缺少一些地方进行修改、我认为我们需要花一些时间仔细检查。

    谢谢、

    Kevin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Kevin:
    不过、正如我前面所说、在单通道级联双二阶滤波器的情况下、优化的空间非常小。

    钟、
    您能分享自然 c 和优化代码的周期数吗?

    谢谢、

    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

     使用 DSPLIB:的周期值

    使用 C 代码的周期值:   

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zhong:
    c 代码是否与 DSPLIB 实施类似?
    我获得了以下数字:
    所需时间选择:  22767
    NATC: 48733

    对我来说、您的优化数字看起来不错。 是否可以共享 c 代码?

    谢谢、
    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    抱歉、我没有共享代码的权限。

    也就是说、到目前为止、当前的性能最多已经过优化。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我使用了优化级别  4.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    抱歉、我没有共享代码的权限。

    我明白。

    我在上面的数字中犯了一个错误。 我在调试中运行性能分析。 以下是 release mode (O3) 的结果:
    时间(可选):9369
    时间 (NATC):42220

    所以,你的数字是这两倍。 您只是分析 exec 函数或所有内容吗?

    谢谢、
    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    现在的数据是调试版本的结果。

    我重新测试了发布版本 (O4)、 周期值:

    选择:6330

    NATC:20173

    谢谢

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Zhong:

    “你听我说。“ 我将继续、关闭该主题。 如果您有任何其他问题、敬请告知。

    谢谢、

    Shreyansh

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    好的、谢谢。

    祝你一切顺利