This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] F29H85X-FFT-EVM:SOM 评估

Guru**** 2465220 points
Other Parts Discussed in Thread: F29-SDK

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/microcontrollers/c2000-microcontrollers-group/c2000/f/c2000-microcontrollers-forum/1495054/f29h85x-som-evm-fft-evaluation

器件型号:F29H85X-EVM SOM
主题中讨论的其他器件:F29-SDK

工具与软件:

尊敬的 TI 代表:

我们使用 CFFT 示例评估 C29内核的1024pt FFT 性能、并发现优化汇编和优化 C 之间的性能差异相当大、在周期中几乎达到5倍、这对于我们的应用非常关键。

对于 VLIW 架构、手动优化汇编中的 DSP 例程可以说是完全没问题的、因此除了 SDK 中的原始代码示例外、是否有提供有关此主题的指导原则或文档的计划?

此致 Ihor。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Ihor:

    我想更好地理解您的问题-它是专门与 CFFT 相关、还是更一般性地涉及此架构的 C 与汇编性能?

    谢谢!

    SIRA

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Sira、

    我认为这会更一般、因为从我们之前使用 TI VLIW DSP 进行手动汇编优化的经验来看、非常有意义。

    关于具体的 CFFT 问题、我认为5倍的差异太大以至于不能处理生成的代码、可能是编译器成熟度问题、我希望改进、但 现在我关于 C29手动优化指南的原始问题仍然存在


    感谢您的观看

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Ihor:

    1、一般而言、我们的编译器已经实现了相当好的"授权"、即在许多情况下、C 代码性能与可从该架构中获得的最佳性能(通过优化汇编)相匹配。 当然、这仍然是编译器的早期阶段、并且随着时间的推移、各种类型的代码也会有所改善。

    2.由于这是 VLIW 架构、我们绝对不希望客户手动优化装配体。 这非常繁琐且容易出错。 我们希望用户编写 C 应用程序代码、并使用我们的库(我们将在其中根据需要提供优化的汇编例程、例如 FFT、FIR)。

    3.有些算法不适合在 C 语言中获得性能。FFT 就是一个典型的例子。 通过优化的汇编语言、我们可以完全填充128位指令包、并创建极其高效的内核。 但是、编译器无法执行此操作。

    4. 我们有一个优化指南(https://www.ti.com/lit/sprujg0)、但其中讨论的是应用程序级别优化、而不是如何在此架构上编写优化汇编。

    谢谢!

    SIRA

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢、我想这就是我想要的解释、我们是否可以预期 DSP 和 SDK 扩展、例如滑动窗口等更多 FFT 类型?


    此外、我还没有在您链接的文件和编译器手册中找到完整的内在函数列表、是否有提供该列表的计划?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Ihor、

    是的、我们计划扩展 SDK 中提供的示例、但这会随着一段时间的推移而发生。 如果有具体的请求、请告诉我、我可以确定优先级。

    这些内在函数尚未公开发布、但目前正在进行中。 如果您对具体答案感兴趣、我建议为其创建一个单独的 e2e (就像您做的这个)、它将被路由到合适的专家来解决。

    谢谢!

    SIRA

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Sira、再次感谢您的回答。

    目前、我们的重点是我们应用中更复杂的控制算法、如 MPC、因此可能是优化的矩阵操作示例。

    此外、我们已经看到 IIR 滤波器示例没有单独的汇编实现、编译器在此任务上的性能已经得出足够的结论?

    此致、Ihor

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Ihor:

    1.01 F29-SDK 预计将很快(本月晚些时候)推出。 它将包含一个矩阵库、其中包含一些优化的汇编实现。

    是的、编译器在 IIR 上表现良好。

    谢谢!

    SIRA

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    这是个好消息!

    非常感谢。

    此致、Ihor