This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] C6678 4096 FFT 的耗时

Guru**** 2609285 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/654535/time-consuming-of-c6678-4096-fft

尊敬的 TI 教授:

  我在 C6678单核中实现了4096点 FFT。 我查看 TI 公司提供的 DSP 性能消耗 1K 点 单浮点 FFT 使用时间6269个周期、但我测试1K 点大约77804个周期、4096点大约384008个周期。 我 使用 DSPF_sp_fftSPxSP()函数来实现 FFT。

  我已设置优化级别-o3。 我可以做什么来缩短  FFT 的计算周期?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    我已通知 RTOS 团队。他们将直接在此处发布反馈。

    此致、
    Yordan
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    检查链接器命令文件。 是 L2 DSP 存储器或 MSMC/DDR 存储器中的输入数据。 如果数据位于内存中、则需要打开高速缓存。 发布的基准将代码和数据放置在 L2存储器(DSP 内部存储器)中。

    有关如何捕获这些基准的详细信息、请查看文档 TI DSP 基准测试。
    www.ti.com/.../sprac13.pdf

    此致、
    Rahul