This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TMS320C6678:计算非常大的 FFT 的性能

Guru**** 2604225 points
Other Parts Discussed in Thread: TMS320C6678, FFTLIB

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/633131/tms320c6678-performance-of-computing-very-large-fft

器件型号:TMS320C6678
主题中讨论的其他器件: FFTLIB

您好!
我使用 e2e.ti.com/.../303599上的 VLFFT 演示 来计算1024K FFT。 它在评估板 TMDSEVM6678LE 上运行。

我使用 SDK CCS 6.2.0。
下面列出了我正在使用折页产品来编译 VLFFT 项目:
XDCTools 3.23.4.60
EDMA3 LLD 2.11.5
IPC 1.24.2.27.
MCSDK 2.1.2.6
SYS/BIOS 6.33.4.39

我无法实现与"用于 TMS320C6678处理器的超大 FFT "文档中执行的相同特性。 FFT 1024K 的下一个结果是:
8内核:32.484165ms 与文档中的6.403ms;
4内核:35.519242ms 与文档中的9.605ms;
2内核:58.152080ms 与文档中的19.328ms;
1内核:115.402698ms、文档中为38.557ms。

计算结果也是不匹配的参考结果。 日志是:
最大错误索引:0
Real、8.515877、Real_ref:36592189439.9998
Imag、8.515877、imag_ref:36592189439.9998
失败!!!

为什么会发生这种情况?e2e.ti.com/.../vlfft.zipe2e.ti.com/.../VLFFT_5F00_log.txt

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好!

    我已通知 RTOS 团队。 他们的反馈将在此处发布。

    此致、
    Yordan
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好!
    您能给我一个项目来确认文档"用于 TMS320C6678处理器的非常大的 FFT "中所述的性能吗?
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!
    这个主题创建至今已近两个月、但我仍未收到答案。
    根据文档"非常大的 FFT 多核 DSP 实现演示指南"、在第二阶段、应按列方向计算 N2大小的 N1 FFT。 但是、根据第二级中的代码、仅转置。
    请将我的帖子重定向至 Xiaohui Li 应用工程师处理器。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    Michael、

    我已经问过、但不再支持 VLFFT。

    此致、
    Garrett
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Garrett!

    我对 C6678上的 VLFFT 也有相同的问题。 问题是、由于非常大的 FFT 文档表1、如何实现 FFT 性能?

    您已告知不再支持 VLFFT。 我在论坛上阅读了其他一些主题。 一些开发人员也无法通过 FFTLIB 获得此类性能。 我们看到、VLFFT 和 FFTLIB 在高性能应用中都很难使用。 还有哪些其他方法或库可用于获得此类性能?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我还对性能问题感兴趣。 不再支持 VLFFT。 当使用单个内核而不是 文档中指定的473175个时钟时、FFTLIB 计算723440个周期的 FFT 16K。 那么、如何实现非常大的 FFT 文档中指定的性能?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    Michael、Alex、

    我已回答了该主题中的 FFT 性能问题- e2e.ti.com/.../2392669

    此致、
    Garrett