This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] 将 DSPLIB 函数的 TMS320C6726B 穿孔为慢速

Guru**** 2618835 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/662317/tms320c6726b-performence-of-dsplib-functions-to-slow

您好!

我使用 Code Composer Studio 中的时钟函数来测量我使用过的 DSPLIB 函数(如 DSPF_sp_vecsum_sq ())的性能、并且性能太慢了3倍。

例如、DSPF_sp_vecsum_sq (x、1024);//矢量 x 是双字对齐!
根据公式、计算应需要573个周期、但我测量的是1610个周期。

我使用的是 DSPLIB 的 ROM 版本。

您能帮我理解为何性能如此缓慢?
我出了什么问题?

此致

Dirk Walther

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好!

    我已通知 RTOS 团队。 他们将直接在此处发布反馈。

    此致、
    Yordan
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    请提供更多信息以供我们提供指导

    • 您使用什么评估平台来对这些函数进行基准测试。
    • 您正在使用的库的版本是什么。
    • 您是否从 L2存储器运行代码和数据?
    • 如果从 DDR 运行代码,您是否已打开高速缓存?
    • 您是否设置了器件时钟、使用 GEL 文件/init 代码进行 DDR。

    该公式基于通过在仿真器上进行基准测试而发布的数据、因此由于系统延迟(如数据提取、时钟设置速度)、预计会有一些变化

    此致、

    Rahul