This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TMS320F28P550SG:CPU 和 CLA 之间的代码执行时间差。

Guru**** 2782615 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/microcontrollers/c2000-microcontrollers-group/c2000/f/c2000-microcontrollers-forum/1617099/tms320f28p550sg-code-execution-time-difference-between-cpu-and-cla

器件型号: TMS320F28P550SG

尊敬的 TI Gurus:

我观察到、对于完全相同的代码、CPU 和 CLA 之间的代码执行时间存在巨大差异(~10 次)。 通过切换 DSO 中的 GPIO 引脚来测量执行时间。

请参阅随附的代码截图。

CPU 执行时间为~100nSec、而 CLA 以~1000nSec 为单位执行代码、比 CPU 慢近 10 倍。

这是预期的还是我错过了沉思? 两个代码的优化级别相同、但不确定时钟速率、RAM 数据变量位置或任何其他问题是否会造成性能差异。  

请提供您的反馈。

F28P55SJ_CPU_vs_CLA.txt 

此致

米兰

 

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Milan、

    CLA 是一个较小的 CPU,在某些操作类型上受限 — 这意味着它没有与 C28x CPU 相同的指令、因此某些操作需要更长的时间。

    它对 32 位浮点数据类型的性能更好。 16 位 int 类型应尽可能限制为加载/存储寄存器访问。 您可以尝试在 CLA 的代码中使用 float32、看看它是否会提高 性能。

    此致

    Lori