器件型号:EVMK2H
我们使用了 TMS320C6678 (仅 DSP)开发。 评估一些具有积极效果的算法的评估板;
我们将 CCSv6.1.2.00015与所有最新的 SDK 捆绑包以及 Blackhawk XDS560v2-USB 夹层仿真器配合使用。
最基本的程序之一是在 所有8个内核上运行的循环计数器测试、这些内核具有已知和预测的时序行为。
将同一测试移植到 EVMK2H 上的 DSP 内核上会产生更慢的循环(大约慢10倍)。
我想、当较快的循环使用 L1P 缓存的优势而较慢的循环则不使用时、会发生这种情况。
当我进一步向下钻取时、我可以在 Cache View 窗口中看到 、快速循环测试在 L1P 缓存中有活动 PC 行、
但慢速测试在 L1P 缓存中没有相同的活动行;非缓存。
地址(0x1840020)上的 L1P 高速缓存控制寄存 器的值为7、表示所有高速缓存-这是默认情况下的预期值。
在快速和慢速情况下、程序代码都在 L2存储器中运行、因此我正在划伤自己的头、这就是为什么这两个板会提供如此不同的结果。
关于这种情况可能发生的原因的任何提示都是非常欢迎的。
供参考、我可以在调试窗口中看到 ARM 内核、但我没有主动对它们执行任何操作;调试器说:
全部 4的 ARM_A15_0 (断开连接:未知)
此致、Jack Hawkins。