您好,
我目前正在测量MCU R5F内核上的软件运行时间,运行频率为1 GHz。 代码从MCU_OCRAM运行,堆栈位于核心的TCM中。 MSMC SRAM用作与其他内核共享的内存。 该应用程序基于RTOS PDK 07.03 .00,由TI SBL启动。
在运行时间比预期长的地方,我更详细地了解了劳特巴赫T32 POWERTRACE调试程序收集的跟踪记录。
在跟踪列表中,我发现访问堆栈所需时间很长的情况令人惊讶。 例如,在这里,堆栈(R13)上的局部变量的初始化显然需要555ns。 
TCM的高速缓存已被禁用,但由于内存非常快,我认为这不会产生这样的影响。
事实上,为函数测量的整体运行时间似乎是正确的,并且与单个记录一致。 在许多情况下,我能够通过 独立测量(读取硬件计时器,切换GPIO和使用示波器测量)来确认劳特巴赫调试器报告的整体运行时。
所以我的问题是
1)跟踪记录到特定代码行的测量时间和跟踪记录的对齐精度如何?
2)如何确定时间"实际"花费在哪里(以及为什么)?
