This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TMDX654IDKEVM:锁步模式是否具有性能回归?

Guru**** 2455360 points
Other Parts Discussed in Thread: AM6548

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1377264/tmdx654idkevm-whether-lockstep-mode-has-performance-regression

器件型号:TMDX654IDKEVM
Thread 中讨论的其他器件:AM6548

工具与软件:

您好!

该问题主要针对 AM65x SoC 的 CCMR5设计细节。

我想知道与位于 Cortex-R4中的 CCM-R4相比、AM6548 SoC 中的 CCM-R5模块是否具有类似的行为。 对于 CCM-R4、有如下数字:

(贷记至[0])

其中说明了模块的内部、并显示 CPU1的输出不会被"2周期延迟"延迟。 不过、我没有为 TI 集成的 Cortex-R5 SoC 找到类似的版本、这让我想知道 AM65x 中的 R5内核(启用了锁步功能)是否也不会因比较逻辑而延迟。

目前、我推测它不会被比较逻辑延迟、因为我已经在 R5内核上完成了一个 FFT 基准测试、并且启用了软件锁步。 结果表明、这两种模式具有相同的基准测试结果。 也就是说、两种模式的 FFT 计算延迟完全相同的结果:764us。 此外、我通过检查 SBL 日志已确保锁步模式已经被正确配置。

尽管有测试结果、TRM 并未明确表示在内核配置为锁步模式时将不会有性能回归。 但是、AM65x TRM 的表述确实如下:

>复制 CPU0的所有输出、将延迟两个周期、并与 CPU1的输出进行比较。

对我来说、"CPU0的所有输出均已复制"语句似乎意味着在锁步模式下不会有性能回归、因为复制输出而不是"等待比较完成"。

那么、TI 人们能否判断在启用锁步模式时是否没有性能回归?

谢谢!

[0] e2e.ti.com/.../lockstep

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    ARM 官员表示、在性能方面不会出现倒退、请参阅:

    https://community.arm.com/support-forums/f/architectures-and-processors-forum/4503/lock-step-mode-execution-on-cortex-r5/18209

    我认为这可能适用于 AM65x 上的 R5、对吧?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    冯慧春您好!

    感谢您的查询和输入。

    我认为应该可以应用相同的方法。

    让我看看是否有专家有其他想法。

    此致、

    Sreenivasa

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    冯慧春问候

    正如您的性能测试显示的和 ARM 文档/论坛帖子指出的那样、在锁步模式下运行不会对性能产生影响。

    锁步模式仅比较两个实例化 R5内核在给定相同输入时的输出;一个内核的输入延迟了两个周期、另一个内核的输出相互比较延迟了两个周期(就像您为 R4共享的图片)。 这不会影响任一 R5内核的工作频率、也不会导致任何性能下降。

    此致、

    卢卡斯