This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM263P4:与 AM2634 相比、AM263P4 上的代码执行需要更长时间

Guru**** 2771175 points

Other Parts Discussed in Thread: LP-AM263P, AM2634, AM263P4, LP-AM263

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/microcontrollers/arm-based-microcontrollers-group/arm-based-microcontrollers/f/arm-based-microcontrollers-forum/1616941/am263p4-code-execution-takes-longer-on-am263p4-compared-to-am2634

器件型号: AM263P4
主题中讨论的其他器件: AM2634、LP-AM263P、 LP-AM263

您好、

我有两个评估板 LP-AM263P 和 LP-AM263。 我在两个电路板上运行相同的代码、有趣的是、AM2634 处理器上的代码执行速度比 AM263P4 上的速度更快。 这两个代码都是从 RAM 运行的、略有不同。 区别如下:

凭据 可执行代码段存储器位置 堆栈、已初始化、未初始化的数据段存储器位置
AM2634 OCSRAM 存储体 1 OCSRAM 存储体 3
AM263P4 OCSRAM 存储体 1 OCSRAM 存储体 4

我已经更新了 AM263P4 的 GEL 文件、以初始化 OCSRAM 组 4 和 5。 为什么在 AM263P4 上运行相同代码的速度变慢? 与组 0 至 3 相比、OCSRAM 组 4 和 5 的访问时间是否不同? 或者、我是否缺少 AM263P$的另一个配置来使用组 4 和 5?

注意:很遗憾、我不能共享代码。 但我相信你应该能够看到同样的行为测试任何代码。

谢谢、

Pouya

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    我发现了这个问题、我没有指定库 4 在 MPU 中可缓存、因此执行速度变慢。

    谢谢、

    Pouya

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    很高兴您找到了这个问题。 但是、请注意器件 TRM (AM263Px Sitara 微控制器技术参考手册(修订版 D) 第 3.2 节)中有关 AM263P 中 OCSRAM 组访问延迟的以下内容:

    在 3 个互连(R5SS0 VBUSM、R5SS1 VBUSM 和 VBUSM 内核互连)之间放置 6 个 L2OCRAM 组的做法已经实现、使得集群中的内核可以更快地访问更靠近该特定集群的组(延迟更小)。 换言之、对于放置在 R5SS0 VBUSM 互连上的其附近的 L2OCSRAM 组 (BANK0 和 BANK1)、R5SS0_CORE0 和 R5SS0_CORE1 内核将具有更快的访问延迟。 同样、R5SS1_CORE0 和 R5SS1_CORE1 内核对位于 R5SS1 VBUSM 互连上的其附近的 L2OCSRAM 存储体(存储体 2 和 BANK3)具有更快的访问延迟。 与附近的存储体相比、所有 4 个内核的常见 L2OCSRAM 存储体 (BANK4 和 BANK5) 的访问延迟都相同、但较慢。 此外、与通用存储体相比、所有 4 个内核对其 far L2OCSRAM 存储体(集群 R5SS0 使用 BANK2 和 BANK3、集群 R5SS1 使用 BANK0 和 BANK1)的访问延迟都更慢。 总之、对于集群中的特定内核、以下是 L2OCRAM 存储体访问延迟比较:近存储体的访问延迟<常见存储体的访问延迟<远存储体的访问延迟

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您指出这一点。 它真的很有帮助。

    是否可以在近存储体、通用存储体和远存储体访问之间共享平均延迟差异?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好:

    ]是否可以共享 near、通用和 far 存储体访问之间的平均延迟差异?

    请查看以下数据:

    读取访问延迟:

    • 靠近银行 :32.5ns
    • 公共银行 :47.5ns(比近时慢 15ns)
    • 远银行 : 57.5ns(比接近时慢 25ns、比普通时慢 10ns )

    写入访问延迟:

    • 靠近银行 :25ns
    • 公共银行 :35ns(比接近值慢 10ns)
    • 远银行 : 40ns(比接近低 15ns、比普通低 5ns )

    延迟开销汇总:

    • 公共与近 :读取速度慢~46%、写入速度慢~40%
    • 远比近 :读取速度慢~77%、写入速度慢~60%
    • Far 与 Common :读取速度慢~21%、写入速度慢~14%

    此致、

    Sahana