This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM67:Linux SDK:Dhrystone 基准测试结果?

Guru**** 1992785 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1392814/am67-linux-sdk-dhrystone-benchmark-results

器件型号:AM67

工具与软件:

团队、
我一直在查看我们的应用手册"Sitara AM64x/AM243x 基准测试 https://www.ti.com/lit/pdf/spracv1 "、其中提供了每个内核的 Dhrystone 3 DMIPS/MHz。
应用手册指出、对于标准 ARM 内核、使用相同的编译器标志时、DMIPS/MHz 将是相同的。

现在查看适用于 Dhrystone 的 AM67x Linux SDK 9.02基准测试:
https://software-dl.ti.com/jacinto7/esd/processor-sdk-linux-am67a/09_02_00/exports/docs/devices/J7_Family/linux/ddr.html?Release_Specific_Performance_Guide

很奇怪、对于用颜色标记的3个值、DMIPS/MHz 却相当、因为这是不同的内核(A53、A72)、以不同的 clk 速度运行的不同内核数(8、4和2)。
(即使根据应用手册、Dhrystone 基准测试是从 L1存储器运行的)。
您能否确认已发布的值?
您能解释一下为什么基准是相似的吗?

提前感谢、

安伯

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    Dan Chen said:
    您能否确认已发布的值?
    [报价]

    是的、这些是在不同设备上的场中运行的标准测试用例。 数字是有效的。

    [报价 userid="4466" url="~/support/processors-group/processors/f/processors-forum/1392814/am67-linux-sdk-dhrystone-benchmark-results "]

    您能解释一下为什么基准是相似的吗?

    [报价]

    我将让我们的专家对此发表意见。

    -基尔西

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

     Anber、您好!

    扫描网页后、报告中确实出现错误。  J722S (列表中的第7个)应报告值~3 (2.9)、并显示4.4与 A72的值内联。   Dhrystone 测试为仅单核测试、适合 L1。  如表所示、当归一化为 MHz (假设它以恒定速度运行)时、分数中的主要因素将是编译器和选项、CPU 类型和任何竞争负载。

    发布的值应来自在 SDK 完整版本上构建和运行的对象运行。  值得注意的是、该值不是最佳值、而是表示可以通过标准构建获得的值。 通过使用不同的编译器并去除整个系统运行中可能存在的所有 CPU 竞争对手、可以获得更高的数字。  另一个令人困惑的地方是、您会看到一些人发布具有和不具有函数内联优化的数字。  一个 nlined 值可能达到~>6.5、其中一个非 inlined 大约为~4.5。

    为了说明这一点、我将附上一些由 ARM ETM (硬件跟踪)创建的配置文件。

    该 A72 ~4.95是一个在裸机上没有内联的 GCC (注意到所有 dhry 函数都可以看到 Proc_1-x 和 Func1-x)

    此 A72 ~6.1在裸机上进行内联(您可以看到 Proc_x 的#和 Func_x 会减小、因为函数已经相互折叠、通过消除标注开销来提高速度)。

     

    这里运行的是 Linux 上的 Dhry。  您可以清楚地看到影响 CPU 使用率的开销。  在本例中、非 dhry 活动主要是稀疏的中断、但如果运行的中断更多、可能会干扰分数。  这会在运行到运行结果中出现一些抖动。 诸如热节流之类的事情可能会导致不直观的结果。
    此致、
    理查德·W·
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Richard:
    感谢您提供非常精确的答案。

    我们可以确保在下一版本的 SDK 文档中纠正基准测试吗?
    是否应输入 JIRA 工单?

    提前感谢、

    安伯

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Anber、您好!

    是的、我为该 SDK 版本创建了 Jira 工单。  希望后续版本的匹配列中会显示 J722S 结果。  对于几个测试、其清晰的列6不是7是其结果所在的位置。  对于基于吞吐量的基准测试、J722S A53将低于 J7-A72平台的性能。  A53在某些 RT 抖动类型基准测试中可能只会更好。

    此致、
    理查德·W·