This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] LP-AM243:与基准测试结果相关的问题

Guru**** 2668625 points

Other Parts Discussed in Thread: AM2431

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1592494/lp-am243-question-related-to-benchmark-results

器件型号: LP-AM243
主题中讨论的其他器件: AM2431

Benchmark_Slides 

大家好:

我们目前正在对照我们使用的 TMS570LC431 处理器来评估 TI AM2431 处理器的性能。 由于 TI AM2431 处理器具有与 TMS570LC431 相同的内核 R5F、并 800MHz 在 TMS570LC431 上的时钟速度比 300MHz 更高。 我们预计性能的最低提高幅度为 2.6 倍。

因此、在执行 TI 基准测试 (Coremark、Dhrystone) 时、我们遇到的值似乎不合理。 未启用高速缓存时 Coremark 结果的差异显示两个处理器之间的性能差异很小。

我们的理解是,情况列表用于避免缓慢访问内部 RAM ,但内部 OCRAM 用于运行 benachmark 的速度比 TMS570LC431 上具有 8 级流水线的存储器更快。 您能否确认我们的结果(请参阅 Excel 工作表)?如果是、为什么根据时钟速度差异、备注结果之间的差距小于我们的预期?

提前非常感谢您的回答。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好:Markus、

    为什么根据时钟速度的差异、coremark 结果之间的差距要小于我们的预期?

    我认为可能是因为 Corestone 表单本身的问题。 如果我们看一下李氏单张表,我们可以看到 AM2431 甚至在标准化的(每 1MHz ) 性能)性能得分方面有很大的改善。 例如、对于-O0、移除 MHz 差异后、Dhrystones 的分数提高~10 倍、精度提高~ 4 倍:

    无优化 (-O0)
    Dhrystone AM243x(启用高速缓存) TMS570(启用高速缓存) AM243x(禁用高速缓存) TMS570(禁用高速缓存)
    ClockRateMHZ 800 300 800 300
    开始 7 刻度 437040ns 111 个周期 2169600ns
    结束  600632312 个刻度 2675452160ns  –818381844 个刻度 13505529600ns
    用户  600632305 刻度 2675015120ns  –818381955 刻度 13503360000ns
    用户时间(秒) 0.75079 267501512 4345732 13,50336
    整个 Dhrystone 运行的时间 1、5. 17,83343506. 8、7. 90,0223999.
    Dhrystones 每秒 665964,80 56074,45 115055,40 11108,35
    归一化 MIPS/MHz 0.47 0.11. 0.08. 0.02.

    相比之下、在 Corestone 表中、归一化 CoreMark/MHz 数据不是从 800 和 300MHz 得出的、我可以看到这两个器件都将其除以 400。 这让我认为 CoreMark 1.0 结果也可能在某种程度上不正确或已经实现了每 MHz 的标准化。

    否则、-O3 优化和启用缓存的归一化分数与此链接中的分数非常接近:

    https://software-dl.ti.com/mcu-plus-sdk/esd/AM64X/latest/exports/docs/api_guide_am64x/EXAMPLES_BENCHMARKS.html

    此外、您能否告诉我您为什么要了解缓存禁用的性能? 在实际应用程序中是否需要它(缓存已禁用)?

    此致、

    Stan

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Stan:

    非常感谢您的快速回答。 我们可以确认结果表中存在计算错误(未以 ns 为单位转换的节拍和用于分频的不正确的时钟速率)。 更正问题后、我们现在得到了不同的结果、但我们仍然没有 understand.e2e.ti.com/.../AM243x_2D00_vs_2D00_TMS570.xlsx

    新结果显示编译选项-O1 的性能值不一致。 你有什么想法吗?

    我们还测量了禁用缓存的结果、因为我们有具有巨大随机存储器访问的用例、我们必须假设在最坏的情况下、我们会遇到大量缓存缺失。 对于最坏情况下的执行时间、我们假设缓存被禁用。

    此致、

    Markus  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好:Markus、

    抱歉、我不能评论该工作表、现在有很大不同。 我在这里的主要关注点是原始-O3 值与 TI EVM 测试中的值非常匹配、现在变得太不同了。

    对于 Coremark、我知道这是一个可以放入处理器高速缓存的微小测试、主要侧重于处理器内核性能。 对于包括高速缓存、内存、互连在内的更全面的测试、您可能需要考虑 Coremark Pro。

    此致、

    Stan

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Stan:

    非常感谢您的回答。 我们将考虑使用 Coremark pro 进行基准测试。

    此致、

    Markus