This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM6442:R5F 与 Coldfire V4的性能基准测试

Guru**** 2387080 points
Other Parts Discussed in Thread: AM6442
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1494467/am6442-r5f-performance-benchmark-in-comparison-to-coldfire-v4

器件型号:AM6442

工具/软件:

我目前正在研究一个基于 NXP/Freescale MCF5485的 CPU 卡替换设计。  它是192 MHz Coldfire V4。  假设 AM6442中的 R5F 以800MHz 运行、我预计性能会显著提高。  但在实践中、我并没有看到我预期的增长。  在 R5F 内核上运行的代码必须访问位于 DDR 中的约100K 数据。  将100K 移动到 MSRAM 实际上会导致性能下降。  目前正在考虑将数据移至 TCM、但非连续(ATCM + BTCM)存在一些问题。   

通过比较 DMIPS/MHz 和 Dhrystone 2.1数据的研究、我预计800MHz RF5的性能约为 Coldfire 的5倍。  我观察到大约2倍。  也就是说、我还没有能够真正比较这两款处理器的任何已发布材料。   

是否有任何可用的数据可供参考? 或者有什么建议可以最大限度地提高性能?  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Shawn、

    从说明中可以看出、我假设您使用 Dhrystone 程序进行基准测试。 MCU+SDK 中已经提供了一个 Dhrystone 示例: https://software-dl.ti.com/mcu-plus-sdk/esd/AM64X/10_01_00_32/exports/docs/api_guide_am64x/EXAMPLES_DHRYSTONE.html、 您是否使用相同的示例或自行集成这些基准?

    本应用手册中还提到了 R5的一些 Dhrystone 基准编号、您可以比较使用它的结果、并告诉我您是否看到任何偏差。

    此致、

    会面。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Thakar、   

    我们尝试重新创建您提供的链接中提供的结果以及 Coremark 基准测试。  在这两种情况下、示例给出的结果比文档要少得多。  我的结果约为 Dhrystone 示例的1/4和 CoreMark 示例的1/6。  对于实现与示例相同的结果、您有什么建议吗?  我在 AM2434-LP 以及 TQ Systems 的定制 CPU 开发套件上运行这些器件、获得完全相同的结果。  

    [MAIN_Cortex_R5_0_0]基准测试开始- ARM R5F - COREMARK
    用于备注的2K 性能运行参数。
    第666章我是不是很好
    第一百四十七章..
    -结束勾号:33561032
    -总滴答次数:33559985
    -总时间(秒): 33.559985
    -迭代次数/秒: 446.960867.
    -迭代: 15000
    -内存位置:堆栈
    -幼苗: 0xe9f5.
    [0]Crclist : 0xe714
    -[0] crcmatrix : 0x1fd7.
    [0]crcstate : 0x8e3a.
    [0]crcfinal : 0x65c5.
    CoreMark 1.0:446.960867
    CoreMark/MHz:1.117402/堆栈
    BENCHMARK END

    所有测试均已通过。

    **************************************************************************

    基准测试开始- ARM R5F - Dhrystone

    Dhrystone 基准测试、版本2.1 (语言:C)

    -开始循环计数: 62
    -结束周期计数:600746456
    -用户周期计数:600746394
    -用户时间(以秒为单位):3.003732
    -微秒、一次运行至 Dhrystone:6.0
    - Dhrystones 每秒:166459.6

    标准化 MIPS/MHz:0.4737
    BENCHMARK END

    ************************************************************************

    该示例结果显示了这一点。  

    基准测试开始- ARM R5F - Dhrystone
    Dhrystone 基准测试、版本2.1 (语言:C)
    -开始循环计数: 58
    -结束周期计数:145142816
    -用户周期计数:145142758
    -用户时间(秒):0.725714
    -微秒、每次运行到 Dhrystone:1.5
    - Dhrystones per Second (每秒):688976.9
    标准化 MIPS/MHz:1.9607
    基准结束
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Shawn、

    我最后在 AM243 LP 上运行了这些示例并获得了预期的结果:

    Dhrystone:

    DMSC Firmware Version 9.2.7--v09.02.07 (Kool Koala)
    DMSC Firmware revision 0x9
    DMSC ABI revision 3.1                                                                                                                  
                                                                                                                                           
    [BOOTLOADER_PROFILE] Boot Media       : NOR SPI FLASH                                                                                  
    KPI_DATA: [BOOTLOADER_PROFILE] Boot Media Clock : 100.000 MHz                                                                          
    KPI_DATA: [BOOTLOADER_PROFILE] Boot Image Size  : 49 KB                                                                                
    [BOOTLOADER_PROFILE] Cores present    :                                                                                                
    r5f0-0                                                                                                                                 
    KPI_DATA: [BOOTLOADER PROFILE] SYSFW init                       :      11793us                                                         
    KPI_DATA: [BOOTLOADER PROFILE] System_init                      :      13320us                                                         
    KPI_DATA: [BOOTLOADER PROFILE] Drivers_open                     :        283us                                                         
    KPI_DATA: [BOOTLOADER PROFILE] Board_driversOpen                :     141109us                                                         
    KPI_DATA: [BOOTLOADER PROFILE] Sciclient Get Version            :       9852us                                                         
    KPI_DATA: [BOOTLOADER PROFILE] CPU load                         :      17661us                                                         
    KPI_DATA: [BOOTLOADER_PROFILE] SBL Total Time Taken             :     194022us                                                         
                                                                                                                                           
    Image loading done, switching to application ...                                                                                       
                                                                                                                                           
    Dhrystone Benchmark, Version 2.1 (Language: C)                                                                                         
                                                                                                                                           
    - BEGIN cycle count:                         62                                                                                        
    - END Cycle count:                           145115213                                                                                 
    - USER cycle count:                          145115151                                                                                 
    - Usertime in sec:                           0.725576                                                                                  
    - Microseconds for one run through Dhrystone:   1.5                                                                                    
    - Dhrystones per Second:                     689107.9                                                                                  
                                                                                                                                           
    Normalized MIPS/MHz:                         1.9610                                                                                    
    BENCHMARK END 

    Coremark:

    [MAIN_Cortex_R5_0_0] BENCHMARK START - ARM R5F - COREMARK
    2K performance run parameters for coremark.
    - CoreMark Size    : 666
    - Begin tick       : 987
    - End tick         : 4975353
    - Total ticks      : 4974366
    - Total time (secs): 4.974366
    - Iterations/Sec   : 3015.459659
    - Iterations       : 15000
    - Memory location  : STACK
    - seedcrc          : 0xe9f5
    - [0]crclist       : 0xe714
    - [0]crcmatrix     : 0x1fd7
    - [0]crcstate      : 0x8e3a
    - [0]crcfinal      : 0x65c5
    CoreMark 1.0 : 3015.459659 
    CoreMark/MHz :7.538649 / STACK
    BENCHMARK END

    您能告诉我、您是按原样使用 TI 的 am243-LP、还是在定制电路板上进行了一些硬件更改吗?

    此致、

    会面。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的会议:  

    我发现了这个问题。  示例文件不会将编译器优化级别设置为3。  说明中也没有提到这一点。  将编译器优化级别设置为3时、会得到相同的结果。  感谢您的观看。