This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VH-Q1:TDA4VH DDR 性能问题

Guru**** 2540720 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1256231/tda4vh-q1-tda4vh-ddr-performance-issue

器件型号:TDA4VH-Q1
主题中讨论的其他器件:TDA4VH

嗨、专家、

我有一些关于 TDA4VH 平台(SDK8.6)上 DDR 带宽的问题。

  • 根据 LMBench 的测试结果、 DDR memcpy 的),带宽约为10GB/s ,但 DDR 的最大理论带宽约为68GB/S (__LW_AT__17GB*4 μ s 为什么利用率如此低?
  • 我们试图将4个 DDR 控制器修改为1、发现 memcpy 的带宽基本没有变化。
  • 我们想知道阿斯拉科对复员方案访问缓慢的根本原因是什么?
基准 j7200-EVM:PERF j721e-idk-GW:perf j721s2-EVM:perf j784s4-EVM:PERF
AF_UNIX_SOCK_STREAM_LATION (微秒) 20.47 19.88 19.91 19.30
AF_UNIX_SOCKET_STREAM_BAN带宽(MB) 2811.71 3054.68 3047.35 3650.94
bw_file_rd-IO-1MB (Mb/s) 2182.97 2783.96 2539.45 3528.72
bw_file_rd-O2C-1MB (Mb/s) 1064.40 1488.93 1205.86 1447.44
bw_mem-bcopy-16MB (Mb/s) 2353.29 2861.23 3389.47 3575.02
bw_mem-bcopy-1MB (Mb/s) 3297.91 5326.97 4697.48 9316.77
bw_mem-bcopy-2MB (Mb/s) 2473.50 3954.13 3570.72 5129.14
bw_mem-bcopy-4MB (Mb/s) 2341.46 3917.73 3450.06 4493.54
bw_mem-bcopy-8MB (Mb/s) 2360.23 3129.07 3393.67 3765.89
bw_mem-bzero-16MB (Mb/s) 2343.29 9657.46 10521.12 10854.82

谢谢

全力

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、 Quanli、

    您是在 TDA4VH 电路板上运行测试用例、还是对性能进行报价?
    您可以运行多个其他测试用例、并且您可以看到 DDR 带宽会更大。 例如:

    A72上的 RAMSMP 8线程用例+ 12个摄像头用例

    总之、通过上述用例、我们可以看到大约14Gb/s 带宽。

    您能否尝试一下、并告诉我们总带宽是否仍然为10Gb/s。

    -基尔西

     

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Keerthy、您好!

    A72上的 RAMSMP 8线程用例+ 12个摄像头用例

    总之、通过上述用例、我们可以看到大约14Gb/s 带宽。

    [/报价]

    我运行哪个测试 caces 可以看到大约14GB/s 的带宽,是 ramspeed-SMP?

    https://github.com/cruvolo/ramspeed-smp

    似乎 ramspeed-SMP 不支持 ARM64,你能为我们分享这些测试案例吗?

    谢谢

    全力

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    运行 RAMSMP 的步骤:

    1.  sources.buildroot.net/ramsmp-3.5.0.tar.gz 下载 ramsmp-3.5.0.tar.gz  并将其复制到 TDA4VH EVM 板上;
    2. tar xvf ramsmp-3.5.0.tar.gz
    3. cd ramsmp-3.5.0/
    4. build.sh
    5. ./ramsmp -b 3 -p 8

    -基尔西

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Keerthy、您好!

    在 EVM 电路板上、我的测试结果如下、仅观察到9GB/s 带宽。

    RAMspeed/SMP (GENERIC) v3.5.0 by Rhett M. Hollander and Paul V. Bolotoff, 2002-09
    
    8Gb per pass mode, 8 processes
    
    INTEGER   Copy:      9133.69 MB/s
    INTEGER   Scale:     9124.03 MB/s
    INTEGER   Add:       8799.31 MB/s
    INTEGER   Triad:     8682.72 MB/s
    ---
    INTEGER   AVERAGE:   8934.94 MB/s

    谢谢

    全力

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Quanli、

    12摄像头用例

    您能否与 RAMSMP 并行运行12个摄像头演示或环视用例? 您应该会看到它增加了更多 Gb/s 带宽。

    此致、
    基尔西

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Keerthy、您好!

    我们没有购买摄像头、因此无法 运行12个摄像头的演示。

    为什么运行12个摄像头的演示会增加 DDR 带宽? 是因为使用了 DMA 吗? 我们测试了 A72 8核 DDR 带宽可高达9GB。

    我们认为 CPU 访问 DDR 的速度较慢的原因如下:

    A72访问 DDR 延迟=系统总线延迟+ DDR 延迟

    但是系统总线延迟远大于 DDR 延迟、 这种观点是否正确?

    谢谢

    全力

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    是因为使用了 DMA 吗? 我们测试了 A72 8核 DDR 带宽可高达9GB。

    是的、DMA 可以获得更大的带宽。 因此、我们已经测试了使用 DMA 的用例、能够实现超过25Gb/s 的速率。
    所以,你是对的,这不是 DDR 带宽它的 A72访问它有~10 Gb/s。 使用时
    借助 DMA、我们可以扩展更高的典型现实案例、如摄像头环视、深度学习用例等、使用 DMA。

    -基尔西

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

     Keerthy、您好!

    因此,您是对的,它不是 DDR 带宽,而是 A72访问它时的带宽~10 Gb/s。

    为什么 a72的内存访问速度与 DDR 带宽无关?

    我们认为 CPU 访问 DDR 的速度较慢的原因如下:

    A72访问 DDR 延迟=系统总线延迟+ DDR 延迟

    但是系统总线延迟远大于 DDR 延迟、 这种观点是否正确?

    [/报价]

    是因为这个原因?

    谢谢

    全力