This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:QNX 中的 memcpy 性能

Guru**** 2524550 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1084144/tda4vm-the-performance-of-memcpy-in-qnx

部件号:TDA4VM
“线程:测试”中讨论的其它部件

您好,

  我们发现,QNX 中的 memcpy 性能远低于 Linux。 我们知道,Linux 中的 memcpy 是通过 NEON 指令进行优化的,我们在 QNX 中使用 NEON 优化来测试 memcpy,性能与 memcpy 相同,而 Linux 中没有 NEON 优化,我们如何在 QNX 中提高 memcpy 性能? 谢谢。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的客户:

      您使用的是 SDP 的哪个版本? 您是否测试了 SDP7.0的基础?  谢谢。

    林军

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    是的,它是 SDP7.0

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好,

    关于问题的“氖光灯优化的模块”部分,请注意以下常见问题,以检查是否启用了氖光灯。

    https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1075898/faq-tda4vm-neon-support-in-psdk-qnx 

    此致,

    KB

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好:

     我们的配置如下:

    /home/root#pidin syspage=cpuinfo
    标题大小=0x00000108,总大小=0x00000e38,#CPU=2,Type=257
    部分:cpuinfo 偏移量:0x00000340大小:0x00000040 elsize:0x00000020
    0) CPU:411fd080 flg:c0000c7a SPD:2000 hwid:8000000高速缓存 i/d:0/1名称:111
    历史:fffffffffffffffffffffffffffffff7.
    1) CPU:411fd080 flg:c0000c7a SPD:2000 hwid:80000高速缓存 i/d:0/1名称:111
    历史:飞利法飞利法飞利法

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    flg:c0000c7a” 表示氖灯(0x40)功能被视为由 H/W 和 QNX 启用。

    此致,

    KB

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    比较 QNX/Linux 之间的功能时,必须小心确保所测试的设置相同。  例如,启用了三级高速缓存,可能会对一个 HLOS 与另一个 HLOS 有所不同,用于构建二进制文件的工具集以及构建过程中使用的编译标志也会有所不同。

    一般而言,预期用于 QNX 和 Linux 的 memcpy()的性能应该与您在没有 NEON 的情况下所看到的性能相当。   如果您认为问题已被 NEON 隔离,请检查 QNX 使用的编译标志,以确保正在测试的 memcpy()是为 NEON 支持而构建的。

    建议联系 QNX 以获取有关 memcpy()实施的更多详细信息。  

    此致,

    KB