This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM4379:Sitara 处理器性能出色

Guru**** 2555630 points
Other Parts Discussed in Thread: AM3358, AM5708, AM4379

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/605957/am4379-sitara-processors-flops-performance

器件型号:AM4379
主题中讨论的其他器件:AM3358AM5708

您好!

我正在尝试比较 AM3358、AM4379和 AM5708的浮点性能(FLOPS)、但我不太清楚。

是否有人可以共享这些 CPU 的每个时钟周期的触发器?

使用 VFP 和 NEON 的性能推理是什么?

谢谢。

此致、

朱利雄。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    工厂团队已收到通知。 他们将在这里作出回应。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好 Julio、
    运行 Processor SDK Linux 的器件的基准测试可在以下位置找到: processors.wiki.ti.com/.../Processor_SDK_Linux_Kernel_Performance_Guide

    LINPACK 基准测试可测量您所需的浮点性能。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    感谢您的回答。

    我验证了基准、但我没有找到关于我的疑问的答案。

    有人知道谁可以帮助我吗?

    谢谢
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您的疑问到底是什么? 是 VFP 还是 Neon? 由于 gcc 编译器会自动为您优化、因此该特定点无关紧要。 此外、它们是用于不同任务的不同协处理器。 NEON 是用于并行计算的 SIMD、而 VFP 只是单个浮点单元。  

    其他一些详细信息:从我提供的基准 Wiki 中、您可以假设 AM335x EVM 以800MHz 运行、AM437x EVM 为1000MHz、AM572x 为双核1500MHz。 您可以将其除以找出每个时钟周期的运算放大器性能。 我忘了说、Whetstone 基准还测量浮点性能、但它是单线程的、因此不要在该线程上除以2。  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您的解释。

    我的疑问是 、例如、在下面的基准中、NEON 基准有一个在 MFLOPS 中的分解:

    借助这些信息、我可以简单地比较 Raspberry 与 TI DSP (不会考虑彼此不同的应用和硬件)、后者具有 FLOPS 中提供的浮点性能。

    关于浮点性能、我不清楚如何在 FLOPS 中转换 Whetstone 基准。 您能帮我解决这个问题吗?

    谢谢!

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    我们没有任何基准仅测试氖光。 您应该只查看 Linpack 基准以进行快速比较。 从您提供的链接中、我可以看到在 RPi 上运行的 NBench 和 Linpack 测试、我提供的 wiki 具有这些测试的基准测试结果。

    通过链路进行 LINPACK 测试
    PI 2 - 299.93MFLOPS (四通道 A7 @ 900MHz)
    PI 3 - 462.07 MFLOPS (四通道 A53 @ 1200GHz)

    来自我提供的 Wiki 的 LINPACK
    AM335x - 57.22MFLOPS (单路 A8 @ 800MHz)
    AM437x - 137.33MFLOPS (单路 A9 @ 1000MHz)
    AM57xx - 686.67MFLOPS (双通道 A15 @ 1500MHz)

    我们似乎没有 C66x DSP 的可比基准。 ARM Cortex 内核在任何 SoC 中通常都是相同的、由于内核周围构建了何种互连、因此您会发现存储器带宽存在差异。 如果您可以在任何其他 SoC 中找到适用于 Cortex 内核的 NEON 基准、那么您可以在我们的系统中获得相同的性能。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    此比较测试主要使用 Android、其中包括在某些浮点测试中使用和不使用 NEON 的 A9和 A15之间的直接比较。 使用 NEON 时、A9的运行速度是每个 CPU 的两倍、A15的运行速度是每个 CPU 的四倍。 请看第二个表。

        

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    很抱歉、我没有看到 Linpack 测试。
    我现在明白了。
    谢谢!
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    这种情况有很大的差异、并使处理器可以自由执行其他任务。