This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM2434:R5F 内核与 C6000 DSP 内核

Guru**** 2780465 points

Other Parts Discussed in Thread: AMIC110

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/microcontrollers/arm-based-microcontrollers-group/arm-based-microcontrollers/f/arm-based-microcontrollers-forum/1044045/am2434-r5f-core-vs-c6000-dsp-cores

器件型号:AM2434
主题中讨论的其他器件:AMIC110

我们的客户希望了解 R5F 内核和 C6000 DSP 内核之间的性能差异。

以下基准测试显示了 A15内核与 C66x 和 C674x DSP 内核之间的性能差异。

内核基准测试
www.ti.com/.../core-benchmarks.html

以下基准显示了 AM64x 的 A53和 R5F 内核的性能、但不清楚 VFPv3是否用于 R5F 内核中的浮点运算。

AM64x 基准
www.ti.com/.../spracv1.pdf

您能否提供有关 R5F 内核与 C6000 DSP 内核性能比较的更多信息?

此致、

Daisuke

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Daisuke、

    我将对此进行研究、并很快与您联系。

    此致、
    弗兰克

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    [引用 userid="102452" URL"~/support/microcontrollers/arm-based-microcontrollers-group/arm-based-microcontrollers/f/arm-based-microcontrollers-forum/1044045/am2434-r5f-core-vs-c6000-dsp-cores "]

    以下基准显示了 AM64x 的 A53和 R5F 内核的性能、但不清楚 VFPv3是否用于 R5F 内核中的浮点运算。

    AM64x 基准
    www.ti.com/.../spracv1.pdf

    [/报价]

    这些基准使用在 AM64x 和 AM243x 器件上启用的 VFPv3-16完全实现进行编译。

    [引用 userid="102452" URL"~/support/microcontrollers/arm-based-microcontrollers-group/arm-based-microcontrollers/f/arm-based-microcontrollers-forum/1044045/am2434-r5f-core-vs-c6000-dsp-cores "]您能否提供有关 R5F 内核与 C6000 DSP 内核性能比较的更多信息?

    在信号处理中、C6000在性能和功耗方面都是明显更高的终端内核。 每个时钟周期、SP float C66x 内核的速度比 R5F 快3-10倍。 FFT 的差值为~10x、点积和 FIR 的差值为~4x、IIR 或点阵滤波器的差值为~3.5x。 在控制代码中、例如通过 Dhrystone 或 Coremark 测量的状态机或指针循环、差异要小得多、~x1.5到2倍。

     Pekka

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Pekka-San:

    感谢你的答复。

    我们的客户在每个评估板上运行了一个 FFT 和其他操作循环来比较 C674x 和 R5F 内核的性能、发现 C674x 内核比 R5F 内核快约5倍。

    此致、

    Daisuke

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    5x 很有意义。 我的示例是 C6x 和 R5之间的10倍差异。 在某种程度上取决于 FFT 的大小和输入的优化级别(例如针对2个大小的功率进行优化、 或针对 R5 TCM 或 C6x L2或 L1D SRAM、DMA 交替使用中的内容进行优化)、最终的性能步骤可能需要付出努力、并且可能侧重于特定 C6x 所需的特定 FFT。 在32位浮点应用中、C66x 与 C674x 相比具有一些优势。

     Pekka

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Pekka-San:

    感谢您的更新。

    我们的一些客户正在其当前产品中使用 C674x DSP、在某些情况下还与 AMIC110结合使用、他们希望在不增加成本的情况下提高性能、或在不降低性能的情况下降低成本。

    此致、

    Daisuke