This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AWR2944EVM:最大 HWA 计算/运算数

Guru**** 1549780 points
Other Parts Discussed in Thread: AWR2944EVM, AWR2944, MATHLIB
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/sensors-group/sensors/f/sensors-forum/1379453/awr2944evm-maximum-number-of-hwa-computations-operations

器件型号:AWR2944EVM
主题中讨论的其他器件: AWR2944MATHLIB

工具与软件:

您好!

我计划编写一个资源密集型程序、使用 HWA 2.0在 AWR2944EVM 上运行。 每次迭代(可能每帧)总共计算大约200,000次运算、主要是复杂的算术运算、但也有一些 FFT。

1.在 HWA 上运行每一个操作是否实用,或者是否也应该使用内核? 如果后者是正确的、那么将两者结合的最佳方法是什么?

2.如何估算 AWR2944EVM/HWA 完成这些操作所需的时间? 这个数量是否完全可行、或者是否存在由 HWA 时钟和可用存储器引起的上限?

3.我还注意到有两个 R5F 内核和一个 DSP 内核。 我看到的所有应用仅使用这三个中的两个。 第三个会发生什么情况?

4.关于此程序的说明:AWR2944EVM 是否可以从 IMU 或 GPS 等外部传感器接收数据?

谢谢!

亚伦

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    大家好、Aaron:

    感谢您访问 e2e! 请查看我对这些主题的回答、如下所示:

    1. 理想情况下、最好将大部分计算卸载到 HWA。 无法在 HWA 上完成的任何操作都可以在 DSP/R5f 上完成。 将它们组合在一起的理想方法是在 HWA /内核之间拆分信号链、DMA 会独立移动数据并平均分配负载以获得理想时序。
    2. 对于大多数操作、HWA 充当流引擎(即每个周期一个复数输出)。 例如、FFT 将占用 ACNT * BCNT 个周期、额外占用 ACNT 个周期的开销。 这种关系对于大多数操作都适用、ACNT/BCNT 指示所需的时间。
    3. R5f 内核处于双核锁步模式。 两者将一同使用、不能独立使用、因为这会破坏锁步、而锁步对于 AWR2944作为安全汽车器件至关重要。
    4. AWR2944上提供了许多数据传输接口、例如 CSI2、SPI、I2C 等、可用于实现此目的。 我强烈建议您浏览数据表、以了解可用的内容以及可以根据用例使用的内容。

    此致、

    Kaushik

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Kaushik:

    感谢快速响应。

    1.我希望能够执行以下操作:复数加法/减法/乘法/sqrt、正弦和余弦、FFT 和地板。 我在 HWA 文档中看到了正弦和余弦、FFT 和复杂的乘法运算、但没有看到加法/减法、sqrt 和 floor。 是否必须使用 mathlib 库在 DSP/R5F 上完成后两个任务? 分离信号链和分配负载的推荐方法是什么、它会导致在 HWA 和 DSP 之间来回传输数据的速度减慢程度? 我可以查看任何文档/代码示例吗?

    2.只是澄清 ACNT 和 BCNT。 根据我从 HWA 的 swru526b 文档中的理解、ACNT 是指要处理的样本数、而 BCNT 是指处理链的数量(RX 通道数)。 因此、如果4个 RX 通道中的每个通道有256个 ADC 样本、则 FFT 将需要256*4+256=1280个时钟周期、300 MHz 可以转换为4.27us。 是这样吗?

    此致!

    亚伦

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    大家好、Aaron:

    请按以下方式查找我的回答:

    1. 作为第一个选项、可以在 DSP/R5F 内核上执行您提到的操作。 但是、你可以通过一些方法来执行你已经提到的使用 HWA 的某些运算。
      1. 加法-您可以使用通道组合或统计块对一系列数字求和。
      2. 减法-您可以重复使用上面的相同块并实现减法运算(您可以使用 BPM 去除或向量乘法来引入符号翻转)
      3. 可以在 DSP 中实现 sqrt 和 floor 等运算。
        • 分离信号链和分配负载的推荐方法是什么以及它会导致在 HWA 和 DSP 之间来回传输数据的减慢程度?
        需要考虑的事项有:
        1. 能够在 HWA 上实施某种东西的可行性。
        2. 可用的总时间预算。
        3. 可以使用的总内存。
        4. 根据这些输入、您会找到一种简单的方法。 然后、您可以在时间预算内根据每个 CPU 的利用率执行优化、并尝试实现更多的并行化。
        • 我可以查看哪些文档/代码示例?
        您可以查看毫米波 MCUPlus SDK OOB 演示的数据路径处理链。
    2. 有。 您的理解是正确的。

    此致、

    Kaushik