This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM62A7-Q1:是否有软件/模型可为 C7x 施加应力?

Guru**** 2398695 points
Other Parts Discussed in Thread: SK-AM62A-LP

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1476616/am62a7-q1-is-there-a-software-model-to-stress-the-c7x

器件型号:AM62A7-Q1
主题中讨论的其他器件:SK-AM62A-LP

工具与软件:

为了进行资格认证、我们需要对 C7x 施加压力以达到(接近) 100%。 是否有办法加载处理此问题的特殊固件/软件?

要么是需要大量资源的模型、要么是强调 C7x 超出正常 edgeai 接口的特殊固件?

此致、

Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    我们很乐意为您提供帮助。 您能否提供有关您用例的更多详细信息、以便我们相应地提出合适的基准?  

    AM62A 中的 AI 加速器由 C7x DSP 和矩阵乘法器加速器组成。 大多数 AI 工作都取决于稍后的情况。  

    有关 C7x DSP 的基准测试、请查看 AM62D 基准测试应用手册: https://www.ti.com/lit/an/spradm6/spradm6.pdf

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    我想补充更多详细信息、说明如何为 AI 用途强调 C7x-MMA。 请您解释一下您的意思  

    强调 C7x 超出正常 edgeai 接口的特殊固件?

    对 C7x-MMA 施加应力取决于您尝试运行的模型的大小和结构。 TI modelzoo: https://github.com/TexasInstruments/edgeai-modelzoo 为各种任务提供广泛的模型集合。 模型选择工具(Edge AI Studio 的一部分: https://dev.ti.com/edgeaistudio/) 可显示这些模型的出色性能。 请注意、此工具中显示的性能数字是在 C7x 在850MHz 时钟(转换为1.7TOPS)下收集的。 对于2TOPS、C7x 的时钟频率必须为1GHz。

    如果您感兴趣的特定模型的运行速度快于视频流、则可以运行模型的并行流水线、以对 C7x-MMA 加重。 多摄像头应用手册中提供了这方面的一个示例: https://www.ti.com/lit/an/spradh2a/spradh2a.pdf。第16页的表提供了使用四个并行摄像头运行 MobileNetV1模型的详细信息。 它还提供了 C7x-MMA 利用率的详细信息。  

    请告诉我这是否解答了您的问题。  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Qutaiba:

    为了进行鉴定、我们希望 C7x 上的 CPU 使用率接近100%、以确保在 EMI 测试期间注意到 C7x 产生的任何电磁干扰。 我真的不关心这是通过使用 TPU 还是仅使用 DSP 实现的、只要它在一段时间内尽可能努力/快速地工作即可。 它是一种仅用于鉴定而不是用于通用用途的特殊软件。

    这可以通过更换 Linux 上 C7x 的固件实现吗? 如果我可以为 C7x 加载替代固件、以在其运行时尽快执行一些计算、这将是理想选择。

    我们将在 C7x 上以850 MHz 运行、A53的最高运行频率为1.25 GHz

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、  

    感谢您提供详细信息。 这很有帮助。 这是否是裸机裸机解决方案、其中只有 C7x 在运行、而 SoC 的其余部分没有太大作用?  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Qutaiba:

    理想情况下、此操作将与在 A53上的 Linux 同时运行、这也会对 CPU 和内存造成压力。 这可能是 Linux 所有内核上的存储器测试。

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    我想告知您、我们正在处理您的请求。 我们正在为您的用例找到最佳的解决方案。 期待您本周的解答。  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    因此、它可以对我们的设计提供很大帮助。

    我很期待看到您能提出什么解决方案。

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    为了确保 C7x 的完整和连续应力、我们准备了一个内核、可在 MMA 上执行矩阵乘法、并在无限循环中将其调用。 内核的二进制文件如下: /cfs-file/__key/communityserver-discussions-components-files/791/MMALIB_5F00_LINALG_5F00_matrixMatrixMultiply_5F00_ixX_5F00_ixX_5F00_oxX_5F00_C7504_5F00_tc151_5F00_linux.out

    该内核在 C7x 上的裸机上运行。 当 Linux 在 A53内核上运行时、您可以将其加载到 C7x 中。 只要不从 Linux 调用 C7x (即运行 AI 推理或运行 perf_stats)、这就应该没问题。  

    您将需要使用 CCS 在 AM62A 上加载和运行内核。 以下是 CCS 的安装说明: https://software-dl.ti.com/mcu-plus-sdk/esd/AM62AX/10_01_00_33/exports/docs/api_guide_am62ax/CCS_SETUP_PAGE.html。以下是连接 C7x、加载和运行内核的说明: https://software-dl.ti.com/mcu-plus-sdk/esd/AM62AX/10_01_00_33/exports/docs/api_guide_am62ax/CCS_LAUNCH_PAGE.html。

    内核运行时、控制台上仅打印性能表的标题。 这是预料之中的、因为内核进入了无限的状态、而性能值从未计算过。  

    如果需要帮助、请告诉我。  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Qutaiba:

    是否可以让 Linux 中的 Remoteproc 子系统加载您发送的内核? 我不确定目前是否有与 CCS 兼容的 JTAG 以便单独加载。

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

     JTAG 无需特定要求即可与 CCS 一同使用。 任何微型 USB 电缆都可以正常工作。 您使用的是 SK-AM62A-LP 还是定制电路板?

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Qutaiba:

    我们目前使用的是定制电路板。

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    刚刚跟我的硬件工程师说过。 我们需要可以使用 Linux 或 u-boot 中的 remoteproc 接口将某个文件加载到 C7x 中。 使用 CCS 向电路板加载某些器件是不可行的、因为这意味着将电线焊接到 JTAG 接口、加载软件、在测试期间针对每个下电上电周期运行。 该测试将包括其中的多个。

    因此、如果可以使用 Linux 或 u-boot 加载此类固件、那就很理想了。

    这是可能的吗?

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    感谢您提供有关要运行的测试的详细信息。 我会给你一个建议。  

    此致、

    Qutaiba

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Qutaiba:

    您能在这方面取得进展吗?

    此致、

    Bas Vermeulen

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Bas、

    似乎只有 CCS 才是加载裸机内核的现成选项、就像我与您分享的选项。 我将告诉您是否有任何其他选项可用。  

    此致、

    Qutaiba