主题中讨论的其他器件:SK-AM62A-LP
工具与软件:
为了进行资格认证、我们需要对 C7x 施加压力以达到(接近) 100%。 是否有办法加载处理此问题的特殊固件/软件?
要么是需要大量资源的模型、要么是强调 C7x 超出正常 edgeai 接口的特殊固件?
此致、
Bas Vermeulen
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
工具与软件:
为了进行资格认证、我们需要对 C7x 施加压力以达到(接近) 100%。 是否有办法加载处理此问题的特殊固件/软件?
要么是需要大量资源的模型、要么是强调 C7x 超出正常 edgeai 接口的特殊固件?
此致、
Bas Vermeulen
嗨、Bas、
我们很乐意为您提供帮助。 您能否提供有关您用例的更多详细信息、以便我们相应地提出合适的基准?
AM62A 中的 AI 加速器由 C7x DSP 和矩阵乘法器加速器组成。 大多数 AI 工作都取决于稍后的情况。
有关 C7x DSP 的基准测试、请查看 AM62D 基准测试应用手册: https://www.ti.com/lit/an/spradm6/spradm6.pdf
此致、
Qutaiba
嗨、Bas、
我想补充更多详细信息、说明如何为 AI 用途强调 C7x-MMA。 请您解释一下您的意思
强调 C7x 超出正常 edgeai 接口的特殊固件?
对 C7x-MMA 施加应力取决于您尝试运行的模型的大小和结构。 TI modelzoo: https://github.com/TexasInstruments/edgeai-modelzoo 为各种任务提供广泛的模型集合。 模型选择工具(Edge AI Studio 的一部分: https://dev.ti.com/edgeaistudio/) 可显示这些模型的出色性能。 请注意、此工具中显示的性能数字是在 C7x 在850MHz 时钟(转换为1.7TOPS)下收集的。 对于2TOPS、C7x 的时钟频率必须为1GHz。
如果您感兴趣的特定模型的运行速度快于视频流、则可以运行模型的并行流水线、以对 C7x-MMA 加重。 多摄像头应用手册中提供了这方面的一个示例: https://www.ti.com/lit/an/spradh2a/spradh2a.pdf。第16页的表提供了使用四个并行摄像头运行 MobileNetV1模型的详细信息。 它还提供了 C7x-MMA 利用率的详细信息。
请告诉我这是否解答了您的问题。
此致、
Qutaiba
尊敬的 Qutaiba:
为了进行鉴定、我们希望 C7x 上的 CPU 使用率接近100%、以确保在 EMI 测试期间注意到 C7x 产生的任何电磁干扰。 我真的不关心这是通过使用 TPU 还是仅使用 DSP 实现的、只要它在一段时间内尽可能努力/快速地工作即可。 它是一种仅用于鉴定而不是用于通用用途的特殊软件。
这可以通过更换 Linux 上 C7x 的固件实现吗? 如果我可以为 C7x 加载替代固件、以在其运行时尽快执行一些计算、这将是理想选择。
我们将在 C7x 上以850 MHz 运行、A53的最高运行频率为1.25 GHz
此致、
Bas Vermeulen
嗨、Bas、
为了确保 C7x 的完整和连续应力、我们准备了一个内核、可在 MMA 上执行矩阵乘法、并在无限循环中将其调用。 内核的二进制文件如下: /cfs-file/__key/communityserver-discussions-components-files/791/MMALIB_5F00_LINALG_5F00_matrixMatrixMultiply_5F00_ixX_5F00_ixX_5F00_oxX_5F00_C7504_5F00_tc151_5F00_linux.out
该内核在 C7x 上的裸机上运行。 当 Linux 在 A53内核上运行时、您可以将其加载到 C7x 中。 只要不从 Linux 调用 C7x (即运行 AI 推理或运行 perf_stats)、这就应该没问题。
您将需要使用 CCS 在 AM62A 上加载和运行内核。 以下是 CCS 的安装说明: https://software-dl.ti.com/mcu-plus-sdk/esd/AM62AX/10_01_00_33/exports/docs/api_guide_am62ax/CCS_SETUP_PAGE.html。以下是连接 C7x、加载和运行内核的说明: https://software-dl.ti.com/mcu-plus-sdk/esd/AM62AX/10_01_00_33/exports/docs/api_guide_am62ax/CCS_LAUNCH_PAGE.html。
内核运行时、控制台上仅打印性能表的标题。 这是预料之中的、因为内核进入了无限的状态、而性能值从未计算过。
如果需要帮助、请告诉我。
此致、
Qutaiba
刚刚跟我的硬件工程师说过。 我们需要可以使用 Linux 或 u-boot 中的 remoteproc 接口将某个文件加载到 C7x 中。 使用 CCS 向电路板加载某些器件是不可行的、因为这意味着将电线焊接到 JTAG 接口、加载软件、在测试期间针对每个下电上电周期运行。 该测试将包括其中的多个。
因此、如果可以使用 Linux 或 u-boot 加载此类固件、那就很理想了。
这是可能的吗?
此致、
Bas Vermeulen