This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TDA4VM:在尝试使用 TDA4VM SOC 在 J721E EVM 上引导 PSDK Linux + RTOS 时卡在引导循环中

Guru**** 1980945 points
Other Parts Discussed in Thread: TDA4VM
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1257323/tda4vm-stuck-in-a-boot-loop-while-trying-to-boot-psdk-linux-rtos-on-j721e-evm-with-tda4vm-soc

器件型号:TDA4VM

在尝试使用 PSDK Linux + RTOS 指南执行新的 SD 卡准备时、我会被卡住在循环的 Uboot 屏幕上。

最初、我会为视觉应用构建 PSDK RTOS、并编写了包含 Linux 图像和视觉应用可执行文件和数据集的 SD 卡。 我仍然卡在引导环路中。

 尝试使用 PSDK Linux SK-TDA4M 进行刷写后(08.06.01.03)、我们可以引导、但使用这些日志

Fullscreen
1
2
3
4
5
6
7
8
k3_r5f_rproc r5f@41000000: Core 1 is already in use. No rproc commands work
k3_r5f_rproc r5f@41400000: Core 2 is already in use. No rproc commands work
Load Remote Processor 3 with data@addr=0x82000000 302028 bytes: Success!
Failed to load '/lib/firmware/j7-main-r5f1_0-fw'
Failed to load '/lib/firmware/j7-main-r5f1_1-fw'
remoteproc remoteproc7: Direct firmware load for j7-main-r5f1_1-fw failed with error -2
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

在运行 edgeai-tidl-tools 推理脚本(https://github.com/TexasInstruments/edgeai-tidl-tools#benchmark-on-ti-soc)时,我们再次进入引导循环一段时间,使用 remoteproc6和 remoteproc7获得相同的错误:

Fullscreen
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
[ 10.095217] remoteproc remoteproc6: 5e00000.r5f is available
[ 10.107625] remoteproc remoteproc6: loading /lib/firmware/j7-main-r5f1_0-fw failed with error -22
[ 10.108465] platform 5f00000.r5f: configured R5F for remoteproc mode
[ 10.122862] remoteproc remoteproc6: Direct firmware load for j7-main-r5f1_0-fw failed with error -22
[ 10.122870] remoteproc remoteproc6: powering up 5e00000.r5f
[ 10.137606] remoteproc remoteproc6: loading /lib/firmware/j7-main-r5f1_0-fw failed with error -22
[ 10.146519] remoteproc remoteproc6: Direct firmware load for j7-main-r5f1_0-fw failed with error -22
[ 10.155685] remoteproc remoteproc6: request_firmware failed: -22
[ 10.256142] platform 5f00000.r5f: assigned reserved memory node vision-apps-r5f-dma-memory@a7000000
[ 10.352360] remoteproc remoteproc7: 5f00000.r5f is available
[ 10.405439] remoteproc remoteproc7: loading /lib/firmware/j7-main-r5f1_1-fw failed with error -22
[ 10.417266] remoteproc remoteproc7: Direct firmware load for j7-main-r5f1_1-fw failed with error -22
[ 10.433147] remoteproc remoteproc7: powering up 5f00000.r5f
[ 10.442698] remoteproc remoteproc7: loading /lib/firmware/j7-main-r5f1_1-fw failed with error -22
[ 10.458334] remoteproc remoteproc7: Direct firmware load for j7-main-r5f1_1-fw failed with error -22
[ 10.473596] remoteproc remoteproc7: request_firmware failed: -22
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

当手动尝试使用 echo start >/sys/class/remoteproc/remoteproc6/state 启动 R5内核时,会出现以下错误:

Fullscreen
1
2
3
4
5
6
root@j7-evm:~# echo start > /sys/class/remoteproc/remoteproc6/state
[ 301.632594] remoteproc remoteproc6: powering up 5e00000.r5f
[ 301.638198] remoteproc remoteproc6: loading /lib/firmware/j7-main-r5f1_0-fw failed with error -22
[ 301.647062] remoteproc remoteproc6: Direct firmware load for j7-main-r5f1_0-fw failed with error -22
[ 301.656189] remoteproc remoteproc6: request_firmware failed: -22
[ 301.662187] remoteproc remoteproc6: Boot failed: -22
XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX

我不知道如何克服这些错误、是否有人告诉我如何解决此问题。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Vaibhav、

    您能否确认您使用的是 TDA4VM EVM 还是 SK?

    如果是 TDA4VM EVM、您能否按照以下用户指南来创建可引导 SD 卡?

    https://software-dl.ti.com/jacinto7/esd/processor-sdk-rtos-jacinto7/08_06_00_12/exports/docs/vision_apps/docs/user_guide/BUILD_AND_RUN.html

    此致、

    尼基尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Nikhil:

    感谢您的回答。 我们正在使用 TDA4VM 电路板、我们也曾尝试使用 PSDK Linux + RTOS 安装、无论是在构建后还是使用网站上提供的预编译文件。  

    我们将再次给它一个快照、但是这些错误似乎出现了、有时即使出现了这些错误、电路板也会启动。  

    当我们运行视觉应用演示应用时、不会遇到错误、但一旦我们在从主机系统复制已编译的工件后执行深度学习推理脚本(onnxrt_ep.py)( github.com/.../custom_model_evaluation.md)、应用程序崩溃并且电路板进入引导环路  

    当我们尝试仅使用 PSDK Linux 进行引导时、不会出现这些错误。

    能否指出、无论哪个评估板正常运行、这些错误是否会出现? 此外、当我们遇到此类错误时、我们可以选择哪些故障排除步骤。

    此致、

    韦巴哈夫·卡塞拉

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Vaibhav、

    让我们缩小问题的范围。

    我们正在使用 soc 主板,并且我们曾尝试过安装 PSDK Linux+RTOS,这两种情况在构建后和使用其网站中提供的预编译文件时均适用。  [/报价]

    首先、在 TDA4VM 电路板中、您是指 EVM、对吧? 如果是、您是否在构建和准备 SD 卡时执行了以下步骤?

    Vision Apps 用户指南:运行说明

    如果是、那么我可以知道您在这里遇到了什么问题吗? 您能否共享此特定日志?

    当我们运行视觉应用程序演示应用程序时,我们不会遇到错误,但一旦我们从主机系统复制编译的工件后执行深度学习推理脚本(onnxrt_ep.py)( github.com/.../custom_model_evaluation.md),应用程序崩溃并且电路板进入引导循环[/ quot]

    如果在准备 SD 卡时没有问题、并且您能够以"root"身份登录、那么您可以在登录后简要说明您在此处执行的步骤吗?

    此致、

    尼基尔

    [/quote]
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Nikhil:

    是的、我认为我在使用 EVM。 我已按照用户指南中的所有步骤准备 SD 卡。 就在 SD 卡准备就绪后、我们通常能够在大多数时间启动。 我们能够以 root 身份登录。

    登录后、我们使用 ONNX RT 框架为特定模型(yolov3/v5s)运行推理脚本、该脚本有时会运行、但在大多数情况下、我们观察到程序会在运行脚本前崩溃几秒钟、 然后电路板回到引导阶段(Uboot SPL 屏幕)。 在此之后、我们卡在引导环路中、此问题有时通过循环粉末并将 ENV 设置为默认值或通过刷写 SD 卡来修复。

    我们的主要问题是我们在运行推理脚本时遇到的崩溃。 推理脚本有时会运行、因此我们不认为脚本是问题、但运行不一致是问题所在。

    此致、
    韦巴哈夫·卡塞拉

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    您能否确认您看到的推理行为与其他模型相同?
    您可以尝试 Model Zoo 中的标准支持模型、尝试运行这些预编译的模型工件并让我们了解其行为。

    这将缩小范围、从硬件特定问题(我很少看到)或自定义模型编译相关问题。

    另外、如果模型推理失败、请分享详细日志、其中显示已执行命令。

    请详细说明您的实验设置、您是否在其中添加了任何更改? 您修改了哪些文件 ETC、还与模型 onnx 文件共享您的模型编译流程方法。

    此致、

    普拉蒂克

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Pratik、您好!

    现在、我们已经在电路板上测试了 Yolov3和 Yolov5s TI Lite。 经过几次电源循环后、Yolov5s 目前似乎运行良好、但 Yolov3仍进入引导循环。 我们尚未对模型进行任何更改、在查看推荐的分支后、仅运行 edgeai-tidl-tools 库中提供的推理脚本。

    至于推理失败的日志、我们实际上无法显示任何日志、主要是因为系统在推理脚本运行时直接重新启动。 推理不会出错然后退出、它只是自发地转到 SPL 引导屏幕。

     

    这是运行 Yolo v3时重新启动的示例。

    以下是我们尝试运行的型号、但有以下问题:

    yolov3_d53_416x416_20210116_model.onnx - modelzoo
    yolov5s6_640_ti_lite_37p4_56p0.onnx - edgeai 超透镜(github.com/.../edgeai-yolov5)

    如果我们可以分享任何其他信息来协助诊断、请告知我们。
    此致、
    韦巴哈夫·卡塞拉

x 出现错误。请重试或与管理员联系。