This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] J784S4XEVM:使用 Yocto 生成的映像上出现内核错误 (PROCESSOR-SDK-scarthgap-11.00.09.04-config.txt)

Guru**** 2416110 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1530101/j784s4xevm-kernel-panic-on-image-generated-with-yocto-processor-sdk-scarthgap-11-00-09-04-config-txt

器件型号:J784S4XEVM

工具/软件:

信息:  

平台: J784S4XG01EVM

启动模式: TFTP/NFS

图片: 使用 processor-sdk-scarthgap-11.00.09.04-config.txt 文件进行 Yocto 构建

主持人:  Ubuntu 22.04.5

Docker 映像: ghcr.io/texasInstruments/ubuntu-distro:最新(提交哈希值:7047cf3)  

问题:

从 Yocto 配置文件“processor-sdk-scarthgap-10.01.10.04-config.txt"迁移“迁移到“processor-sdk-scarthgap-11.00.09.04-config.txt"后“后、我们有时会在启动阶段遇到内核脉冲。 很难捕获、发生在%5-10 的速率下。 我们从不会在之前的配置文件中遇到此问题。 所有其他型号都相同(我们的层,电路板,Docker 映像,引导模式等)。 我将供您使用的内核日志附加到 review.e2e.ti.com/.../kernel_5F00_panic.loge2e.ti.com/.../kernel_5F00_panic2.log

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    内核错误是否每次都发生在同一个位置、或者是否有所不同?

    这是在热复位还是仅在冷复位时发生?

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、

    出现这种情况时、时间戳值似乎几乎相同(~13 秒)。

    上述两个示例日志文件取自两个不同的会话、内核错误时间几乎相同。

    我确信我在热复位中看到了这种情况、但在冷复位中不确定。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    您正在构建哪个图像?

    我将在我的最后看到我是否可以复制您的问题

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、
    有关 Yocto 映像构建过程的信息位于问题说明中。 (信息部分)
    谢谢

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    我看到您使用的配置、但我看不到 您构建的映像。

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、
    我正在构建“tisdk-default-image"。“。
    谢谢

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    我会在我这边看到是否可以重现问题、但在这中间、您可以尝试使用 PROCESSOR-SDK-LINUX 配置吗?

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、

    我寻找了一个与“ti-processor-sdk-linux-adas-j784s4-evm-11_00_00_08"版本“版本最匹配的配置文件。 由于“processor-sdk-scarthgap-11.00.09.04-config.txt"是“是唯一具有版本 11 的版本、因此我使用了该版本。 据我所见、PROCESSOR-SDK-LINUX 中的最新配置是“PROCESSOR-SDK-LINUX-10_01_08_01.txt"。“。 您能否确认? 如果您引导我生成一个 11 版本的 PROCESSOR-SDK-LINUX 文件、我可以使用这个文件。

    谢谢

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    抱歉、我看到目前没有 11.0 配置;我假设会有。 我问道、因为这是存储 J7 版本配置的位置。 Sitara 版本配置存储在 PROCESSOR-SDK 目录中。

    目前、我不断使用使用 PROCESSOR-SDK 配置生成的 tisdk-default-image 重新启动电路板、如果我看到您的内核严重问题、我将报告这个问题。

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    我无法重新创建 SD 卡问题。 我现在正在尝试将 NFS 用于 rootfs。

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Gokhan

    我在 89 次重新启动后看到内核严重错误。 但是、这似乎是一个与您不同的问题。

    [    8.747506] platform 5900000.r5f: assigned reserved memory node r5f-dma-memory@a6000000
    [    8.754320] k3-dsp-rproc 65800000.dsp: configured DSP for IPC-only mode
    [    8.766233] remoteproc remoteproc4: 5900000.r5f is available
    [    8.767470] remoteproc remoteproc5: 65800000.dsp is available
    [    8.772614] remoteproc remoteproc4: attaching to 5900000.r5f
    [    8.781066] remoteproc remoteproc5: attaching to 65800000.dsp
    [    8.784179] cdns-ufshcd 4e84000.ufs: ufshcd_populate_vreg: Unable to find vdd-hba-supply regulator, assuming enabled
    [    8.784188] cdns-ufshcd 4e84000.ufs: ufshcd_populate_vreg: Unable to find vcc-supply regulator, assuming enabled
    [    8.784192] cdns-ufshcd 4e84000.ufs: ufshcd_populate_vreg: Unable to find vccq-supply regulator, assuming enabled
    [    8.784195] cdns-ufshcd 4e84000.ufs: ufshcd_populate_vreg: Unable to find vccq2-supply regulator, assuming enabled
    [    8.789407] rproc-virtio rproc-virtio.12.auto: assigned reserved memory node r5f-dma-memory@a6000000
    [    8.795930] remoteproc remoteproc5: unsupported resource 65538
    [    8.800266] SError Interrupt on CPU0, code 0x00000000bf000002 -- SError
    [    8.800280] CPU: 0 UID: 0 PID: 270 Comm: (udev-worker) Tainted: G           O       6.12.17-ti-00771-gc85877d40f8e #1
    [    8.800286] Tainted: [O]=OOT_MODULE
    [    8.800288] Hardware name: Texas Instruments J784S4 EVM (DT)
    [    8.800291] pstate: 800000c5 (Nzcv daIF -PAN -UAO -TCO -DIT -SSBS BTYPE=--)
    [    8.800295] pc : _raw_spin_unlock+0x18/0x40
    [    8.800311] lr : handle_level_irq+0xe0/0x1a8
    [    8.800317] sp : ffff800080003f20
    [    8.800319] x29: ffff800080003f20 x28: ffff00080657e300 x27: 0000000000000000
    [    8.800326] x26: ffff000f0bf04300 x25: ffff000802f82400 x24: 0000000000000001
    [    8.800331] x23: ffff000802f8f030 x22: ffff00080354f800 x21: ffff0008035934ac
    [    8.800336] x20: ffff000803593430 x19: ffff000803593400 x18: 0000000000000000
    [    8.800341] x17: ffff800e8acef000 x16: ffff800080000000 x15: 00625a979c4a22e0
    [    8.800345] x14: 000089ac96b76c64 x13: 000000000000007c x12: 000000000000007c
    [    8.800350] x11: 0000000000000040 x10: ffff00080354f8b0 x9 : ffff00080354f8a8
    [    8.800355] x8 : ffff000f0bf00f58 x7 : a35bcd24d4973214 x6 : ffffffffffffffe0
    [    8.800359] x5 : ffff00080150a480 x4 : 0000000000000000 x3 : ffffffffffffffe0
    [    8.800364] x2 : ffff800083a00000 x1 : ffff00080657e300 x0 : 0000000000010001
    [    8.800370] Kernel panic - not syncing: Asynchronous SError Interrupt
    [    8.800372] CPU: 0 UID: 0 PID: 270 Comm: (udev-worker) Tainted: G           O       6.12.17-ti-00771-gc85877d40f8e #1
    [    8.800377] Tainted: [O]=OOT_MODULE
    [    8.800378] Hardware name: Texas Instruments J784S4 EVM (DT)
    [    8.800381] Call trace:
    [    8.800382]  dump_backtrace+0x90/0xe8
    [    8.800392]  show_stack+0x18/0x24
    [    8.800396]  dump_stack_lvl+0x34/0x8c
    [    8.800402]  dump_stack+0x18/0x24
    [    8.800405]  panic+0x390/0x3a4
    [    8.800412]  nmi_panic+0x40/0x8c
    [    8.800416]  arm64_serror_panic+0x64/0x70
    [    8.800421]  do_serror+0x3c/0x70
    [    8.800426]  el1h_64_error_handler+0x30/0x48
    [    8.800432]  el1h_64_error+0x64/0x68
    [    8.800434]  _raw_spin_unlock+0x18/0x40
    [    8.800438]  handle_irq_desc+0x40/0x58
    [    8.800443]  generic_handle_domain_irq+0x1c/0x28
    [    8.800447]  ti_sci_inta_irq_handler+0x7c/0x128
    [    8.800455]  handle_irq_desc+0x40/0x58
    [    8.800459]  generic_handle_domain_irq+0x1c/0x28
    [    8.800462]  gic_handle_irq+0x54/0xd0
    [    8.800465]  call_on_irq_stack+0x24/0x4c
    [    8.800469]  do_interrupt_handler+0x80/0x8c
    [    8.800473]  el1_interrupt+0x34/0x68
    [    8.800477]  el1h_64_irq_handler+0x18/0x24
    [    8.800481]  el1h_64_irq+0x64/0x68
    [    8.800483]  smp_call_function_many_cond+0x150/0x3c0
    [    8.800488]  kick_all_cpus_sync+0x44/0x70
    [    8.800491]  load_module+0x1750/0x1d8c
    [    8.800499]  init_module_from_file+0x88/0xcc
    [    8.800503]  __arm64_sys_finit_module+0x148/0x324
    [    8.800507]  invoke_syscall+0x48/0x10c
    [    8.800512]  el0_svc_common.constprop.0+0xc0/0xe0
    [    8.800516]  do_el0_svc+0x1c/0x28
    [    8.800520]  el0_svc+0x28/0x98
    [    8.800524]  el0t_64_sync_handler+0x120/0x12c
    [    8.800527]  el0t_64_sync+0x190/0x194
    [    8.800532] SMP: stopping secondary CPUs
    [    9.855535] SMP: failed to stop secondary CPUs 4
    [    9.855542] Kernel Offset: disabled
    [    9.855544] CPU features: 0x08,00002002,80200000,4200420b
    [    9.855547] Memory Limit: none
    [   10.220942] ---[ end Kernel panic - not syncing: Asynchronous SError Interrupt ]---

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、

    我将切换到 PROCESSOR-SDK-LINUX 目录中的版本 11 配置(如果可用)。 将来我会定期检查存储库。 对于我这边的内核紧急情况,我也会尝试缩小错误范围,也许启用一些内核调试配置,以便能够获取更多信息并与您共享它们。 我还将检查当我使用通过创建的预构建映像时是否出现此错误 create-sdcard.sh 提供的脚本 ti-processor-sdk-linux-adas-j784s4-evm-11_00_00_08 封装。 感谢您的耐心和努力尝试 89 重启:)  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    请告诉我您的结果是什么。 运行另一个测试后、它将重新启动 208 次(到目前为止)、因此我认为我无法重新创建您的问题。

    您的问题可能是由于 NFS 服务器和客户端之间的连接中断造成的?

    新注意:在我停止测试之前、主板重启了 482 次。

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、

    使用随创建的预编译映像运行  PROCESSOR-SDK-LINUX-ADAS-j784s4-EVM-11_00_00_08 (引导模式:sdcard)、我也无法重新创建问题。  
    可能有 2 种可能的问题:您建议的 Yocto 映像或 NFS 引导模式。  
    现在、我将尝试使用不带 NFS 的 Yocto 映像(从 sdcard 引导)来找出问题所在。 我会让你保持发布。

    谢谢

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Gokhan:

    您还可以 使用 NFS 测试 PROCESSOR-SDK-LINUX-ADAS-j784s4-EVM-11_00_00_08。 请告诉我您的实验结果。

    此致、
    Jared

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Jared、

    我测试了以下配置。

    不带 NFS 的 Yocto += 181 重新启动成功。

    Yocto + NFS = 32 次重新启动、直到发生内核错误。

    Processor SDK Linux + NFS = 76 会重新启动、直到 发生内核错误。

    此外、您和我之前检查了“Processor SDK Linux + without NFS“配置、没有看到内核错误。

    总之、正如您所指出的、这可能是一个 NFS 问题、“由于 NFS 服务器与客户端之间的连接中断“。  

    我不会进一步调试此问题、因为很难检测是由我们公司网络负责还是内核网络驱动程序/init 脚本等中存在问题 由于我们在开发阶段使用 NFS 工作流、因此我可以解决此问题。

    感谢您为我指明正确的方向和时间。

    此致

    Gokhan