This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM5748:内核崩溃和根本原因

Guru**** 657930 points
Other Parts Discussed in Thread: AM5748
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1248019/am5748-kernel-crash-and-root-cause

器件型号:AM5748

您好、TI 团队、

我们将使用 AM5748 Linux SDK 软件包(5.0.0.15)。 我们将 Linux 用户空间应用程序长期运行。 有时我们会观察到内核崩溃。

我们尝试检查内核日志、但无法确定根本原因。  

是否有办法分析内核崩溃并找出根本原因?

测试日志1:

4月26日00:02:20 [408655.846906]警告:CPU:0 PID:1262 at mm/truncate.c:311 truncate_inode_page_range+0x284/0x610
4月26日00:02:20 [408655.856107]链接模块:rpmsg_proto ti_prueth pruu_rproc pruss_intc pruss_soc_bus omap_remotecrypto Remoteproc XT_conntrack IPT_masquerade nf_NAT_masquerade_rpxfrm_user
4月26日00:02:20 [408655.897877] CPU:0 PID:1262 Comm:NGBCPController not amised 4.14.40-g4796173fc5 #4
4月26日00:02:20 [408655.905830]硬件名称:通用 DRA74X (平展设备树)
4月26日00:02:20 [408655.912036]反向:  
Apr 26 00:02:20 [408655.914591][ ](dump_backtrace),来自[ ](show_stack+0x18/0x1c)
APR 26 00:02:20 [408655.922282] r7:00000009 R6:600f0013 R5:00000000 R4:c0e39b44
4月26日00:02:20 [408655.928062][ ](show_stack)从[ ](dump_stack+0x90/0xa4)
4月26日00:02:20 [408655.935410][ ](dump_stack),来自[ ](__warn+0xec/0x104)
APR 26 00:02:20 [408655.942490] r7:00000009 R6:c0b35ab8 R5:00000000 R4:00000000
Apr 26 00:02:20 [408655.948267][ ](__WARN)从[ ](WARN_SLOPPATH_null + 0x28/0x30)
APR 26 00:02:20 [408655.955957] R9:efcdeac R8:00000a86 r7:eb59764 R6:ecab7d28 R5:ecab7d60 R4:ffffffffff
4月26日00:02:20 [408655.963827][ ](warn_sleppath_null)来自[ ](trunce_inode_pages_range+0x284/0x610)
Apr 26 00:02:20 [408655.973439][ ](trunce_inode_pages_range)来自[ ](trunce_inode_pages_final+0x64/0x6c)
4月26 00:02:20 [408655.98352] R10:ed29f5d8 R9:00000001 R8:00080060 r7:c0a11bfc R6:00000000 R5:eb597770
4月26日00:02:20 [408655.991520] R4:eb59764
Apr 26 00:02:20 [408655.994158][ ](trunce_inode_pages_final)从[ ](ext4_evict_inode+0x104/0x3e8)
4月26日00:02:20 [408656.003591] R5:eb59772c R4:eb59670
Apr 26 00:02:20 [408656.007273][ ](ext4_evict_inode )从[ ](逐出+0xa0/0x168)
Apr 26 00:02 :20 [408656.014788] r7:c0a11bfc r6:c0a11bfc r5:eb5972c r4:eb59670
Apr 26 00:02:20 [408656.020561][ ](逐出)从[ ](iput+0x13c/0x1c4)
Apr 26 00:02 :20 [408656.027117] r7:c0a11bfc r6:eb5976c8 r5:eb597670 r4:edcfc400
4月26日00:02:20 [408656.032892][ ](输入)从[ ](dentry_unlink_inode+0x10c/0x154)
4月26日00:02:20 [408656.040669] r7:00080040 R6:eb5111e8 R5:eb59670 R4:eb511198
4月26日00:02:20 [408656.046443][ ](dentry_unlink_inode)从[ ](__dentry_kill+0xd4/0x180)
4月26日00:02:20 [408656.054915] R5:ed29f5d8 R4:eb511198
Apr 26 00:02:20 [408656.058594][ ](__dentry_kill)来自[ ](dput.part.5+0x190/0x2ac)
APR 26 00:02:20 [408656.066456] r7:00080040 R6:eb5111e8 R5:c0b39274 R4:ed29f5d8
Apr 26 00:02:20 [408656.072228][ ](dput.part.5)来自[ ](dput+0x18/0x1c)
4月26 00:02:20 [408656.079134] R10:00000000 R9:00000000 R8:ecab7f40 r7:00000000 R6:ec627908 R5:eb511198
4月26日00:02:20 [408656.087083] R4:ecab7f50
4月26日00:02:20 [408656.089716][ ](输出)从[ ](sys_renameat2+0x3a0/0x4cc)
Apr 26 00:02:20 [408656.096973][ ](sys_renameat2) ](sys_rename + 0x2C/0x34)
4月26 00:02:20 [408656.104576] R10:00000000 R9:ecab6000 R8:c0207e64 r7:00000026 R6:00000001 R5:b69d8030
4月26日00:02:20 [408656.112525] R4:00000002
Apr 26 00:02:20 [408656.115161][ ](sys_rename)从[ ](RET_FAST_SYSCAL+0x0/0x4c)
4月26日00:02:20 [408656.126072]--[结束轨迹 b79652cad6710355 ]-

测试日志2:

五月28 00:56:04 [474291.717281] systemd-shutdown[1]:卸载/tmp。
五月28 00:56:04 [474291.780398] systemd-shutdown[1]:重新安装"/"只读,选项为"data=orded"。
5月28 00:56:04 [474291.821169] EXT4-FS (mmcblk2p2):重新安装。 opts:数据=有序
五月28 00:56:04 [474291.872488] systemd-shutdown[1]:重新安装"/"只读,选项为"data=orded"。
5月28 00:56:04 [474291.880682] EXT4-FS (mmcblk2p2):重新安装。 opts:数据=有序
五月28 00:56:04 [474291.886739] systemd-shutdown [1]:重新安装"/"只读,选项为"data=orded"。
5月28 00:56:04 [474291.894881] EXT4-FS (mmcblk2p2):重新安装。 opts:数据=有序
五月28 00:56:04 [474291.900971] systemd-shutdown[1]:所有文件系统均已卸载。
五月28 00:56:04 [474291.942942]无法处理虚拟地址0000002a 处的内核 NULL 指针解除引用
5月28 00:56:04 [474291.951188] PgD = ece9afc0
5月28 00:56:04 [474291.953992][0000002a]* PgD=add1c003、* PMD=00000000
5月28日00:56:04 [474291.959006]内部错误:Oops:206[#1]抢占 SMP ARM
5月28日00:56:04 [474291.964601]模块链接如下:rpmsg_proto ti_prueth pruus_rproc pruss_intc pruss_soc_bus omap_remoteproc remoteproc XT_conntrack IPT_masquerade nf_nat_
五月28 00:56:04 [474292.006020] CPU: 0 PID: 1 Comm : systemd-shutdow not damised 4.14.40-g4796173fc5 #4
5月28日00:56:04 [474292.013709]硬件名称:通用 DRA74X (平展设备树)
5月28日00:56:04 [474292.019914]任务:ee880000 task.stack:ee87e000
5月28 00:56:04 [474292.024557] PC 位于 kobject_get+0x18/0x70
5月28 00:56:04 [474292.028763] LR 处于 DEVICE_SHUTDOWN+0xac/0x218
May 2800:56:04 [474292.033399] PC :[ ]   lr :[ ]   PSR:200b0013
五月28 00:56:04 [474292.039779] sp : ee87fe00 ip : ee87fe20 fp: ee87fe1c
May 28 00:56:04 [474292.045111] R10:edc1000c R9 :c0b5b7d4 R8:c0e3e020
五月28 00:56:04 [474292.050444] r7:edc1b434 r6:c0e7ab64 R5:edc10000 r4: 0000000a
五月28 00:56:04 [474292.057084] r3:c0e2c81c r2:000004f3 r1:00000000 r0:0000000a
五月28 00:56:04 [474292.063727]标志: nzCv IRQ 上 FIQ 上 模式 SVC_32 ISA ARM 段用户
五月28 00:56:04 [474292.070978]控件:30c5387d 表:ace9afc0 DAC:fffffffd
五月28 00:56:04 [474292.076834] Process systemd-shutdow (pid:1、stack limit = 0xee87e210)
5月28 00:56:04 [474292.083475]堆栈:(0xee87fe00至0xee880000)
5月28 00:56:04 [474292.087939] fe00:ee3f0078 ee3f0078 edc1b400 00000002 ee87fe54 ee87fe20 c0627224 c0816904
May 28 00:56:04 [474292.096238] fe20:ee87fe54 c0b5b7c4 c0249ebc 00000000 01234567 c0e162c8 64874200 fee1dead
五月28 00:56:04 [474292.104538] fe40:ee87e000 00000000 ee87fe64 ee87fe58 c024af60 c0627184 ee87fe7c ee87fe68
五月28 00:56:04 [474292.112838] fe60:c024b040 c024af30 00000000 01234567 ee87ffa4 ee87fe80 c024b300 c024b038
May 28 00:56:04 [474292.121138] fe80: 00000024 00000002 beac72dc 00000005 ee87fecc ee87flu0 c033bffc c037db3c
五月28 00:56:04 [474292.129437] FE0:00000000 00000000 edb19d80 edb19d80 00000024 ee87fee0 ee87ff60 00000000
五月28 00:56:04 [474292.137736] fec0:ee87ff54 ee87fed0 c033c15c c032a970 ee87fedc ee87fee0 00000a0f 00000000
5月28 00:56:04 [474292.146037] fee0:00000001 00000000 00000024 ee87fef8 00000005 ee87ff00 beac72a0 00000004
5月28 00:56:04 [474292.154337] ff00:beac7f70 00000010 beac72b4 00000005 beac736c 0000000a b6f3e628 000001
五月28 00:56:04 [474292.162636] ff20:fff000 c0207e64 ee87ff4c ee87ff38 ee87ff54 ee87ff40 edb19d80 edb19d80
May 28 00:56:04 [474292.170935] ff40:00000000 00000000 ee87ff94 ee87ff58 c033c1d8 c033c0dc 00000000 00020000
五月28 00:56:04 [474292.179235] ff60:00000000 00000000 ee87ff94 00000000 beac736c b6fa4290 00000092 c0207e64
五月28 00:56:04 [474292.187535] ff80:ee87e000 00000000 00000000 00000000 00000058 c0207e64 00000000 ee87ffa8
五月28 00:56:04 [474292.195834] ffa0:c0207c80 c024b20c 00000000 fee1dead 28121969 01234567 64874200
五月28 00:56:04 [474292.204134] ffc0:00000000 00000000 00000058 fff000 beac7e74 004e6428 00000000
五月28 00:56:04 [474292.212433] ffe0: 00000058 beac7bac b6d76ad5 b6cfe7e6 600b0030 fee1dead ffffffff ffffffffffff
5月28 00:56:04 [474292.220729]反向跟踪:  
5月28日00:56:04 [474292.223282][ ](kobject_get)来自[ ](DEVICE_SHUTDOWN+0xac/0x218)
5月28日00:56:04 [474292.231230] R4:00000002
五月二十八日00:56:04 [474292.233866][ ](device_shutdown)从[ ](kernel_Restart_Prepare+0x3c/0x40)
五月28 00:56:04 [474292.242692] R10:00000000 R9:ee87e000 R8:fee1dead r7:64874200 R6:c0e162c8 R5:01234567
5月28日00:56:04 [474292.250639] R4:00000000
5月28日00:56:04 [474292.253273][ ](kernel_reset_preparate)从[ ](kernel_restart + 0x14/0x58)
五月二十八日00:56:04 [474292.262011][ ](kernel_restart)从[ ](sys_reboot+0x100/0x1dc)
5月28 00:56:04 [474292.269873] R5:01234567 R4:00000000
五月二十八日00:56:04 [474292.273555][ ](sys_reboot),从[ ](RET_FAST_SYSCAL+0x0/0x4c)
MAY 28 00:56:04 [474292.281332] R8:c0207e64 r7:00000058 R6:00000000 R5:00000000 R4:00000000
五月28 00:56:04 [474292.288149]代码:e24cb004 e24dd00c e2504000 0a000009 (e5d43020)  
May 28 00:56:04 [474292.294404]--[结束迹线17898ac926dc02c8 ]--
五月28 00:56:04 [474292.299162]注:systemd-shutdow[1]因 preempt_count 1而退出
5月28日00:56:04 [474292.308334]系统关闭:7条输出线路因限制而被抑制
五月28 00:56:04 [474292.315407]内核严重错误-未同步:试图杀死 init! exitcode=0x0000000b
5月28日00:56:04 [474292.315407]  
五月28 00:56:04 [474292.324770]--[结束内核紧急-未同步:试图杀死 init! exitcode=0x0000000b
5月28日00:56:04 [474292.324770]

谢谢

Uthayakumar R H

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Uthayakumar:

    它是在定制电路板还是 TI 电路板上?

    发生频率是多少?

    失败时您正在运行什么程序?

    一致性是否一致?

     导致崩溃的原因似乎是内存管理子系统、即 TI 未涉及的标准 Linux 内核内存代码。

    我的建议是迁移到最新的稳定版本、然后查看问题是否仍然存在。

    此致、

    若苏厄