工具与软件:
我们一直在对产品板进行一些引导可靠性测试。 该电路板基于其中一个 TW 演示板、我们准确提升了 CPU/SDRAM 设计和布线。 我们已在 u-boot 中打开了看门狗、但我们看到 HMI 未成功启动大约1:10,000次。 我将在下周尝试载入内核符号并把 mtest 添加到 uboot 构建和测试存储器中。 感谢您的任何见解或帮助。
两个故障示例:
地址往往不一致。
下面举一个例子:
1.492075]8<--剪切这里--
[1.495161]无法处理虚拟地址00000070处的内核 NULL 指针解除引用
[ 1.503290] PgD = 428bcacc
[ 1.506005][00000070]* PgD=00000000
[ 1.509606]内部错误:Oops:8000000005 [#1]抢占 ARM
[ 1.515200]中链接的模块:
[1.518274] CPU: 0 PID: 55 Comm: kthreadd not patried 5.10.65-gdcc6bedb2c #1
[ 1.525350]硬件名称:通用 AM43 (平展设备树)
[1.531292] PC 出现0x00000070
[ 1.534442] lr 位于0xc088bc70
[ 1.537593] PC:[<00000070>] lr:[ ] PSR:00000093
[1.543884] sp : c1a21f10 ip : 00000000 fp : c1a21f64
[ 1.549127] R10:c1a1bed0 R9:00000000 R8:00000000
[1.554371] r7:00000000 r6:c0d630 r5:c0d140 r4:c11e8640
[ 1.560923] r3 : 00000072 r2 : 00000009 r1 : c11e8640 r0 : c0d140
[ 1.567478]标志:nzcv IRQ 关闭模式 SVC_32 ISA ARM 段无上的 FIQ
[ 1.574729]控制:10c53c7d 表:80004059 DAC:00000051
[ 1.580496]进程 kthreadd (pid:55、堆栈限制= 0x52)
另一个例子是:
正在启动内核...
[ 0.000000]错误:进程交换 Pfn:8dee3中的页面状态错误
[ 0.001545]警告:您的"console=ttyO0"已替换为"ttyS0"
[ 0.001558]这可以确保您仍能看到内核消息。 幻灯片
[ 0.001563]更新内核命令行。
[ 1.272834] debugfs:已存在父级"dmaengine"的目录"49000000.dma"!
[ 1.365991]错误:在内核模式下发出 FP 指令、禁用 FP 单元
[ 1.372996] FPEXC = 0x00000000
[ 1.376155]内部错误:Oops -未定义指令:0 [#1]抢占 ARM
[ 1.383234]中链接的模块:
[ 1.386311] CPU:0 PID:1 Comm:swapper 污染:G B W 5.10.65- gdcc6bedb2c #1
[ 1.394609]硬件名称:一般 AM43 (平展设备树)
[ 1.400552] PC 位于0xFF92f2a2
[ 1.403702] LR 位于0xF8ef2a0
[ 1.406855] PC:[ ] LR :[ ] PSR:a0000033
[1.413145] sp : c108deb8 ip : c13f4940 fp : c0b39830
[1.418389] R10:c0b39850 R9:000000c1 R8:00000000
[1.423632] r7 : c0c92344 r6 : ffffffff r5 : 00000001 r4 : c13e5400
[ 1.430185] r3 : c13f4900 r2 : ffff8ad0 r1 : 00000000 r0 : c13f4900
[1.436740]标志:模式 SVC_32 ISA Thumb 段无时 FIQ 上的 NzCv IRQ
[ 1.444079]控制:10c53c7d 表:80004059 DAC:00000051
[ 1.449848]进程开关(pid:1、堆栈限制= 0x (ptrval))
[ 1.455704]堆栈:(0xc108deb8至0xc108e000)
[1.460079] deeA0:c13f4700 c0c92348