This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM62A7-Q1:MEMTESTER 错误

Guru**** 1872900 points
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1367031/am62a7-q1-memtester-error

器件型号:AM62A7-Q1
主题中讨论的其他器件:SysConfig

工具与软件:

我们正在使用具有4GB DDR 的定制电路板上的 memtester。

运行 memtester 时、会出现错误和内核严重错误、如下所示。

是否有调试的意义?

Log_1:

root@am62axx-evm:~# memtester 3100M
memtester version 4.5.1 (64-bit)
Copyright (C) 2001-2020 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 3100MB (3250585600 bytes)
got  3100MB (3250585600 bytes), trying mlock ...locked.
Loop 1:
  Stuck Address       : ok         
  Random Value        : ok
  Compare XOR         : ok
  Compare SUB         : ok
  Compare MUL         : ok
  Compare DIV         : ok
  Compare OR          : ok
  Compare AND         : ok
  Sequential Increment: ok
  Solid Bits          : testing   0FAILURE: 0x00004000 != 0x00000000 at offset 0x00417b98.
FAILURE: 0x00004000 != 0x00000000 at offset 0x01f342d8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x020532d8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x020e22d8.
FAILURE: 0x00000000 != 0x00004000 at offset 0x021a8db8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x02287b88.
FAILURE: 0x00004000 != 0x00000000 at offset 0x0b927dd8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x110d7918.
FAILURE: 0x00004000 != 0x00000000 at offset 0x115b7df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x1ad902d8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x1db97df8.
FAILURE: 0x00000000 != 0x00004000 at offset 0x2d2b8df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x30e27b88.
FAILURE: 0x00000000 != 0x00004000 at offset 0x36278db8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x36467df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x36a57df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x3a1c06e8.
FAILURE: 0x00000000 != 0x00004000 at offset 0x3f797c28.
FAILURE: 0x00004000 != 0x00000000 at offset 0x42117b18.
FAILURE: 0x00004000 != 0x00000000 at offset 0x42627bc8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x42c97808.
FAILURE: 0x00000000 != 0x00004000 at offset 0x42e48df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x430e7bd8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x432502d8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x44977df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x45d57df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x49776df8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x519942e8.
FAILURE: 0x00004000 != 0x00000000 at offset 0x5e8c02d8.
  Block Sequential    : testing  36[  302.245275] Unable to handle kernel NULL pointer dereference at virtual address 00000000000000c0
[  302.254071] Mem abort info:
[  302.256861]   ESR = 0x0000000096000006
[  302.260602]   EC = 0x25: DABT (current EL), IL = 32 bits
[  302.265907]   SET = 0, FnV = 0
[  302.268953]   EA = 0, S1PTW = 0
[  302.272086]   FSC = 0x06: level 2 translation fault
[  302.276955] Data abort info:
[  302.279829]   ISV = 0, ISS = 0x00000006
[  302.283655]   CM = 0, WnR = 0
[  302.286615] user pgtable: 4k pages, 48-bit VAs, pgdp=000000088593e000
[  302.293044] [00000000000000c0] pgd=08000008859ac003, p4d=08000008859ac003, pud=08000008859ab003, pmd=0000000000000000
[  302.303649] Internal error: Oops: 0000000096000006 [#1] PREEMPT SMP
[  302.309907] Modules linked in: ipv6
[  302.313398] CPU: 3 PID: 0 Comm: swapper/3 Not tainted 6.1.46-g247b2535b2 #1
[  302.320349] Hardware name: Texas Instruments AM62A7 SK (DT)
[  302.325911] pstate: 600000c5 (nZCv daIF -PAN -UAO -TCO -DIT -SSBS BTYPE=--)
[  302.332862] pc : unregister_fair_sched_group+0x74/0x180
setting  37[  302.338091] lr : check_preempt_curr+0x4c/0x8c
[  302.344346] sp : ffff8000093e3e80
[  302.347648] x29: ffff8000093e3e80 x28: ffff0008001b0e40 x27: 0000000000000000
[  302.354784] x26: ffff0008001b0e40 x25: 0000000000000000 x24: 0000000000000000
[  302.361909] x23: 0000000000000000 x22: 00000000000000c0 x21: 0000000000000020
[  302.369034] x20: ffff000800efe3c0 x19: 0000000000000003 x18: 0000000000000000
[  302.376158] x17: ffff8008767ae000 x16: ffff8000093e0000 x15: 0000000000000400
[  302.383284] x14: 00000000000000be x13: 0000000000000000 x12: 0000000000000000
[  302.390408] x11: 0000000000000040 x10: 00000000000000db x9 : 0000000000000000
[  302.397535] x8 : ffff8008767ae000 x7 : 0000000000000003 x6 : 0000000000000007
[  302.404659] x5 : ffff800008f94e40 x4 : ffff800008f94d70 x3 : ffff8008767ae000
[  302.411783] x2 : ffff0008001b0e40 x1 : 0000000000000003 x0 : 0000000000000003
[  302.418915] Call trace:
[  302.421353]  unregister_fair_sched_group+0x74/0x180
[  302.426223]  check_preempt_curr+0x4c/0x8c
[  302.430227]  ttwu_do_wakeup.constprop.0+0x1c/0xa4
[  302.434926]  ttwu_do_activate.isra.0+0xb4/0xec
[  302.439361]  sched_ttwu_pending+0xa8/0x144
[  302.443451]  __flush_smp_call_function_queue+0xdc/0x254
[  302.448670]  generic_smp_call_function_single_interrupt+0x14/0x20
[  302.454753]  ipi_handler+0xac/0x150
[  302.458234]  handle_percpu_devid_irq+0x84/0x130
[  302.462762]  generic_handle_domain_irq+0x2c/0x44
[  302.467373]  gic_handle_irq+0x50/0x124
[  302.471124]  call_on_irq_stack+0x24/0x4c
[  302.475041]  do_interrupt_handler+0x80/0x8c
[  302.479217]  el1_interrupt+0x34/0x70
[  302.482792]  el1h_64_irq_handler+0x18/0x2c
[  302.486878]  el1h_64_irq+0x64/0x68
[  302.490270]  arch_cpu_idle+0x18/0x2c
[  302.493837]  default_idle_call+0x30/0x6c
[  302.497755]  do_idle+0x248/0x2c0
[  302.500977]  cpu_startup_entry+0x24/0x30
[  302.504891]  secondary_start_kernel+0x11c/0x140
[  302.509412]  __secondary_switched+0xb0/0xb4
[  302.513599] Code: 91050318 9134e339 9410e5bd aa0003f3 (b94002c1) 
[  302.519684] ---[ end trace 0000000000000000 ]---
[  302.524293] Kernel panic - not syncing: Oops: Fatal exception in interrupt
[  302.531156] SMP: stopping secondary CPUs
[  302.535074] Kernel Offset: disabled
[  302.538550] CPU features: 0x00000,00800084,0000420b
[  302.543416] Memory Limit: none
[  302.546461] ---[ end Kernel panic - not syncing: Oops: Fatal exception in interrupt ]---

Log_2:

root@am62axx-evm:~# memtester 3100M[   12.454615] platform regulator-3: deferred probe pending

memtester version 4.5.1 (64-bit)
Copyright (C) 2001-2020 Charles Cazabon.
Licensed under the GNU General Public License version 2 (only).

pagesize is 4096
pagesizemask is 0xfffffffffffff000
want 3100MB (3250585600 bytes)
got  3100MB (3250585600 bytes), trying mlock ...locked.
Loop 1:
  Stuck Address       : ok         
  Random Value        : ok
  Compare XOR         : ok
  Compare SUB         : ok
  Compare MUL         : ok
  Compare DIV         : ok
  Compare OR          : ok
  Compare AND         : ok
  Sequential Increment: ok
  Solid Bits          : testing  49FAILURE: 0x00004000 != 0x00000000 at offset 0x0dd54d60.
  Block Sequential    : testing 227[  913.084087] Internal error: Oops - Undefined instruction: 0000000002000000 [#1] PREEMPT SMP
[  913.092450] Modules linked in: ipv6
[  913.095946] CPU: 1 PID: 1 Comm: systemd Not tainted 6.1.46-g247b2535b2 #1
[  913.102726] Hardware name: Texas Instruments AM62A7 SK (DT)
[  913.108288] pstate: 20000005 (nzCv daif -PAN -UAO -TCO -DIT -SSBS BTYPE=--)
[  913.115240] pc : link_path_walk.part.0.constprop.0+0x98/0x3d0
[  913.120990] lr : path_openat+0xa4/0xe50
[  913.124823] sp : ffff80000940bb20
[  913.128131] x29: ffff80000940bb40 x28: ffff80000940bc50 x27: ffff000805941020
[  913.135262] x26: 0000000000000000 x25: 0000000000000000 x24: 0000000000000001
[  913.142391] x23: ffff80000940bc50 x22: ffff000800108000 x21: ffff000805941021
[  913.149522] x20: ffff80000940bd74 x19: 0000000005941020 x18: 0000000000000000
[  913.156652] x17: 0000000000000000 x16: 0000000000000000 x15: 0000000000000000
[  913.163781] x14: 0000000000000000 x13: 0000000000000000 x12: 0000000000000000
[  913.170911] x11: fefefefefefefeff x10: 0000fffffffffff8 x9 : 0000000000000000
[  913.178041] x8 : ffff0008035af900 x7 : 0000000000000000 x6 : 000000000000003f
[  913.185171] x5 : 0000000000000013 x4 : ffff000800108000 x3 : 0000000000000000
[  913.192301] x2 : 0000000000000000 x1 : ffff80000940bc50 x0 : 0000000000000070
[  913.199432] Call trace:
[  913.201873]  link_path_walk.part.0.constprop.0+0x98/0x3d0
[  913.207270]  path_openat+0xa4/0xe50
[  913.210756]  do_filp_open+0x84/0x134
[  913.214331]  do_sys_openat2+0xbc/0x174
[  913.218077]  __arm64_sys_openat+0x64/0xb0
[  913.222082]  invoke_syscall+0x48/0x114
[  913.225831]  el0_svc_common.constprop.0+0x44/0xfc
[  913.230533]  do_el0_svc+0x20/0x30
[  913.233847]  el0_svc+0x28/0xa0
[  913.236906]  el0t_64_sync_handler+0xbc/0x140
[  913.241173]  el0t_64_sync+0x18c/0x190
[  913.244839] Code: a94563f7 910203ff d50323bf d65f03c0 (d29a1a18) 
[  913.250926] ---[ end trace 0000000000000000 ]---
[  913.255640] Kernel panic - not syncing: Attempted to kill init! exitcode=0x0000000b
[  913.263296] SMP: stopping secondary CPUs
[  913.267221] Kernel Offset: disabled
[  913.270700] CPU features: 0x00000,00800084,0000420b
[  913.275569] Memory Limit: none
[  913.278617] ---[ end Kernel panic - not syncing: Attempted to kill init! exitcode=0x0000000b ]---

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!
    您能否分享在运行 memtester 之前在 uboot 中对 DDR 配置所做的修改。

    请同时分享您修改后的 uboot 配置、以便我们让 DDR 专家对修改发表意见。  

    此致、
    Aparna

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你(们)好

    该板的 DDR 与连接到 SK 板的 DDR 相同、并且我们使用的是9.1 SDK (Tiny)。

    很遗憾、我们尚未修改 DDR 设置。

    同样、我没有修改 u-boot 设置。

    很抱歉缺少信息。

    此致、

    Kim

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好

    此处:

     
    电路板元件
    TI AM62A SK EVM
    开发板
    LPDDR4
    Micron MT53E1G32D2FW-046 AUT:A
    Micron MT53E1G32D2FW-046 AUT:B
    PMIC
    LEA  
     相同
    串行 NAND 闪存(OSPI/QSPI)
     Cypress 512MB OSPI NOR
    S28HS512TGA
     X
    PHY 的典型布局
     DP83867IRRGZ 和模块化连接器
     X
    TCAN 收发器
     外部广播
     X
    具有 CSI 连接器的成像传感器
    待定(OV2312和 ST 5MP RGBIR、用于软件演示)
     X
    FPDLink
     J7 FPDLink 摄像头连接器
     X
    端口号
     4+、通过 FT4232HL、用户扩展连接器
     X
    EEPROM
     AT24C512C-MAHM-T 或等效器件
     X

    此致、
    Kim

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢 Kim、我会让其他人对此问题发表评论。

    此致、
    Aparna

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Kim、虽然使用了与 SK 相同的 LPDDR4器件、但如果电路板布局不同、可能仍需要对配置进行一些更改。  您是否执行过任何电路板信号完整性仿真?  您是否遵循了本应用手册 https://www.ti.com/lit/pdf/sprad66中的电路板布局指南 、尤其是布线阻抗要求。  您的电路板和 SK 之间的布线或层叠是否有任何差异?

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    PCB 设计不同于 EVK 板。 它设计为14层堆叠 B。附加了 PCB 堆叠数据。 如果您需要任何其他信息、请回复。

    e2e.ti.com/.../IMPEDANCE_2800_14_35CE5F00_1.6T_5F00_36_5F00_50_5F00_76_5F00_90_5F00_100_29002D004CBEDCB4C5C5_B.pdf

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    是否执行了任何电路板信号完整性仿真?  仿真的结果是什么?  DDR 信号的布线阻抗是多少?

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我们没有继续进行信号完整性仿真。

    单阻抗(36Ω ±10%)

    差分阻抗(76Ω ±10%)

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您还可以尝试对 DDR 配置工具进行以下更改: https://dev.ti.com/sysconfig/?product=Processor_DDR_Config&device=AM62Ax

    端接:CA ODT (FSP1)= RZQ/4 (60 Ω)

    端接:CA ODT (FSP2)= RZQ/4 (60 Ω)

    然后使用这个新配置重新编译 u-boot、并重新测试。

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    好的、这似乎更糟糕、因为您无法进入内核提示符。  您发布的原始 memtester 故障表明故障始终在 bit14上。  您是否尝试过多个板? 行为是否相同?

    此致、

    James

      

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    目前只有两块板、所以我用这两块板进行测试、它们的症状是一样的。

    我发现了一些事情。

    如果禁用 R5和 C7x (dts)、它将引导10次(共10次)。

    另一个问题是、如果将 DDR 频率降低到600MHz、它的启动频率会是原来的五分之一左右。

    此致

    Kim

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    因此、如果您禁用 R5和 C7x、memtester 是否运行无错误?  您可以在600MHz 上运行 memtester 吗?  是否可以发送两块电路板的 memtester 日志?

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你(们)好

    很抱歉这么晚才回复。
    这一次、我们使用与 Devkit 相同的模式设计 DDR、它当前运行良好、不禁用 r5x 和 c7x。
    因此、团队得出结论、这是一个 DDR 问题。
    此致、
    Kim