This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM623:am623:引导失败 DDR4 CKE 未变为高电平

Guru**** 2815505 points

Other Parts Discussed in Thread: AM623, SYSCONFIG, SK-AM62B-P1

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1608564/am623-am623-boot-failure-ddr4-cke-not-going-high

器件型号: AM623
主题中讨论的其他器件: SysConfigSK-AM62B-P1

您好、

我们有一些带有 am623 和 8Go DDR4 的定制电路板。 使用的 U-boot 来自 SDK 11.0.15

当从同一 SD 卡引导时,一些此板正在引导和工作正常,但其他卡在 SPL 的早期阶段:

U-Boot SPL 2025.01 (1 月 13 日 2026 - 17:47:24 +0100)
SYSFW ABI:3.1(固件版本 0x0009 '9.2.7--v09.02.07 (Kool Koala))
将 DT 中的 A53 CPU 频率更改为 1000000Hz (S 级
SPL 初始栈使用情况:13424 字节<<<<<<<<<<<< 被困在这里

当查看具有复位和 CKE 信号示波器的 DDR 控制器时、我们看到 CKE 没有变为高电平、但在缩放时、似乎控制器在~600us 后尝试启动(42mV 时的干扰)

 

cke_no_init.png

当我们看一个正常的主板,能够引导我们看到,在复位被释放 600us 后,STEET CKE 被释放 cke_normal.png

我们还测量 DDR 电源在重置的板,不能启动:

vddr_core:855 mV

VPP:2.51 V

vddrefca:603mV

VDDS_DDR:1.205V

并且在此期间看不到干扰或不稳定、

使用的时钟为 800MHz、并出现在复位时

您能在这个主题上为我们提供帮助吗?

谢谢你

此致

 

 

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    已分配线程、但您可能会看到一些延迟、因为指定的专家本周已离职  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    Mukul 是正确的,专家目前是不在办公室。 同时、还有几个基本问题:

    • 您能否在定制电路板上共享 DRAM 的数据表?
    • 您是否还可以共享您为电路板构建映像的 DDR 寄存器配置(.sysconfig 或.dts 文件)?
    • 您的电路板是否具有 CCS/Lauterbach 等器件的 JTAG 访问权限?

    此致、

    Lucas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Lucas:

    我们使用的是金士顿 DRAM (D5116AN9CXGXNI-U)、请找到随附的数据表。 您还可以在 SK-AM62B-P1 上找到我们的.dtsi 文件、该文件主要是参考设计 NT5AD512M16C4 SysConfig 文件的导出文件。 事实上,制造商不能给我们具体的时间 1600 型材(最低的速率是 1866 年)。

    我们的定制板上无法访问 JTAG

    说实话、

    Thomas

    e2e.ti.com/.../k3_2D00_am62x_2D00_tdt7_2D00_ddr4_2D00_1600MTs.zip

    e2e.ti.com/.../DDR4_5F00_8Gb_5F00_C_5F00_x8x16_5F00_D5116AN9CXGRK_2D00_U-_2800_VerO_2900_.pdf

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Thomas:

    发生故障的电路板是否总是显示不良的 CKE 信号?  或者启动是间歇性的(有时工作正常,有时不工作)。

    如果您的一组电路板总是显示不良的 CKE 信号、我可能会怀疑某种组装问题。  可能尝试在错误的主板上更换处理器。

    此外、CKE 上是否有任何其他电路(上拉或其他方式)?  如果存在此问题、请尝试将其删除。

    CKE 肯定有问题。  您可能仍需要在.dtsi 中进行一些配置更改、但在考虑配置更改之前、您应该远远超过 CKE 变为高电平的点。

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、James:

    我们在 CKE 上有 10k 下拉电阻、不幸的是它无法解决 CKE 问题。 我们的电路板组装商对全部 9 个故障电路板进行了 RX 分析、未发现异常。 不过、我们将尝试更改 4 个此电路板上的 CPU、看看这样是否能解决此问题。

    关于时间、您对此特定 DDR 的建议是什么?

    感谢您的帮助、

    此致、

    Thomas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    理想情况下、您应研究 DDR 寄存器配置工具中的每个参数、并与 Kingston 数据表进行比较。  我认为从南亚计时开始应该很好、您可能只需要调整一两个参数。  确保端接和驱动强度设置与您的电路板设计保持一致。  今天稍后我会尝试回顾。   

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、James:

    我们刚刚更换了 4 块主板上的 CPU、出现了 CKE 问题、现在 4 块主板中有 3 块正在启动。  
    仍然有 1 块电路板、其中 CKE 未启动。 这肯定是 CPU 的问题。  
    我们的 PCB 汇编器执行了额外的 Rx 并确认传真板上的一切都正常、因此他们告诉我们这不是组装问题。 这看起来像是一个电子问题。

    在 R5 spl 上、我们添加#define 调试、并在引导期间收到额外的消息  

    U-Boot SPL 2025.01-g7088c9e465b9-脏污 (2 月 06 2026 - 11:27:22 +0100)
    SYSFW ABI:3.1(固件版本 0x0009 '9.2.7--v09.02.07 (Kool Koala))
    k3_ddrss_probe (dev=43c349e8)
    k3_ddrss_ofdata_to_priv (dev=43c349e8)
    k3_ddrss 存储器控制器@f300000:未组装 DDR freq0、使用旁路频率。
    k3_ddrss_power_on (ddrss=43c3a2c0)
    k3_ddrss 存储器控制器@f300000:未找到 VTT-SUPPLY。
    K3_LPDDR4_PROBE:通过
    K3_LPDDR4_INIT:通过
    -->>> LPDDR4 初始化正在进行中...<<<--
    K3_LPDDR4_START:启动后通过
    将 DT 中的 A53 CPU 频率更改为 1000000Hz (S 级
    SPL 初始栈使用情况:13424 字节<<<<<<<<<<< 被困在这里

    工作板上的信息完全相同。 奇怪的是、我们在 SysConfig 文件中配置 DDR4、然后收到一条 LPDDR4 初始化消息。

    这是正常行为吗?

    感谢你的帮助  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    是的、我认为这是正常的、只是来自支持 DDR4 和 LPDDR4 的驱动程序的调试语句。  发生故障的电路板上的 CKE 信号是否正确(这也是原始电路板发生故障的地方)?  如果复位和 CKE 信号看起来良好、则可能仍然存在配置问题。   

    此外、使用 Linux memtester 检查工作板、以确保配置稳健。   

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、James:

    您说得对、我们检查了其余的故障电路板、CKE 正常。 我们假设所有电路板都有相同的问题、但我们错了... 所以似乎我们有两个不同的问题:

    -一是 CKE 不高->我们改变了程序 它解决了问题的 3 板,为什么? 我们还不知道(根据我们的制造商,这不是一个流程问题)

    -一个是另一个问题->可能是配置问题?

    在这两种情况下、产品在尝试初始化 DDR 时都会卡住、   

    我们在工作板上安装了 memtester:

    memtester 600M 1.
    memtester 版本 4.5.1(64 位)
    版权所有 (C) 2001-2020 Charles Cazabon。
    根据 GNU 通用公共许可证版本 2(仅限)获得许可。

    页面大小为 4096
    pagesizemask 为 0xfffffffffffffff000
    需要 600MB(629145600 字节)
    获得 600MB(629145600 字节),尝试 mlock ...锁定.
    环路 1/1:
     地址卡住    :正常
     随机值     :好的
     比较 XOR      :好的
     比较子项      :好的
     比较 MUL      :好的
     比较 DIV      :好的
     比较或      :好的
     比较和      :好的
     连续增量:正常
     实心位      :好的
     块序列  :正常
     棋盘格     :好的
     位扩展      :好的
     位翻转       :好的
     步行的     :好的
     步行零   :还可以
     8 位写入     :好的
     16 位写入    :可以

    已完成。

    因此、一切都正常。 我们在 60°C 进行了一些相同的测试结果。

    你怎么看?

    感谢您的帮助、

    Thomas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Thomas 您好、memtester 运行看起来很好。  为了确保稳健性、我会将其运行更长的时间、甚至可能在夜间运行。

    对于故障电路板、您能否通过实施此页面中所示的补丁来提供寄存器转储: https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1358039/faq-board-bring-up-tips-for-sitara-devices-am64x-am243x-am62x-am62l-am62ax-am62d-q1-am62px#:~:text=Getting%20DDR%20register%20dump%20after%20initialization

    这将在初始化后输出所有 DDR 寄存器。  将输出发布到此处、以便我可以检查初始化失败的位置。

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、James:

    请找到不同电路板的转储文件、一个用于未显示 CKE 信号的电路板、另一个用于 CKE 信号、但仍卡在“SPL 初始堆栈使用情况:13424 字节“消息中、最后一个用于正确引导 Linux 的电路板

    e2e.ti.com/.../no_5F00_init_5F00_no_5F00_cke_5F00_09091_2D00_00002.txt

    e2e.ti.com/.../no_5F00_init_5F00_cke_5F00_ok_5F00_09090_2D00_00006.txt

    e2e.ti.com/.../init-ok-08842_2D00_00002.txt

    感谢您的帮助、

    此致、

    Thomas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    两个失败的重转储都无法实现写入均衡、这是第一个训练步骤。  我仍然认为这些板有一些基本的问题。  由于其中一个甚至无法产生正确的 CKE、处理器可能存在问题、可能是电源问题。

    在不产生上升 CKE 的电路板上、复位信号看起来是否正确?

    在产生上升 CKE 的电路板上、它是否变为高电平并在日志卡住前保持高电平、以及发生故障后是否保持高电平?  在此期间、在该电路板上执行什么复位?

    什么是为此电路板上的电源轨供电?  PMIC 还是分立式?

    为了了解背景情况、总共有多少个电路板可以正常工作?  有多少人有 CKE 但失败?  有多少人不产生 CKE?

    是否可以发送原理图?  如果我们需要通过电子邮件发送电子邮件、我可以将其秘密发送给您。   

    此致、

    James

      

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    18 个电路板中有 6 个电路板存在 DDR 初始化问题。 我们已经更改了其中 4 个处理器:
      - 3 已重新准备好进行此返工
      - 1 仍然失败。 该电路板上有一个 CKE 正常。

    ->我们不会在索斯板上质疑 CKE 的先验状态、因为我们认为他们都有相同的问题...  
       
    因此、现在我们还有 3 块电路板还会出现 DDR 初始化故障:
      - 2、CKE 正常(包括已更换处理器的主板)
      - 1、CKE 不上升
       
    使用 PMIC (TPS6521903) 完成供电。 如果您给我发送了您的地址、我会通过电子邮件向您发送原理图。

    我们将按照您的要求调查电路板上的 CKE / Reset / UART 日志。

    谢谢您、

    此致、

    Thomas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢、我给您发送了一封电子邮件

    最终、处理器应首先驱动 CKE 并复位、因此您应该在开始时看到处于适当电平的 CKE。  然后它将启动初始化和训练。  您应该访问的另一个信号是 DDR 时钟、可能也需要进行检查。  您可能还能够通过过孔访问数据、DQS 或 addr。

    不显示 CKE 上升的电路板、很可能是处理器上的电源问题(例如,其中一个 DDR 电压轨未正常供电,焊球短路或未连接到电路板等)。  我知道您之前检查过一些、下面是完整列表:

    处理器电压轨:
    • VDDS_DDR = VDDS_DDR_C = 1.2V
    • VDDA_PLL0 = 1.8V (AM62x)
    • VDDA_DDR_PLL0 = VDD_CORE = 0.75V 或 0.85V(仅限 AM62 AMC 封装)

    存储器电压轨:

    • VTT = 0.6V
    • DDR_VREFCA = 0.6V
    • DDR_VPP = 2.5V

    此致、

    James

       

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我们在所有初始化过程中检查了 2 个电路板上的复位 CKE 和电源轨(一个与 CKE 一起、另一个不显示 CKE)(请参阅 UART_TX 线路)。 它所示为当存在 CKE 时、INIT 的故障速度(~15ms,请参阅下面的第一幅图)比电路板不显示 CKE(~150ms,请参阅下面的第二幅图)更迅速。  
    所有电源轨看起来都正常。 我们没有 VTT 轨、因为电路板实现了单个 DDR 封装。


    2 块电路板上的 800MHz DDR 时钟看起来正常。


    我将原理图通过邮件发送
    我们将调查数据或地址行。

    此致、

    Thomas  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Thomas、我收到了原理图。  我唯一要提到的是将 DDR_RESET 下拉电阻更改为 10K。  我们之前在 EVM 上使用了 2.2K、但注意到在某些器件中下降的复位电平接近 VIH 阈值。  10K 是较弱的上拉、这将有助于提高复位电压电平。  另外、请确保移除 CKE 上的下拉电阻。  但是、这两个原因可能不是您看到的故障的原因。

    重置和 CKE 变为高电平后、您应该会看到第一个培训步骤的活动、即“写入水平“。  在此训练步骤中、会对 DQS 进行移位以使其与 CLK 对齐。  因此处理器将输出 DQS、并且由存储器针对 DQ 信号发送反馈(在此级中,所有 DQS 都进行“或“运算,因此它们都应处于相同的电平)。  您应该会在 DDR 数据表中找到与此相关的图表。

    如果您看到 DQS 切换而不是 DQ、则很可能是存储器出现了问题、因为您看不到其中的任何响应。  如果您没有看到 DQS、则可能是电路板问题(DQS 无意中短路)、或处理器没有正确地通过训练过程。

    通过这些实验、我们应该能够缩小接口的哪一侧是罪魁祸首。  

    此致、

    James

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、James:

    我们在多个电路板上测量 DQS 和 DQ0、以查看写入矫正期间 DQ 上是否出现 0 到 1 转换:  

    -在板 002 这是一个正常的板,我们看到多个转换... 我们不知道如何解释、但电路板正常工作

    -板 006 这是一个板有 CKE 但没有 DDR 初始化我们看到 DQS 切换,但没有看到任何 DQ 转换:

    -在板 008 这是一个板有 CKE 但没有 DDR 初始化我们 看到 DQS 切换,一个 0 到 1 转换:

    由于在 008 板上有一个 0 到 1 的转换,我们得出结论,写入水平是可以的,即使顺序是相当不同的... 我们也在其他屏幕截图上看到了一些奇怪的 dq 波形(写水平调整后),但我们无法解释,看起来像电容器充电:

    所有电路板上的另一个观察结果是、dQ 信号在 400mV 偏移时似乎处于逻辑 0、但板 0008 除外、它仅为 100mV……

    最后我们认为

    -板载 DDR 控制器正常、CKE 正常(板 006 和 008)、但 DRAM 芯片因不同和未知原因而出现故障

    - DDR 控制器在板上发生故障、但没有显示 CKE。

    你怎么看?

    感谢你的帮助

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢、

    是的、电路板 002 DDR 肯定有问题、要么未正确组装、要么器件已损坏。  可能需要换用其他设备来恢复该设备。

    电路板 008 很有趣。  不确定为什么图案看起来与工作板不同。  

    在所有示波器屏幕截图上、DQ 似乎都存在争用。  它应该在写入水平时将轨道摆动到轨道、我不明白为什么它的低点约为 400mV

    最后一张幻灯片显示了一个未端接的 DQS 信号(不确定是读取或写入)。  DQ 无法识别。  如果您在存储器附近进行探测、由于所有振铃、我可能是一个读取器件、这意味着 DDR 没有正确驱动 DQ。

    可能需要替换这些电路板上的 DDR。

    主板未显示 CKE 是处理器的问题。  如果复位看起来正常、则表明 IO 电压和电源正常。  那么我认为仍然存在一些组装问题、可能是焊接桥或焊流无法提供与电路板的良好连接。   

    可能会在正常工作/非正常工作的电路板上通过 ABA 交换器件来确定元件或电路板(组装)的问题

    此致、

    James