This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM4372:在重新启动期间、sdhci-OMAP 超时

Guru**** 2553440 points
Other Parts Discussed in Thread: AM4372, AM4376

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1114937/am4372-sdhci-omap-timout-during-reboot

器件型号:AM4372
主题中讨论的其他器件: AM4376

大家好

 

定制板上 AM4372处理器中的 sdhci-OMAP 驱动程序存在以下问题

 

系统 MPU:AM4372BZDN80

Linux 内核:5.10.120、SRCREV = git://git.ti.com/git/ti-linux-kernel/ti-linux-kernel.git 中的"ab2d96e4f21159a7df2e87a6fb2a29bd9535506b"

eMMC IC:各种制造商、容量为4GB 和8GB

Linux 内核配置、器件树和设计文件可通过本地支持提供

 

问题描述

有时、当从 Linux 控制台运行 reboot 命令时、sdhci-OMAP 驱动程序会出现超时。 电路板已停止、并且不会重新启动。 问题是随机重现的,但在循环中每次启动后运行重新引导时,大部分时间不到1小时。

控制台日志:

正在重新启动... [216.799795] mmc1:等待硬件 cmd 中断超时。

[216.805608] mmc1:sdhci:==== SDHCI 寄存器转储====

[216.812095] mmc1:sdhci:sys addr: 0x00000000 |版本 :0x00003101

[216.818577] mmc1:sdhci:blk 大小: 0x00000000 | blk cnt: 0x00000000

[216.825059] mmc1:sdhci:参数: 0x00010000 | Trn 模式:0x00000000

[216.8341] mmc1:sdhci:present:  0x01f70000 | Host ctl:0x00000000

[216.838022] mmc1:sdhci:power:    0x00000000 | Blk GAP: 0x00000000

[216.844501] mmc1:sdhci:WAKE-UP:  0x00000000 |时钟   :0x00000000

[216.850980] mmc1:sdhci:超时:  0x00000000 | int stat:0x00000000

[216.857460] mmc1:sdhci:int enab: 0x007f0003 | sig enab:0x007f0003

[216.863939] mmc1:sdhci:acmd stat:0x00000000 |插槽内部:0x00000000

[216.870419] mmc1:sdhci:cap:     0x05e10080 | caps_1:  0x00000000

[216.876899] mmc1:sdhci:cmd:      0x00000d1a |最大电流:0x00000000

[216.883378] mmc1:sdhci:RESP[0]:  0x00000000 | Resp[1]: 0x00000000

[216.889857] mmc1:sdhci:RESP[2]:  0x00000000 | Resp[3]: 0x00000000

[216.896333] mmc1:sdhci:host ctl2:0x00000000

[216.900805] mmc1:sdhci:========================================================

[216.93668686868] sdhci-OMAP 481d8000.mmc:在 sdhci_omap_reset 中等待控制器复位超时

[216.974576] sdhci-OMAP 481d8000.mmc:在 sdhci_omap_reset 中等待控制器复位超时

您是否有任何想法、原因是什么以及如何解决?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    感谢您的提问、我叫 Andrew、我很乐意为您提供帮助。  我已将您的问题转达给团队、希望在接下来的1-2个工作日内得到您的回复。  在我研究这个问题时、您是否有任何关于这个问题的更新/发展需要我们加以考虑?

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andrew

    感谢您的观看。 到目前为止、我们没有更多更新。 问题仍然在使用 AM4376 HS 处理器版本的定制板上重现。

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    [引用 userid="133075" URL"~/support/processors-group/processors/f/processors-forum 1114937/am4372-sdhci-omap-timout-during-reboot/4134357#4134357"]问题仍在重现

    我希望澄清一点:我知道您最初说的问题是不一致的、这是否意味着上述操作有时会按预期执行、避免了错误?  如果是、您能否附上成功运行的日志?

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andrew

    我的意思是、它仍然不时发生。 它不是在每次重启期间、但我们经常观察到它。 正确重新引导的日志为:

    发送所有数据将处理术语信号...
    注销
    发送所有数据将处理 kill 信号...
    正在卸载远程文件系统...
    正在禁用交换...
    正在卸载本地文件系统...
    [229.205054] EXT4-FS (dm-0):已重新安装。 OPTS:(空)
    正在重新启动... [229.531787]重新引导:重新启动系统
    CCCCCC

    出现问题时、需要重新启动:

    发送所有数据将处理术语信号...
    注销
    发送所有数据将处理 kill 信号...
    正在卸载远程文件系统...
    正在禁用交换...
    正在卸载本地文件系统...
    [47.642124] EXT4-FS (dm-0):已重新安装。 OPTS:(空)
    正在重新启动... [58.086607] mmc1:等待硬件 cmd 中断超时。
    [58.092421] mmc1:sdhci:==== SDHCI 寄存器转储====
    [58.098906] mmc1:sdhci:sys addr:0x00000000 |版本:0x00003101
    [58.105388] mmc1:sdhci:blk 大小:0x00000000 | blk cnt:0x00000000
    [58.111869] mmc1:sdhci:参数:0x00010000 | Trn 模式:0x00000000
    [58.118351] mmc1:sdhci:present:0x01f70000 | Host ctl:0x00000000
    [58.124830] mmc1:sdhci:power:0x00000000 | Blk GAP:0x00000000
    [58.131311] mmc1:sdhci:WAKE-UP:0x00000000 |时钟:0x00000000
    [58.137791] mmc1:sdhci:超时:0x00000000 | int stat:0x00000000
    [58.144271] mmc1:sdhci:int enab:0x007f0003 | sig enab:0x007f0003
    [58.150750] mmc1:sdhci:acmd stat:0x00000000 |插槽内部:0x00000000
    [58.157231] mmc1:sdhci:cap:0x05e10080 | caps_1:0x00000000
    [58.163711] mmc1:sdhci:cmd:0x00000d1a |最大电流:0x00000000
    [58.170191] mmc1:sdhci:RESP[0]:0x00000000 | Resp[1]:0x00000000
    [58.176670] mmc1:sdhci:RESP[2]:0x00000000 | Resp[3]:0x00000000
    [58.183148] mmc1:sdhci:host ctl2:0x00000000
    [58.187620] mmc1:sdhci:================================================

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    感谢您提供更多信息。  您能否进一步澄清一下、您估计重新启动时此错误发生的频率如何?  此外、在成功执行的运行和失败的运行之间、情况是否有任何变化(例如电路板设置或重新启动前运行的应用程序)?

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andrew

    将 reboot 命令添加到启动脚本时,它最多可复制一小时。 此测试过程中的情况始终相同、系统正在启动并在启动后立即重新启动。

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    感谢您的澄清。  我已向团队提供了您的所有更新、我将随他们的回复通知您。

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    只是团队的更新:我们认为这种行为可能是由系统关闭期间观察到的竞争情况引起的。  我们正在验证此错误、并进一步确定修复方法;我将随时向您更新我们的进度。

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andrew

    感谢您的更新、我正在等待您的调查结果。

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    很抱歉耽误了时间、 团队仍在以最高优先级处理此事。  我会随时向您介绍我们的最新进展。

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andrew

    我这边有一个更新。 我们 针对系统中可用的 sdcard 发现了类似问题、例如/dev/mmcblk0p1器件。 在安装 sdcard 时发生了以下情况:

    [1099.362364] mmc0:等待硬件中断超时。
    [1099.367829] mmc0:sdhci:==== SDHCI 寄存器转储====
    [1099.374315] mmc0:sdhci:系统地址:0x00000000 |版本:0x00003101
    [1099.380796] mmc0:sdhci:blk 大小:0x00000200 | blk cnt:0x00000002
    [1099.387277] mmc0:sdhci:参数:0x00000802 | Trn 模式:0x00000033
    [1099.393757] mmc0:sdhci:present:0x01f70000 | Host ctl:0x00000002
    [1099.400237] mmc0:sdhci:power:0x0000000e | Blk GAP:0x00000000
    [1099.406716] mmc0:sdhci:WAKE-UP:0x00000000 |时钟:0x00000087
    [1099.413196] mmc0:sdhci:timeout:0x0000000A | int stat:0x000000c0
    [1099.41966] mmc0:sdhci:int enab:0x027f000b | sig enab:0x027f000b
    [1099.426155] mmc0:sdhci:acmd stat:0x00000000 |插槽内部:0x00000000
    [1099.432635] mmc0:sdhci:cap:0x05e10080 | caps_1:0x00000000
    [1099.439115] mmc0:sdhci:cmd:0x0000123a |最大电流:0x00000000
    [1099.445594] mmc0:sdhci:RESP[0]:0x00000000 | Resp[1]:0x00000000
    [1099.452074] mmc0:sdhci:RESP[2]:0x00000000 | Resp[3]:0x00000000
    [1099.458551] mmc0:sdhci:host ctl2:0x00000000
    [1099.463022] mmc0:sdhci:========================================================

    mount 命令失败,终端被阻止。 无法使用 Ctrl+C 停止 mount 命令 此外,无法从其它终端会话(ssh)重新引导系统。

    您是否已经针对此主题取得了一些成果?

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Pawel、

    感谢您提供的其他信息、我已将其复制到团队中。  很抱歉耽误了时间、团队仍在调查此问题、我们正在努力尽快为您解决问题。

    此致、

    Andrew

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Pawel

    我们还无法帮助您解决这一问题。 我们将继续调查。  

    一个快速查询-您是否也在 GP (非 HS) EVM 中看到过此行为? 我认为这与 GP 和 HS 无关、但由于您明确指出了 HS、我想看看您是否在行为上看到过任何差异。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好,Mukul

    问题在我们的两个定制板版本(采用 GP 和 HS 处理器)上重现。

    解决这个问题对我们来说很重要、因为我们在软件更新期间重新启动电路板。 如果 eMMC 出现故障、则在软件更新后器件将无法启动。 如果 sdcard 出现故障并进一步更新软件、我们也无法重新启动电路板并最终完成更新。

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Andrew 和 Mukul、您好

    您的调查是否有任何更新?

    我们观察到、在关闭期间引入几秒钟延迟会导致 eMMC 无法重现此问题。 写入闪存的过程的停止脚本末尾会有延迟。 这可能是 eMMC 情况的一种解决方法、但不能解决 SD 卡在卡安装过程中出现的相同问题。

    此致

    Paweł μ A

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    大家好、Pawel、

    Andrew 在本周剩余的时间内都不在办公室。 如果您在下周中未收到回复、请 Ping 该主题。

    此致、

    Nick