This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM62A7:运行期间发生内核紧急情况

Guru**** 2331900 points
Other Parts Discussed in Thread: AM62A7, SK-AM62A-LP, AM62P
请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1515743/am62a7-kernel-panic-occurs-during-operation

器件型号:AM62A7
主题中讨论的其他器件: SK-AM62A-LPAM62P

工具/软件:

您好:

我们在一些基于 TI AM62A7 的定制电路板的操作过程中、可能会遇到内核错误处理问题、非常感谢 TI 专家提供任何指导或见解。

我们已附加了内核紧急日志和引导日志以供您参考。

实验设置:

  • 基于 TI AM62A7 的定制电路板
  • 使用 A53 和 C7x 内核
  • PROCESSOR-SDK-LINUX AM62A 10.00.00.08
  • 从 eMMC 引导
  • eth0 和 eth1 配置为多端口开关模式并以环形拓扑连接
  • RSTP(快速生成树协议)已启用
  • 自定义应用程序基于 Python、使用多进程架构
  • 该应用执行视频处理和 AI 推理
  • 推理结果以 JSON 格式通过 MQTT 发送到 PC 服务器

观察到的行为:

  • 在某些主板上、启动后 30 分钟到几小时内出现内核严重错误
  • 发生这种情况时、主板将完全无响应:无 SSH 访问、无 ping 应答
  • RSTP 似乎停止工作、随后在以太网上出现广播风暴症状
  • 当电路板封闭在外壳中时、问题往往重现得更快、打开时更慢
  • 在正常运行期间、MPU 内部温度保持在 55–60°C 左右

我们非常感谢为进一步调查和解决此问题提供的任何建议、调试提示或指导。

提前非常感谢。

e2e.ti.com/.../kernel_2D00_panic_2D00_20250519.txt

e2e.ti.com/.../dmesg_2D00_20250519.txt

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    我们将查看您的日志并尝试了解问题。

    同时、请参阅有关将 Linux 移植到定制硬件的 AM62A Linux Academy、了解您是否错过了任何内容:

    https://dev.ti.com/tirex/explore/node?node=A__AQH3F7basNZN1Bd-xGjUng__AM62A-ACADEMY__WeZ9SsL__LATEST

    此致、

    建中

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的建中:
    这一请求来自一个高潜力项目、需要在本周内采取行动。
    我们非常希望您能迅速作出回应并提出任何解决方案建议。

    请快速查看内核错误和dmesg日志、并评估实验环境、以帮助确定可能的解决方向。 如果您能够提供一个补丁、我们也非常感激您。

    谢谢。

    此致、Jack

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    该问题是否可以在 EVM SK-AM62A-LP 上重现?

    是否可以在定制电路板上使用 SDK10.1 来重现此问题?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你(们)好  

    感谢您的答复。  

    • 此问题不能在 EVM 上重现。 我们的定制板使用专用图像传感器、这使得移植图像传感器驱动程序变得困难。
    • 正在移植到 SDK v10.01、但需要一些时间。

    有关调试进度的其他信息:

    在软件方面:

    • 如果没有应用程序正在运行、则不会出现问题。
    • 当运行执行 GStreamer 流水线并 在循环中连续向共享存储器执行 memcpy 操作时、该问题出现。
    • 问:我共享的日志是否可以由 GStreamer 流水线中的问题引起?

    从硬件端:

    • 我们使用示波器测量了 VCC_CORE(黄线,标称 0.75V)和 MCU_XI 时钟(蓝线)。
    • 我们观察到 UART 输入期间的信号波动(请参阅图片_1)。
    • 发生异常行为后、示波器上的 VCC_core 在 0V 至 1.5V 之间显示大电压摆幅(请参阅图 2)。
    • 问题:VCC_CORE 和 MCU_XI 时钟的这种波动是否会导致系统行为异常?

    谢谢你。
    此致。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、

    [722.335557] bug:RSS 计数器状态错误 MM:0000000097bc3f56 type:MM_ANONPAGES val:–1

    此消息从内核内存管理子系统打印出来、该子系统是内核核心模块之一。 判断问题是否与 gstreamer 应用直接相关并不容易。

    但是、如果电源轨不正常、则可能会导致无法预测的行为。 因此、请尝试修复 VCC_CORE 问题、然后查看内核是否仍然崩溃。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    [引述 userid=“598525" url="“ url="~“~/support/processors-group/processors/f/processors-forum/1515743/am62a7-kernel-panic-occurs-during-operation/5833743 #5833743“]
    • 我们使用示波器测量了 VCC_CORE(黄线,标称 0.75V)和 MCU_XI 时钟(蓝线)。
    • 我们观察到 UART 输入期间的信号波动(请参阅图片_1)。
    • 发生异常行为后、示波器上的 VCC_core 在 0V 至 1.5V 之间显示大电压摆幅(请参阅图 2)。
    • 问题:VCC_CORE 和 MCU_XI 时钟的这种波动是否会导致系统行为异常?
    [/报价]

    您测量的电源尖峰可能是探头拾取噪声造成的。

    您是否可以建议客户使用万用表和更好的示波器探针来测量电源?

    在共享的原理图中、GPIO6 似乎是脉冲跳跃、指示 0.85V。  

    您能让客户验证 GPIO6 配置吗?

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    如果观察到在现场测试的设备或电路板上发生内核错误的趋势、则表示有任何想法。

    我看到了电源架构、但不确定用作 PMIC 输入的 5V 电源的电流大小。

    5V 电源轨上的电容器值似乎更高、许多 PMIC 输入电容器值都可以优化。 不确定 5V DC/DC 允许的输出电容。

     此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好
    我们按照 TI SK-AM62A-LP (AM62A 低功耗 SK EVM) 参考设计在 GPIO6 上施加了上拉电阻。
    在我们的定制电路板上、VIO_IN 为 1.8V、因此我们使用了 1.8V 上拉电阻。 GPIO6 上测得的电压为 1.8V、符合预期。

    根据您的响应、VCC_core 应为 0.85V、但我们的测量值显示为 0.75V。
    这个 0.75V 电平是否可能会导致功能问题?

    至于电容器、我们遵循了 TI EVM 设计。
    您能推荐合适的电容值吗?
    如果需要任何其他信息来确定优化值、请告知我们。
    谢谢你。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    谢谢你。

    至于电容器、我们遵循了 TI EVM 设计。
    您能否推荐合适的电容值?

    EVM 使用 3.3V、10A 作为 PMIC 输入、客户使用 5V、3A。

    客户电路板上 DC/DC 上的总电容为~250 μ F。  

    我不确定是否使用 3A 电源与 10A 电源对电流大小进行了所需的分析。

    [引述 userid=“598525" url="“ url="~“~/support/processors-group/processors/f/processors-forum/1515743/am62a7-kernel-panic-occurs-during-operation/5840065 #5840065“]

    我们按照 TI SK-AM62A-LP (AM62A 低功耗 SK EVM) 参考设计在 GPIO6 上施加了上拉电阻。
    在我们的定制电路板上、VIO_IN 为 1.8V、因此我们使用了 1.8V 上拉电阻。 GPIO6 上测得的电压为 1.8V、符合预期。

    根据您的响应、VCC_core 应为 0.85V、但我们的测量值显示为 0.75V。
    这个 0.75V 电平是否可能会导致功能问题?

    [/报价]

    我知道 PMIC 团队有一个替代 Thread。 您可能需要咨询 PMIC 团队。

    从原理图中、我不确定自己是否了解 SOC OPN。

    OPP 的选择是 VDD_CORE、具体取决于所需的 OPP。

    客户需要验证 SOC OPN 的选择。

    此致、

    Sreenivasa.

     

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    如果需要任何其他信息来确定优化值、请告知我们。

    以下信息可能有所帮助。

    如果观察到在现场测试的设备或主板上出现内核严重错误的趋势、您会有什么想法。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好:

    以下是有关我们使用的 SoC OPN 和当前 OPP 设置的信息:
       SoC OPN:AM62A74
       OPP:性能、1400MHz

    我们还测试了将调速器设置为用户空间、并将 CPU 频率手动设置为 1000MHz、但问题仍然存在。

    随着温度升高、问题电路板显示异常行为的速度会更快。
    发生故障时、CPU 温度约为 66°C:

    但是、在正常运行的其他电路板上、温度可能会通过 70°C 而不会出现任何问题。

    在问题发生之前、文件系统会无响应。 例如、执行“ls"之类“之类的简单命令不会返回任何输出。
    如果在此之后立即关闭系统电源、则在下次开机时无法引导系统。
    但是、如果我们等待温度下降、系统将再次成功引导。

    谢谢你。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    谢谢你。

    是否有工作板与没有工作板的对比、是否可以检查正在测试的板的数量。

    如前所述、您能否检查客户是否分析了连接到 PMIC 输入的 5V 中间 DC/DC 电源的尺寸。

    此致、

    'reenivasa

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Sreenivasa 先生  

    我们已确定根本原因并解决了该问题。
    该问题与 VCC_CORE 电压有关。
    根据我们电路板的硬件设计、VCC_core 应该为 0.85V、但实际上在 0.75V 下测得。

    我们的电路板经过设计、通过上拉 PMIC GPIO6 将 VCC_core 设置为 0.85V。
    由于电路板上的 VIO_IN 为 1.8V、因此我们最初将 PMIC GPIO6 上拉至 1.8V。
    然而、在测试期间、我们发现当 GPIO6 上拉至 3.3V 时、VCC_core 仅达到 0.85V。

    我查看了 PMIC 数据表、但找不到任何提及 GPIO 输入阈值电压的内容。
    我最初假设上拉电压应与 VIO_IN (1.8V) 匹配、但在这种情况下、PMIC 似乎需要 3.3V 上拉电阻以便 GPIO6 按预期运行、而与 VIO_IN 无关。

    感谢您检查 PMIC GPIO6 的建议、我们能够解决这个问题。

    我衷心感谢您的帮助。

    此致。  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    感谢您的意见。

    很高兴、我能提供帮助。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi.

    我进行了快速检查、并观察到  SOM_MAIN_RST_OUT 在不同外设的“与运算“逻辑和门输入端具有 10K 下拉电阻和 4.7k 上拉的上拉电阻。

    必须将拉电阻设置为高电平、客户才能继续测试。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Sreenivasa 先生

    我是一名与 Choi 先生共事的硬件技术人员。
    我查看了您提到的内容、但这只是在更新原理图版本过程中发生的一个微小错误。
    不应在信号网上放置电阻器。
    我会修改它、但我想当前的电路板仍可使用。
    网络上有四个 4.7k 上拉电阻和一个 10k 下拉电阻。
    根据分压、净信号可视为高电平。

    我们的定制电路板没有做任何的缺陷。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    谢谢你。

    TI 建议使用 DNI 电阻器。

    您应该可以 根据内部分析来决定后续步骤。 关键是下一个版本的电路中会有差异。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    附加输入:

    U22 负载开关
    VCC_3V3_SYS 电压开关
    添加了 220 pF 以进行压摆率控制
    SoC IO 电源具有压摆率要求

    某些引导模式输入似乎处于开路状态
    SW2.7、SW3.1、SW3.2
    不建议也不允许将任何引导模式输入保持未连接状态
    U38 输出是 DNI

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    有关电容器额定电压的附加输入:

    更新了
    C30
    0.47 μ F 电容器
    6.3V 用于提供 5V
    增加到 16V

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Sreenivasa 先生

    我只是想得到你提到的关于“DNI"的“的保证。
    这是否意味着“请勿安装“、在 PCB 上放一个空的电阻焊盘以进行调试?

    我通常使用 DNI 焊盘进行调试。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    如需更多讨论、

    1.向负载开关添加 220pF
    我想让你为我解释一下。
    在我看来、U22 仅用于 VCC_3V3_SYS 的开/关功能。
    我是否需要考虑电路中的压摆率?

    2.引导模式输入
    -当我更改为另一个引导模式的滑动开关时,使用 U38 是可选的电路。
    我只是一个考虑因素,它现在没有被使用。

    3. C30
    - C30 是直流/直流输出电容器之一、值为 0.1uF。
    您是否建议将上限更改为 0.47uF?
    此外、100V(封装 1608)时、电流 C30 为 0.1uF。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    比您高。

    我只想得到你提到的“DNI"的“的保证。
    这是否意味着“请勿安装“、并在 PCB 上放置一个空的电阻焊盘以进行调试?

    您是对的。 建议移除电阻器。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    3. C30
    - C30 是直流/直流输出电容器之一、值为 0.1uF。
    您是否建议将上限更改为 0.47uF?
    此外、100V 时的电流 C30 为 0.1uF(封装 1608)。[/报价]

    之前提供的参考符号 C30 I 不正确。 我的道歉。

    请参阅 C39 和 C48 — 使用的 6.3V 电容器

    使用 C37、C38、C47 - 10V 电容器。

    请更改为 16V。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    1. 向负载开关添加 220pF
    我想让你为我解释一下。
    在我看来、U22 仅用于 VCC_3V3_SYS 的开/关功能。
    我是否需要考虑电路中的压摆率?

    AM62A SK 原理图中存在错误、并且可能 遵循了相同的原理图。

    https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1340905/faq-am62a7-am62a7-q1-am62a3-am62a3-q1---custom-board-hardware-design---design-and-review-notes-for-reuse-of-sk-am62a-lp-schematics

    您可以参阅 AM62P 原理图

    https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1340906/faq-am62p-am62p-q1---custom-board-hardware-design---design-and-review-notes-for-reuse-of-sk-am62p-lp-schematics

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Hello Hogyun Ryu,

    2. 引导模式输入
    -当我更改为另一个引导模式的滑动开关时,使用 U38 是可选的电路。
    我只是其中一个考虑因素,它现在没有被使用。

    建议确保引导模式输入均未保持开路。

    复位期间、引导模式输入会启用其输入缓冲器、内部上拉电阻器会关闭。

    此致、

    Sreenivasa.