This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM62A7:温度很高时不引导

Guru**** 2419530 points
Other Parts Discussed in Thread: AM62A7, SK-AM62A-LP

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1530288/am62a7-not-booting-when-temperature-is-high

器件型号:AM62A7
主题中讨论的其他器件: SK-AM62A-LP

工具/软件:

你好。
我是 Jae Young Choi。

我们在使用 AM62A7 的定制电路板上遇到引导问题、请寻求支持。
当 AM62A7 的内部温度很高时、是否有可能无法引导?


实验设置:

  • 基于 TI AM62A7 的定制电路板
  • 使用 A53 和 C7x 内核
  • PROCESSOR-SDK-LINUX AM62A 10.00.00.08
  • 从 eMMC 引导

观察到的行为:

  • 运行 2–3 小时后、某些电路板在关闭并再次打开时无法上电。
  • 大约 10 个电路板中有 2 到 3 个出现了这种情况。
  • 该故障并不一致:不同的电路板可能会在不同尝试下失败。
  • 发生故障时、MPU 温度约为 80°C 至 90°C。

预期行为:

  • 即使温度在 80°C 至 90°C 范围内、电路板也应成功引导。

其他实验:

  •  使用热枪加热 SoC 区域以将温度升高到 90°C 以上时、电路板始终无法上电。
    但是、如果电源关闭并保持约 5 分钟冷却、所有电路板将再次正常通电。


问题:

  • 上电时的高内部温度是否会阻止 AM62A7 引导?
  • 数据表指定了 125°C 的最高工作温度、但是否有专门针对上电或引导过程的较低温度限值?

序列日志:

U-Boot SPL 2024.04-ti-g818c76aed67f (Nov 11 2024 - 15:14:15 +0900)
SYSFW ABI: 4.0 (firmware rev 0x000a '10.0.8--v10.00.08 (Fiery Fox)')
SPL initial stack usage: 13568 bytes
Trying to boot from MMC1

谢谢你。  

此致。  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、  

    感谢您的查询。

    发生故障时、MPU 温度约为 80°C 至 90°C。

    请帮助我了解您所说的 MPU 温度 — 这是 VTM 传感器温度吗?

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好  

    是的。 我使用以下命令测量了 VTM 传感器温度。   

    cat /sys/class/thermal/thermal_zone*/temp

    感谢您的帮助。  

    此致。  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、  

    是的。 我使用以下命令测量了 VTM 传感器温度。   [/报价]

    测得的 VTM 温度是否为 90°C?

    您是否知道客户是否进行了针对 5V DC/DC Made(减小电容)的建议更改?

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好。  

    我提到的温度是在对 5V 直流/直流外设电路进行任何修改之前测量的。

    谢谢你。  

    此致  

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、

    谢谢你。

    VTM 温度的测量值是 90°C 吗?

    请帮助回答问题。

    客户是否取得了一些进展?

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好。

    客户尝试将电容降低了大约 100 μ F、但没有效果。
    在定制电路板上、25MHz 和 32.768kHz 晶体均使用了低成本替代方案。
    我们计划使用 TI SK-AM62A-LP 上使用的 ECS 晶体来测试定制电路板。
    定制电路板还为 eMMC 提供了低成本替代方案。 我们还将使用 TI SK-AM62A-LP 上使用的 Micron eMMC 进行测试。
    一旦启动测试结果可用、我们就会将其共享。

    谢谢你。
    此致。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、

    谢谢你。

    我在原理图上观察到了一些观察结果(可能的值变化)、并将与客户分享这些结果、以便客户在最早进行测试时进行审查和更新。

    此致、

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Sreenivasa 先生

    已经有一段时间了。
    同时、我们制作了新的电路板、应用了与 EVM 相同的 ECS 晶体和 Micron eMMC。
    实际上、这是四种类型的组合、分别放置两个供应商晶体和 eMMC 以找出原因。
    1、替代晶振及替代 eMMC
    2.替代晶体和 Micron eMMC
    3、ECS 晶体和替代 eMMC
    4. ECS 晶体和 Micron eMMC

    遗憾的是、当电路板温度约为 90°C~100°C 时、所有类型都有相同的症状、即重新启动故障。
    我们在比之前提到的更高温度的极端情况下对它们进行了测试、以再现与真实情况相同的情况。

    所以,现在我问你,

    1.我认为重启失败是由高温造成的。
    在这种情况下、晶体和/或 eMMC 是否会导致重启失败?
    晶体和 eMMC (125°C) 的工作温度规格远高于测试条件。
    或者任何其他运行条件都无法使 MPU 重新启动、例如晶体的时钟时序?(可能会影响引导序列?)

    2、在这种情况下,是否有可能发生 PMIC 故障,为 MPU 提供正确的电源?
    我在 MPU 数据表中找到了“电源要求“(第 7.10.2 节)。
    它解释了“压摆率“的要求,我想这是你让我尝试在之前的另一个线程中缩小帽的原因。
    我的回答正确吗?

    3.我知道你有一些测试点。
    您能告诉我结果吗?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、霍根柳  

    感谢您的意见。

    我之前提到过这一点、但您可以测量 VTM 温度吗?

    SOC 使用内核温度触发、该值可能高于环境温度。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Kallikuppa Sreenivasa

    感谢您的答复。
    为混乱而道歉。
    所有提到的温度值都是指使用以下命令获得的 VTM 温度:

    # cat /sys/class/thermal/thermal_zone*/temp
    84974
    84498
    86869
    

    谢谢你。
    此致、

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、

    谢谢你。

    我知道您有一些测试点。
    您能告诉我结果吗?

    不确定讨论的内容在哪里。

    我查看了原理图并分享了审阅注释。

    一些评论与值更改有关。

    您能回顾一下评论并检查一下吗?

    您能否确认您所设置或看到的环境温度。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、

    加热是在本地进行还是在腔室中进行?

    是否有方法可以验证主板是否已退出重置并尝试引导并失败、或者主板是否未启动?

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好 Kallikuppa Sreenivasa,

    我们对整个器件加热了。
    为了快速提高温度、我们用毯子覆盖了设备。

    为了进行调试、我们将 UART0 调试电缆连接到其中一个器件。
    当温度达到 85°C 附近时、我们执行了冷复位。

    器件退出复位状态、但在引导过程中挂起。
    它并不总是在同一时间点停止、有时在 U-Boot 期间挂起、其他时候则在内核引导期间挂起。
    为了便于您参考、我附上了两个具有代表性的日志文件。

    如果您有任何有用的想法或建议、请随时与我们分享。

    谢谢你。

    此致。  

    e2e.ti.com/.../temperature_5F00_20250715_5F00_1232.txt

    e2e.ti.com/.../temperature_5F00_20250715_5F00_1438.txt

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jae Young Choi、

    谢谢你。

    我来回顾一下反馈意见。

    我可能必须请求我们的软件专家查看日志。

    当温度达到 85°C 附近时、我们执行了冷重置。

    我需要您确认这是内核温度还是环境温度。

    如果这是芯片、请帮助我确认环境温度。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好 Sreenivasa。

    如果芯片温度过度上升(例如,高于 80~90°C)、则理论上某些内部模拟块、电源开关或 PLL 功能可能会在复位操作(冷复位和热复位)期间变得不稳定。 特别是、如果温度接近热关断电路即将激活的关键阈值、则即使在复位后立即重新施加电源、也可能无法保证正常运行。

    在因过热而自动关闭或用户启动的强制关机后、芯片不会仅通过其内部引导逻辑自动重新启动和恢复;相反、系统只能在温度充分降低且通电(即系统复位)后才能恢复正常引导。


    如果系统设计为在温度下降到足够低且重新接通电源后正常上电和引导、则芯片必须返回多大的安全温度范围才能正常运行?
    此外、PMIC 是否具有可自动重新供电的功能、并在温度恢复到安全范围时尝试自行重新启动系统?

    如果散热区域的 CPU_CRITICAL 温度值设置为类似于 85–90°C 的温度、并且 IC 达到该温度而导致系统断电、那么之后是否可以立即上电(冷复位)、并期望正常启动而不会出现任何问题?
    还有必要验证在类似温度下正常关机后重新启动系统与在该温度下执行热复位或冷复位来重新启动系统之间、结果是否有任何差异?

     
    谢谢。

    此致、  

    插孔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jack、  

    感谢您的意见。

    [引述 userid=“177086" url="“ url="~“~/support/processors-group/processors/f/processors-forum/1530288/am62a7-not-booting-when-temperature-is-high/5926378

    我需要您确认这是内核温度还是环境温度。

    如果这是芯片、请帮助我确认环境温度。

    [/报价]

    您能帮助回答以上问题、以便我向专家咨询。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好 Kallikuppa Sreenivasa,

    我前面提到的温度是指内核温度((VTM 温度)。  
    定制电路板封闭在机械外壳中、我们无法直接测量外壳内的温度。
    我们在毯子内放置了一个温度传感器、距离外壳约 3cm、测得的温度在 34°C 周围。

    谢谢你。
    此致、

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Jack、  

    谢谢你。

    您能否确认温度设置  

    #define MAX_TEMP 115000
    +#define COOL_DOWN_TEMP 90000

    您是否尝试过如上所述设置温度、并将 SOC 跳闸和恢复作为测试?

    如果我们没有 SOC 环境温度信息、则设置说明不清楚。

    此致、

    Sreenivasa.

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好 Sreenivasa。

    我是否应该让这个客户尝试通过如下所示的器件树更改来提出您的建议?

    热区{
    CPU_THERMAL:CPU_THERMAL{
    Polling-delay-passive =<250>;// ms
    Polling-delay =<1000>;// ms

    跳闸{
    cpu_alert0:trip0{
    温度=<90000>;// COOL_DOWN_TEMP(以毫微秒为单位)
    迟滞=<2000>;
    类型=“被动“;
    };

    cpu_crit:trip1{
    温度=<115000>;// MAX_TEMP(以毫秒为单位)
    迟滞=<2000>;
    Type =“Critical(严重)“;
    };
    };

    冷却图{
    map0{
    Trip =<&CPU_ALERT0>;
    冷却设备=<&CPU0 THERMAL_NO_LIMIT THERMAL_NO_LIMIT>;
    };
    };
    };
    };

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 JK、  

    谢谢你。

    你有什么想法吗?

    此致、

    Sreenivasa.