This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM62A7:EVM:偶尔启动失败

Guru**** 2487425 points
Other Parts Discussed in Thread: AM62A7, SK-AM62A-LP, SYSCONFIG

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1424104/am62a7-evm-occasional-boot-failure

器件型号:SK-AM62A-LP
主题中讨论的其他器件:AM62A7SysConfig

工具与软件:

您好!

 

   我们一直在使用10 SDK 对 am62a7 EVM 进行重新启动测试(这是通过简单的 systemd 服务完成的、该服务会在系统准备就绪后调用重新启动)、我们已经注意到偶尔会发生引导故障、其中 u-boot 在第一次 spl 中停止(大约1/100次启动)。

U-Boot SPL 2024.04-ti-g818c76aed67f (Aug 01 2024 - 19:19:47 +0000)
SYSFW ABI: 4.0 (firmware rev 0x000a '10.0.8--v10.00.08 (Fiery Fox)')
SPL initial stack usage: 13568 bytes

   复位系统会使系统恢复正常。

   对可能导致此问题的原因有什么想法吗?

谢谢!

   Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您的引导模式/介质是什么?

    您是否使用的是来自 SDK v10的未修改的 U-Boot?

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我们将从 SD 卡引导。

    我们使用的是未修改的 U-Boot。

    使用 TI 提供的映像 https://dr-download.ti.com/software-development/software-development-kit-sdk/MD-PvdSyIiioq/10.00.07.04/tisdk-default-image-am62xx-evm.rootfs.wic.xz 直接刷写 SD 卡

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢您的确认。

    您使用的 SD 卡的确切品牌/型号是什么?

    然后、您是否可以尝试不同的品牌/型号、看看这是否会有所不同?

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我们正在使用三星32 G EVO Select Micro SD 卡。

    切换至 SAN Disk Ultra 32G Micro SD 卡没有任何区别、仍观察到挂起。

    另外请注意,在我的上一篇文章中,我不小心链接到62X 图像,而不是62a 图像。 正确的网址是: https://dr-download.ti.com/software-development/software-development-kit-sdk/MD-D37Ls3JjkT/10.00.00.08/tisdk-edgeai-image-am62a-evm.wic.xz

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢额外的测试。

    您能否提供确切的电路板器件型号和序列号? 您可以随意拍照。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    电路板器件型号:SK-AM62A-LP

    序列号:46221350178

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    谢谢。 我正在与团队核实后续步骤、并会回复给您。 我们确实在早期的 SDK 中有一些与软件相关的 SD/MMC 问题、但 AFAIK 应全部在 SDK v10.0中解决。 因此、此处存在一些其他/不同的软件相关问题、或者您的特定电路板存在问题。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    与团队更详细地讨论这一点、我们认为这更像是潜在的 DDR-init 相关问题、而不是 SD/MMC 相关问题(后者会失败并显示这样的消息、而您的日志中没有此类消息、它只是在 DDR init 后安静)。

    有了这句话、我想让您尝试以下两个实验:

    1. 使用 AM62A SDK v9.1进行引导测试。 该特定版本很重要、因为在实施一些与 PLL 相关的更改/改进之前、这些更改/改进在某些情况下会影响 DDR init (v9.2和 v10.x)。 因此、尝试从 SDK v9.1获取映像是一个很好的数据点、请参阅
      https://www.ti.com/tool/download/PROCESSOR-SDK-LINUX - AM62A/09.01.00.07

    2. 向 U-Boot 添加随附的补丁、以一半的速度运行 LPDDR4以进行测试、查看它是否产生任何影响。 我`m该补丁对 U-Boot 进行了快速测试构建、并在` emtester 的性能之前/之后进行了比较、添加补丁后速度较慢、因此更改似乎生效、LPDDR4仍正常工作。

    此致、Andreas

    e2e.ti.com/.../0001_2D00_arm_2D00_dts_2D00_k3_2D00_am62a_2D00_Switch_2D00_to_2D00_using_2D00_to_2D00_933MHz 2D00_LPDDR4_2D00_co.patch

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、

    感谢您的更新、下面是测试结果:

    1 - 9.1 SDK -这仍然导致相同的引导失败。 实际上、它似乎大大提高了故障率、达到了20次靴子中的1次(然而、我没有进行足够的测试来确认这一故障率变化、我可能只是运气不好)。

    2 -半速 LPDDR4 -这似乎已经完全解决了这个问题,我运行了数千个靴子没有一次故障。

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    约书亚

    感谢您与我合作。

    2 -半速 LPDDR4 -这似乎已经完全解决了问题、我已经运行了数千次引导、没有一次失败。

    很棒的发现 看起来 DDR 配置可能有改进空间...

    事实上、我刚刚通过在 SysConfig 工具(https://dev.ti.com/sysconfig)中加载相关模板并进行检查/比较来为该平台生成最新/建议的配置、我看到配置数据与 SDK v10版本中使用的配置存在差异!!

    下一步、您可以应用随附的补丁(确保您从之前的版本中删除了半速补丁)、以引入最新数据并重试、这次是全速启用。 如果此功能现在起作用、这意味着可能已识别到需要正式修复的 SDK 交付件中的一个错误。

    此致、Andreas

    e2e.ti.com/.../0001_2D00_arm_2D00_dts_2D00_k3_2D00_am62a_2D00_Update_2D00_LPDDR4_2D00_Config_2D00_File_2D00_w_2D00_latest.patch

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、

       我在晚上跑了新的补丁。 新补丁最终失败了、并且出现以下错误:

    U-Boot SPL 2024.04-00052-gd8cef0b37a8-dirty (Oct 23 2024 - 08:44:53 -0400)      
    SYSFW ABI: 4.0 (firmware rev 0x000a '10.0.8--v10.00.08 (Fiery Fox)')            
    SPL initial stack usage: 13568 bytes                                            
    Trying to boot from MMC2                                                        
    Partition 1 invalid on device 1                                                 
    spl_register_fat_device: fat register err - -1                                  
    spl_load_image_fat: error reading image tispl.bin, err - -1                     
    SPL: failed to boot from all boot devices                                       
    ### ERROR ### Please RESET the board ###      

    此致!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    好的、现在这看起来更像是与 SD/MMC 卡相关的故障。

    您需要重新启动多少次才能出现该故障?

    听起来您以前与 DDR 相关的故障很容易重现。 但这一个可能需要很多(?) 失败的原因是什么?

    如果可能的话、我想将这些问题分开、看看我们可以一次解决一个问题。

    Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、

       大约1000次启动后出现上一个错误。

       我在周末重新进行测试(相同的补丁)、并在大约1200次启动后收到旧错误消息:

    U-Boot SPL 2024.04-00052-gd8cef0b37a8-dirty (Oct 23 2024 - 08:44:53 -0400)
    SYSFW ABI: 4.0 (firmware rev 0x000a '10.0.8--v10.00.08 (Fiery Fox)')
    SPL initial stack usage: 13568 bytes
    Trying to boot from MMC2

    有两个不同的问题是有道理的、我认为一次解决一个问题也是好的。

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    2 -半速 LPDDR4 -这似乎已经完全解决了问题、我已经运行了数千次引导、没有一次失败。

    感谢您使用更新的全速 DDR 补丁重新确认这种情况。 但您能再做一件事吗? 返回到半速 DDR 补丁、并尝试查看是否可以通过执行更多引导尝试来中断引导。

    我的理论是、虽然新的全速 DDR 配置似乎肯定会改善一些事情、但它可能仍然不完美、而且您看到的带有"设备1上的分区1无效"等症状的引导问题可能是由"大部分(但不完全)工作"的存储器而不是 MMC/SD 行为引起的。

    因此、基本而言、我想确保这里确实存在 MMC/SD 问题、无论是否存在。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    关于我之前的评论...

    [报价 userid="4452" url="~/support/processors-group/processors/f/processors-forum/1424104/am62a7-evm-occasional-boot-failure/5476823 #5476823"]

    很棒的发现 看起来 DDR 配置可能有改进空间...

    事实上、我刚刚通过在 SysConfig 工具(https://dev.ti.com/sysconfig)中加载相关模板并进行检查/比较来为该平台生成最新/建议的配置、我看到配置数据与 SDK v10版本中使用的配置存在差异!!

    下一步、您可以应用随附的补丁(确保您从之前的版本中删除了半速补丁)、以引入最新数据并重试、这次是全速启用。 如果此功能现在起作用、这意味着可能已识别到需要正式修复的 SDK 交付件中的一个错误。

    [报价]

    与同事讨论此问题后发现、最近发现了相同的问题、并与另一位客户(内部跟踪为 LCPD-39016)合作解决了此问题、此后正式修复 将其放入用于我们即将推出的 SDK v10.1的集成树(git.ti.com/.../ https://git.ti.com/cgit/ti-u-boot/ti-u-boot/commit/?h=ti-u-boot-2024.04&id=d4d9af62c47e65c2d0264d72c32f22410841e996

    在我们为 AM62A 提供的最新 CI/CD 映像中也可以找到更改、  点击此处可找到该更改:software-dl.ti.com/.../index.html 您可以通过单击"Latest"、然后下载"tisdk-tinlinux-image-am62axx-evm.rootfs.wic.xz"映像文件来获取该更改。 如果您也可以使用该映像(按原样)在电路板上执行引导测试、那会很好。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、

    感谢您的更新、我们目前正在测试提供的新映像。 我将告诉您结果。

    谢谢!

       Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、

      我使用您链接的瘦映像进行了测试、并且在244次重新启动后、我遇到同样的问题:

    U-Boot SPL 2024.04-ti-g8ce3f54eee6f (Oct 24 2024 - 07:21:18 +0000)
    SYSFW ABI: 4.0 (firmware rev 0x000a '10.1.1--v10.01.01 (Fiery Fox)')
    SPL initial stack usage: 13568 bytes

    我将继续运行测试以便更好地了解故障率。  

    谢谢!

      Joshua Bourgeot

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    感谢您的更新,以及您花费测试的所有努力,我知道所有这些都在您的最后花费宝贵的时间 根据您的报告、我提交了一份内部问题报告(SITSW-5848)、以便开发团队可以进行进一步调查。 我们将尝试通过循环运行引导测试在最后重新创建引导测试。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua:

    快速更新。 此后、我们的团队尝试通过在两个不同的 SK-AM62A 电路板上进行引导应力测试来重新创建该电路板、每个电路板迭代超过1000次、未发现任何问题。 我们想在此处获取您的电路板进行分析、并为您提供不同(新)的电路板。 我正在尝试确定这方面的正式流程步骤、并将告诉您。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、感谢您的帮助。  我可以将 EVM 与 SDcard 打包。 您是否需要任何其他组件?  

    将等待您的邮件发送流程更新。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    乔纳森、约书亚、您好!

    这似乎负责退货的人目前不在办公室、但我仍然想继续前进、并提出以下建议:

    1.我想联系你一个人(谁?) 直接通过电子邮件获取收货信息、即可获得新电路板(免费)。
    2.您握住现有的电路板、一旦我们澄清了此处的流程、我们将建议您如何将其退还给 TI。 这对您来说应该是免费的。

    如果可以、请告诉我。

    此致、Andreas

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Andreas、我已经通过私人消息与您进行了联系

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢 Jonathan。 我们 通过电子邮件继续退货/换货流程。