This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] AM625:AM625 tisdk-default-image-mitysom-am62x 9.1 Weston 启动故障

Guru**** 2562120 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/1355910/am625-am625-tisdk-default-image-mitysom-am62x-9-1-weston-startup-failure

器件型号:AM625

您好!

我们正在测试没有模块上系统的 SDK 9.1文件系统、并注意到 Weston 服务通常无法启动。 调查过程中发现、双核芯片上出现此问题的可能性远远大于四核芯片。 这使我相信韦斯顿服务和它的前身之间有一个竞争条件。

1月01 00:00:19 am62xx-evm Weston [444]: wayland.freedesktop.org
Jan 01 00:00:19 am62xx-evm Weston [444]:错误报告至: gitlab.freedesktop.org/.../
1月01 00:00:19 am62xx-EVM Weston [444]:构建:10.0.2
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.592]命令行:/usr/bin/weston --modules=systemd-notify.so
01月01日00:00:19 am62xx-evm Weston[444]:[00:00:19.592]操作系统:Linux、6.1.33-g40c32565ca、#1 SMP 抢占 Thu Jul 6 14:17:24 UTC 2023、Aarch64
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.592]飞行记录仪:已启用
JAN 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.583199575Z" level=info msg="加载插件\"io.containerd.runtime.v2.task\"..." type=io.containerd.runtime.v2
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.593908705Z" level=info msg="正在加载插件\"io.containerd.monitor.v1.cgroups\..." type=io.containerd.monitor.v1
1月01 00:00:19 am62xx-EVM Weston[444]:[00:00:19.595]正在使用配置文件/etc/xdg/weston/weston.ini
JAN 01 00:00:19 am62xx-EVM Weston[444]:[00:00:19.601]最大输出重新喷漆窗口为7ms。
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.603]正在加载模块"/usr/lib/libweston-10/drm-backend.so "
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.604346900Z" level=info msg="加载插件\"io.containerd.service.v1.tasks-service\"..." type=io.containerd.service.v1
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.604891600Z" level=info msg="加载插件\"io.containerd.grpc.v1.introspection\"..." type=io.containerd.grpc.v1
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.605151825Z" level=info msg="加载插件\"io.containerd.internal.v1.restart\"..." type=io.containerd.internal.v1
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.614]初始化 DRM 后端
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.614]正在尝试登录启动器...
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.631]登录:会话控制已授予
Jan 01 00:00:19 am62xx-EVM Weston[444]:[00:00:19.640]登录:TakeDevice on 226:0失败。
Jan 01 00:00:19 am62xx-evm Weston[444]:[00:00:19.640]登录:/dev/dri/card0上的 TakeDevice 失败、error=无此类设备
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.645149550Z" level=info msg="加载插件\"io.containerd.grpc.v1.containers\"..." type=io.containerd.grpc.v1
Jan 01 00:00:19 am62xx-EVM Weston [444]:[00:00:19.648] logind:TakeDevice on 226:1 failed.
Jan 01 00:00:19 am62xx-EVM Weston [444]:[00:00:19.648]日志:/dev/dri/card1上的 TakeDevice 失败、error=无此类设备
1月01 00:00:19 am62xx-EVM Weston[444]:[00:00:19.648]未找到 DRM 器件
1月01 00:00:19 am62xx-EVM Weston[444]:[00:00:19.649]错误:关闭后 Layer_list 不为空。 对 weston_layer_fini()的调用丢失 somhere。
Jan 01 00:00:19 am62xx-evm Weston [444]:[00:00:19.649]致命:创建合成器后端失败
1月01 00:00:19 am62xx-evm Weston [444]:内部警告:调试范围"rm-backend"未损坏。
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.656452775Z" level=info msg="加载插件\"io.containerd.grpc.v1.content\"..." type=io.containerd.grpc.v1
Jan 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.656978410Z" level=info msg="加载插件\"io.containerd.grpc.v1.diff\"..." type=io.containerd.grpc.v1
JAN 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.657403995Z" level=info msg="加载插件\"io.containerd.grpc.v1.events\"..." type=io.containerd.grpc.v1
JAN 01 00:00:19 am62xx-evm containerd[429]:time="1970-01-01T00:00:19.657715555Z" level=info msg="加载插件\"io.containerd.grpc.v1.healthcheck\"..." type=io.containerd.grpc.v1
Jan 01 00:00:19 am62xx-evm systemd[1]:weston.service:主进程已退出,代码=已退出,状态= 1/故障
JAN 01 00:00:19 am62xx-EVM systemd[1]:weston.service:失败、结果为"exit-code"。
Jan 01 00:00:19 am62xx-evm systemd[1]:无法将 Wayland 合成器 Weston 作为系统服务启动。


正如您在上面的日志摘录中所看到的那样、显示不在那里... 我猜可能是在 Weston 尝试启动时固件尚未完成 DSS 加载?

我已经使用 maxcpus=2引导参数在 EVM 上重新创建了这个问题。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    是否修改了 Weston 启动脚本或 systemd 服务中的其他任何内容?  

    此外、您提到过、您曾在 TI EVM 上使用 MaxCPU 启动参数重现了问题。 只是为了说明一点、这是在 TI EVM 上和使用 TI 默认 SDK 时发生的?  

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好, Krunal

    我们尚未修改 Weston 启动脚本。 我们向 systemd 添加了几个单元(dhcpserver netowrk 单元、lmsensors、expand_rootfs)

    EVM 文件系统是库存的 TI 文件。

    加油打气

    /时间

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢! 让我尽量重复这个问题、并使用我们的软件开发工具进行内部检查。

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

     到目前为止,我还没有能够在我身边重复这一问题。 就您而言、当您看到问题时、您是否能够重新启动 Weston (systemctl 重新启动 Weston)或它处于不良状态?

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Krunal,

    我可以重新启动 Weston、然后一切都基本正常工作(但需要注意的是、当前 shell 中不会设置 WAYLAND_DISPLAY 环境、因此必须手动设置)。 即使它确实引导到演示、我也看到 在正确启动 Weston 之前尝试启动 Weston 失败的次数
    Jan 01 00:00:19 am62xx-evm Weston [415]:[00:19.658] logind:TakeDevice on 226:0 failed.
    Jan 01 00:00:19 am62xx-evm Weston[415]:[00:19.658] logind:/dev/dri/card0上的 TakeDevice 失败、error=无此类设备
    Jan 01 00:00:19 am62xx-evm Weston [415]:[00:19.664]登录:TakeDevice on 226:1失败。
    Jan 01 00:00:19 am62xx-evm Weston [415]:[00:19.664]日志:/dev/dri/card1上的 TakeDevice 失败、error=无此类设备
    Jan 01 00:00:19 am62xx-evm Weston [415]:[00:19.664]致命:创建合成器后端失败
    Jan 01 00:00:20 am62xx-evm Weston [601]:[00:00:20.253] logind:TakeDevice on 226:0 failed.
    Jan 01 00:00:20 am62xx-evm Weston [601]:[00:00:20.253]日志:/dev/dri/card0上的 TakeDevice 失败、error=No such device (没有此类设备)
    Jan 01 00:00:20 am62xx-evm Weston [601]:[00:00:20.258] logind:TakeDevice on 226:1 failed.
    Jan 01 00:00:20 am62xx-evm Weston [601]:[00:00:20.258] logind:/dev/dri/card1上的 TakeDevice 失败、error=无此类设备
    Jan 01 00:00:20 am62xx-evm Weston [601]:[00:00:20.259]致命:创建合成器后端失败
    Jan 01 00:00:20 am62xx-evm Weston [651]:[00:00:20.729] logind:TakeDevice on 226:0 failed.
    Jan 01 00:00:20 am62xx-evm Weston [651]:[00:00:20.730]日志:/dev/dri/card0上的 TakeDevice 失败、error=No such device (此类设备无效)
    Jan 01 00:00:20 am62xx-evm Weston [651]:[00:00:20.735] logind:TakeDevice on 226:1 failed.
    Jan 01 00:00:20 am62xx-evm Weston [651]:[00:00:20.736]日志:/dev/dri/card1上的 TakeDevice 失败、error=No such device (此类设备无效)
    Jan 01 00:00:20 am62xx-evm Weston [651]:[00:00:20.736]致命:无法创建合成器后端

    我的怀疑是、有时在启动 Weston 和 going.e2e.ti.com/.../ti_5F00_svm_5F00_bootup.txt.gz 之前超时

    我已经附上了一家正在工作的初创公司的日志、这些日志显示 Weston 故障3次、然后在4日成功。

    加油打气

    /时间

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    感谢日志、我将与团队一起回顾。

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    出现问题时、您可以使用命令 "journalctl -b"转储所有内容吗? 我无法成功地在我身边重现此问题。  

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Krunal:

    我是 Tim 的另一名工程师。 以下是成功启动和失败启动上的 journalctl 日志。 e2e.ti.com/.../weston_5F00_fail.loge2e.ti.com/.../weston_5F00_success.log

    此致!

    约书亚

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、 Joshua、

    谢谢您的博客。 在测试工作映像与非工作映像时、您是要更改引导映像、Uboot 还是电路板? 我问的原因是、在工作设置中、我看到了以下日志:

    apr 28 17:42:27 mitysom-am62x kernel:kernel command line:console=ttyS2115200n8 earlycon=ns16550a、mmio32@、0x02800000 mtdparts=spi-nand0@:512k (ospi.tiboot3

    几秒钟后、我看到 SD 卡已安装、包括 DSS 在内的所有模块都已加载。 在不工作的安装程序中、我在内核命令行中只看到以下内容:  

    行2-45Apr 28 17:42:27 mitysom-am62x kernel:kernel 命令行:console=ttyS2115200n8 earlycon=ns16550a、mmio32、0x02800000 mtdparts=spi-nand0:512k (ospi.tiboot3)、2m (ospi.tispl)、4m (ospi-boot、25>

    我没有看到您的文件被装入,没有加载模块。  

    此致、

    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Krunal:

       我很抱歉、但似乎我向您发送了一个不完整的文件。 这是完整版: e2e.ti.com/.../5432.weston_5F00_fail.log。电路板或引导映像没有变化、区别仅是重启电源。

    谢谢!

       约书亚

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    作为一个实验、您可以在您的 Yocto local.con 文件"image_install:append ="seatd"中尝试以下命令吗?

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Krunal:

     我添加了 image_install:append ="seatd"并进行了重建。 虽然这似乎减少了韦斯顿未能启动的靴子数量,但它仍然不时发生。 下面是一个 journalctl 和引导日志,它来自 Weston 无法启动的引导之一。 e2e.ti.com/.../weston_5F00_fail_5F00_2_5F00_boot.loge2e.ti.com/.../weston_5F00_fail_5F00_2_5F00_jrnl.log

    谢谢!

       约书亚

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    你好、Joshua、

    感谢快速实验。  我未尝试多个电路板、无法使用 TI SDK 在 TI EVM 上重现问题。 在 Uboot 中、我传递了 maxcpus 参数以将内核限制为1或2、但仍然无法复制问题。  

    一般而言、您在 Yocto 和内核配置中执行了哪些更改。 此外、是否可以为我获取您的 rootfs 文件以在 TI EVM 上尝试? 根据日志、我看到 GPU 和 DSS 探测器、因此/dev/dri/cardN 应该存在、但 Weston 等用户空间应用无法在您的设置中访问/dev/dri/cards。 这似乎是一个时间问题与 systemd 或 seatd ,但日志并没有真正显示任何有用的帮助定位问题。

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Krunal:

    我能够使用 SDK 9.1和9.2在我们的 EVM 板(PROC114E2)上复制此问题。 我在 maxcpus=1时看到了90%的故障、在 maxcpus=2时看到了大约60%的故障(故障是 Weston 未启动)。 上面的 EVM 是 GP 板、但我认为这无关紧要、因为我们的定制板是 HS。

    我们执行了多项更改。 您可以在 这里和这里找到它们。 然而、由于我们能够在未修改的 SDK 的 EVM 板上重现此情况、我认为这些更改并不重要。

    再次感谢您、

       约书亚·布尔格特

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    您能否与默认的9.2 SDK 共享 TI EVM 的日志? 记录通过和失败的情况。  

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Krunal:

    这是针对具有 maxcpus=2的 TI EVM 9.2 SDK 的日志和引导日志、这两个日志都是针对成功的 Weston 启动和失败的 Weston 启动。 如果您有任何其他需要、请告诉我。

    此致!

       约书亚·布尔格特

    e2e.ti.com/.../weston_5F00_fail_5F00_sdk9.2_5F00_evm_5F00_boot.loge2e.ti.com/.../weston_5F00_success_5F00_sdk9.2_5F00_evm_5F00_boot.log

    e2e.ti.com/.../weston_5F00_success_5F00_sdk9.2_5F00_evm_5F00_jrnl.loge2e.ti.com/.../weston_5F00_fail_5F00_sdk9.2_5F00_evm_5F00_jrnl.log

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!  

    感谢您的日志、我在您的成功日志上看到一些有趣的显示消息:

    1月01 00:00:21 am62xx-EVM Weston[958]:[00:00:21.642] DRM:头'HDMI-A-1'已更新、连接器40已断开连接。
    Jan 01 00:00:21 am62xx-EVM Weston [958]:[00:00:21.642] DRM:HEAD 'HDMI-A-1"找到、连接器40已断开连接。

    1月01 00:00:15 am62xx-EVM 内核:tidss 30200000.dss:[DRM]找不到任何 CRTC 或大小
    1月01 00:00:15 am62xx-EVM 内核:tidss 30200000.dss:[DRM]找不到任何 CRTC 或大小

    我在我的设置中根本看不到这一点、我很好奇您使用的是哪种类型的 HDMI 显示器? 是标准全高清显示器吗?

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

       抱歉、我在没有 HDMI 电缆的情况下运行测试、因为我认为这不会影响结果。 下面是我将该板连接到 Asus HD 显示器后收集的启动日志。

    此致!

       约书亚·布尔格特

    e2e.ti.com/.../0068.weston_5F00_fail_5F00_sdk9.2_5F00_evm_5F00_jrnl.loge2e.ti.com/.../0068.weston_5F00_fail_5F00_sdk9.2_5F00_evm_5F00_boot.log

    e2e.ti.com/.../7411.weston_5F00_success_5F00_sdk9.2_5F00_evm_5F00_jrnl.loge2e.ti.com/.../7411.weston_5F00_success_5F00_sdk9.2_5F00_evm_5F00_boot.log

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    似乎确实存在一些我们需要调试的时序问题。 同时、我建议两点修正:

    1. 建议的修复:在这里描述: https://github.com/systemd/systemd/issues/25408#issuecomment-1383154942

    2. Hacky 修复:在 Weston 服务中添加延迟。 步骤如下:

    在您的电路板上、打开文件 /etc/systemd/system/graphical.target.wants/weston.service 并按如下方式进行编辑:

    [Service]
    # Requires systemd-notify.so Weston plugin.
    Type=notify
    EnvironmentFile=/etc/default/weston
    ExecStart=/usr/bin/weston --modules=systemd-notify.so
    ExecStartPre=/usr/bin/test -e /dev/dri/card1
    RestartSec=10
    Restart=on-failure
    

    在"Service"下、我们添加了 ExecStartPre 条件和一个重启计时器。 请随时根据您的需求更改值。

    此致、
    克鲁纳尔

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

       我们尝试了推荐的修复方法、它似乎起作用。 我们将创建 Yocto bb 附加文件和共享。

    谢谢!

       约书亚·布尔格特

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    谢谢 Joshua。 如果您在上述方法方面遇到任何问题、请随时向我们提供最新信息。

    此致、
    克鲁纳尔