This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] Linux/AM5716:OpenCL 相关 TIOCL 致命错误:与 DSP 的通信已丢失(可能是由于 MMU 故障)

Guru**** 2609955 points


请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/581974/linux-am5716-opencl-related-tiocl-fatal-communication-to-a-dsp-has-been-lost-likely-due-to-an-mmu-fault

器件型号:AM5716

工具/软件:Linux

您好!

客户正在 OpenCL 框架内运行算法、它显然可以在大量电路板上工作、但某些电路板遇到以下错误

从命令行运行程序的跟踪:
------------------------------------------

排队任务:扫描--@5781ms
Recvfrom 失败:链接已断开(67)
rpmsgThreadFxn:FD 11上的 transportGet 失败、返回-20
TIOCL 致命错误:与 DSP 的通信已丢失(可能是由于 MMU 故障)。 请稍候、DSP 已复位、运行时尝试终止。 如果运行另一个 OpenCL 应用程序失败、则可能需要重新启动。 有关故障信息、请参阅内核日志。

客户正在将完全相同的软件部署到多个主板上,并且在大多数主板上,例如7,一切似乎都可以正常工作,并且在3个主板 上,它们会出现错误:“TIOCL 致命:与 DSP 的通信已丢失(可能是由于 MMU 故障)。” 发生此错误后,即使似乎重新加载了固件,并且内核日志中再次报告 DSP 为“正常运行”和“可用”,DSP 也不可用。 即使要从 ti/examples/OpenCL 成功运行平台示例程序、也需要重新启动。

 

随附 的是程序跟踪、与故障相对应的 dmesg 输出和 LAD 日志输出。

如果存在系统错误或可疑的情况、是否有人可以查看随附的迹线?

此类故障的原因可能是什么? 这些电路板在温度下进行了大量 DDR 测试、没有故障。

e2e.ti.com/.../6116.opencl_5F00_lad_5F00_issue.zip

谢谢、

-Gunter

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好 Gunter、

    很抱歉耽误你的答复。 我已通知设计团队。

    此致、
    Yordan
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好 Gunter
    只是为了澄清、所有电路板都是相同的架构-相同的存储器、相同的一切、相同的软件、对吧?

    谢谢

    已运行