This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] OMAP-L137:以太网问题

Guru**** 2581905 points
Other Parts Discussed in Thread: OMAP-L137

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/processors-group/processors/f/processors-forum/630408/omap-l137-ethernet-issue

主题中讨论的其他器件:OMAP-L137

大家好、我的客户现在已经停产了、并联系了我、提出了以下有关 OMAP-L137的问题。 请查看以下客户问题。

我目前正在调查一个使用 TI OMAP L137 (OMAPL137DZKB3)的运动板问题。 在此调查期间、我们遇到了 OMAP 的一些意外行为、希望您的支持人员能够找到根本原因并找到解决方案。  

背景信息:
电路板布局使得 OMAP 处理器通过 RMII 总线连接到以太网 PHY 类型 KSZ8041 (来自 Microchip Technology)。 MII 接口直接连接到1.5米 UTP 电缆与笔记本电脑(主机)。 此笔记本电脑运行测试软件、以模拟一个通过以太网对运动板进行的简单 API 调用。

问题简介:
我们的最终客户报告了有关软件 API 调用超时错误的问题。 问题是 OMAP 在呼叫超时(8秒)内不响应主机、并且主机上记录超时错误。 超时最初设置为8秒、但作为变通方式增加到3分钟、因为最终(通常在1分钟50秒后)呼叫始终完成。

内部调查:

  • 我们能够在到目前为止测试的所有板上重现此问题。
  • 我们发现问题出在从 OMAP 到主机(通过以太网)的通信路径中:
    • 在应用程序级别、响应在毫秒内被推入 TCP 套接字、但主机在1min50秒后收到响应。
    • 在 Wireshark 的支持下、我们可以看到网络错误、并在超时期间重新传输。

  • 该问题在一个电路板上重现比在其他电路板上重现更容易、并且与温度相关。 超时次数随着 OMAP 温度的升高而增加(测试结果高达45摄氏度)。

观察结果:

  • 如果我们用热风枪略微加热 OMAP 处理器、我们会看到 API 调用的超时周期增加了一分钟甚至更多。
  • 如果我们在超时期间 Ping OMAP 处理器、则此超时时间会以秒为单位减少、但我们并不知道原因(可能与内核中的 TCP 拥塞机制有关)。
  • 每次出现此问题时、我们都会看到主机上的 RX 数据包丢失错误计数器增加1。
  • 我们在示波器上看到、当发生超时错误时、RMII_CLK 和 RMII_TXEN 信号之间的时序发生变化(请检查附件中的示波器图)。 RMII_CLK 和 RMII_D0/D1信号之间的关系没有变化。 RMII_CLK 看起来也很稳定。
  • 我们还检查了电源噪声和 RMII 时序、并执行了以太网合规性测试。 这些都在规格范围内。

问题1:

RMII TXEN 时序和 OMAP 输入(电源、晶振等)之间或通过去耦或 PCB 布线是否存在任何已知关系? 哪些因素会导致 EMAC 子系统的温度灵敏度?

 

问题2:

哪些特定的电源引脚供应 EMAC 模块? 测量 OMAP 的 PLL 电源时要符合 OMAP 规格、但我们要测量尽可能靠近 EMAC 块的电源噪声。

OMAP-RMII_CLK_VS_RMII_TX_EN_ERROR_During_OMA_暖 通.png:

OMAP_RMII_CLK_VS_RMII_TX_EN_NO_ERRORS.png

提前感谢 Patrick

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好!

    我们将对此进行研究。 反馈将发布在此处。

    此致、
    Yordan
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    我在附件中包括了一个示波器图,其中显示了来自 OMAP (OMAP ->以太网 PHY)的 RMII_CLK (CH1)和 RMII_TXD0 (CH2)信号。 时钟到输出的时间随时间突然变化(~5ns)。 由于这不是正常行为、我们怀疑 EMAC 模块中存在一些时序问题。 问题是哪些硬件/布局依赖项会导致这种影响。 如果我们的测试软件没有显示计时错误,我也看不到时钟和数据之间的关系发生了这种变化。 如果 OMAP 的温度升高、就会出现偏移。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    问题1:

    RMII TXEN 时序和 OMAP 输入(电源、晶振等)之间或通过去耦或 PCB 布线是否存在任何已知关系? 哪些因素会导致 EMAC 子系统的温度灵敏度?

    [MB]数据表中的外设时序在器件支持的整个规格范围内指定。 没有已知问题、错误或任何报告的 EMAC 时序随温度变化而敏感的问题。
    您肯定应该仔细检查整个温度规格内的电源、晶振/时钟源稳定性

    问题2:

    哪些特定的电源引脚供应 EMAC 模块? 测量 OMAP 的 PLL 电源时要符合 OMAP 规格、但我们要测量尽可能靠近 EMAC 块的电源噪声。

    [MB] EMAC 控制器逻辑由 CVDD 供电、IO 由 DVDD 供电。


    跟进问题
    1) 1)您说所有电路板都显示了问题、但其中一个电路板更为突出。 请详细说明。 此外、如果旧设计和所有电路板都出现故障、这是新设计还是旧设计-是因为它从未过过过温度测试、还是您认为您看到最近一批电路板出现故障等?
    2) 2) Micrel phy 具有自己的时钟源。 您正在提供其时钟源的内容、并且您是否对时钟源过热进行了特性描述、以确保它不会随温度的变化而出现问题。
    3) 3) OMAPL137 EVM 也有一个 Micrel PHY、尽管它是不同的 PHY。 如果您可以访问 EVM、则可以对其进行实验、以查看是否存在任何问题-如果没有、则可能会导致电路板上出现系统硬件设计问题。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    如何提供50MHz OMAP RMII 时钟?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    硬件测试:

    -       以太网合规性测试

    -       物理设备和 OMAP 上的电源噪声

    -       计时(计时、信号完整性)

    -       RMII 时序和信号完整性

           - OMAP 输入时钟

    -       上电复位行为

     

    软件测试(使用笔记本电脑(运行 Linux)和运动板:

           ‘应用程序(一个特定的 API 调用“获取信息”并记录 Rx 错误 Linux ifconfig)不涉及运动控制。

           -笔记本电脑(Linux OS)和运动控制板(10Gbit)之间的 Iperf、UDP 测试

     

    另外值得一提的是、我们最近根据当前设计推出了一款新产品、但我们遇到了一些问题。 我们的客户希望在不更改任何软件和固件的情况下在这个新电路板上具有相同的功能、并将其用于下一代系统(以便节省时间并降低集成风险)。 该板是原理图和固件版本、准确复制、但由于外形尺寸等原因、电路板布局略有不同 在该板上、我们无法重现此问题。 因此、我们已经了解了电路板之间的布局差异、但无法找到可能导致我们所面临问题的差异。 我们还测量了电源噪声、信号完整性和时序、以检查我们是否可以发现任何差异。 唯一的区别是 OMAP 和 PHY 之间 RMII TX 接口的时钟到输出延迟。 在出现时钟输出延迟问题的电路板上,会发生偏移,但我们不知道原因。 新设计的时钟到输出延迟始终相同。 在这一新设计中,我们不会丢失 UDP 封包,也不会在我们自己的测试应用程序中出现任何超时错误。 因此、我们非常确信问题与硬件相关、这也是因为温度对误差数量有影响。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好、Mukul、

    要回答您的问题:

    1) 1)您说所有电路板都显示了问题、但其中一个电路板更为突出。 请详细说明。 此外、如果旧设计和所有电路板都出现故障、这是新设计还是旧设计-是因为它从未过过过温度测试、还是您认为您看到最近一批电路板出现故障等?

    这是一种旧设计、并非所有电路板都在温度范围内进行了测试。 但我们确实认为板上存在问题。

    2) 2) Micrel phy 具有自己的时钟源。 您正在提供其时钟源的内容、并且您是否对时钟源过热进行了特性描述、以确保它不会随温度的变化而出现问题。

    否、Micrel 通过 OMAP RMII_CLK (引脚 A04)获得其50MHz REFCLK。 RMII_CLK 的信号完整性正常、如发送10月9日的图中所示。 但我们看到时钟到输出延迟发生了一些奇怪的移位、我们无法解释。

    3) 3) OMAPL137 EVM 也有一个 Micrel PHY、尽管它是不同的 PHY。 如果您可以访问 EVM、则可以对其进行实验、以查看是否存在任何问题-如果没有、则可能会导致电路板上出现系统硬件设计问题。

    我们没有 EVM,因此很遗憾我们无法进行实验。
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    直流电平使用真 RMS 万用表进行测量:
    - DVDD 为3.325
    - CVDD 为1.199V
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    [引用用户="Martijn Damen"]Hi Mukul、

    要回答您的问题:

    2) 2) Micrel phy 具有自己的时钟源。 您正在提供其时钟源的内容、并且您是否对时钟源过热进行了特性描述、以确保它不会随温度的变化而出现问题。

    否、Micrel 通过 OMAP RMII_CLK (引脚 A04)获得其50MHz REFCLK。 RMII_CLK 的信号完整性正常、如发送10月9日的图中所示。 但我们看到时钟到输出延迟发生了一些奇怪的移位、我们无法解释。

    [/报价]

    请参阅 TRM 第7.3.4节中的注释。 引脚 A04不应用于为 RMII 计时。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好!

    感谢您关注此问题。

    很明显、RMII_CLK 不符合规格、但您是否认为 RMII 输出时钟与温度相关并导致我们看到的时钟到输出延迟的变化并导致我们在以太网上看到的问题? 我想了解为什么 OMAP 的 RMII 输出时钟会导致我们的问题。 这意味着我们需要重新设计电路板。 但是、我们在 OMAP L137中也有其他设计、RMII 时钟的配置完全相同、但该电路板不对温度敏感。 唯一的布局差异是总线总长度(230mm 与75mm)。 总线长度是否会对我们看到的行为产生任何影响。  

    此致、Martijn

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    Martijn、

    从 OMAP L-13x 原理图查看检查清单:

    CLKOUT 时钟输出被提供为 PLL 观测时钟、并且只用于测试和调试。 不应将其用作任何外设接口的同步时钟、因为它不会对任何其他信号进行时序闭合。 该时钟输出也不用于为任何需要低抖动参考时钟的时间关键型外部电路供电。 抖动性能取决于许多系统变量、还会受到其他影响抖动性能的不可预测因素的影响、例如应用特定噪声和时钟电路串扰。 没有 CLKOUT 抖动性能的特性数据。


    缺少支持您的用例的特性数据告诉我、很可能会发现不可预测的行为。 我建议您为 MAC 和 PHY 提供(共享)外部50MHz 时钟、然后重新运行测试。 请确保该时钟源在 MAC 和 PHY 之间以等距方式放置、并且每个时钟源的走线长度应尽可能匹配。 理想情况下、CLK 到 MAC 和 CLK 到 PHY 布线之间的偏斜应小于2.5mm、每个布线的总布线长度小于150mm。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 DK:

    感谢您对此进行澄清。 我向电路板添加了外部时钟源、问题 似乎 已经解决。 即使在高环境环境中测试电路板、我也看不到任何问题。 我不是原始设计人员、也不是这个电路板。 我想、在过去、我们甚至使用了 L137的实验版本来启动该项目。 由于这是一个"旧"设计、我们错过了此设计说明、或者当时甚至不存在。 由于我们和客户 从未遇到 过任何问题、因此在项目的早期阶段从未发现过此问题。

    我认为这一项目已经解决,如果可能,可以结案。

    谢谢、

    此致 Martijn

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    感谢 Martijn、
    我更新了问题标签、以供后续和进一步搜索。 我还在 TI 方面标记了这一问题的解决方法;非常感谢您的解决方法。