This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] TLK2501:罕见、间歇性数据损坏

Guru**** 2584465 points
Other Parts Discussed in Thread: TLK2501

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/interface-group/interface/f/interface-forum/1575736/tlk2501-rare-intermittent-data-corruption

部件号:TLK2501


工具/软件:

TI 代表、您好

我们观察到、在使用 TLK2501 作为高速发送串行器的多个系统中、发生了罕见的局部数据损坏。 在室温下进行的一项有代表性的试验中、我们捕获了总共~4400 个不良帧中的 10 个错误帧。 每个事件都限制在帧内的单个水平行、存在位级异常、例如强制使字为 0x0000 或明显 MSB 翻转、而相邻行保持干净。 在一个受影响的主板上更换 TLK2501 后、损坏停止、随后的捕获不会产生坏帧。 我们的原理图和布局已根据 TLK2501 文档进行了审核、并且符合要求。  我们寻求有关潜在器件灵敏度或运行条件的指导、以解释这些间歇性字/位错误。

 

设置(摘要)

  • 仅 TX(RX 未使用)。 将 CML 输出交流耦合到 50Ω。
  • VDD = 2.5V;DOUTTXP/N 上的 49.9Ω 上拉至 2.5V;RREF = 150Ω;根据数据表提供本地去耦+铁氧体磁珠。
  • 由 FPGA 提供 GTX_CLK;TLK2501 正常(非测试)模式下的控制/测试引脚。
  • 有效载荷是一种确定性 14 位测试模式(帧时序与工作模式相同)、用于检测 single-bit /字错误。

 

Test Method

  • 连续捕获帧并根据像素/位与已知良好的基准进行比较、以检测 single-bit 或字错误。

 

观察到的行为

  • 室温运行:总共~4400 个坏帧中有 10 个坏帧
  • (框架 4,280,4304307432432743343354346、 4,366,4374377438438043843824389)。

 

误差特性:

  • 损坏为行局部化:每个事件影响一个水平行;相邻行是干净的。
  • 位级增量显示:
    • 整个字强制为 0x0000、或
    • MSB 组切换(高位翻转)、或
    • 找到特定的重复字值。
  • 事件之间不会重复像素位置(间歇性,未卡住)。
  • 通过对 10 个帧的额外分析、可以发现丢弃的位、重复的数据模式和与上述行为一致的特定错误像素值。

 

我们尝试/观察到的情况

  • 在受影响的主板上更换 TLK2501 已移除故障(之后未观察到错误帧)。
  • 我们根据 TLK2501 + PowerPAD 应用手册审查了原理图/布局;未找到不合规问题(有详细信息)。

 

请求指导

  • 在其他标称条件下、TLK2501 灵敏度是否已知会产生间歇性的字级清除 (0x0000) 或 MSB 翻转?
    • 例如、RREF 容差/漂移、VDD 纹波、CML 负载/端接容差、GTX_CLK 抖动 器件老化/ESD/潜在损坏、PowerPAD 焊料空洞/热偏移。
  • 是否有可能映射到我们症状的与数据包中干扰(例如空闲插入,TX_EN/TX_ER 时序)相关的勘误表或字段说明?
  • 推荐的基准诊断用于隔离器件与系统:
    • DOUTTX±处的眼图、TLK2501 引脚上的电源纹波、GTX_CLK 处的抖动屏蔽、PRBS 模式 BER 目标、温度扫描指南。
  • 交流耦合 50Ω 链路中 TLK2501 的任何最低/典型 BER 预期以及建议的 PRBS 模式/长度?

 

我们可以分享示波器捕获 (TX 眼图、VDD、GTX_CLK)、布局摘录(PowerPAD、RREF 放置)、 和错误日志。

 

感谢您的任何建议或已知缺陷。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Matt:

    感谢您联系我们! 此设备的专家目前已不在办公室、因此响应可能会延迟到本周结束。 在此期间、我将尽力提供帮助

    替换受影响主板上的 TLK2501 已删除故障(之后未观察到错误帧)。

    1.您是否注意到多个电路板或一个电路板上存在此问题? 如果问题可以隔离到一个板上、而更换 TLK2501 解决了问题、则这可能与故障器件的特定器件或焊接问题有关。 如果只有一个电路板+器件故障组合、 则完全 A-B-A 交换 可以缩小这是焊接问题还是器件本身是原因的范围。

    2.在失败的测试中是否有任何不利的因素可能会干扰您的信号? 我看到所有 10 个错误帧都 接近 4400 中发送的最后 100 个帧、因此很好奇、测试室内是否有可能干扰的事件。 是否只有一个测试运行失败?或者是否完成了多个测试?

    此致、

    Shane

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    嗨、Shane、

    感谢您的答复。

    我们观察到 2 个 CCA 上存在错误的帧。  我们有更多报告相同故障模式的系统、可以作为重复测试的候选方案。  我们检查了 2 个 CCA 上的焊料、并对 2 个 CCA 进行了 X 光检查。  我们没有发现与焊料不合规的情况。  我们确实保留了 TLK2501 与第 2 个 CCA 的区别、并可以将其安装在另一个 CCA 上、以确认器件是否存在问题。

    在坏帧期间没有已知的不良反应。  是相同的。  测试是在室温下进行的、而不是在室温下进行的。  第一个 CCA 有 5 次运行、帧错误。  我们有 2 次运行、第二次 CCA 的帧错误。

    此致、

    马特