This thread has been locked.

If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.

[参考译文] Linux/TPS23861:TPS23861#39特定批次的故障率是否较高?

Guru**** 2494635 points
Other Parts Discussed in Thread: TPS23861

请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

https://e2e.ti.com/support/power-management-group/power-management/f/power-management-forum/706647/linux-tps23861-tps23861-s-particular-batch-has-a-high-failure-rate

器件型号:TPS23861

工具/软件:Linux

我们的 TPS23861芯片组有问题。 在正常环境温度下、我们一直在项目中使用此芯片组。 连续运行24小时后、我们的1000件整批产品中大约2.5%将出现故障。 PoE 将无法检测我们的 PD 器件并为电路板供电。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    我们的 TPS23861芯片组有问题。 在正常环境温度下、我们一直在项目中使用此芯片组。 连续运行24小时后、我们的1000件整批产品中大约2.5%将出现故障。 PoE 将无法检测我们的 PD 器件并为电路板供电。

     

    我们最初认为、可能是由于48V 上的巨大尖峰或波动导致芯片组发生故障。 因此、我们添加了大量保护电路、包括在48V 上添加510 Ω 电阻器、以及添加保护晶体管和一些电容器。 但是、这不会降低电路板上该芯片组的故障率。

     

    随附了 PSE 和升压电压电路原理图:

    1. 外部电源电压为27V。 我们通过直流/直流升压升压升压到48V。
    2. 我们通过 MPU 控制 TPS23837的 I2C 和复位。 MPU 的 IO 电压为2.62V。

     

    这是我们的原理图:

     

     

    当我们使用示波器测试 Drain1至 Drain4时、我们无法看到应该存在的任何检测信号(如下图所示):

     

    (我们看不到这些检测信号中的任何一个。 我们的信号始终为一条直线)

     

    我们还对被破坏的芯片组和普通芯片组的寄存器进行了一些比较,发现对于所有被破坏的芯片组,它们具有相同的“固件版本”(0x41)和“芯片版本号”(0x43)。 普通芯片组没有此“固件版本”或“芯片版本号”。 这似乎意味着这批具有此“固件版本”或“芯片版本号”的芯片组更容易发生故障,但我们无法完全确定。 我们也不知道这些参数在被破坏后是否已被重写、但根据我们的理解、这2个寄存器是不可写的。  

     

    正常的芯片组寄存器转储

     

    已损坏芯片组寄存器转储

     

    我们也分析过被破坏的芯片组、看不到任何短路或任何异常情况。

     

    目前、我们处于亏损状态。 是否有人可以就下一步要做什么向我们提出建议?

     

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好、Shuanglin、

    您能描述一下如何在24小时内运行测试? 您是否始终保持48V 电源开启且端口开启? 或者您是否始终如一地循环系统? 您还可以检查 TPS238电气 顺序(VPWR、VDD 和复位)吗? 我们需要与本应用手册www.ti.com/.../slva723.pdf 中的图1类似的波形。谢谢。

    此致、
    一分钱
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Penny:

    很抱歉、我们向您提交了如此多不同的案例。 这是因为在提交期间出现了错误,似乎拒绝了我们的提交。

    下图说明了我们如何在24小时内测试电路板。

    答案如下:

    问题1:您是否始终保持48V 电源和端口保持开启状态?

    答案1:48V 电源始终开启、并由电路板上的直流/直流供电。 此直流/直流转换器可升高我们馈入的27V 电压并转换为48V 电压、从而为 TPS23861和外部 PD 器件供电。 测试电路板时、PD 器件未连接。

    问题2:或者您的系统循环是否一致?

    答案2:当系统通电时、我们不切断电源、这意味着我们根本不会对系统进行循环。

    问题3:关于 slva723.pdf 波形、我的测试结果如下:

    我注意到,我们的加电波形可能无法满足文档的要求。 这主要是因为当我们的 MPU 通电时,IO 的状态为高电平。 当我们的软件系统启动时、软件可以修改 IO 输出状态。 因此、当我们打开电源时、我们将重置芯片组。 这是否是芯片组故障的可能原因?

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好、Shuanglin、

    没问题。 我们可以将注意力集中在这个线程上并关闭其他线程。 不正确的上电序列可能会导致 TPS23861修整位损坏、并且无法恢复。 您需要找到一种方法、在 Vpwr 达到其 UVLO 之前将 RESET 引脚保持在低电平。
    您还能向我发送 TPS23842 3.3V 如何生成的原理图吗? 谢谢。

    此致、
    一分钱
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Penny:

    非常感谢您的建议和专业帮助。

    下面是我们的电源方框图和原理图。 它将显示如何生成 TP23842的3.3V 电压。

    目前、我们已经生产了一小批产品以发送给客户。 如果我们需要对我们的董事会进行重大变革、这对我们来说将是极其困难的。

     

    1. 您能帮助我们考虑一种解决此问题的替代方法吗?
    2. 另外、您认为对于已经经历24小时老化过程的电路板、将来他们不会出现这种问题吗?

     

    我们还发现,对于那些被破坏的芯片组,I2C 中的寄存器显示“固件版本”(0x41=0x00)和“芯片版本号”(0x43=0x2)是相同的。 似乎只有这一特定批次才会出现此类故障。 在您看来、您认为该批次对这种故障特别敏感、还是由于我们的加电序列异常而导致这2个寄存器被重新写入(正常值应为0x41=0x02,0x43=0xe3)? 芯片组采用相同的批次和相同的封装,因此这些寄存器应该是相同的。

     

    我们的主要目的是查看此特定批次是否更容易出现问题、以便我们可以从生产中挑选出具有此特定批次芯片组的电路板、以销毁电路板、而不是将其交给客户。 这将是我们目前最具成本效益的解决方案。 在下一个批次中、我们将修改硬件以完全消除问题。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。
    您好、Shuanglin、

    我认为固件版本应该与原来相同。 为了解决这个问题、我认为您可以将 GPIO 的默认输出更改为低电平。 我知道有一种使用 MSP430实现它的方法、但我认为您的 MPU 必须具有类似的功能。 谢谢。

    此致、
    一分钱
  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Penny:

     

    我们的 MPU 基于 MIPs 处理器。 运行的软件是 uboot + Linux。 如果是微处理器、我们可以使用软件来控制上电 IO 状态。 但是、该特定处理器无法控制此上电 IO 状态。 因此、我们可以做的是等待 uboot 启动、然后接管 GPIO 的控制权。 但是、当我们能够进行控制时、我们已经越过加电时序了。

    目前、我们已经找到了一种修改硬件以实现加电序列的方法。  我们使用 GPIO 和下拉电阻器来修改复位和电源序列。 当它被加电80ms 时、复位将有一个短尖峰(这个尖峰不由我们控制)。

     

    硬件修改后、波形变为如下所示:

    您能帮助我们检查此加电序列是否能满足 TPS23842的要求吗?

     

    对于当前产品、我们已经向客户发送了2K 的器件。 如果我们回忆一下这些产品、肯定会给我们带来一些巨大的痛苦。 这些2K 产品都经过24小时老化处理。 每个产品、我们都至少加电4次(在功能测试期间以及在 MAC 地址中刻录)。 大约有6块损坏的电路板、这相当于3%的故障率。 所有主板的芯片组都显示“芯片修订号”为0x2。 在这种情况下,您认为0xe3芯片组的版本可能不会像0xe2那样容易破坏吗? 还是0xe3芯片组根本不会出现此类问题?

     

    我们提出这个问题是因为,如果我们可以使用软件来确定哪个主板的芯片组是0x2,那么我们就可以挑选出这些主板了。 我们已经检查了产品、发现0xe2是我们发送给客户的电路板池中的少数。

     

    总之、

    1. 请帮助我们审查修改后的硬件建议是否能满足 TPS23842的要求。

    2. 0xe2是否更容易受到这些类型的问题的影响? 在我们的情况下、0xe3是否仍然可以正常工作而不会出现任何问题?

     

    非常感谢您的帮助。 我们将来肯定会修改我们的 PCB 硬件、但我们首先需要解决当前的情况。 希望在您的专业帮助下、我们能够解决这个问题。

     

    非常感谢、

    Shuanglin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Penny:

        很抱歉、因为我们正在进行生产、也要移交给客户、所以这对我们来说是一个非常关键的问题。 如果您能尽快向我们提供您所掌握的任何信息或进展、我们将不胜感激。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Shuanglin、

    很抱歉耽误你的回答。 我仍在等待我的开发团队确认。 我的最初回复是、我们的所有器件都应该具有相同的固件版本、即0xE3。 不正确的开机顺序可能会导致固件版本问题。 我认为返工后的上电序列应该可以、但再次运行测试会更好。 不正确的上电顺序可能会导致器件故障、强烈建议进行修复。 谢谢。

    此致、

    一分钱

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好 Penny:

     

    我们在修改后的电路板和未修改的电路板上进行了一些实验:

    1. 将每个组的10块电路板置于标准工作温度下、然后进行下电上电。
    2. 对于每个电路板、我们都要执行下电上电、即:断电10秒、上电60秒。
    3. 在实验过程中、环境温度为32摄氏度、湿度为53%。 没有 PoE 负载(未连接 PD 器件)。
    4. 在实验之前,我们对寄存器读数执行转储,所有转储显示芯片组的固件版本为0xe3。

     

    目前、我们已经进行了20小时的测试、每块电路板都进行了1000次以上的测试。 我们未发现 TPS23861出现任何故障。 目前测试仍在进行中。

     

    我们希望通过上述比较测试、可以在未修改的电路板上重复出现故障、并且在修改的电路板上不会出现故障。 这将确认我们对这类故障的当前分析可以通过修改电路板来解决。

     

    请务必继续询问您的技术支持团队、我们是否应该注意到任何内容、以及我们的问题、即为什么只读寄存器能够重新写入0x2。 我们希望能够完全消除这一问题、以便我们能够快速推进并为客户解决问题。

     

    再次感谢您对我们如此耐心。

     

    谢谢、

    Shuanglin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    大家好、Penny、目前我们的比较测试仍在进行中、我们已经测试了96小时(4天)以上。 这两组测试都不会再次出现 PoE 故障问题、因此、如果我们完全解决了 PoE 问题、我们仍然非常担心。 您有没有关于您的方面的新闻? 谢谢、我们很抱歉耽误您的时间。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    您好、Shuanglin、

    我们的固件将寄存器0x42设置为0x2、将寄存器 ox43设置为0xE3、因此所有器件在这2个寄存器中都应具有相同的值。 谢谢。

    此致、

    一分钱

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Penny:
    器件 ID 应仅为0x43、在该寄存器中、我们可以看到坏批次为0x2、良好批次为0xe3。 为什么会这样呢?
    此外,在您第一次答复中,您提到“不正确的加电序列可能会导致 TPS23861 修整位损坏,并且无法恢复。  “,您能告诉我们什么是“修整位损坏”吗?
     
    谢谢、
    Shuanglin

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。


    您好、Shuanglin、

    我认为0xE2可能是由您的加电顺序不当引起的。 我从另一位客户那里看到了类似的问题、在他们解决上电序列问题后、TPS23861故障消失了。 如果在   电源被视为“有效”之前,它们复位为高电平(数字系统被“启用”),则数字系统可以进入未知状态。  谢谢。

    此致、

    一分钱

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Penny:

    我们使用了新方法并重新路由电路板、目前我们正在对1K 的电路板进行老化处理。 这些测试将于8月3日结束。 目前,我们仍然非常担心问题是否确实得到解决,因为我们无法找到绝对的解决办法。 因此、如果您不介意、我们是否可以将问题延长到8月3日左右? 如果你能这样做,我们将不胜感激。 谢谢。

  • 请注意,本文内容源自机器翻译,可能存在语法或其它翻译错误,仅供参考。如需获取准确内容,请参阅链接中的英语原文或自行翻译。

    尊敬的 Penny:

        我们已经完成了这1K 器件的生产、没有发现任何缺陷 PoE 器件。 我们相信,我们已经在你的帮助下成功地解决了这个问题。

    再次感谢!  ^_^