工具/软件:Linux
我们的 TPS23861芯片组有问题。 在正常环境温度下、我们一直在项目中使用此芯片组。 连续运行24小时后、我们的1000件整批产品中大约2.5%将出现故障。 PoE 将无法检测我们的 PD 器件并为电路板供电。
This thread has been locked.
If you have a related question, please click the "Ask a related question" button in the top right corner. The newly created question will be automatically linked to this question.
我们的 TPS23861芯片组有问题。 在正常环境温度下、我们一直在项目中使用此芯片组。 连续运行24小时后、我们的1000件整批产品中大约2.5%将出现故障。 PoE 将无法检测我们的 PD 器件并为电路板供电。
我们最初认为、可能是由于48V 上的巨大尖峰或波动导致芯片组发生故障。 因此、我们添加了大量保护电路、包括在48V 上添加510 Ω 电阻器、以及添加保护晶体管和一些电容器。 但是、这不会降低电路板上该芯片组的故障率。
随附了 PSE 和升压电压电路原理图:
这是我们的原理图:
当我们使用示波器测试 Drain1至 Drain4时、我们无法看到应该存在的任何检测信号(如下图所示):
(我们看不到这些检测信号中的任何一个。 我们的信号始终为一条直线)
我们还对被破坏的芯片组和普通芯片组的寄存器进行了一些比较,发现对于所有被破坏的芯片组,它们具有相同的“固件版本”(0x41)和“芯片版本号”(0x43)。 普通芯片组没有此“固件版本”或“芯片版本号”。 这似乎意味着这批具有此“固件版本”或“芯片版本号”的芯片组更容易发生故障,但我们无法完全确定。 我们也不知道这些参数在被破坏后是否已被重写、但根据我们的理解、这2个寄存器是不可写的。
正常的芯片组寄存器转储
已损坏芯片组寄存器转储
我们也分析过被破坏的芯片组、看不到任何短路或任何异常情况。
目前、我们处于亏损状态。 是否有人可以就下一步要做什么向我们提出建议?
您好 Penny:
很抱歉、我们向您提交了如此多不同的案例。 这是因为在提交期间出现了错误,似乎拒绝了我们的提交。
下图说明了我们如何在24小时内测试电路板。
答案如下:
问题1:您是否始终保持48V 电源和端口保持开启状态?
答案1:48V 电源始终开启、并由电路板上的直流/直流供电。 此直流/直流转换器可升高我们馈入的27V 电压并转换为48V 电压、从而为 TPS23861和外部 PD 器件供电。 测试电路板时、PD 器件未连接。
问题2:或者您的系统循环是否一致?
答案2:当系统通电时、我们不切断电源、这意味着我们根本不会对系统进行循环。
问题3:关于 slva723.pdf 波形、我的测试结果如下:
我注意到,我们的加电波形可能无法满足文档的要求。 这主要是因为当我们的 MPU 通电时,IO 的状态为高电平。 当我们的软件系统启动时、软件可以修改 IO 输出状态。 因此、当我们打开电源时、我们将重置芯片组。 这是否是芯片组故障的可能原因?
尊敬的 Penny:
非常感谢您的建议和专业帮助。
下面是我们的电源方框图和原理图。 它将显示如何生成 TP23842的3.3V 电压。
目前、我们已经生产了一小批产品以发送给客户。 如果我们需要对我们的董事会进行重大变革、这对我们来说将是极其困难的。
我们还发现,对于那些被破坏的芯片组,I2C 中的寄存器显示“固件版本”(0x41=0x00)和“芯片版本号”(0x43=0x2)是相同的。 似乎只有这一特定批次才会出现此类故障。 在您看来、您认为该批次对这种故障特别敏感、还是由于我们的加电序列异常而导致这2个寄存器被重新写入(正常值应为0x41=0x02,0x43=0xe3)? 芯片组采用相同的批次和相同的封装,因此这些寄存器应该是相同的。
我们的主要目的是查看此特定批次是否更容易出现问题、以便我们可以从生产中挑选出具有此特定批次芯片组的电路板、以销毁电路板、而不是将其交给客户。 这将是我们目前最具成本效益的解决方案。 在下一个批次中、我们将修改硬件以完全消除问题。
您好 Penny:
我们的 MPU 基于 MIPs 处理器。 运行的软件是 uboot + Linux。 如果是微处理器、我们可以使用软件来控制上电 IO 状态。 但是、该特定处理器无法控制此上电 IO 状态。 因此、我们可以做的是等待 uboot 启动、然后接管 GPIO 的控制权。 但是、当我们能够进行控制时、我们已经越过加电时序了。
目前、我们已经找到了一种修改硬件以实现加电序列的方法。 我们使用 GPIO 和下拉电阻器来修改复位和电源序列。 当它被加电80ms 时、复位将有一个短尖峰(这个尖峰不由我们控制)。
硬件修改后、波形变为如下所示:
您能帮助我们检查此加电序列是否能满足 TPS23842的要求吗?
对于当前产品、我们已经向客户发送了2K 的器件。 如果我们回忆一下这些产品、肯定会给我们带来一些巨大的痛苦。 这些2K 产品都经过24小时老化处理。 每个产品、我们都至少加电4次(在功能测试期间以及在 MAC 地址中刻录)。 大约有6块损坏的电路板、这相当于3%的故障率。 所有主板的芯片组都显示“芯片修订号”为0x2。 在这种情况下,您认为0xe3芯片组的版本可能不会像0xe2那样容易破坏吗? 还是0xe3芯片组根本不会出现此类问题?
我们提出这个问题是因为,如果我们可以使用软件来确定哪个主板的芯片组是0x2,那么我们就可以挑选出这些主板了。 我们已经检查了产品、发现0xe2是我们发送给客户的电路板池中的少数。
总之、
1. 请帮助我们审查修改后的硬件建议是否能满足 TPS23842的要求。
2. 0xe2是否更容易受到这些类型的问题的影响? 在我们的情况下、0xe3是否仍然可以正常工作而不会出现任何问题?
非常感谢您的帮助。 我们将来肯定会修改我们的 PCB 硬件、但我们首先需要解决当前的情况。 希望在您的专业帮助下、我们能够解决这个问题。
非常感谢、
Shuanglin
您好 Penny:
我们在修改后的电路板和未修改的电路板上进行了一些实验:
目前、我们已经进行了20小时的测试、每块电路板都进行了1000次以上的测试。 我们未发现 TPS23861出现任何故障。 目前测试仍在进行中。
我们希望通过上述比较测试、可以在未修改的电路板上重复出现故障、并且在修改的电路板上不会出现故障。 这将确认我们对这类故障的当前分析可以通过修改电路板来解决。
请务必继续询问您的技术支持团队、我们是否应该注意到任何内容、以及我们的问题、即为什么只读寄存器能够重新写入0x2。 我们希望能够完全消除这一问题、以便我们能够快速推进并为客户解决问题。
再次感谢您对我们如此耐心。
谢谢、
Shuanglin