出现问题场景:
AM5716的eth1网口和对端设备都接在交换机上,正常情况下会建立TCP链接,并通过MODBUS协议不断交互报文。在长时间稳定运行的情况下,应用程序会突然报通讯故障。检测的机制是,AM5716上应用程序在收不到数据的情况下,会不断尝试重新创建socket进行connect,当阻塞时间超过10s即判断通讯故障。此时通过SSH登录设备,发现ping对端IP也不通,并且故障不会恢复。此时,通过ifconfig eth1 down/up或者重启AM5716设备,通讯即可恢复。
由于出现问题频率较低,目前隔好几天甚至一周才出现一次,且之前出问题时未收集到有效信息帮助定位,通过现有信息,请TI工程师帮忙看下是否遇到过类似问题?
另外,之前在AM335x上曾经也遇到过类似的问题,运行一段时间后,测试人员用电脑通过交换机一直ping AM335x的eth1口做测试,中间突然出现ping中断。插拔网线依然没有恢复,尝试通过串口登录设备,对eth1口进行抓包,此时网卡进入混杂模式,发现又可以ping通了,而退出混杂模式又ping不通了。最后,尝试将eth1口进行ifconfig eth1 down/up,此时ping又正常了。怀疑AM5716和之前AM335x上遇到的是同一个问题,且该问题不容易复现。