Добрый день.
Начальные условия:
Контроллер WB: 8.4.4A/4G 1.2B-4G/1
S/N: AKK237GJ
Контроллер подключен к сети через порт eth0 (в коммутатор на скорости 100 Мбит/с). Это основной интерфейс, в нем же прописан шлюз. Сегмент выделеный для “технологической” сети.
Так же на контроллере установлено подключение к Wi-Fi сети в режиме клиента. В этой сети не был прописан шлюз по-умолчанию так как подключение предполагалось для резервного доступа и обнаружения Apple TV моста HomeKit в SprutHub-е (слава богу я предусмотрел такой резерв).
Также есть LTE-модем с двумя сим-картами.
В целом все это работало исправно около года (с момента запуска).
Проблема:
Недавно обновился на 2507, не могу утверждать, что проблема достоверна с этим связана, но до обновления такого точно не было.
Собственно проблема в том, что просто перестает работать проводное подключение. При этом Wi-Fi и LTE работают нормально.
На интерфейсе горит только оранжевый светодиод. Иногда кратковременно гаснет.
В процессе диагностики удалось выяснить, что проблема не в патч-корде и не в коммутаторе. Менять провод, менял порт на коммутаторе и подключал к другому коммутатору другим патч-кордом. Поведение не меняется никак.
Включение и выключение программно так же не исправляют ситуацию (что логично, так как интерфейс не отключает интерфейс а только “стирает” его настройки).
Отключение и включение кабеля также не помогают. Второй интерфейс (eth1) при этом работает нормально (по крайней мере на нем видны пакеты прилетающие, настраивать его вместо первого пока не настраивал).
После перегрузки контроллера eth0 начинает работать нормально, но работает не долго (последний раз хватило на 3 с небольшим часа).
Проблема началась пару недель назад (может чуть больше). По началу интерфейс отваливался, но через какое-то время “приваливался” обратно сам, без посторонней помощи. Но со временем провалы становились длиннее и чаще пока в итоге он не начал отваливаться “на совсем”. Спасет только перегрузка, но не на долго.
Анализ логов коммутатора показал, что на порту постоянно идет пересогласование:
4w4d: %LINK-3-UPDOWN: Interface FastEthernet1/0/27, changed state to down
4w4d: %LINK-3-UPDOWN: Interface FastEthernet1/0/27, changed state to up
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to up
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to down
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to up
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to down
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to up
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to down
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to up
4w4d: %LINEPROTO-5-UPDOWN: Line protocol on Interface FastEthernet1/0/27, changed state to down
4w4d: %LINK-3-UPDOWN: Interface FastEthernet1/0/27, changed state to down
4w4d: %LINK-3-UPDOWN: Interface FastEthernet1/0/27, changed state to up
И иногда “моргает” сам линк.
В системе это тоже видно, что адаптер перезапускается драйвером:
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: NETDEV WATCHDOG: CPU: 0: transmit queue 0 timed out 9296 ms
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: Reset adapter.
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: Register MEM_TYPE_PAGE_POOL RxQ-0
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: PHY [gpio-0:00] driver [RTL8201F Fast Ethernet] (irq=POLL)
Sep 04 19:55:09 wirenboard-AKK237GJ netplugd[3895]: eth0: state INSANE flags 0x00011043 UP,BROADCAST,RUNNING,MULTICAST,10000 -> 0x00001003 UP,BROADCAST,MULTICAST
Sep 04 19:55:09 wirenboard-AKK237GJ netplugd[3895]: eth0: state INSANE flags 0x00001003 UP,BROADCAST,MULTICAST -> 0x00001002 BROADCAST,MULTICAST
Sep 04 19:55:09 wirenboard-AKK237GJ netplugd[332374]: /etc/netplug/netplug eth0 probe -> pid 332374
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Interface eth0.IPv6 no longer relevant for mDNS.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Leaving mDNS multicast group on interface eth0.IPv6 with address fe80::3187:71bf:fc:da5f.
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: No Safety Features support found
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: No MAC Management Counters available
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: PTP not supported by HW
Sep 04 19:55:09 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: configuring for phy/rmii link mode
Sep 04 19:55:09 wirenboard-AKK237GJ netplugd[3895]: eth0: state PROBING flags 0x00001002 BROADCAST,MULTICAST -> 0x00001003 UP,BROADCAST,MULTICAST
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Interface eth0.IPv4 no longer relevant for mDNS.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Leaving mDNS multicast group on interface eth0.IPv4 with address 10.50.52.100.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Withdrawing address record for fe80::3187:71bf:fc:da5f on eth0.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Withdrawing address record for 10.50.52.100 on eth0.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Joining mDNS multicast group on interface eth0.IPv4 with address 10.50.52.100.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: New relevant interface eth0.IPv4 for mDNS.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Registering new address record for 10.50.52.100 on eth0.IPv4.
Sep 04 19:55:09 wirenboard-AKK237GJ netplugd[3895]: eth0: state PROBING_UP pid 332374 exited status 0
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Joining mDNS multicast group on interface eth0.IPv6 with address fe80::5134:f76:3a95:cfd8.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: New relevant interface eth0.IPv6 for mDNS.
Sep 04 19:55:09 wirenboard-AKK237GJ avahi-daemon[316]: Registering new address record for fe80::5134:f76:3a95:cfd8 on eth0.*.
Sep 04 19:55:11 wirenboard-AKK237GJ ntpd[1758]: Deleting interface #378 eth0, 10.50.52.100#123, interface stats: received=0, sent=0, dropped=0, active_time=148 secs
Sep 04 19:55:11 wirenboard-AKK237GJ ntpd[1758]: Deleting interface #379 eth0, fe80::3187:71bf:fc:da5f%2#123, interface stats: received=0, sent=0, dropped=0, active_time=139 secs
Sep 04 19:55:11 wirenboard-AKK237GJ netplugd[3895]: eth0: state INACTIVE flags 0x00001003 UP,BROADCAST,MULTICAST -> 0x00011043 UP,BROADCAST,RUNNING,MULTICAST,10000
Sep 04 19:55:11 wirenboard-AKK237GJ netplugd[332393]: /etc/netplug/netplug eth0 in -> pid 332393
Sep 04 19:55:11 wirenboard-AKK237GJ NetworkManager[500]: <info> [1757004911.6404] device (eth0): carrier: link connected
Sep 04 19:55:11 wirenboard-AKK237GJ kernel: dwmac-sun8i 5020000.ethernet eth0: Link is Up - 100Mbps/Full - flow control off
Sep 04 19:55:11 wirenboard-AKK237GJ netplugd[3895]: eth0: state INNING pid 332393 exited status 256
Sep 04 19:55:14 wirenboard-AKK237GJ ntpd[1758]: Listen normally on 380 eth0 10.50.52.100:123
И такой цикл примерно каждые 3 минуты.
К сожалению по неизвестной мне причине недавно контроллер экстренно перезагрузился, после чего повредились БД wb-mqtt-db и логи частично побились и полный журнал за долгое время не достать. Но проблемы с сетью начались существенно раньше и на прямую это не связанные вещи скорее всего.