Проблемы с Ethernet

Обнаружил неприятный глюк с WB5. Постараюсь по порядку…

Изначально контроллер получал питание от двух БП - через PoE и через клеммы для отказоустойчивости питания. Когда наводил порядок с Ethernet проводами обратил внимание, что WB5 уходит в перезагрузку. Первая мысль была - что-то не так с PoE. Отключил инжектор и включил напрямую в коммутатор. То есть питание осталось от одного БП только через клеммы контроллера. Глюк остался: отключаю порт коммутатора (выдергивание провода дает тот же эффект) - контроллер продолжает работать. Включаю порт коммутатора - контроллер уходит в перезагрузку. Успеваю словить логи:

Sep 8 12:34:47 wirenboard user.info kernel: [ 208.094549] fec 800f0000.ethernet eth0: Link is Down
Sep 8 12:34:47 wirenboard daemon.info netplugd[3002]: eth0: state ACTIVE flags 0x00011043 UP,BROADCAST,RUNNING,MULTICAST,10000 -> 0x00001003 UP,BROADCAST,MULTICAST
Sep 8 12:34:47 wirenboard daemon.info netplugd[3491]: /etc/netplug/netplug eth0 out -> pid 3491
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Withdrawing address record for 192.168.118.123 on eth0.
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Leaving mDNS multicast group on interface eth0.IPv4 with address 192.168.118.123.
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Interface eth0.IPv4 no longer relevant for mDNS.
Sep 8 12:34:48 wirenboard daemon.info netplugd[3002]: eth0: state OUTING flags 0x00001003 UP,BROADCAST,MULTICAST -> 0x00001002 BROADCAST,MULTICAST
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Interface eth0.IPv6 no longer relevant for mDNS.
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Leaving mDNS multicast group on interface eth0.IPv6 with address 2a02:2168:c98:7200:286:41ff:fe37:dca7.
Sep 8 12:34:48 wirenboard daemon.info avahi-daemon[2760]: Withdrawing address record for 2a02:2168:c98:7200:286:41ff:fe37:dca7 on eth0.
Sep 8 12:34:48 wirenboard daemon.info netplugd[3002]: eth0: state DOWNANDOUT pid 3491 exited status 0
Sep 8 12:34:48 wirenboard daemon.info netplugd[3521]: /etc/netplug/netplug eth0 probe -> pid 3521
Sep 8 12:34:48 wirenboard daemon.info netplugd[3002]: eth0: state PROBING flags 0x00001002 BROADCAST,MULTICAST -> 0x00001003 UP,BROADCAST,MULTICAST
Sep 8 12:34:48 wirenboard user.info kernel: [ 209.259507] fec 800f0000.ethernet eth0: Freescale FEC PHY driver [SMSC LAN8710/LAN8720] (mii_bus:phy_addr=800f0000.etherne:00, irq=-1)
Sep 8 12:34:48 wirenboard user.info kernel: [ 209.277312] IPv6: ADDRCONF(NETDEV_UP): eth0: link is not ready
Sep 8 12:34:48 wirenboard daemon.info netplugd[3002]: eth0: state PROBING_UP pid 3521 exited status 0
Sep 8 12:34:49 wirenboard user.notice serial: TModbusDevice::ReadRegisterRange(): failed to read 8 discrete(s) @ 0 of slave modbus:5
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: Deleting interface #7 eth0, 2a02:2168:c98:7200:286:41ff:fe37:dca7#123, interface stats: received=0, sent=0, dropped=0, active_time=141 secs
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: Deleting interface #6 eth0, fe80::286:41ff:fe37:dca7#123, interface stats: received=0, sent=0, dropped=0, active_time=141 secs
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: Deleting interface #3 eth0, 192.168.118.123#123, interface stats: received=42, sent=42, dropped=0, active_time=141 secs
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: 91.207.136.55 interface 192.168.118.123 -> (none)
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: 85.21.78.91 interface 192.168.118.123 -> (none)
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: 197.12.0.14 interface 192.168.118.123 -> (none)
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: 95.104.192.10 interface 192.168.118.123 -> (none)
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: 192.168.118.1 interface 192.168.118.123 -> (none)
Sep 8 12:34:50 wirenboard daemon.info ntpd[3031]: peers refreshed
Sep 8 12:35:33 wirenboard user.info kernel: [ 253.436370] fec 800f0000.ethernet eth0: Link is Up - 100Mbps/Full - flow control off
Sep 8 12:35:33 wirenboard user.info kernel: [ 253.451819] IPv6: ADDRCONF(NETDEV_CHANGE): eth0: link becomes ready
Sep 8 12:35:33 wirenboard daemon.info netplugd[3002]: eth0: state INACTIVE flags 0x00001003 UP,BROADCAST,MULTICAST -> 0x00011043 UP,BROADCAST,RUNNING,MULTICAST,10000
Sep 8 12:35:33 wirenboard daemon.info netplugd[3543]: /etc/netplug/netplug eth0 in -> pid 3543
Sep 8 12:35:33 wirenboard daemon.info avahi-daemon[2760]: Joining mDNS multicast group on interface eth0.IPv4 with address 192.168.118.123.
Sep 8 12:35:33 wirenboard daemon.info avahi-daemon[2760]: New relevant interface eth0.IPv4 for mDNS.
Sep 8 12:35:33 wirenboard daemon.info avahi-daemon[2760]: Registering new address record for 192.168.118.123 on eth0.IPv4.
Sep 8 12:35:35 wirenboard daemon.info avahi-daemon[2760]: Joining mDNS multicast group on interface eth0.IPv6 with address fe80::286:41ff:fe37:dca7.
Sep 8 12:35:35 wirenboard daemon.info avahi-daemon[2760]: New relevant interface eth0.IPv6 for mDNS.
Sep 8 12:35:35 wirenboard daemon.info avahi-daemon[2760]: Registering new address record for fe80::286:41ff:fe37:dca7 on eth0..
Sep 8 12:35:35 wirenboard daemon.err ntpdate[3595]: the NTP socket is in use, exiting
Sep 8 12:35:36 wirenboard auth.info sshd[3068]: Received signal 15; terminating.
Sep 8 12:35:36 wirenboard daemon.info avahi-daemon[2760]: Leaving mDNS multicast group on interface eth0.IPv6 with address fe80::286:41ff:fe37:dca7.
Sep 8 12:35:36 wirenboard daemon.info avahi-daemon[2760]: Joining mDNS multicast group on interface eth0.IPv6 with address 2a02:2168:c98:7200:286:41ff:fe37:dca7.
Sep 8 12:35:36 wirenboard daemon.info avahi-daemon[2760]: Registering new address record for 2a02:2168:c98:7200:286:41ff:fe37:dca7 on eth0.
.
Sep 8 12:35:36 wirenboard daemon.info avahi-daemon[2760]: Withdrawing address record for fe80::286:41ff:fe37:dca7 on eth0.
Sep 8 12:35:36 wirenboard daemon.err watchdog[3422]: cannot open /var/run/sshd.pid (errno = 2 = ‘No such file or directory’)
> Sep 8 12:35:36 wirenboard daemon.alert watchdog[3422]: shutting down the system because of error 2
Sep 8 12:35:36 wirenboard auth.info sshd[3627]: Server listening on 0.0.0.0 port 22.
Sep 8 12:35:36 wirenboard auth.info sshd[3627]: Server listening on :: port 22.
Sep 8 12:35:37 wirenboard daemon.info netplugd[3002]: eth0: state INNING pid 3543 exited status 0
Sep 8 12:35:38 wirenboard daemon.info ntpd[3031]: Listen normally on 9 eth0 192.168.118.123 UDP 123
Sep 8 12:35:38 wirenboard daemon.info ntpd[3031]: Listen normally on 10 eth0 fe80::286:41ff:fe37:dca7 UDP 123
Sep 8 12:35:38 wirenboard daemon.info ntpd[3031]: Listen normally on 11 eth0 2a02:2168:c98:7200:286:41ff:fe37:dca7 UDP 123
Sep 8 12:35:38 wirenboard daemon.info ntpd[3031]: peers refreshed

Вижу, что срабатывает watchdog, который при такой ситуации срабатывать не должен… Как это можно решить? Нехорошо, если контроллер всякий раз будет перезагружаться, когда я буду что-либо делать с коммутатором.

Самый простой способ в /etc/watchdog.conf отключить строчку с мониторингом sshd:

https://github.com/contactless/wirenboard/blob/master/configs/configs/etc/watchdog.conf.wb#L23

Отключил. Помогло. Спасибо! Это будет как-то исправлено в обновлениях или так и оставить навсегда?

Пока не исправлено. Там нужно или демон watchdog радикально обновлять (не из пакетов debian), или monit вместо него использовать, или какие-то страшные костыли сооружать.