WB7 зависает, спустя 2-3 часа работы полностью зависает, с наружи на него невозможно достучаться по ip
Добрый день.
Пожалуйста опишите что такое “зависает”?
Какие команды выполняете на компьютере, какой результат ожидаете, какой получаете?
Что такое “достучаться”? Какой интерфейс, чем назначается адрес и что контроллер отвечает на пакеты к нему?
не работают правила, пытаюсь подключиться по ssh на контроллер но тот не отвечает,
примерно по логам видно что он завил в 3:40, и заработал примерно в 11, когда его перезагрузил
и таких подвисаний за последние два дня было уже 3 раза, блинный полки по графику
Причем в cloud.whiteboard пингуется как зеленый, но не дает заходить по ssh и в ui морду
Обратите внимание:
Sep 30 10:44:55 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693095.2322] dhcp4 (eth0): state changed no lease
Sep 30 10:44:56 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693095.9921] dhcp4 (eth0): activation: beginning transaction (timeout in 45 seconds)
Sep 30 10:45:06 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693106.5963] dhcp4 (eth0): state changed new lease, address=192.168.1.107
Sep 30 10:45:14 wirenboard-AEF4X2VX NetworkManager[411]: <warn> [1727693114.5561] dispatcher: (44) /etc/NetworkManager/dispatcher.d/01-ifupdown failed (failed): Script '/etc/NetworkManager/dispatcher.d/01-ifupdown' exited with status 1.
Sep 30 10:45:27 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693126.9812] audit: op="device-reapply" interface="wlan0" ifindex=5 args="ipv4.route-metric" pid=1574 uid=0 result="success"
Sep 30 10:45:29 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693129.6883] dhcp4 (wlan0): canceled DHCP transaction
Sep 30 10:45:29 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693129.7331] dhcp4 (wlan0): activation: beginning transaction (timeout in 45 seconds)
Sep 30 10:45:29 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693129.7333] dhcp4 (wlan0): state changed no lease
Sep 30 10:45:32 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693132.8475] dhcp4 (wlan0): activation: beginning transaction (timeout in 45 seconds)
Sep 30 10:45:36 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693136.4222] policy: set 'wb-eth0' (eth0) as default for IPv4 routing and DNS
Sep 30 10:45:45 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727693145.1935] dhcp4 (wlan0): state changed new lease, address=192.168.1.106
Sep 30 10:45:53 wirenboard-AEF4X2VX NetworkManager[411]: <warn> [1727693153.4648] dispatcher: (46) /etc/NetworkManager/dispatcher.d/01-ifupdown failed (failed): Script '/etc/NetworkManager/dispatcher.d/01-ifupdown' exited with status 1.
Sep 30 10:46:24 wirenboard-AEF4X2VX NetworkManager[411]: <warn> [1727693184.7174] dispatcher: (48) /etc/NetworkManager/dispatcher.d/01-ifupdown failed (failed): Script '/etc/NetworkManager/dispatcher.d/01-ifupdown' exited with status 1.
Sep 30 11:04:10 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694250.4189] audit: op="connection-activate" uuid="c3e38405-9c17-4155-ad70-664311b49066" name="wb-eth1" pid=1574 uid=0 result="fail" reason="Connection 'wb-eth1' is not available on device eth1 because device has no carrier"
Sep 30 11:04:37 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694277.3057] audit: op="device-reapply" interface="eth0" ifindex=3 args="ipv4.route-metric" pid=1574 uid=0 result="success"
Sep 30 11:04:47 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694287.4593] dhcp4 (eth0): canceled DHCP transaction
Sep 30 11:04:47 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694287.8843] dhcp4 (eth0): activation: beginning transaction (timeout in 45 seconds)
Sep 30 11:04:47 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694287.9792] dhcp4 (eth0): state changed no lease
Sep 30 11:04:51 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694291.3890] dhcp4 (eth0): activation: beginning transaction (timeout in 45 seconds)
Sep 30 11:05:13 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694313.0446] dhcp4 (eth0): state changed no lease
Sep 30 11:05:14 wirenboard-AEF4X2VX NetworkManager[411]: <info> [1727694314.1145] dhcp4 (eth0): state changed new lease, address=192.168.1.107
Видно что адрес на интерфейсе - присутствует, вплоть до момента перезапуска вызванного EC:
Sep 30 11:07:25 wirenboard-AEF4X2VX kernel: sun4i-emac 1c0b000.ethernet eth0: Link is Down
Sep 30 11:07:27 wirenboard-AEF4X2VX kernel: sun4i-emac 1c0b000.ethernet eth0: Link is Up - 100Mbps/Full - flow control off
Sep 30 11:07:28 wirenboard-AEF4X2VX kernel: sun4i-emac 1c0b000.ethernet eth0: Link is Down
Sep 30 11:07:32 wirenboard-AEF4X2VX kernel: sun4i-emac 1c0b000.ethernet eth0: Link is Up - 100Mbps/Full - flow control off
Sep 30 11:08:55 wirenboard-AEF4X2VX kernel: input input0: power key press detected
Сразу перед перезапуском, кстати, пару раз пропадал линк на eth0.
Так что как минимум на уровне линка и доступности DHCP - соединение было.
Кстати, вижу непонятное мне решение - соединение через wlan0 имеет адрес из совпадающей по маске с сетью на eth0 подсети. Как оно должно работать?
Для диагностики рекомендую подключиться к контроллеру с помощью Debug Port и проверить доступность сети с него.
У меня подключен контроллер к одному роутеру, на роутере для каждого MAC адреса зарезервирован свой ip адрес (106 для wifi соединения, 107 для Ethernet), на самом контроллере выставил проиритет соединений, Ethernet - высокий, Wi-fi - средний, не понимаю почему происходит конфликт, я правильно понимаю, что когда у контроллера проблема с сетью, он встает в ступор, так как не собираются метрики (судя по графикам)
Покажите пожалуйста график напряжения питания или uptime самого контроллера.
Нет, полки - потому что в этот момент не работает брокер. Что видно из логов:
Sep 29 02:41:40 wirenboard-AEF4X2VX wb-rules[2066]: INFO: [wbgo_mqtt] rules-wirenboard-AEF4X2VX-2066: MQTT connection established
Sep 29 02:43:11 wirenboard-AEF4X2VX wb-rules[2066]: WARNING: [wbgo_mqtt] MQTT connection lost: pingresp not received, disconnecting
Sep 29 02:43:14 wirenboard-AEF4X2VX wb-rules[2066]: WARNING: [wbgo_mqtt] Cleaning up token queue
Причем брокер упирается в RAM:
Sep 29 07:40:58 wirenboard-AEF4X2VX mosquitto[1940]: 1727595658: Client wb-modbus disconnected due to out of memory.
Sep 29 07:40:58 wirenboard-AEF4X2VX mosquitto[1940]: 1727595658: Client wb-adc disconnected due to out of memory.
Sep 29 07:40:58 wirenboard-AEF4X2VX mosquitto[1940]: 1727595658: Client wb-gpio disconnected: Broken pipe.
Sep 29 07:40:58 wirenboard-AEF4X2VX mosquitto[1940]: 1727595658: Client wb-mqtt-metrics-QEdFctYh disconnected due to out of memory.
рекомендую проверить все стороннее ПО на потребление памяти, даже на динамику потребления. Если растет неконтролируемо - то в нем и причина.