Зависают правила на wb5

Периодически (непредсказуемо, от раза в пол года, до трёх раз за последние два дня) зависают правила контроллера (контроллер перестает реагировать на внешние “кнопки”, управление через веб-морду работает за исключением программной кнопки reboot).
Симптом в веб: страница с правилами (rules) открывается долго или вовсе не открывается (список файлов, имеется в виду).
Если список файлов появился, контроллер возвращается к полноценной жизни. Если нет, помогает только жёсткая перезагрузка или программная через консоль.

Но и здесь есть нюансы, как сегодня, не всегда загружается с первого раза. После команды reboot сегодня он завис на загрузке (мигает красный индикатор).

Проблема такая с первого года использования.
Менялись прошивки, а проблема остаётся. Раз в пол года можно смениться, но три раза за два дня - перебор (два раза вернулся к жизни без перезагрузки, через долгое открытие страницы с правилами, третий - потребовался ребут).

Прошивка, софт, всё обновлено. Правда, почему-то, для wb5 веб-морда предпоследняя, а не последняя в репозитарии. Соответственно она не последняя.

======================
Release name: wb-2110
Release suite: testing
Short SN: AU2YHHQM
Firmware version: 201906131405

Welcome to Wiren Board (s/n AU2YHHQM), release wb-2110 (as testing)
Linux wirenboard-AU2YHHQM 4.9.22-wb1 #2 Thu May 20 15:58:00 UTC 2021 armv5tejl GNU/Linux

Screenshot_20220125-192124341

Добрый день. А почему testing?
Ну и - в состоянии “Симптом в веб: страница с правилами (rules) открывается долго или вовсе не открывается (список файлов, имеется в виду).”
в каком состоянии находться сам сервис wb-rules?
Дайте вывод

journalctl --since "10 minutes ago"

Ну или со времени мут за 15 до прекращения работы.

testing - думал обновится до последней версии веб-морда :slight_smile: Но не в этом дело точно, тестовая сборка несколько месяцев, в сбоям несколько лет.

Логи в файле. Точное время сбоя сложно сказать. Выявилось примерно в 3 часа 27 числа (по шкале логов), в 18 часов 26 числа - точно всё работало.
Далее была попытка перезагрузки через root, в результате которой контроллер завис на загрузке. Отсутствие логов, соответственно. В 14 часов началась успешная загрузка через отключение питания.

messages.txt (293.0 КБ)
(это весь вы

Видно же:

Jan 26 18:05:32 wirenboard-AU2YHHQM wb-rules[7953]: ERROR: queue handleMessage is almost filled! 2048/2048

и соответственно:

Jan 26 18:08:45 wirenboard-AU2YHHQM wb-rules[7953]: WARNING: MQTT connection lost
Jan 26 18:08:45 wirenboard-AU2YHHQM wb-rules[7953]: INFO: MQTT connection established
Jan 26 18:08:45 wirenboard-AU2YHHQM wb-rules[7953]: ERROR: queue Tokens is almost filled! 2048/2048

Какая весия wb-rules?

Обсуждалось тут:

wb-mqtt-dac/stable,now 1.1.2 all [installed]
  wb-rules-based IIO DAC driver for WB MQTT

wb-rules/stable,now 1.7.1 armel [installed]
  Wiren Board Rule Engine

wb-rules-system/stable,now 1.6.13 all [installed]
  Default system rules for Wiren Board

По ссылке речь про таймер, в частности, у меня его нет, простая обработка замыкания сухих контактов.

Много сообщений

MQTT connection lost

А сколько всего устройств, нет ли в логах Mosquitto ошибок?
То есть судя по логу - движок правил теряет связь с брокером, что приводит к его, движка, перезапуску.

Устройств не сильно много, три расширения, три модуля и термометр. Но могут быть теоретически помехи.

Вот такие ошибки есть:

1643042824: Client mosqpub|17142-wirenboar disconnected.
1643042824: Client mosqsub|17141-wirenboar disconnected.
1643042889: Client rules-wirenboard-AU2YHHQM-5907 has exceeded timeout, disconnecting.
1643042889: Socket error on client rules-wirenboard-AU2YHHQM-5907, disconnecting.
1643044351: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.
1643046152: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.
1643047953: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.
1643083973: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.
1643085774: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.
1643087574: New connection from 127.0.0.1 on port 1883.
1643087574: New client connected from 127.0.0.1 as rules-wirenboard-AU2YHHQM-5907 (c1, k30).
1643087575: Saving in-memory database to /var/lib/mosquitto/mosquitto.db.

1643087584: New client connected from 127.0.0.1 as mosqsub|17504-wirenboar (c1, k60).
1643087584: New connection from 127.0.0.1 on port 1883.
1643087585: New client connected from 127.0.0.1 as mosqpub|17520-wirenboar (c1, k60).
1643087585: Socket error on client mosqsub|17504-wirenboar, disconnecting.
1643087585: New connection from 127.0.0.1 on port 1883.
1643087586: Client mosqpub|17520-wirenboar disconnected.

1643087598: New client connected from 127.0.0.1 as mosqpub|17605-wirenboar (c1, k60).
1643087598: Client mosqsub|17596-wirenboar disconnected.
1643087598: Client mosqpub|17605-wirenboar disconnected.
1643087599: Socket error on client confed-wirenboard-AU2YHHQM-5899, disconnecting.
1643087602: New connection from 127.0.0.1 on port 1883.

1643120884: New client connected from 127.0.0.1 as mosqpub|20541-wirenboar (c1, k60).
1643120884: Client mosqpub|20541-wirenboar disconnected.
1643120884: Client mosqsub|20540-wirenboar disconnected.
1643120894: Socket error on client <unknown>, disconnecting.
1643120895: Socket error on client <unknown>, disconnecting.
1643120895: Socket error on client <unknown>, disconnecting.
1643120895: Socket error on client <unknown>, disconnecting.
1643120895: Socket error on client <unknown>, disconnecting.
1643120926: Client contactless-EvHRn8VTW3 has exceeded timeout, disconnecting.
1643120942: New connection from 127.0.0.1 on port 1883.

Ничего в них не понимаю.

Нет ли доступа к брокеру снаружи? Много ли ресурсов потребляет? Вообще советую отключить в настройках использование persistence базы, которая /var/lib/mosquitto/mosquitto.db

В конфиге указать “persistence false” ?

Доступ настроен как здесь Защита паролем — Wiren Board ,
но были проброшены порты на роутере, убрал с роутера их.

Не знаю, много ли ресурсов потребляет: