Wb-mqtt-serial периодически теряет связь с брокером

Wiren Board 7.3.1

Контроллер на данный момент на testing, но и раньше также проблема наблюдалась, перешел на тестинг для проверки.
Бывает несколько раз в неделю теряет связь с брокером и вешается контроллер.

7-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker
17-12-2023 01:37:36.700 [wb-mqtt-serial]	WARNING: [backend] Unable to publish, no connection to broker

Рекомендации из Errata#ERRWB73010 выполнены, persistence false, база не появляется в /var/lib/mosquitto/

# Place your local configuration in /etc/mosquitto/conf.d/
#
# A full description of the configuration file is at
# /usr/share/doc/mosquitto/examples/mosquitto.conf.example

pid_file /run/mosquitto/mosquitto.pid

persistence false
persistence_location /var/lib/mosquitto/

log_dest syslog

include_dir /etc/mosquitto/conf.d

Подскажите куда дальше смотреть?

Добрый день.
Тут поможет диагностический архив. Ну и - стоит ли какое-то стороннее ПО?

Из ПО только Spruthub, но оно стоит уже 2-3 года и проблемы начались только после подключения дополнительного Bridge для grafana (отдельный сервер), делался по данной инструкции:
https://wirenboard.com/wiki/Grafana

diag_output_AY2DVMO5_2023-12-19-11.45.45.zip (238,4 КБ)

Очеyь похоже что мост не работает. И падает брокер - из-за

дек 16 04:37:14 wirenboard-AY2DVMO5 mosquitto[15379]: 1702701434: Client rules-wirenboard-AY2DVMO5-2237 disconnected due to out of memory.
дек 16 04:37:14 wirenboard-AY2DVMO5 mosquitto[15379]: 1702701434: New connection from /var/run/mosquitto/mosquitto.sock:0 on port 0.

Проверьте, отключив мост.

Ну если мост отключу, то думаю что проблема не будет, тут больше вопрос как заставить с ним работать корректно.

Так мост не работает. Постоянные ошибки.

Ошибки на связь с мостом? такое возможно только если проблемы на стороне WB, данные на сервере Grafana отслеживаю, также и отслеживаю сам сервак, он в рабочем состоянии и проблем кроме как перезагрузки севере плановых - нету. Настройки моста в инструкции корректные?

дек 16 02:47:50 wirenboard-AY2DVMO5 mosquitto[1675]: 1702694870: Connecting bridge (step 1) bridge1 (10.10.10.20:1883)
дек 16 02:47:50 wirenboard-AY2DVMO5 mosquitto[1675]: 1702694870: Connecting bridge (step 2) bridge1 (10.10.10.20:1883)
дек 16 02:47:54 wirenboard-AY2DVMO5 mosquitto[1675]: 1702694874: Client local.wirenboard-AY2DVMO5.bridge1 disconnected: No route to host.

Настройки в инструкции - корректны именно для того набора ПО и версий которые использовались. Они не “универсальны”, могут не подходить для каких-то (возможных) комбинаций. Подразумевается что настройку мостов для рабочего решения надо начинать после прочтения документации.
Но я, кстати, запланирую ебе проверить что будет если специально настроить неверно.

Логи выше это вы кидаете когда WB ушел в аут и не отвечал, в таком состоянии он висел 3 дня пока локально не появится на месте. Те до 14 числа надо смотреть ка кон отвечает на связь с мостов или сегодняшний день также можно посмотреть, он сутки работает точно также с мостом уже.

Мост при этом доступен?

Конечно, все данные на grafana передаются.

У меня пока не воспроизводится.

Могу провести тесты какие-то

Вчера ради теста, перезагрузил сервер grafana, но после перегрузки контроллер wb перестал слать (хотя сервер был доступен) и через день опять ушел в аут. Выглядит так что если сервер теряет связь (перезагружен, пропала линия и тд) то мост не восстанавливается видимо.

Перечитал заново всю инструкцию, заново все перепроверил, ошибок в настройках нету. Linux используется тот же, отдельный голый сервер пустой с необходимыми настройками (те по соседству не крутится какая-то мешающая программа). Но контроллер явно начинает себя плохо чувствовать как только отключается сервер.

Подскажите вы тестируете на голом контроллере? Пробовали добавляли большое количество топиков? Тк в моем варианте очень много модулей крутится и соотвественно топиков.

Как понимать “плохо”? Что в логах, как изменяются доступные ресурсы?

Несколько датчиков, в общем не более сотни топиков.

Перестают работать топики, теряется связь с веб интерфейсом, не могу зайти на терминал. Иногда можно через VPN зайти и сделать рестарт (при этом проброс порта через NAT не пускает, те видимо и сеть начинает подлагивать на контроллере), а иногда только физическая перезагрузка.

Хм, у меня никак не получается вызвать проблемы, уж тем более с сетью. Для проверки наличия сети - запустите на контроллере правило, которое, например, пингует что-то, как вариант из Скрипт для пингования хоста темы.

Может будет время зайти на контроллер, я отключу сервер grafana и понаблюдать что происходит?

Да, могу, в общем.