Нужна технология дебага от Разработчиков WB

Прошу прощения, действительно, в репозиторий эта версия не была загружена. Загрузил, можете проверить ещё раз, пожалуйста?

Сейчас, норм.
Что нам даст это обновление? Какие баги им были исправлены?
Как дебажить проблему, если ситуация повторится, при том что данная проблема наблюдается на протяжении 4 лет во множестве релизов правил wb-rules?

Про одну из серьёзных исправленных проблем можно почитать тут:

По поводу советов насчёт дебага - очень сложно сказать, сильно зависит от ситуации. Не всегда корректно падения обрабатываются, мы знаем о некоторых таких случаях и стараемся по возможности исправлять. Общий совет: если совсем непонятно, что происходит, то пишите сюда, здесь часто бывают разработчики и смотрят, что не так. Как минимум, дадут совет, как обойти проблему, к тому же ваш запрос поспособствует выпуску исправлений.

Эти устройства подключаются через другую шину. Для устройств из /etc/wb-hardware.conf не нужен wb-mqtt-serial, так что с этим всё в порядке, wb-mqtt-serial может не запускаться в таких случаях.

Если вы позже добавите устройства в /etc/wb-mqtt-serial.conf через web-интерфейс, сервис запустится автоматически.

И покажите, кстати, версию ядра

uname -a

На первом
Linux wirenboard-AQMXJCR7 4.9.22-wb2 #2 Wed Nov 13 22:02:28 UTC 2019 armv5tejl GNU/Linux
На втором
Linux wirenboard-APWZSDMN 4.9.22-wb6 #2 SMP Tue Mar 9 09:47:37 UTC 2021 armv7l GNU/Linux

Обновил пакеты на 4 контроллерах, будем наблюдать. И все же вопрос стабильности работы скриптов не дает мне покоя, уж больно не надежная получается конструкция для управления оборудованием. Остается вthjznyjcnm подвисания.
Хочется более подробно раскрыть вопрос надежного оповещения и сбоях, сбора данных для дебага и оперативного устранения.

А команда

journalctl -u wb-rules

возвращает что-то- при “остановке” скриптов?

Не на всех версиях команда срабатывает. Если смотреть логи там пусто!

В старых версиязх wb-rules логи писались в /var/log/messages

К вопросу о логах Ошибка после обновления пакетов
Этот мой вопрос остался без ответа
Пить к лог файлам служб WB - здесь был раскрыт вопрос записи логов - и не было ответа про journalctl - или я просто не разобрался?

Возможно, пропустил. Но по картинке сложно что-то диагностировать, без вывода содержимого конфига, без самой ошибки.

Для служб, которые на тот момент выводили в journal - было так и написано.

Сегодня был очередной сбой на контроллере. Все скрипты разом перестали исполняться. Команда
service wb-rules restart не сработала! Пришлось service wb-rules stop / start после чего работа скриптов была восстановлена.
В логах пусто - ошибок нет

Дайте какой-нибудь из “стандартных” скриптов. Попробую воспроизвести.

smesitel_2328_14.js (9.0 КБ)
Скрипт смесительного модуля

Думаю нужен какой-то сервис который будет отслеживать работу других сервисов и перезапускать их при сбоях. Каждый сервис меняет свой “heartbeat” параметр, а другой сервис следит за ними. Как только наступил таймаут изменения - перезапускает проблемный процесс.

Для продакшен систем это не решение. У нас есть мониторинг доступности сервисов, но он только информирует о сбоях

1 лайк

Сегодня был очередной сбой, на этот раз еще более тяжелый.
С контроллера продолжали поступать данные по mqtt , но скрипты wb-rules не исполнялись и подключение по ssh было весьма затруднено.

Уже есть.
https://wirenboard.com/wiki/Watchdog

А процессы wb-rules были запущены? “затруднено” - как? Что с нагрузкой на CPU, с памятью?