Ошибка чтения по modbus - Serial protocol error

Добрый день.

Контроллер рандомно перезагружается, может раз в неделю, а сегодня вот упал два раза с промежутком 5 минут.
Причину из логов понять невозможно - все забито сообщениями по несколько раз в секунду вида

WARNING: [modbus] failed to read 1 holding(s) @ 8 of device modbus:55: Serial protocol error: malformed response: invalid crc
INFO: [serial device] device modbus:55 is disconnected

Известно ли, как это лечить?

С уважением,
Михаил.

Добрый день.

Очевидно из записи в логе что имеются проблемы на шине. Диагностика - обычная, проверить физическое подключение модулей, правильность настроек. Начать можно с анализа - опрос какиих устройств возвращает ошибки.
Ну и как вариант - проверять подключя устройства по одному на свободный порт.

Это модуль WB-MR6CU v.2, он и на вкладке devices красным выделен, но сам при этом вполне нормально работает.

Видимо нужно переподключить его заново - на вид все подключения сделаны как нужно, как у остальных таких же реле.

Кстати, это может являться причиной ребута контроллера?

Причин может быть несколько, начиная с аппаратных (недостаточная мощность питания, ошибки монтажа, импульсная помеха) и до программных: срабатывание watchdog как программного так и аппаратного.
как пример - недостаток памяти. Но при срабатывании программного WD - как правило есть запись в лог.

Какой релиз на контроллере?

Какой релиз на контроллере?

6.7
Питание пишет 24v, контроллер подключен через UPS v2
Память тоже в норме

MemTotal: 509124 kB
MemFree: 268620 kB
MemAvailable: 428668 kB

Напишите пожалуйста серийный номер контроллера и релиз установленого ПО

серийный номер ANTQ3AEM

RELEASE_NAME=wb-2104
SUITE=stable
TARGET=wb6/stretch

Для начала - все же обновитесь, текущий релиз - 2108
Ну и посмотрите в лог, есть вообще записи от watchdog?

Обновился.
Про перезагрузки пока говорить рано, но ошибка на шине никуда не делась, продолжает спамить в messages.
В watchdog пусто (по крайней мере пусто тут /var/log/watchdog/).

Опять ребутнулось -(

Чтобы посмотреть лог watchdog, выполните в консоли команду:
journalctl -u watchdog

Спасибо!
Лог во время ребутов

– Reboot –
Nov 08 16:59:11 wirenboard-ANTQ3AEM systemd[1]: Starting watchdog daemon…
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: starting daemon (5.15):
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: int=1s realtime=yes sync=no load=0,0,0 soft=no
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: memory: minimum pages = 256 free, 0 allocatable (4096 byte pages)
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: ping: no machine to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: file: no file to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: pidfile: /var/run/sshd.pid
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: interface: no interface to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: temperature: no sensors to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: no test binary files
Nov 08 16:59:11 wirenboard-ANTQ3AEM systemd[1]: Started watchdog daemon.
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: no repair binary files
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: error retry time-out = 30 seconds
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: repair attempts = 1
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: alive=/dev/watchdog1 heartbeat=[none] to=[none] no_act=no force=no
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: watchdog now set to 60 seconds
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: hardware watchdog identity: GPIO Watchdog
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: Stopping watchdog daemon…
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Control process exited, code=exited status=1
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: Stopped watchdog daemon.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Unit entered failed state.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Triggering OnFailure= dependencies.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Failed to enqueue OnFailure= job: Resource deadlock avoided
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Failed with result ‘exit-code’.
– Reboot –

В 5.14 описывалось похожее. После запуска контроллера попробуйте явно остановить watchdog - для проверки.

Остановил, посмотрим

Но после обновления плохие чудеса начались - часть выключателей перестала нормально работать с “глючным” модулем, первый раз за все время - то не работают совсем, то включат и не выключают
В WEB UI не отображаются содержимое conf файлов, скриптов - Loading и пустой экран
продолжаю наблюдения ;(

В 5.14 описывалось похожее. После запуска контроллера попробуйте явно остановить watchdog - для проверки.

не помогло

root@wirenboard-ANTQ3AEM:~# last -x | head | tac

root pts/0 192.168.88.254 Mon Nov 8 17:26 - crash (00:11)
reboot system boot 4.9.22-wb2 Mon Nov 8 17:37 still running
runlevel (to lvl 5) 4.9.22-wb2 Mon Nov 8 17:38 - 18:30 (00:52)
root pts/0 192.168.88.254 Mon Nov 8 17:45 - crash (00:44)
reboot system boot 4.9.22-wb2 Mon Nov 8 18:30 still running
runlevel (to lvl 5) 4.9.22-wb2 Mon Nov 8 18:30 - 00:02 (05:31)
root pts/0 192.168.88.254 Mon Nov 8 22:57 - crash (01:03)
reboot system boot 4.9.22-wb2 Tue Nov 9 00:01 still running
runlevel (to lvl 5) 4.9.22-wb2 Tue Nov 9 00:02 still running
root pts/0 192.168.88.254 Tue Nov 9 00:06 still logged in

Помогите, пожалуйста, с ребутами контроллера.
Пользоваться стало невозможно, что еще можно посмотреть - не понятно
Система постоянно крашится

Надо установить причину. Как часто перезапускается? Подключитесь к Debug консоли, оставьте консоль открытой.

Несколько раз в день

Имеется в виду вот это?
https://wirenboard.com/wiki/WB_Debug_Console