Fencer
08.Ноябрь.2021 09:58:50
1
Добрый день.
Контроллер рандомно перезагружается, может раз в неделю, а сегодня вот упал два раза с промежутком 5 минут.
Причину из логов понять невозможно - все забито сообщениями по несколько раз в секунду вида
WARNING: [modbus] failed to read 1 holding(s) @ 8 of device modbus:55: Serial protocol error: malformed response: invalid crc
INFO: [serial device] device modbus:55 is disconnected
Известно ли, как это лечить?
С уважением,
Михаил.
Добрый день.
Fencer:
WARNING: [modbus] failed to read 1 holding(s) @ 8 of device modbus:55: Serial protocol error: malformed response: invalid crc
INFO: [serial device] device modbus:55 is disconnected
Известно ли, как это лечить?
Очевидно из записи в логе что имеются проблемы на шине. Диагностика - обычная, проверить физическое подключение модулей, правильность настроек. Начать можно с анализа - опрос какиих устройств возвращает ошибки.
Ну и как вариант - проверять подключя устройства по одному на свободный порт.
Fencer
08.Ноябрь.2021 10:18:59
4
Это модуль WB-MR6CU v.2, он и на вкладке devices красным выделен, но сам при этом вполне нормально работает.
Видимо нужно переподключить его заново - на вид все подключения сделаны как нужно, как у остальных таких же реле.
Кстати, это может являться причиной ребута контроллера?
Причин может быть несколько, начиная с аппаратных (недостаточная мощность питания, ошибки монтажа, импульсная помеха) и до программных: срабатывание watchdog как программного так и аппаратного.
как пример - недостаток памяти. Но при срабатывании программного WD - как правило есть запись в лог.
Какой релиз на контроллере?
Fencer
08.Ноябрь.2021 11:15:46
7
Какой релиз на контроллере?
6.7
Питание пишет 24v, контроллер подключен через UPS v2
Память тоже в норме
MemTotal: 509124 kB
MemFree: 268620 kB
MemAvailable: 428668 kB
Напишите пожалуйста серийный номер контроллера и релиз установленого ПО
Fencer
08.Ноябрь.2021 11:30:34
9
серийный номер ANTQ3AEM
RELEASE_NAME=wb-2104
SUITE=stable
TARGET=wb6/stretch
Для начала - все же обновитесь, текущий релиз - 2108
Ну и посмотрите в лог, есть вообще записи от watchdog?
Fencer
08.Ноябрь.2021 14:05:56
11
Обновился.
Про перезагрузки пока говорить рано, но ошибка на шине никуда не делась, продолжает спамить в messages.
В watchdog пусто (по крайней мере пусто тут /var/log/watchdog/).
Чтобы посмотреть лог watchdog, выполните в консоли команду:
journalctl -u watchdog
1 лайк
Fencer
08.Ноябрь.2021 15:21:28
14
AlexandrD:
journalctl -u watchdog
Спасибо!
Лог во время ребутов
– Reboot –
Nov 08 16:59:11 wirenboard-ANTQ3AEM systemd[1]: Starting watchdog daemon…
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: starting daemon (5.15):
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: int=1s realtime=yes sync=no load=0,0,0 soft=no
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: memory: minimum pages = 256 free, 0 allocatable (4096 byte pages)
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: ping: no machine to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: file: no file to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: pidfile: /var/run/sshd.pid
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: interface: no interface to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: temperature: no sensors to check
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: no test binary files
Nov 08 16:59:11 wirenboard-ANTQ3AEM systemd[1]: Started watchdog daemon.
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: no repair binary files
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: error retry time-out = 30 seconds
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: repair attempts = 1
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: alive=/dev/watchdog1 heartbeat=[none] to=[none] no_act=no force=no
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: watchdog now set to 60 seconds
Nov 08 16:59:11 wirenboard-ANTQ3AEM watchdog[5050]: hardware watchdog identity: GPIO Watchdog
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: Stopping watchdog daemon…
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Control process exited, code=exited status=1
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: Stopped watchdog daemon.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Unit entered failed state.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Triggering OnFailure= dependencies.
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Failed to enqueue OnFailure= job: Resource deadlock avoided
Nov 08 17:00:58 wirenboard-ANTQ3AEM systemd[1]: watchdog.service: Failed with result ‘exit-code’.
– Reboot –
В 5.14 описывалось похожее. После запуска контроллера попробуйте явно остановить watchdog - для проверки.
Fencer
08.Ноябрь.2021 20:06:56
16
Остановил, посмотрим
Но после обновления плохие чудеса начались - часть выключателей перестала нормально работать с “глючным” модулем, первый раз за все время - то не работают совсем, то включат и не выключают
В WEB UI не отображаются содержимое conf файлов, скриптов - Loading и пустой экран
продолжаю наблюдения ;(
Fencer
08.Ноябрь.2021 21:02:02
17
В 5.14 описывалось похожее. После запуска контроллера попробуйте явно остановить watchdog - для проверки.
не помогло
root@wirenboard-ANTQ3AEM:~# last -x | head | tac
root pts/0 192.168.88.254 Mon Nov 8 17:26 - crash (00:11)
reboot system boot 4.9.22-wb2 Mon Nov 8 17:37 still running
runlevel (to lvl 5) 4.9.22-wb2 Mon Nov 8 17:38 - 18:30 (00:52)
root pts/0 192.168.88.254 Mon Nov 8 17:45 - crash (00:44)
reboot system boot 4.9.22-wb2 Mon Nov 8 18:30 still running
runlevel (to lvl 5) 4.9.22-wb2 Mon Nov 8 18:30 - 00:02 (05:31)
root pts/0 192.168.88.254 Mon Nov 8 22:57 - crash (01:03)
reboot system boot 4.9.22-wb2 Tue Nov 9 00:01 still running
runlevel (to lvl 5) 4.9.22-wb2 Tue Nov 9 00:02 still running
root pts/0 192.168.88.254 Tue Nov 9 00:06 still logged in
Fencer
09.Ноябрь.2021 07:04:03
18
Помогите, пожалуйста, с ребутами контроллера.
Пользоваться стало невозможно, что еще можно посмотреть - не понятно
Система постоянно крашится
Надо установить причину. Как часто перезапускается? Подключитесь к Debug консоли, оставьте консоль открытой.
Fencer
09.Ноябрь.2021 09:26:33
20
Несколько раз в день
Имеется в виду вот это?
https://wirenboard.com/wiki/WB_Debug_Console