Перезагрузка контроллера раз в несколько дней

Раз в 2-4 дня контроллер самопроизвольно перезагружается. С чем связанно не пойму. В log/messages ничего критичного не увидел. Судя по логу сегодня в 10.53 перезагрузился. На всякий случай привожу часть лог файла

May 12 10:52:50 wirenboard-AVNAZUEJ npm[2008]: e[32mZigbee2MQTT:info e[39m 2021-05-12 10:52:50: MQTT publish: topic 'zigbee2mqtt/0x00158d00031e6bf8', payload '{"battery":100,"contact":true,"last_seen":1620805970591,"linkquality":104,"voltage":3025}'

May 12 10:52:52 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 1 input(s) @ 280 of device modbus:178: Serial protocol error: request timed out
May 12 10:52:56 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 2 input(s) @ 9 of device modbus:165: Serial protocol error: request timed out
May 12 10:52:58 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 2 input(s) @ 9 of device modbus:165: Serial protocol error: request timed out
May 12 10:53:01 wirenboard-AVNAZUEJ CRON[5056]: pam_unix(cron:session): session opened for user root by (uid=0)
May 12 10:53:01 wirenboard-AVNAZUEJ CRON[5060]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
May 12 10:53:06 wirenboard-AVNAZUEJ CRON[5056]: pam_unix(cron:session): session closed for user root
May 12 10:53:06 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 1 input(s) @ 280 of device modbus:165: Serial protocol error: request timed out
May 12 10:53:15 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 1 input(s) @ 283 of device modbus:176: Serial protocol error: request timed out
May 12 10:53:25 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 2 input(s) @ 0 of device modbus:178: Serial protocol error: request timed out
May 12 10:53:29 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 2 input(s) @ 9 of device modbus:178: Serial protocol error: request timed out
May 12 10:53:35 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 2 input(s) @ 0 of device modbus:165: Serial protocol error: request timed out
May 12 10:53:38 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 1 input(s) @ 283 of device modbus:165: Serial protocol error: request timed out
May 12 10:53:41 wirenboard-AVNAZUEJ wb-mqtt-serial[7387]: WARNING: [modbus] failed to read 1 input(s) @ 283 of device modbus:165: Serial protocol error: request timed out
May 12 10:56:43 wirenboard-AVNAZUEJ systemd-modules-load[148]: Module ‘sc16is7x2’ is builtin
May 12 10:56:43 wirenboard-AVNAZUEJ systemd-fsck[149]: /dev/mmcblk0p3: clean, 29824/65536 files, 151030/262144 blocks
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Started Create list of required static device nodes for the current kernel.
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Started Load Kernel Modules.
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Started File System Check on Root Device.
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Started File System Check Daemon to report status.
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Starting Remount Root and Kernel File Systems…
May 12 10:56:43 wirenboard-AVNAZUEJ systemd[1]: Starting Apply Kernel Variables…

Добрый день.

Давайте мы поменяем вам контроллер. Курьер привезёт новое оборудование и заберёт старое.
Для возврата напишите, пожалуйста, письмо на info@wirenboard.com.

В письме укажите:

  1. ссылку на эту тему,
  2. серийный номер устройства, AVNAZUEJ
  3. ваш действующий телефон и адрес доставки.

Ничего в настройках контроллера не меняйте пожалуйста.

Добрый день я не уверен что дело в контроллере, ранее все работало хорошо. Проблемы начались после того как я включил zigbetomqtt и подключил несколько устройств. А может это связанно с тем что я по инструкции на SPRUT ( Wiren Board - оптимизация опросов) настраивал устройства.
в настройках менять ничего не буду. письмо напишу.

Так… Если перезагрузки начались именно после изменения настроек - тогда давайте попробуем отключить watchdog

systemctl disable watchdog && systemctl stop watchdog

и проверим пару дней.

Отключил. Где то можно дополнительно логи накопать?

Итак прошла неделя. 13 мая я отключил ватчддог

systemctl disable watchdog && systemctl stop watchdog

была одна перезагрузка 15 мая ночью.

reboot system boot 4.9.22-wb6 Sat May 15 00:58 still running
сегодня 20 мая пока больше не перезагружалось.

Еще у меня большой лог messages с failed to read, я так понимаю это проблема чтения по шине rs485

ay 18 15:20:02 wirenboard-AVNAZUEJ CRON[21621]: pam_unix(cron:session): session closed for user root
May 18 15:20:05 wirenboard-AVNAZUEJ CRON[21620]: pam_unix(cron:session): session closed for user root
May 18 15:20:08 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 283 of device modbus:165: Serial protocol error: request timed out
May 18 15:20:10 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 283 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:39 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 2 input(s) @ 9 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:42 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 3 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:48 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 2 input(s) @ 9 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:50 wirenboard-AVNAZUEJ wb-mqtt-db[511]: 2021-05-18 15:20:50.555 NOTICE: Bulk processing took 146ms
May 18 15:20:50 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 2 input(s) @ 9 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:51 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 3 of device modbus:178: Serial protocol error: request timed out
May 18 15:20:53 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 280 of device modbus:165: Serial protocol error: request timed out
May 18 15:20:55 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 283 of device modbus:165: Serial protocol error: request timed out
May 18 15:21:01 wirenboard-AVNAZUEJ serial: ModbusRTU::ReadRegisterRange(): failed to read 1 input(s) @ 280 of device modbus:165: Serial protocol error: request timed out
May 18 15:21:01 wirenboard-AVNAZUEJ CRON[21705]: pam_unix(cron:session): session opened for user root by (uid=0)
May 18 15:21:01 wirenboard-AVNAZUEJ CRON[21709]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
May 18 15:21:06 wirenboard-AVNAZUEJ CRON[21705]: pam_unix(cron:session): session closed for user root

Я бы советовал контроллер обновить, старые пакеты.

Я обновляю постоянно…Все кроме wb-mqtt-serial/stretch,stretch 2.7.1 armhf [upgradable from: 1.60.0~rc.1] его не трогаю из за диммера у меняя 4 канала одноцветной ленты.
может быть в этом дело?

на всякий случай

Batch No

6.7.2A 429

Current uptime

5d 20h 53m

DTS Version

Firmware version

202002171718

HW Revision

6.7.2

Manufacturing Date

Ср сен 9 14:23:52 MSK 2020

service watchdog stop
systemctl disable watchdog

Парадоксально, но после этого у меня прекратились спорадические затыки с загрузкой (вероятно, если бы был разрешен аппаратный вочдог, машинка и ребуталась бы сама, я сразу отключаю его).

Попробуйте, расскажете.

Возвращаюсь к вопросу. WB по прежнему раз в несколько дней перезагружается. Есть подозрения что что то сжирает оперативную память.

 PID USER      PR  NI    VIRT    RES    SHR S %CPU %MEM     TIME+ COMMAND                              
    1 root      20   0   26576   5032   3724 S  1.9  1.0   9:45.07 systemd                              
    2 root      20   0       0      0      0 S  0.0  0.0   0:00.07 kthreadd                             
    3 root      20   0       0      0      0 S  0.3  0.0   3:11.67 ksoftirqd/0                          
    5 root       0 -20       0      0      0 S  0.0  0.0   0:00.00 kworker/0:0H                         
    7 root      20   0       0      0      0 S  0.6  0.0  11:15.28 rcu_sched                            
    8 root      20   0       0      0      0 S  0.0  0.0   0:00.00 rcu_bh                               
    9 root      rt   0       0      0      0 S  0.0  0.0   0:00.00 migration/0

top

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
140 root 20 0 157572 97388 96948 S 0.3 19.1 7:48.08 systemd-journal
4281 root 20 0 138184 53992 27044 S 0.0 10.6 0:53.85 node
1386 root 20 0 119016 34024 26548 S 0.0 6.7 0:05.29 node
1993 www-data 20 0 78804 5044 3272 S 0.0 1.0 0:20.57 nginx
2000 www-data 20 0 78804 4836 3072 S 0.0 0.9 0:27.76 nginx
2002 www-data 20 0 78804 4836 3072 S 0.0 0.9 0:28.25 nginx
2003 www-data 20 0 78804 4968 3204 S 0.0 1.0 0:08.47 nginx
1989 root 20 0 78640 3552 1956 S 0.0 0.7 0:00.01 nginx
3403 root 20 0 68596 7272 5968 S 16.7 1.4 321:24.25 wb-mqtt-serial

joornalctl

Aug 18 21:35:00 wirenboard-AVNAZUEJ bash[26728]: ===================================================
Aug 18 21:35:00 wirenboard-AVNAZUEJ bash[26728]: *** BETA/DEV BRANCH ***
Aug 18 21:35:00 wirenboard-AVNAZUEJ bash[26728]: ===================================================
Aug 18 21:35:00 wirenboard-AVNAZUEJ bash[26728]: > starting monitor.sh (v. 0.2.200)…
Aug 18 21:35:01 wirenboard-AVNAZUEJ bash[26728]: > error: minimum required mosquitto_sub version 1.5+ not found. please update.
Aug 18 21:35:01 wirenboard-AVNAZUEJ bash[26728]: > error: minimum required mosquitto_pub version 1.5+ not found. please update.
Aug 18 21:35:01 wirenboard-AVNAZUEJ bash[26728]: > warning: for security purposes, please consider changing ‘username’ in: mqtt_preferences
Aug 18 21:35:01 wirenboard-AVNAZUEJ bash[26728]: > warning: for security purposes, please consider changing ‘password’ in: mqtt_preferences
Aug 18 21:35:01 wirenboard-AVNAZUEJ bash[26728]: > warning: operating in anonymous and unprotected mode for mqtt broker at 127.0.0.1
Aug 18 21:35:01 wirenboard-AVNAZUEJ systemd[1]: monitor.service: Main process exited, code=exited, status=1/FAILURE
Aug 18 21:35:01 wirenboard-AVNAZUEJ systemd[1]: monitor.service: Unit entered failed state.
Aug 18 21:35:01 wirenboard-AVNAZUEJ systemd[1]: monitor.service: Failed with result ‘exit-code’.
Aug 18 21:35:11 wirenboard-AVNAZUEJ systemd[1]: monitor.service: Service hold-off time over, scheduling restart.
Aug 18 21:35:11 wirenboard-AVNAZUEJ systemd[1]: Stopped Monitor Service.
Aug 18 21:35:11 wirenboard-AVNAZUEJ systemd[1]: Started Monitor Service.

Добрый день. А что такое monitor.service?

Passive Bluetooth presence detection of beacons, cell phones, and other Bluetooth devices. Useful for mqtt-based home automation, especially when the script runs on multiple devices, distributed throughout a property.

Отключил его.

Выполните пожалуйста на контроллере пеосе перезагрузки

busybox devmem 0x20bc004 16

И выложите результат

После автоматической перезагрузки или можно самостоятельно перезагрузить и выполнить команду?

После автоматической.

Добрый день. Контроллер не перезапускался?

Ну я там довольно активно мучил контроллер и перезагружал, несколько дней специально ничего не трогал, пока uptime, надеюсь так и останется
23:59:29 up 10 days, 21:26, 1 user, load average: 3.83, 3.77, 3.82

Хорошо. Если будет что-то подозрительное - пишите.

Я рано радовался, сегодня перезагрузился 2 раза контроллер. В 10.03 утра и 16.09, никаких действий я с ним не производил…До этого как я писал выше аптайм был 10 дней

busybox devmem 0x20bc004 16

дает ответ 0x0010