Периодическая перезагрузка контроллера WB7

Добрый день!
Имею следующую проблему - не так давно (недели 2 назад) решил оставить контроллер работать продолжительное время, настроив к нему удаленный доступ через WG.
На контроллере (WB7) не установлено ничего особенного кроме штатного ПО, mc, WG, SH.
При подключении по ssh, стал замечать, что при вводе команды uptime пишет всегда (почти) менее суток. Заинтересовался, стал копать.
Вот результат

last reboot

root@wirenboard-AJTSWQEN:~# last reboot
reboot system boot 5.10.35-wb133+wb Sun Jun 4 22:59 still running
reboot system boot 5.10.35-wb133+wb Sun Jun 4 17:16 still running
reboot system boot 5.10.35-wb133+wb Sat Jun 3 00:00 still running
reboot system boot 5.10.35-wb133+wb Fri Jun 2 16:27 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 23:59 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 22:45 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 22:35 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 22:28 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 22:24 still running
reboot system boot 5.10.35-wb133+wb Thu Jun 1 18:52 still running
reboot system boot 5.10.35-wb133+wb Wed May 31 17:21 still running
reboot system boot 5.10.35-wb133 Mon May 29 07:55 still running
reboot system boot 5.10.35-wb133 Sun May 28 18:58 - 07:55 (12:56)
reboot system boot 5.10.35-wb133 Sun May 28 18:25 - 18:58 (00:33)
reboot system boot 5.10.35-wb133 Wed May 24 19:39 - 20:17 (00:37)
reboot system boot 5.10.35-wb133 Wed May 24 19:10 - 19:39 (00:28)
reboot system boot 5.10.35-wb133 Wed May 24 19:04 - 19:10 (00:06)
reboot system boot 5.10.35-wb133 Tue May 23 23:54 - 00:50 (00:55)
reboot system boot 5.10.35-wb133 Tue May 23 23:27 - 23:54 (00:27)
reboot system boot 5.10.35-wb133 Tue May 23 23:05 - 23:26 (00:21)
reboot system boot 5.10.35-wb133 Tue May 23 22:49 - 23:04 (00:15)
reboot system boot 5.10.35-wb133 Tue May 23 22:42 - 22:49 (00:06)
reboot system boot 5.10.35-wb133 Tue May 23 22:08 - 22:42 (00:34)
reboot system boot 5.10.35-wb133 Sun May 21 20:40 - 21:50 (01:09)
reboot system boot 5.10.35-wb133 Sun May 21 18:51 - 19:20 (00:28)
reboot system boot 5.10.35-wb133 Fri May 19 18:50 - 20:41 (01:51)
reboot system boot 5.10.35-wb133 Fri May 19 18:27 - 18:50 (00:22)
reboot system boot 5.10.35-wb133 Thu Apr 20 09:03 - 18:50 (29+09:46)
reboot system boot 5.10.35-wb133 Tue Apr 11 22:37 - 00:46 (02:09)
reboot system boot 5.10.35-wb133 Tue Apr 11 16:27 - 16:36 (00:09)
reboot system boot 5.10.35-wb133 Tue Apr 11 16:17 - 16:27 (00:09)
reboot system boot 5.10.35-wb133 Tue Apr 11 15:28 - 16:17 (00:48)
reboot system boot 5.10.35-wb133 Tue Apr 11 15:20 - 15:28 (00:08)
reboot system boot 5.10.35-wb120+wb Tue Apr 11 14:41 - 15:19 (00:38)
reboot system boot 5.10.35-wb120+wb Sun Mar 26 19:08 - 15:19 (15+20:10)
reboot system boot 5.10.35-wb120+wb Fri Mar 24 08:08 - 08:14 (00:05)
reboot system boot 5.10.35-wb120+wb Thu Mar 23 09:11 - 09:15 (00:03)
reboot system boot 5.10.35-wb120+wb Thu Mar 23 09:02 - 09:15 (00:12)
reboot system boot 5.10.35-wb120+wb Sat Mar 18 14:30 - 15:33 (01:03)
reboot system boot 5.10.35-wb120+wb Sat Mar 18 14:16 - 14:29 (00:13)
reboot system boot 5.10.35-wb120+wb Wed Mar 15 08:35 - 08:47 (00:12)
reboot system boot 5.10.35-wb120+wb Wed Mar 15 08:25 - 08:34 (00:09)
reboot system boot 5.10.35-wb120+wb Wed Mar 15 08:09 - 08:24 (00:15)
reboot system boot 5.10.35-wb120+wb Sun Mar 12 17:51 - 17:55 (00:04)
reboot system boot 5.10.35-wb120+wb Sun Mar 12 17:13 - 17:55 (00:41)
reboot system boot 5.10.35-wb120+wb Sun Mar 12 16:12 - 17:13 (01:01)
reboot system boot 5.10.35-wb120+wb Sun Mar 12 14:12 - 16:11 (01:58)
reboot system boot 5.10.35-wb104 Sun Mar 12 13:48 - 14:12 (00:23)
reboot system boot 5.10.35-wb104 Mon Feb 21 16:45 - 14:12 (383+21:27)
reboot system boot 5.10.35-wb104 Mon Feb 14 10:33 - 14:12 (391+03:39)
reboot system boot 5.10.35-wb104 Thu Nov 3 20:32 - 14:12 (2319+17:39)
reboot system boot 5.10.35-wb104 Sat Jan 1 06:14 - 14:12 (8471+07:58)

Вот результат

who -b и last -x | head | tac

root@wirenboard-AJTSWQEN:~# who -b
загрузка системы 2023-06-04 22:59
root@wirenboard-AJTSWQEN:~# last -x | head | tac
runlevel (to lvl 5) 5.10.35-wb133+wb Fri Jun 2 16:28 - 00:02 (07:33)
root pts/0 10.66.66.1 Fri Jun 2 16:43 - 17:13 (00:30)
reboot system boot 5.10.35-wb133+wb Sat Jun 3 00:00 still running
runlevel (to lvl 5) 5.10.35-wb133+wb Sat Jun 3 00:02 - 17:18 (1+17:15)
reboot system boot 5.10.35-wb133+wb Sun Jun 4 17:16 still running
runlevel (to lvl 5) 5.10.35-wb133+wb Sun Jun 4 17:18 - 23:00 (05:42)
reboot system boot 5.10.35-wb133+wb Sun Jun 4 22:59 still running
runlevel (to lvl 5) 5.10.35-wb133+wb Sun Jun 4 23:00 still running
root pts/0 10.66.66.1 Mon Jun 5 11:37 - 11:46 (00:08)
root pts/0 10.66.66.1 Mon Jun 5 11:47 still logged in

Провел проверку

износа emmc

root@wirenboard-AJTSWQEN:~# cat /sys/kernel/debug/mmc0/mmc0:0001/ext_csd \

| python -c ‘import binascii, sys; print “~%d%% wear” % (ord(binascii.unhexlify(sys.stdin.read().strip())[0x5e])*10)’
~0% wear

Прикладываю диагностический архив
приложен диагностический архив, доступен только сотрудникам поддержки (215,6 КБ)
и
journalctl --list-boots и watchdog
journalctl --list-boots и watchdog.txt (53,7 КБ)

Прошу помочь разобраться

Подозрительного не вижу, совсем. А есть возможность подключить Debug порт к компьютеру, например сохранить вывод из порта в файл?

Вот выводы

[shell localhost] (2023-06-06_084024) Debug console2.log (69,7 КБ)
[shell localhost] (2023-06-06_083615) Debug console1.log (82,6 КБ)
[shell localhost] (2023-06-06_081310) Debug console.log (291,2 КБ)

Я не вижу в файлах момента перезапуска, к сожалению.
Ну и часть строк почему-то обрезаны. Цель, собственно, в том чтобы увидеть что выводится в порт при неожиданном перезапуске.

Естественно, его нет. Я могу перезагрузить устройство сам, но ждать, когда оно ребутнется с воткнутым кабелем и компом целый день я не могу)
Не знаю, почему часть строк обрезаны, пользуюсь рекомендованным Вами ПО на сайте по Вашей же инструкции. Как сделать полный вывод?
Видите ошибки вотчдога? С чем они связаны? Может его отключить?

Достаточно подключить и направить вывод порта в файл, ждать рядом не нужно.

Не совсем понял про “рекомендованное”
Я пользуюсь типично

minicom -D /dev/ttyACM0 -C logFile.txt

Именно ошибок - нет, какие строки имеете в виду?

Хорошо, оставлю ноут подключенным на сутки, посмотрим. Пока ребута не было.

Ну например

watchdog.service: Failed to enqueue OnFailure= job, ignoring: Transaction for wd_keepalive.service/start is destructive (dev-disk-by\x2dpath-platform\x2d1c11000.mmc\x2dpart5.swap has ‘stop’ job queued, but ‘start’ is included in transaction).
2023-06-06T07:31:01.149Z [init] watchdog.service: Triggering OnFailure= dependencies.
2023-06-06T07:31:01.148Z [init] Stopped watchdog daemon.
2023-06-06T07:31:01.146Z [init] watchdog.service: Failed with result ‘exit-code’.
2023-06-06T07:31:01.145Z [init] watchdog.service: Control process exited, code=exited, status=1/FAILURE
2023-06-06T07:31:01.012Z [init] Stopping watchdog daemon…

log_20230606T103246.log (24,2 КБ)

Нормальный запуск watchdog:

journalctl --since "15 min ago" |grep watchdog
Jun 07 08:11:31 wirenboard-AWI3MCGC systemd[1]: Stopping watchdog daemon...
Jun 07 08:11:32 wirenboard-AWI3MCGC watchdog[2728]: stopping daemon (5.16)
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: watchdog.service: Control process exited, code=exited, status=1/FAILURE
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: watchdog.service: Failed with result 'exit-code'.
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: Stopped watchdog daemon.
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: watchdog.service: Triggering OnFailure= dependencies.
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: watchdog.service: Failed to enqueue OnFailure= job, ignoring: Transaction for wd_keepalive.service/start is destructive (wb-configs-early.service has 'stop' job queued, but 'start' is included in transaction).
Jun 07 08:11:32 wirenboard-AWI3MCGC systemd[1]: watchdog.service: Consumed 1min 5.003s CPU time.
Jun 07 08:11:55 wirenboard-AWI3MCGC kernel: sunxi-wdt 1c20c90.watchdog: Watchdog enabled (timeout=16 sec, nowayout=0)
Jun 07 08:12:24 wirenboard-AWI3MCGC systemd[1]: Starting watchdog daemon...
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]: starting daemon (5.16):
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  int=1s realtime=yes sync=no load=0,0,0 soft=no
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  memory: minimum pages = 256 free, 0 allocatable, max swap 0 (4096 byte pages)
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  ping: no machine to check
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  file: no file to check
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  pidfile: /var/run/sshd.pid
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  interface: no interface to check
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  temperature: no sensors to check
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  no test binary files
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  no repair binary files
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  error retry time-out = 30 seconds
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  repair attempts = 1
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]:  alive=/dev/watchdog1 heartbeat=[none] to=[none] no_act=no force=no
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]: watchdog now set to 60 seconds
Jun 07 08:12:24 wirenboard-AWI3MCGC watchdog[2719]: hardware watchdog identity: GPIO Watchdog
Jun 07 08:12:24 wirenboard-AWI3MCGC systemd[1]: Started watchdog daemon.

У вас в логе почему-то порядок обратный, сверху - самые новые события, это с толку сбивает немного.

Так выгрузилось с помощью журнала WB в веб-интерфейсе.
Так это ошибка WD или нет?

Нет.

Аптайм сутки, ждём. Ничего не менял и не делал. Если это повторяться не будет и будет аптайм хотя бы дня 3 - отпишусь, закроем тему. Спасибо

1 лайк

Опять перезагрузка! 2 за ночь!
log-file.zip (79,7 КБ)
Приложил лог за 2 перезагрузки.
Оставил компьютер с воткнутым debug, будем посмотреть.

@BrainRoot Андрей, можете посмотреть лог? Или лучше достать диаг. архив еще?

Посмотрел лог. Нет странного. Все ж подозреваю аппаратное, то есть предлагаю замену.

Давайте посмотрю сегодня что выведет на ноутбук программа для вывода, если будет ребут.
Потом что нужно сделать для замены? Я буду готов немного доплатить за 2/64 если что и, пожалуйста, напишите, если не трудно, или ткните носом, как сохранить все нужное в виде настроек устройств и спрутхаба. Впн понятное дело заново поднимать.
Как раз хотел датчики заказывать ещё msw…

Это достаточно в общем, указать в письме.

Основные настройки, бэкап - Резервное копирование настроек контроллера — Wiren Board
Про SH - не скажу. А, кстати, если его отключить - перезапускается?

Да, пробовал. Не влияет.