Отключали счет - контроллер начал снова перезагружаться

Андрей, к тебе, наверное, снова за помощью.
в районе не было света пару часов, после этого контроллер, который вы починили после частичного обновления опять ведет себя также - не пускает на вебморду, постоянно перезагружается.
второй “рабочий” контроллер перенес испытание со светом нормально - поднялся и работает.
watchdog остановил, что сделать дальше?

свободное место:
Filesystem Size Used Avail Use% Mounted on
/dev/root 976M 502M 408M 56% /
devtmpfs 239M 0 239M 0% /dev
tmpfs 248M 0 248M 0% /dev/shm
tmpfs 248M 508K 247M 1% /run
tmpfs 5.0M 0 5.0M 0% /run/lock
tmpfs 248M 0 248M 0% /sys/fs/cgroup
/dev/mmcblk0p6 1.3G 394M 820M 33% /mnt/data
tmpfs 50M 0 50M 0% /run/user/0

время правильное
ip address -
1: lo: <LOOPBACK,UP,LOWER_UP> mtu 65536 qdisc noqueue state UNKNOWN group default qlen 1000
link/loopback 00:00:00:00:00:00 brd 00:00:00:00:00:00
inet 127.0.0.1/8 scope host lo
valid_lft forever preferred_lft forever
inet6 ::1/128 scope host
valid_lft forever preferred_lft forever
2: eth1: <NO-CARRIER,BROADCAST,MULTICAST,UP> mtu 1500 qdisc pfifo_fast state DOWN group default qlen 1000
link/ether 04:91:62:c2:97:81 brd ff:ff:ff:ff:ff:ff
inet 192.168.88.202/24 brd 192.168.88.255 scope global eth1
valid_lft forever preferred_lft forever
3: eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc pfifo_fast state UP group default qlen 1000
link/ether 04:91:62:c1:e8:6b brd ff:ff:ff:ff:ff:ff
inet 192.168.0.202/24 brd 192.168.0.255 scope global eth0
valid_lft forever preferred_lft forever
inet6 fe80::691:62ff:fec1:e86b/64 scope link
valid_lft forever preferred_lft forever
4: sit0@NONE: mtu 1480 qdisc noop state DOWN group default qlen 1000
link/sit 0.0.0.0 brd 0.0.0.0
5: wlan0: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000
link/ether ac:64:cf:c2:f7:22 brd ff:ff:ff:ff:ff:ff
6: wlan1: <BROADCAST,MULTICAST> mtu 1500 qdisc noop state DOWN group default qlen 1000
link/ether ae:64:cf:c2:f7:22 brd ff:ff:ff:ff:ff:ff

ya.ru не пингуется - icmp_seq=1 Destination Host Unreachable
сеть настроена -
auto eth0
iface eth0 inet static
address 192.168.0.202
gateway 192.168.0.1
hostname wirenboard
hwaddress 04:91:62:c1:e8:6b
mtu 1500
netmask 255.255.255.0
pre-up wb-set-mac

Здравствуйте!
Пришлите, пожалуйста, логи, в которых будет виден процесс загрузки контроллера, а затем последующая перезагрузка. Для их получения подключитесь к контроллеру через отладочный порт:
https://wirenboard.com/wiki/WB_Debug_Console
Сами логи скопируйте в отдельный файл и пришлите.

Также попробуйте отключить использование базы данных брокером mosquitto: Множественная перезагрузка контроллера - #3

Также попробуйте отключить все модули расширения физически от контроллера. Изменится ли поведение?

error_log.txt (30.0 КБ)
В конфигурационном файле /etc/mosquitto/mosquitto.conf уже persistence false
файл базы данных удалил и рестартанул контроллер.
модуль расширения отключил. не помогает, ушел в ребут.

Вижу в логах вот это:

root@wirenboard-AVYLBVBW:~# [  107.262558] systemd-journald[103]: Received SIGTERM from PID 4900 (watchdog).

То есть контроллер перезагружается по watchdog. Попробуйте отключить и остановите сервис watchdog так:

systemctl disable watchdog
systemctl stop watchdog

А затем проверьте статус работы сервиса

systemctl status watchdog

Покажите вывод команды в консоли. Сервис должен быть остановлен.

в первом же сообщении написал, что сервис остановлен, иначе постоянный перезагруз.

watchdog_log.txt (1.3 КБ)

upd - попробовал зайти на web: ЧУДО, пустил. системные журналы посмотрел, watchdog ругается на такую ошибку:
12-07-2022 10:10:20.918 [watchdog] cannot open /var/run/syslogd.pid (errno = 2 = ‘No such file or directory’)
есть еще такая:
12-07-2022 10:58:41.750 [wb-mqtt-db.service] WARNING: [dblogger] Group data limit is reached: group all, row count 102006, limit 100000

Вот теперь понял, что сервис остановлен и перезагрузок нет. Сначала я понял, что и с остановленным сервисом есть перезагрузки.

Это не ошибка, а информационное сообщение о том, что достигнуто максимальное количество записей в группе all для архива данных. Данные будут циклически перезаписываться новыми. Можно не обращать внимание на это

Видимо сервис watchdog проверяет работает ли сервис syslogd. В новых версиях ПО эта проверка отключена, предлагаю сделать аналогично. Пришлите, пожалуйста, файл настроек сервиса etc/watchdog.conf.
Попробуйте привести следующую секцию в этом файле к виду:

# Test if vital daemons are running
pidfile		= /var/run/sshd.pid

То есть watchdog будет контролировать только работу сервиса ssh.

Еще покажите полный вывод команд:

systemctl list-units --type=service

и

dpkg -l  

watchdog_log2.txt (35.8 КБ)

перезагрузить контроллер после этого

Test if vital daemons are running

pidfile = /var/run/sshd.pid

Можете ли прислать архив с диагностической информацией контроллера? Создание архива описано в инструкции.

Если не получится, то еще раз пришлите, пожалуйста, полный вывод команды (вывод занимает несколько страниц, нужно промотать ниже):

systemctl list-units --type=service

Во вложении в предыдущем сообщении вывод не полный. Это нужно, чтобы понять, есть ли еще какие-нибудь проблемы, проверить статус работы всех сервисов.

инструкция - просто ссылка на системный журнал. какая диагностическая инфа нужна? доступ на веб-панель пока есть

Нужно сгенерировать архив с диагностической информацией и прислать его. Архив генерируется по нажатию на кнопку:
image

diag_output_AVYLBVBW_2022-07-13-11.46.49.zip (130.6 КБ)

В целом не вижу больше проблем. Думаю, можно попробовать перезагрузить контроллер. Рекомендую при этом через отладочную консоль контролировать процесс загрузки.

перезагрузил, wathdog не отключал, вроде работает, но опять не пускает.

Нужно больше информации. По какому интерфейсу подключаетесь? Пришлите файл настроек /etc/network/interfaces.
Контроллер не пингуется? Покажите вывод команды

ip address

с утра зашел нормально и вот такие действия проделал:

  1. перезагрузил контроллер - зайти не могу ни через хром (со сбросом кеша), ни через редко пользуемый яндекс, ни еще реже brave. дело не в браузере.
  2. перезагрузил комп - зашел.
    получается дело в чем-то на самом компьютере. что это может быть?
    раньше такого не было, появилось после обновления до 2204.
    есть еще контроллер, там стоит 2201. его пока не трогаю и там все нормально с доступом после перезагрузок.
    проведем эксперимент - подключимся к wb6 другим компом и повторим те же действия.
    в понедельник отпишусь.

Покажите результаты выполнения на компьютере:

wget IPадресКонтроллера

Не совсем понимаю, что описываете про невозсожность зайти. Контроллер пингуется? SSH доступен?

Андрей, приветствую.
контроллер не под рукой сейчас, буду в офисе, отпишусь.

окошко авторизации очищается после набора логина-пароля и попытки зайти и опять нужно набирать лога-пароль. внутрь не пускает.

Так, сброс кэша и куков браузера?