Помогите определить проблему по логу

Тогда - бэкап всего нужного и factory reset.
Хотя… Возможно что не запускается как раз потому что с стетью пробема? Он же сеть слушает.

ip address

Что дает?


здесь вроде бы все ок

конечно хотелось бы понять, что произошло

настройки все стандартные были
ни каких замысловатых и вообще ни каких правил не было на нем
только шлюз запущен был в одну сторону mQTT

Да, согласен. Либо подождите 15 минут - все ж пробую воспроизвести либо сбрасывайте.

подожду
в любом случае обновлять сейчас буду
если необходим могу дать доступ удаленный через таймвювер, прежде чем обновлять

для меня то в первую очередь важно причину понять, почему это произошло

Присылайте в личку тимвьювер.

Сводка

Удалил данные.

Понятно ИБП нету, база данных самого москита повреждена. Удалил базу.
Вот такой: https://wirenboard.com/wiki/WBMZ2-BATTERY
Ставится в корпус контроллера.

А можно как-то сделать авто-выключение, когда батарейка заканчивается?

Иначе батарейка просто оттягивает момент порчи файлов…

Можно написать свои правила и сохранять-останавливать критичные сервисы. Хм, если остановить mqtt брокер то потом правила ж работать перестанут… Ну и от большниства угроз (скачки, пропадания короткие) защищает.

1 лайк

в этом вся проблем, аккуратно завершить работу, то надежность наверно системы будет выше

вопрос в том, как поймать момент, чтобы:

  1. Батарейки точно хватило на shutdown (или остановку сервисов?)
  2. Не дергаться при коротких пропаданиях сети

P.S. Проблема актуальная. На даче второй раз умер WB5 (не загрузился после восстановления напряжения). Первый раз тупо место закончилось (сам виноват). Вроде нашел кто его пожирал и полечил. Почему второй раз умер - буду на днях разбираться. Возможно, какие-то остатки от первого падения. Там часто бывают отключения питания. Обычно в пределах часа-двух. Вроде хватает батарейки. Но бывают и на 4-8 часов, тогда точно не хватает. Хочется научиться переживать пару часов или на сколько хватает батарейки, а потом корректно отключаться.

Точно. Вот у меня контроллер. К нему еще подключено 5 модулей 485 и пара WBIO. Сейчас выключил основное питание, уже 5 минут живет
Screenshot from 2020-09-22 11-05-32
А в правиле никто не мешает ориентироваться именно на напряжение батареи.
Оно измеряется точно, стоит стандартный литий 18650.

Как понять “сколько у меня есть времени?”

Типа как-то определить :

  1. предельно-критичное напряжение
  2. считать падение напряжения, чтобы понять точку “х минут до полного отрубания”
  3. все-таки определиться shutdown (занимает немало времени и батарейки, как я думаю) или stop основных сервисов, которые пишут на диск?

Screenshot from 2020-09-22 12-33-23
Отключил в 11:03
Screenshot from 2020-09-22 12-34-57
Выключилось в 12:07
Время есть.
Ну можно и на % заряда ориентироваться, он тоже считается.

Дело в том что основное питание могут включить после остановки сервисов, но до полной разрядки батареи. И запустить сервисы - уже будет некому.

1 лайк

Вот зарядка пошла, в %
Screenshot from 2020-09-22 12-58-13
То есть 0% был еще за 2 минуты до отключения. Но лучше оставлять “запас”, конечно.

добрый день!
проблема повторилась
симптомы точно таки же
удалить БД?
только проблема, контроллер пингуется, но зайти на него не получается

по питанию удалось перегрузить, остановить ватчдог
попал на контроллер
сгрузил логи


Добрый день. Да, надо попробовать. Смотрю логи.

может будет полезна еще вот такая информация
на WB6 настрое бридж MQTT отправляет на сторонyий MQTT и далее в базу InfluxDB на cервер, развернутый на амазоне и на на графане можем смотреть график

и сейчас смотрю график на блоках питания, видно как контроллер начинает “уставать” и посылки топиков уменьшаются в своей частоте


до 4 утра все было хорошо, потом они начинают пропадать … и в итоге видим на графике
как минимум поведение контроллера видно

Судя по логу - проблема с нехваткой оперативной памяти. В результате ошибок ее выделения (неоткуда, все занято, Free swap = 0kB) - начали падать процессы и сработал ватчдог

03:46:27 wirenboard-AOQVPT27 user.err kernel: [144309.071992] Killed process 29668 (node) total-vm:78836kB, anon-rss:1604kB, file-rss:2700kB, shmem-rss:0kB