Сегодня выяснилось, что не работает вся автоматизация на контроллере WB 7.4.
Контроллер отвечал на пинги, но веб-интерфейс не работал, SSH также не работал, даже при прямом подключении к debug network. Решилось перезагрузкой.
Хочется понять, почему и как это произошло. В логах с 19:31 13.10.24 до 9 вечера отсутствуют сообщения, полагаю, что именно тогда и произошел сбой.
Добрый день.
Обратите внимание что сервисы были завершены OOM/
Oct 14 01:53:17 wb-ng-vv-grg systemd[1]: systemd-journald.service: State 'stop-sigterm' timed out. Killing.
Oct 14 01:53:27 wb-ng-vv-grg systemd[1]: systemd-journald.service: Killing process 9094 (systemd-journal) with signal SIGKILL.
Oct 14 01:54:12 wb-ng-vv-grg systemd[1]: systemd-journald.service: Main process exited, code=killed, status=9/KILL
Oct 14 01:54:37 wb-ng-vv-grg systemd[1]: systemd-journald.service: Failed with result 'timeout'.
Oct 14 01:55:07 wb-ng-vv-grg systemd[1]: Failed to start Journal Service.
Проверьте диннамику потребления RAM процессом homeassistant.
Оптимизировал работу автоматизаций в HA, вроде больше таких утечек памяти не наблюдал. Снова произошел сбой, точное время в этот раз назвать не могу. В НА устройства стали недоступны, скорее всего также была потеря доступа, контроллер перезагрузили и я восстановил работу. Сейчас такие же симптомы или проблема в другом?
diag_output_ACUW547_2024-11-02-13.41.01.zip (312,0 КБ)
Добрый день.
Судя по архиву - перезагружали несколько раз? А в какое время наблюдалась “потеря доступа”?
Даже не уверен что была потеря доступа, знаю что НА фактически перестал работать. Перезагружали контроллер примерно в 12:30, сбой произошел незадолго до этого. Хочется хотя бы выяснить, в какую сторону копать: НА, wb-engine или wiren board.
Перезапускался несколько раз.
-2 0e6e3119107149e7806c97a45e330ac2 Sat 2024-11-02 12:28:52 MSK—Sat 2024-11-02 12:37:09 MSK
-1 325d94524515436fb3f27f0b0572ceff Sat 2024-11-02 12:38:09 MSK—Sat 2024-11-02 12:54:54 MSK
0 c687d892da9740b4ab744130d4aba91d Sat 2024-11-02 12:56:58 MSK—Sat 2024-11-02 13:40:35 MSK
В логах уже нет, к сожалению данных.
Но можете посмотреть в Истории, если настроены все каналы - то состояние RAM, количество свободной.
Сбоя скорее всего не было, контроллер был перезагружен когда были проблемы с провайдером, и после перезагрузки возникла проблема с НА. Тут уже сам буду разбираться.
Если будут вопросы - пишите, постараюсь помочь.