В общем, сегодня снова попробовал. Но перед этим параметр max write fail time s установил в 30 для всех устройств. Скачал файл настроек, проверил, всё по 30.
Отключил модули. Опрос счётчика электроэнергии шел раз в 9 секунд, в течение 20-25 минут всё норм. Включил устройства, snmp тоже ожил. Ну ок, для крайне редкого режима норм. Главное, что оно само всё оживает.
Однако обратил внимание, что раз в две минуты примерно стал перезапускаться сервис wb-mqtt-serial.
Посмотрел с включенным логом serial, посмотрел без него - одинаково не понятно.
Есть интерфейс MOD3, на котором нет устройств в конкретный момент времени - выключил полностью интерфейс. Поведение не изменилось.
Пробовал перезагружать движок правил и serial - эффекта нет. Снял архив.
приложен диагностический архив, доступен только сотрудникам поддержки
(605,8 КБ)
Далее пробовал так и вот что:
Отключил все правила в админке - эффект пропал. Включил правила, перезапустил сервис правил - перезапуска serial нет.
Перезапускаю сервис serial через изменение и сохранение настроек в админке - сервис запускается, и снова через каждые две минуты перезапускается сам. При этом правила в этот момент в dev не пишут. Активно считывают, да, но не пишут.
Снова иду в настройки, меняю max write fail time s на 600, сохраняю, не помогло, перезапуск стабильно каждые 2 минуты, получается не в этом дело.
Я не могу сказать точно, когда появилась проблема, возможно и до тестов оно вело себя так же какое-то время. Но одновременно с этим уверенно могу сказать, что ранее такого не было.
Сделать что-то особенное, или речь о диаг архиве?
Прикладываю свежий, только что снял, проблема стабильно проявляется. diag_output_AM75Z4F3_2025-11-27-13.56.35.zip (603,7 КБ)
Дебаг сериал отключен, в настройка проверил.
Nov 27 13:55:36 wirenboard-AM75Z4F3 systemd[1]: wb-mqtt-serial.service: Main process exited, code=killed, status=4/ILL
То есть явно остановлен снаружи. При этом записей от OOM в логах нет.
Судя по тому что период перезапуска сервиса всегда один и тот же - проверьте нет ли нигде в установленном ПО или скриптах его перезапуска.
В правилах я через shell ни к чему не обращаюсь, даже mqtt функции не использую, только dev. Какого-то стороннего софта тоже не ставил, node red, скад ничего такого нет, HA работает на отдельном компьютере.
Были установки мелкого софта, например htop, но не более, даже docker не стоит.
Как искать то?)
Кстати, период перезапуска разный. Он какое-то время был одинаковый, раз в две минуты, а сейчас зашёл, больше 6 минут, и не повторяется пока что (минут 7 уже).
В общем, минут 20 опять ничего не происходило, не перезапускалось. Я зашёл в настройки serial и поменял тот параметр на 30 у всех устройств. И сначала вроде как ничего не изменилось, но через 5-7 минут снова сервис перезапустился. А потом опять где-то в районе 2 минут стал перезапускается.
Далее в админке правил снял галочки со всех файлов правил, и отключил питание компьютера ХА - всё равно через две минуты примерно перезапуск. Ещё минуты две - перезапуск. Связано с параметром интерфейса или нет - вряд ли, но более стабильное проявление - шанс на поиск проблемы.
В общем, оно какой-то своей жизнью живёт. Контроллер единственный на удалёнке, сбросы до заводских делать не могу. Разве что некоторые тесты. Сигнал остановки всегда тот же kill.
Как ни странно, но я как-то скептически отношусь к повторяемости у вас, мне кажется надо думать как у меня диагностировать. Понять бы кто сигнал убийства посылает.
PS: сейчас, в 21.40 зашёл, и нет сбоев с 16 часов.
Поиск по логам дал такую картинку перезапуска:
Спойлер
27-11-2025 16:49:06.983
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:45:54.767
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:43:27.979
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:41:01.845
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:38:37.315
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:36:21.686
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:34:08.536
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:31:58.221
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:29:48.066
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:29:13.039
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:26:59.290
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:24:50.724
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:22:46.735
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:20:43.618
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:18:43.822
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:16:51.985
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:15:02.800
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:13:17.237
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:11:15.160
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:09:06.750
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:06:51.936
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:59:55.679
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:35:19.149
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:25:36.339
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:19:55.322
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:17:35.543
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:15:20.272
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:13:02.751
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:10:48.836
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:09:01.274
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:06:57.835
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:04:57.604
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:02:53.241
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 15:00:53.008
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:58:49.940
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:56:48.247
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:54:50.246
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:52:56.971
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:51:08.316
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:49:19.984
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:47:27.239
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:45:35.310
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:43:46.103
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:41:36.774
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:39:28.214
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:37:08.984
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:34:58.822
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:32:45.820
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:30:31.820
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:28:16.522
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:26:04.289
INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 14:24:13.504
INFO: [serial device] device modbus_io:183:4 is connected
Уже по классике зашёл в конфигуратор serial - поменял пару опций (не важно каких, я тут всё вернул назад), получил перезапуск сервиса и увидел лог:
Спойлер
27-11-2025 21:55:57.385 INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 21:53:22.613 INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 21:50:51.643 INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 21:48:29.382 INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 21:46:08.117 INFO: [serial device] device modbus_io:183:4 is connected <---- это мой ручной перезапуск
27-11-2025 16:49:06.983 INFO: [serial device] device modbus_io:183:4 is connected
27-11-2025 16:45:54.767 INFO: [serial device] device modbus_io:183:4 is connected
От чего оно зависит - фиг его знает. (Подключаюсь я через облако)