Периодически wb-mqtt-serial.service: Main process exited, code=killed, status=4/ILL

Есть еще одно наблюдение. При попытке в веб интерфейсе редактировать конфигурацию сериала обычно получаю вот такое:
image
И происходит перезагрузка службы (судя по логам.
Грешил на плохую связь, но очень редко все же получается открыть страничку конфигурации нормально. И если уж она открылась, то там можно все править и сохранять. И оно правится и сохраняется успешно.

а еще на больном контроллере постоянно проскакивает:


Чего не наблюдается на втором, который работает вполне нормально.
Вот на всякий случай диагностика здорового контроллера.
diag_output_AMI2YYK5_2024-01-09-16.15.23.zip (209,4 КБ)

Вот так теперь выглядит лог. С отключенным опросом mqtt-serial. Что-то с i2c похоже не так. За что он отвечает?


diag_output_AN4RTE7N_2024-01-09-16.50.58.zip (178,1 КБ)

Перезагрузка какой службы?
Редактирование конфигов - это wb-mqtt-confed Не должно влиять.
Но вот что интересно:
В его логе

Jan 08 20:02:16 wirenboard-AN4RTE7N wb-mqtt-confed[2078]: INFO: reloading file: /var/lib/wb-mqtt-confed/schemas/wb-mqtt-adc.schema.json

Ну и как следствие:

Jan 09 02:43:38 wirenboard-AN4RTE7N systemd[1]: wb-mqtt-adc.service: Main process exited, code=killed, status=4/ILL

То есть - кто-то реально редактировал ночью?
Или кто-то имеет доступ к контроллеру по mqtt, например?

Работа в WBIO модулями.
Не должно влиять на сервисы.

Ну и serial получает от confed 15 сигнал все ж.
Для проверки - остановите nginx. Ну и подпишитесь на /rpc:

mosquitto_sub -v -t /rpc/#

Нет ли туда записей?

Спрошу коллег, похоже моей компетенции мало.

Не очень понимаю как такое получается…


но перезагрузка mosquitto помогла.

приложен диагностический архив, доступен только сотрудникам поддержки
(187,0 КБ)

так же стоит nodered с нодой wirenboard. Он имеет доступ к mqtt. но явно с RPC я не работаю.

mqtt-serial и (или) mqtt-db

Далее. Подписался к RPC, туда явно лишнего ничего не приходит. Когда открываю в веб конфигурацию mqtt-serial летит оооочень длинное сообщение, в течении десятка секунд. Кусочек его прилагаю в файле. На сколько истории терминала хватило.
rpc.log (84,6 КБ)
Я так понимаю из-за размера сообщения и неспешности мобильного интернета имеем
image

Но по логам как-то это связано. При этом даже если отключить все WBIO модули в конфиге ошибка все равно появляется.

Похоже надо менять контроллер. У меня идеи кончились.

Оставлю тут проявления на почти чистом контроллере (получил его на руки) что бы было где посмотреть что надо ремонтировать.


Лог во время выполнения последней команды:

Контроллер буду вам отправлять на диагностику и ремонт.

Скриншоты с контроллера с заводскими настройками? Сброшенного актуальным образом?

только что перепрошитый с флешки последним образом с сайта вашего. (через файл факториресет)
добавлено только соедующее: (4 модуля)




Да, весьма похоже на аппаратную проблему. При этом к WBIO модулям что-то подключено? А если, кстати, исключить первый из них, wb-14?

Контроллер, который уехал на замену работал с этими модулями нормально. Это стенд мы сейчас смотрим. Мы махнули контроллеры местами и проблема переместилась вместе с контроллером. Просто удаленно мы не могли целиком сбросить и перепрошить контроллер. Теперь, когда получили его на руки - смогли.

Давайте мы бесплатно поменяем вам оборудование. Курьер привезёт новое оборудование и заберёт старое:

  • WB7 - 1 шт.

Для возврата напишите, пожалуйста, письмо на info@wirenboard.com.

В письме укажите:

  1. ссылку на эту тему,
  2. серийный номер устройства, AN4RTE7N,
  3. ваш действующий телефон, адрес доставки, ФИО получателя.

У нас коллеги приедут на мероприятие к вам и привезут устройство с пояснительной запиской…
Если вы им выдадите новый, то будет просто круто. И гонять курьеров не придеться.

Я не думаю что так получится без предварительно договоренности, это прямо противоречит обычной процедуре. Да, забрать в офисе можно - но письмо требуется отправить в любом случае.