Странное поведение WB8.
При подключении ethernet контроллер уходит в перезагрузку, корректно, с завершением процессов.
Если подключить ethernet во второй порт, контролер работает нормально 2 недели и опять ситуация повторилась. От перезагрузок спасает только отключение ethernet.
Ситуация наблюдается даже если все шины и MOD устройства не подключены.
Пробовал разобраться самостоятельно. Ставил обходы перезагрузки, в таком случае ребута не происходит, но и перестаёт работать драйвер поиска serial устройств(мистика), но да, новые устройства контроллер не находит, если убрать обход reboot и отключить сеть rs485 устройства находятся.
Использовался testing релиз, пробовал делать factory reset - не помогло, пробовал откат на stable - не помогло.
Если говорить грубо, то что-то как будто через команду ребутит. Но watchdog ничего не пишет в лог, и вроде я его тоже пробовал отключать.
Картину наблюдаю через debug подключение: logs.txt (213,1 КБ)
Перезагружает контроллер wb-cloud-agent из-за проблем с DNS:
Oct 04 20:51:21 wirenboard-ABOLSXMI wb-cloud-agent[2156145]: Error: failed to connect to wirenboard.cloud: DNS lookup failed
Oct 04 20:51:21 wirenboard-ABOLSXMI wb-cloud-agent[2156145]: Retrying in 10 seconds...
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: Stopping fast reverse proxy client for Wiren Board Cloud (wirenboard.cloud)...
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: wb-cloud-agent-frpc@wirenboard.cloud.service: Succeeded.
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: Stopped fast reverse proxy client for Wiren Board Cloud (wirenboard.cloud).
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: wb-cloud-agent@wirenboard.cloud.service: Main process exited, code=exited, status=1/FAILURE
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: wb-cloud-agent@wirenboard.cloud.service: Triggering OnFailure=wb-reboot-on-cloud-fail.service
Oct 04 20:51:22 wirenboard-ABOLSXMI systemd[1]: Starting Reboot system after Cloud Agent failure...
Oct 04 20:51:23 wirenboard-ABOLSXMI systemd[1]: Reached target Reboot.
Oct 04 20:51:23 wirenboard-ABOLSXMI systemd-shutdown[1]: Rebooting.
[EC] Reboot request, reset power.
Если физическое подключение к сети исправно, но проблема сохраняется — попробуйте прописать тот же DNS-сервер для проводного интерфейса, что используется при Wi-Fi-подключении.
Чтобы убедиться, что именно wb-cloud-agent вызывает перезагрузки, можно временно отключить его и понаблюдать за стабильностью работы контроллера.
Так как вы утверждаете, что после сброса к заводским настройкам проблема не ушла, то мы исключаем возможные перезагрузки в результате срабатывания скриптов.
Остается два варианта: получение команды перезагрузки извне или аппаратная проблема.
Однако из логов NetworkManager видно следующее предупреждение::
dispatcher: (11) /etc/NetworkManager/dispatcher.d/01-ifupdown failed (failed): Script '/etc/NetworkManager/dispatcher.d/01-ifupdown' exited with status 1.
01-ifupdown (2,2 КБ)
Приложил файл.
В том то и странно, месяца три этот контроллер отработал, и ни с того ни с сего начал ребутиться. Переткнул сеть в другой разъем, и две недели было всё хорошо. Потом и тут так же началось.
Роутер и сетью управляет и вифи раздает, интерфейсы в бридже, так что все параметры одинаковы для провода и воздуха.
А, да, письмо отправил. Пробовал еще вариант с watchdog, но это похоже не он.
Если коротко, то выключаю netplugd и NM-dispatcher, тогда ребуты прекращаются.
Но тут выползает тогда другая проблема, поиск устройств на RS485 перестаёт работать.
Добрый день.
Похоже, что в системе применены нестандартные настройки или выполняется пользовательский скрипт.
Еще раз уточню, вы уверены, что после сброса к заводским настройкам (от 26 сентября) не вносили изменения, после которых стала наблюдаться данная проблема?
Да, точно. С флешки делал перезаливку factory. Форматировал MicroSD. Пробовал и testing и stable релизы через factory. Но важно что около двух недель до начала перезагрузок, ничего не делал, свет не выключался. Т.е. не нашел ничего что могло внести какие-то изменения. Чертовщина какая-то. Может доступ дать?
Давайте еще раз все проверим. Потому что ситуация непонятная и есть вероятность того, что проблема не в контроллере.
Пригласите пожалуйста пользователя support@wirenboard.com в организацию на облачном сервисе.
Для этого в настройках организации нажмите кнопку “Пригласить”
Здравствуйте!
Контроллер уже вам выслали, ждите курьера.
Стандартный пароль к ssh не подходит.
Пожалуйста, сделайте стандартный или напишите мне личным сообщением. Нам он понадобится при диагностике.
Еще раз снял диагностический архив и обратил внимание на:
Oct 17 06:03:41 wirenboard-ABOLSXMI systemd[1]: systemd-journald.service: Failed with result 'watchdog'.
Oct 17 18:22:28 wirenboard-ABOLSXMI kernel: wbec-watchdog 5011000.spi:wbec@0:wbec-watchdog@0: stop watchdog, but actually EC watchdog is always running, timeout set to 300 seconds
Так как полный сброс не помог, то я склонен к версии аппаратного сбоя.
Старый отправил, вместе с MicroSD(на всякий случай).
Новый воткнул, 3 часа работает, полёт нормальный. Сейчас начну перекидывать скрипты автоматизаций.