Контроллер wb7 отключился, ищу источник проблемы

Самая “тяжелая” операция - публикация MQTT-топиков. Я бы посмотрел первым делом, кто там больше всех публикует - как правило наталкивает на мысль, куда дальше копать.

Полезная информация, также жду информацию по методам тестирования от @DmitryKur

Добрый день!

Вот что порекомендовали коллеги:

Если нужно просто нагрузить CPU, то поможет stress -c 4 (stress надо установить apt install’ом).

Память можно продиагностировать через memtester (его и используем).

Эти тесты не помогут вам получить полезную информацию о вышеописанной проблеме.
В вашей ситуации контроллер перезагружается не от перегрева, а из-за программного сбоя, вызванного при работе определенного ПО.

Из диагностического архива сложно еще какие-нибудь выводы сделать? Мы продолжаем тестировать, у нас около 40 инсталяций работают с нашим ПО, пока подобных проблем не встречали, дай Бог и не встретим. Может какое-то ПО криво встало, логов еще не хватает блин.

Укажите пожалуйста на конкретный программный сбой, если такая возможность имеется.

Не конктреное ПО, а просто по какой информации из диагностического архива вы сделали такой вывод

Добрый день!

По какой-то причине был повреждён корневой раздел файловой системы:

[ 0.000000] Kernel command line: console=ttyS0,115200 root=/dev/mmcblk0p2 rootwait ro

[ 3.544536] EXT4-fs (mmcblk0p2): INFO: recovery required on readonly filesystem
[ 3.551866] EXT4-fs (mmcblk0p2): write access will be enabled during recovery

Точную причину установить не удалось.
По моему опыту, установленное стороннее ПО нередко становится причиной перезагрузок и сбоев — тем более мы с вами выяснили, что на данном контроллере оно существенно нагружает процессор.

Лучший способ проверить работоспособность самого контроллера — исключить наиболее вероятные факторы и убрать все лишнее.

В данном случае я бы сделал резервную копию и выполнил бы сброс до заводских настроек по инструкциям:

После этого следует проверить работу контроллера с тем же количеством опрашиваемых устройств — сначала без установки стороннего ПО, а затем с ним.

Мы потестировали нагрузку на контроллер нашим ПО, ничего существенного не выявили.

Может я повредил как-то другими махинациями корневой раздел, сброшу настройки без проблем. После сброса как проверить корневой раздел или просто диаг архив пустого контроллера к вам?

Если вы уверены, что ваше ПО не повлияло на работу контроллера, то давайте диагностировать без него.
После сброса настройте опрос устройств и понаблюдайте. Если проблема проявится, вышлите диагархив.

Пока не могу ничего сказать про наше ПО. Надеемся с ним все хорошо. Если с ним будет проблема, то все наши клиенты прибегут к нам)

Я планирую вычистить контроллер, немного потестить, далее установить его к себе домой, буду смотреть. Если ситуация повторится, буду собирать больше логов

1 лайк

Добрый день!

Как проходит тестирование?

20-12-2025 01:50:29.165 task:rcu_sched state:I stack: 0 pid: 12 ppid: 2 flags:0x00000000

20-12-2025 01:50:29.165 rcu: RCU grace-period kthread stack dump:

20-12-2025 01:50:29.165 rcu: Unless rcu_sched kthread gets sufficient CPU time, OOM is now expected behavior.

20-12-2025 01:50:29.165 rcu: rcu_sched kthread starved for 2102 jiffies! g17894837 f0x0 RCU_GP_WAIT_FQS(5) ->state=0x402 ->cpu=1

20-12-2025 01:50:29.164 (t=2102 jiffies g=17894837 q=7344)

20-12-2025 01:50:29.164 rcu: 1-…!: (2100 ticks this GP) idle=5c2/0/0x3 softirq=9038624/9038624 fqs=0 

20-12-2025 01:50:29.163 rcu: INFO: rcu_sched self-detected stall on CPU

20-12-2025 01:49:15.968 [init.scope] apt-daily.service: Consumed 2.742s CPU time.

20-12-2025 01:49:15.967 [init.scope] Finished Daily apt download activities.

20-12-2025 01:49:15.965 [init.scope] apt-daily.service: Succeeded.

Извиняюсь, данные со смартфона. Контроллер чистый, после сброса. Никакого ПО нет, только wb-cloud.

Это какая ошибка, после нее была перезагрузка контроллер, аптайм обновился. На контроллере юпс с аккумуляторами на 14Ач, думаю контроллер без питания не оставался

Добрый день!

Вероятнее всего, мы имеем дело с аппаратной неисправностью.

Так как с момента продажи прошло от двух до трёх лет, то я готов предложить вам купон на скидку 30 % на приобретение новой модели взамен вышедшего из строя устройства:

WB7.4.3 - 1 шт.

Кроме того, при наличии аналогичных устройств из категории «восстановленных», вы также сможете воспользоваться этой скидкой.

Для получение скидки напишите, пожалуйста, письмо на info@wirenboard.com.

Доброе утро, у вас же в таких случаях обычно замена оборудования?) Объект только запустили, может отправить вам на ремонт?

Или может я так и не разобрался в вашей системе возвратов. Вы заменяете если наступает эррата?

Основной критерий для определения гарантийного случая — это срок с момента продажи. Гарантийный срок составляет 2 года.

Ваш случай не относится к известным неисправностям (в каждой версии устройства указан свой путь обхода). Ревизия 7.4.3 уже не производится, поэтому нет смысла отправлять устройство на исследование с целью улучшения качества продукта.

Вы можете отправить контроллер нам на ремонт, однако стоимость ремонта будет близка к цене нового устройства. В связи с этим оптимальным решением станет приобретение аналогичного устройства со скидкой.