Самая “тяжелая” операция - публикация MQTT-топиков. Я бы посмотрел первым делом, кто там больше всех публикует - как правило наталкивает на мысль, куда дальше копать.
Полезная информация, также жду информацию по методам тестирования от @DmitryKur
Добрый день!
Вот что порекомендовали коллеги:
Если нужно просто нагрузить CPU, то поможет stress -c 4 (stress надо установить apt install’ом).
Память можно продиагностировать через memtester (его и используем).
Эти тесты не помогут вам получить полезную информацию о вышеописанной проблеме.
В вашей ситуации контроллер перезагружается не от перегрева, а из-за программного сбоя, вызванного при работе определенного ПО.
Из диагностического архива сложно еще какие-нибудь выводы сделать? Мы продолжаем тестировать, у нас около 40 инсталяций работают с нашим ПО, пока подобных проблем не встречали, дай Бог и не встретим. Может какое-то ПО криво встало, логов еще не хватает блин.
Укажите пожалуйста на конкретный программный сбой, если такая возможность имеется.
Не конктреное ПО, а просто по какой информации из диагностического архива вы сделали такой вывод
Добрый день!
По какой-то причине был повреждён корневой раздел файловой системы:
[ 0.000000] Kernel command line: console=ttyS0,115200 root=/dev/mmcblk0p2 rootwait ro
[ 3.544536] EXT4-fs (mmcblk0p2): INFO: recovery required on readonly filesystem
[ 3.551866] EXT4-fs (mmcblk0p2): write access will be enabled during recovery
Точную причину установить не удалось.
По моему опыту, установленное стороннее ПО нередко становится причиной перезагрузок и сбоев — тем более мы с вами выяснили, что на данном контроллере оно существенно нагружает процессор.
Лучший способ проверить работоспособность самого контроллера — исключить наиболее вероятные факторы и убрать все лишнее.
В данном случае я бы сделал резервную копию и выполнил бы сброс до заводских настроек по инструкциям:
После этого следует проверить работу контроллера с тем же количеством опрашиваемых устройств — сначала без установки стороннего ПО, а затем с ним.
Мы потестировали нагрузку на контроллер нашим ПО, ничего существенного не выявили.
Может я повредил как-то другими махинациями корневой раздел, сброшу настройки без проблем. После сброса как проверить корневой раздел или просто диаг архив пустого контроллера к вам?
Если вы уверены, что ваше ПО не повлияло на работу контроллера, то давайте диагностировать без него.
После сброса настройте опрос устройств и понаблюдайте. Если проблема проявится, вышлите диагархив.
Пока не могу ничего сказать про наше ПО. Надеемся с ним все хорошо. Если с ним будет проблема, то все наши клиенты прибегут к нам)
Я планирую вычистить контроллер, немного потестить, далее установить его к себе домой, буду смотреть. Если ситуация повторится, буду собирать больше логов
Добрый день!
Как проходит тестирование?
20-12-2025 01:50:29.165 task:rcu_sched state:I stack: 0 pid: 12 ppid: 2 flags:0x00000000
20-12-2025 01:50:29.165 rcu: RCU grace-period kthread stack dump:
20-12-2025 01:50:29.165 rcu: Unless rcu_sched kthread gets sufficient CPU time, OOM is now expected behavior.
20-12-2025 01:50:29.165 rcu: rcu_sched kthread starved for 2102 jiffies! g17894837 f0x0 RCU_GP_WAIT_FQS(5) ->state=0x402 ->cpu=1
20-12-2025 01:50:29.164 (t=2102 jiffies g=17894837 q=7344)
20-12-2025 01:50:29.164 rcu: 1-…!: (2100 ticks this GP) idle=5c2/0/0x3 softirq=9038624/9038624 fqs=0
20-12-2025 01:50:29.163 rcu: INFO: rcu_sched self-detected stall on CPU
20-12-2025 01:49:15.968 [init.scope] apt-daily.service: Consumed 2.742s CPU time.
20-12-2025 01:49:15.967 [init.scope] Finished Daily apt download activities.
20-12-2025 01:49:15.965 [init.scope] apt-daily.service: Succeeded.
Извиняюсь, данные со смартфона. Контроллер чистый, после сброса. Никакого ПО нет, только wb-cloud.
Это какая ошибка, после нее была перезагрузка контроллер, аптайм обновился. На контроллере юпс с аккумуляторами на 14Ач, думаю контроллер без питания не оставался
Добрый день!
Вероятнее всего, мы имеем дело с аппаратной неисправностью.
Так как с момента продажи прошло от двух до трёх лет, то я готов предложить вам купон на скидку 30 % на приобретение новой модели взамен вышедшего из строя устройства:
WB7.4.3 - 1 шт.
Кроме того, при наличии аналогичных устройств из категории «восстановленных», вы также сможете воспользоваться этой скидкой.
Для получение скидки напишите, пожалуйста, письмо на info@wirenboard.com.
Доброе утро, у вас же в таких случаях обычно замена оборудования?) Объект только запустили, может отправить вам на ремонт?
Или может я так и не разобрался в вашей системе возвратов. Вы заменяете если наступает эррата?
Основной критерий для определения гарантийного случая — это срок с момента продажи. Гарантийный срок составляет 2 года.
Ваш случай не относится к известным неисправностям (в каждой версии устройства указан свой путь обхода). Ревизия 7.4.3 уже не производится, поэтому нет смысла отправлять устройство на исследование с целью улучшения качества продукта.
Вы можете отправить контроллер нам на ремонт, однако стоимость ремонта будет близка к цене нового устройства. В связи с этим оптимальным решением станет приобретение аналогичного устройства со скидкой.
