Перезагрузка WB6 при нагрузке CPU

Замечено, что при скачке нагрузки на CPU через некоторое время WB перезагружается.
При этом, если нагрузка нормализовалась, то перезагрузка все равно будет и ровно через минуту.
Грешу на watchdog.
Но конфигурацию (/etc/watchdog.conf) изменил соответствующим образом ( maxl-load-1=0 max-load-5=0 max-load-15 =0)
Ругани в логах на них нет, но и видимой реакции тоже.
Софт , который грузит процессор может быть разный. Для устойчивости использовал тестовый вечный цикл на C. Температура вроде не вызывающе-высокая ( попросту говоря чуть теплые ).
То , что на длительной нагрузке перегружается, можно понять, но почему перезагрузка после короткого “навала” и как это побороть ?

В дополнение.
watchdog следит только за syslogd и sshd.

А система обновлена?
Пришлите пожалуйста серийник контроллера.

Что будет, если выключить сервис watchog?

service watchdog stop

s/n AT3L5HRP

Что странно, то же самое - через минуту система перезагрузится.
То есть получается так, что перезагружает ядреный драйвер ?
Еще интересный момент, забыл сразу указать, перезагружается при установленной перемычке (https://wirenboard.com/wiki/index.php?title=Watchdog).
При этом после halt сама, как и полагается , не включается.

А прошивка? (в веб-интерфейсе, рядом с серйником)

WEB-интерфейс отрублен, поэтому я через “cat /etc/wb-fw-version”
202006011208

попробовал воспроизвести.
поставил
apt install stress-ng
Запускаю
stress-ng --cpu 2--io 2 --timeout 200s --metrics
Нагрузка cpu в районе 100%


Не перезагружается, не отключается.
Но! Температура cpu растет до 90+
У вас температура какая?

В районе 60 +/- градус.
По симптомам складывается впечатление такое, что нагрузка - вторична. Каким то образом получается так, что в аппаратный watchdog минуту не приходят тики и он перезагружает WB. Не понимаю пока, что так ему может препятствовать. А нагрузка просто увеличивает вероятность, занимая проц.
Примечание, моя “грелка” - однопоточкая в один процесс, то есть нет переключений. Не знаю как это влияет и влияет ли. Вроде не должно

Вроде не должно. А попробуйте stress-ng все ж. Надо сравнить.
Да, разработчики утверждают что перемычка отключает аппаратный watchdog.

Боюсь, что связь перезагрузок с нагрузкой была ложной. Со stress-ng не перезагружается.
Видимо исходный "тестовый вечный цикл на С " некорректен.

Однако в рабочих средах перезагрузки происходят от “раз в 10-20 минут” до “раз в 3 часа”. Системы не наблюдается.
При этом один из модулей связывается по WiFi, а второй по сотовой сети.
Перемычек нет нигде.
с остановленными watchdog и wd_keepalive WB, подключенный по GSM, перезагрузился в пределах 1,5 часов. В логах ничего примечательного нет

Так, GSM. Вообще - модемы сотовые славятся большими импульсами тока при работе. От чего контроллер питается? Что за БП? (напряжение, мощность)

отсюда не скажу - он далеко “в поле”. Блок питания на DIN-рейку. “такого же” рядом к сожалению, нет. ПО памяти 12V 2A.
И ,коль скоро речь про питание, в ту же тему, к нему по MODBUS подключено 5 промышленных датчиков разного толка. Схему подключения питания датчиков нам не дали.
То есть вы предполагаете, что перезагрузки - следствие перегрузки по питанию ?
Да, похоже. Многое объясняет.
Пытаюсь инициировать замену на 5А.
Пока не до конца понятно, почему перегружался второй, который на Wifi.

А какие-либо бесперебойники в контроллерах стоят? https://wirenboard.com/wiki/index.php/WBMZ2-BATTERY
например?

нет, внутри контроллера точно нет.

Предлагаю поменять контроллер для проверки.
Напишите (можно в ЛС мне) Ваш email, свяжемся по поводу замены.

Пока это невозможно, контроллер вернется в Москву в конце июля-начале августа.
Но я думаю, что в любом случае надо сначала проверить на БП 5А. Потому как “лабораторный” ( БП 12V 2,5А) держится уже почти сутки. Это после отключения watchdog и без провода. Посмотрим как продержится выходные с включенным сервисом watchdog

Ок, отпишитесь сюда по результатам.

Заменили блок питания на DR-4525, 24В, 2А, 48Вт.
Тем не менее модуль перезагрузился.