Перезагрузка WB7 по температуре

Проблема, видимо, в программном WatchDog’е:
при превышении 80 градусов контроллер уходит в перезагрузку при запущенном сервисе WD. После выключения WD перезагрузки не происходят.

Скрины


Можно ли выставить порог сработки по температуре для watchdog’а?

WB7 bullseye, обновления все.

что именно вы делали?

это температура чего?

График какого канала приложен?

поажлуйста напишите серийный номер, аппаратную ревизию и приложите диагностический архив, который можно скачать из веб-интерфейса.

Остановка службы через
service watchdog stop

Приложен график канала /devices/hwmon/controls/CPU Temperature

Дополнительно настроил мониторинг SSH каждые 5 секунд, чтобы убедиться что точно не SSH демон вызывает проблему. Увеличил ретрай-таймаут вочдога до 1 минуты.

AG237NSQ
Партия 7.3.3
diag_output_AG237NSQ_2023-05-28-18.01.31.zip (231,0 КБ)

А как используется (настроен) модем?
И, кстати что воткнуто в USB разьемы контроллера? в том числе и Debug разъем?

Никак не настроен, только прошит на последнюю версию. Используется только как СМС-шлюз.
ЮСБ пустой, в том числе дебаг.

Фото на тапок


Так…
Четно говоря пока предположений нет…
С текущими настройками - перезапускается?

Ни перезапусков, ни провалов по SSH со старта темы.

Сводка

Я так понимаю, что температура - это следствие.

Скорее всего, да. То есть что-то загружало процеесор или, скорее текло - и oom начинал убивать процессы.

Сейчас произошла перезагрузка: память в норме, cpu тоже, SSH был все время доступен.
Отключаю вочдог.

Диагностический архив сделали после перезапуска? Это, пожалуй - лучший способ понять причину.

Диагностику, увы, не собирал. Пока перезагрузок не было.
Доведу аптайм до недели, если система будет стабильна, то смысла держать тему не будет.

Продолжаются перезагрузки. Куда копать я уже и не знаю.

Сводка

приложен диагностический архив, доступен только сотрудникам поддержки (157,3 КБ)

Добрый день, @acidvenom! Как следите за перезагрузками - что за ПО? Имею похожую проблему по рестарту контроллера, 7.2 только у меня.
Тоже хотел бы так мониторить. У Вас уведомления приходят после рестарта?
Система обновлена до последней версии? Что установлено?
@BrainRoot @EvgenyBoger Мне тоже попробовать отключить вотчдог как и в соседних темах?

Это Zabbix 6.4. На WB встает агент 6.4 для raspbery.
Уведомления приходят так, как замониторить.
Обновления все, из ПО не установлено ничего, кроме заббикса. Аппаратно только WBC-4G, WBE2-DI-DR-3, WB-MWAC, WB-UPS v.2.

Нет предположений, кроме как странного вывода

Jun 06 09:11:29 wirenboard-AG237NSQ kernel: option 3-1:1.2: device disconnected
Jun 06 09:11:29 wirenboard-AG237NSQ kernel: option1 ttyUSB1: GSM modem (1-port) converter now disconnected from ttyUSB1
Jun 06 09:11:29 wirenboard-AG237NSQ kernel: option 3-1:1.4: device disconnected
Jun 06 09:11:29 wirenboard-AG237NSQ kernel: option1 ttyUSB2: GSM modem (1-port) converter now disconnected from ttyUSB2
Jun 06 09:11:29 wirenboard-AG237NSQ kernel: option 3-1:1.5: device disconnected
Jun 06 09:11:29 wirenboard-AG237NSQ kernel: usb 3-1: new high-speed USB device number 4 using ehci-platform
Jun 06 09:11:34 wirenboard-AG237NSQ kernel: usb 3-1: device descriptor read/64, error -110
Jun 06 09:11:50 wirenboard-AG237NSQ kernel: usb 3-1: device descriptor read/64, error -110
Jun 06 09:11:50 wirenboard-AG237NSQ kernel: usb 3-1: new high-speed USB device number 5 using ehci-platform
Jun 06 09:11:55 wirenboard-AG237NSQ kernel: usb 3-1: device descriptor read/64, error -110
Jun 06 09:12:11 wirenboard-AG237NSQ kernel: usb 3-1: device descriptor read/64, error -110
Jun 06 09:12:11 wirenboard-AG237NSQ kernel: usb usb3-port1: attempt power cycle
Jun 06 09:12:11 wirenboard-AG237NSQ kernel: usb 3-1: new high-speed USB device number 6 using ehci-platform
Jun 06 09:12:22 wirenboard-AG237NSQ kernel: usb 3-1: device not accepting address 6, error -110
Jun 06 09:12:22 wirenboard-AG237NSQ kernel: usb 3-1: new high-speed USB device number 7 using ehci-platform
Jun 06 09:12:32 wirenboard-AG237NSQ kernel: usb 3-1: device not accepting address 7, error -110
Jun 06 09:12:32 wirenboard-AG237NSQ kernel: usb usb3-port1: unable to enumerate USB device

Так как ничего кроме модема нет - подозреваю аппаратное.
На аналогичном контроллере с модемом такое не воспроизводится.
Думаю - заменим.

Давайте мы бесплатно поменяем вам оборудование. Курьер привезёт новое оборудование и заберёт старое:

  • WB7 - 1 шт
  • WBС4G - 1 шт
    Для возврата напишите, пожалуйста, письмо на info@wirenboard.com.

В письме укажите:

  1. ссылку на эту тему,
  2. серийный номер устройства, AG237NSQ,
  3. ваш действующий телефон, адрес доставки, ФИО получателя.

Сейчас выключил модем, отпишусь по результатам.
Какое напряжение должно быть на выходе WB-UPS v.2?

В режиме работы от БП - напряжение БП. В режиме работы от АКБ - определяется положением переключателя на самом UPS.

А вот, наверное, и разгадка.
С самого начала он выдавал 11.5-11.6V. Выход с БП - ровно 12V

Сводка

А что к нему подключено, кроме контроллера?
Я к тому что - не превышена ли мощность?
Вообще колебания на 0,2 вольта - вполне себе норма.
Ну и если отключить блок питания UPS - работает?

При отключении от сети работает, показания стабильны.
Попробую исключить еще и UPS.