Повышение температуры

добрый день
вопрос - на 4 разных контроллерах, расположенных в 4 разных городах, одновременно увеличилась нагрузка и стала расти температура
на всех 4 контроллерах дополнительно установлен нодред (почти пустой там по сути только управление освещением), опенвпн и заббикс агент. 2 контроллера при этом находятся в нежилых домах

уже не в первый раз замечаю такое поведение, мне кажется это странным. какой-то софт WB обновляется сам по себе или из-за чего такое может происходить?

более наглядно за последние 2 дня

спустя ровно час всё восстановилось на обычные значения

upd
верхние 2 линии на графике - WB7
нижние - WB8

Добрый день!

Так как контроллеры WB работают на ОС Linux у нас есть возможность анализировать его работу и вести журналирование событий.
Любой из вышеперечисленных вами сервисов может создавать пиковую нагрузку.
Интересно было бы в данный период времени посмотреть какие процессы потребляли больше ресурсов, чем обычно.
Тогда вы сможете более точно определить причину повышение температуры:

  • Попробуйте отключить сервисы, которые вызывают подозрение.

  • Проверьте работу правил.

  • Внешние факторы, где находятся контроллеры, так же могут влиять на температуру.

  • Возможно так оказывает влияние модем.

Командой grep -i "install\|upgrade" /var/log/dpkg.log можно проверить даты последних обновлений.

в следующий раз посмотрю что за процессы

внешние факторы точно исключаю, так как контроллеры друг от друга на расстоянии от 100 до 1500 км, и что самое странное - повышение и понижение температуры началось в одно время

wb rules не настроен
контроллеры wb8 практически новые, не больше 2 месяцев
модемы есть только в wb7 (2 верхние линии)

никаких скриптов и обновлений не запускал. заббикс-агент тоже не запускал ничего, работает 24/7

тот же набор софта установлен на нескольких raspberry + еще и с home assistant и там не было в тот момент повышения температуры/изменения графиков. поэтому подумал что возможно внутренний софт что-то там делает

Теоретически стандартный софт из коробки не должен автоматически выполнять обновления.

Если в момент повышения температуры снять диагностические архивы с данных контроллеров и сравнить их с обычным состоянием, то сможем более детально увидеть причину.


когда температура сбросится пришлю архивы в “спокойном состоянии”

из дополнений:
контроллеры не перезагружались
впн не переподключался
заббикс не инициирует никакие дополнительные скрипты и проверки, стандартный linux by zabbix agent работает

ранее такого не было, контроллеры месяцами были подключены к впн и к заббиксу и было всё стабильно, никаких всплесков температуры. триггер на повышение температуры начал срабатывать на прошлой неделе. сервер (впн + заббикс) также не обновлялся. с контроллерами никто не работает.

отключаю сегодня впн и заббикс, буду мониторить вручную температуру, чтобы исключить проблему на стороне сервера

на фиолетовом контроллере нет нодреда и подключено всего 10 устройств по модбасу, но нагрузка растет пропорционально. на всех контроллерах в топе wb-rules и wb-mqtt-serial (на некоторых норде иногда, но чаще wb-rules и wb-mqtt-serial)

контроллер 1 (красная линия на скрине)

приложен диагностический архив, доступен только сотрудникам поддержки
(187,9 КБ)

root@wirenboard-ASOI7OWQ:~# top -b -n1 | head -20
dmesg | tail -30
journalctl -b --no-pager | grep -I temperature
top - 19:15:03 up 24 days,  9:46,  1 user,  load average: 4.02, 4.01, 3.78
Tasks: 186 total,   2 running, 184 sleeping,   0 stopped,   0 zombie
%Cpu(s): 20.0 us, 15.2 sy,  0.0 ni, 63.8 id,  0.0 wa,  0.0 hi,  1.0 si,  0.0 st
MiB Mem :   2012.9 total,     61.3 free,    776.9 used,   1174.8 buff/cache
MiB Swap:    256.0 total,    255.5 free,      0.5 used.   1177.1 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
 2593 root      20   0    9916   2588   2096 R  18.2   0.1   0:00.10 top
 1849 root      20   0  163788  13276   5172 S  13.6   0.6  10293:30 wb-mqtt-serial
 2042 root      20   0   69192  11912   4836 S   9.1   0.6   8313:49 main
27052 1000      20   0  239716 125020  33548 R   9.1   6.1   4781:49 node-red
 4431 root      20   0   64028   4316   3672 S   4.5   0.2 198:10.20 wb-mqtt-adc
    1 root      20   0   32408   7736   5468 S   0.0   0.4  24:10.89 systemd
    2 root      20   0       0      0      0 S   0.0   0.0   0:09.37 kthreadd
    3 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 rcu_gp
    4 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 rcu_par_gp
    8 root       0 -20       0      0      0 I   0.0   0.0   0:00.00 mm_percpu_wq
    9 root      20   0       0      0      0 S   0.0   0.0   0:00.00 rcu_tasks_rude_
   10 root      20   0       0      0      0 S   0.0   0.0   0:00.00 rcu_tasks_trace
   11 root      20   0       0      0      0 S   0.0   0.0  31:31.18 ksoftirqd/0
[1936956.274985] option 3-1:1.2: GSM modem (1-port) converter detected
[1936956.285263] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB0
[1936956.296064] option 3-1:1.4: GSM modem (1-port) converter detected
[1936956.303168] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB1
[1936956.311617] option 3-1:1.5: GSM modem (1-port) converter detected
[1936956.318947] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB2
[1936956.328131] option 3-1:1.3: GSM modem (1-port) converter detected
[1936956.335679] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB3
[2021022.737417] usb 3-1: USB disconnect, device number 95
[2021022.743056] rndis_host 3-1:1.0 usb0: unregister 'rndis_host' usb-1c1c000.usb-1, RNDIS device
[2021022.823471] option1 ttyUSB0: GSM modem (1-port) converter now disconnected from ttyUSB0
[2021022.832309] option 3-1:1.2: device disconnected
[2021022.841445] option1 ttyUSB1: GSM modem (1-port) converter now disconnected from ttyUSB1
[2021022.850377] option 3-1:1.4: device disconnected
[2021022.859775] option1 ttyUSB2: GSM modem (1-port) converter now disconnected from ttyUSB2
[2021022.868499] option 3-1:1.5: device disconnected
[2021022.882523] option1 ttyUSB3: GSM modem (1-port) converter now disconnected from ttyUSB3
[2021022.891233] option 3-1:1.3: device disconnected
[2021028.272471] usb 3-1: new high-speed USB device number 96 using ehci-platform
[2021028.558640] usb 3-1: USB disconnect, device number 96
[2021034.491979] usb 3-1: new high-speed USB device number 97 using ehci-platform
[2021034.697187] rndis_host 3-1:1.0 usb0: register 'rndis_host' at usb-1c1c000.usb-1, RNDIS device, 56:c3:93:9a:ad:7c
[2021034.710233] option 3-1:1.2: GSM modem (1-port) converter detected
[2021034.717234] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB0
[2021034.726135] option 3-1:1.4: GSM modem (1-port) converter detected
[2021034.733663] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB1
[2021034.753091] option 3-1:1.5: GSM modem (1-port) converter detected
[2021034.760967] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB2
[2021034.770152] option 3-1:1.3: GSM modem (1-port) converter detected
[2021034.777817] usb 3-1: GSM modem (1-port) converter now attached to ttyUSB3
^C
root@wirenboard-ASOI7OWQ:~#

контроллер 2 (зеленая линия на скрине)

приложен диагностический архив, доступен только сотрудникам поддержки
(359 КБ)


root@wirenboard-AAA4DILM:~# top -b -n1 | head -20
dmesg | tail -30
journalctl -b --no-pager | grep -I temperature
top - 19:13:57 up 19 days, 20:14,  2 users,  load average: 3.79, 2.74, 2.56
Tasks: 180 total,   4 running, 174 sleeping,   2 stopped,   0 zombie
%Cpu(s): 22.6 us, 35.7 sy,  5.2 ni, 33.9 id,  0.0 wa,  0.0 hi,  2.6 si,  0.0 st
MiB Mem :   2013.0 total,     91.4 free,    353.0 used,   1568.6 buff/cache
MiB Swap:    256.0 total,    255.7 free,      0.2 used.   1603.1 avail Mem 

  PID USER      PR  NI    VIRT    RES    SHR S  %CPU  %MEM     TIME+ COMMAND
14760 root      20   0  147464  14272   6424 S  34.8   0.7   5555:10 wb-mqtt-serial
 2067 root      20   0   69180  12368   5076 R  21.7   0.6   3091:40 main
16553 root      20   0    9916   2576   2116 R  21.7   0.1   0:00.11 top
  340 root      25   5  233736  88588  14992 R  17.4   4.3   3284:06 node-red
  329 avahi     20   0    5804   2788   2160 S   8.7   0.1 241:45.26 avahi-daemon
16559 root      20   0    2636   2056   1800 R   8.7   0.1   0:00.02 ensure-env-cach
  505 root      20   0   64464  12568   9928 S   4.3   0.6 808:03.69 NetworkManager
 2062 root      20   0  910920  17380   3608 S   4.3   0.8   7:41.23 wb-mqtt-confed
 2106 root      20   0   32720   9808   4500 S   4.3   0.5 487:18.66 wb-mqtt-mbgate
 5389 root      20   0       0      0      0 I   4.3   0.0   0:01.22 kworker/u8:6-events_unbound
28402 root      20   0       0      0      0 I   4.3   0.0   0:17.41 kworker/u8:1-events_unbound
    1 root      20   0   32328   7476   5252 S   0.0   0.4  16:21.23 systemd
    2 root      20   0       0      0      0 S   0.0   0.0   0:05.59 kthreadd
[1714428.757371] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714428.764502] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714430.976232] RTL871X: send eapol packet
[1714430.986156] RTL871X: send eapol packet
[1714430.998330] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
[1714439.157499] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714439.164546] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714441.398079] RTL871X: send eapol packet
[1714441.421837] RTL871X: send eapol packet
[1714441.431983] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
[1714449.557569] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714449.564731] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714451.814184] RTL871X: send eapol packet
[1714451.825936] RTL871X: send eapol packet
[1714451.836309] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
[1714459.957744] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714459.964974] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714462.209542] RTL871X: send eapol packet
[1714462.219256] RTL871X: send eapol packet
[1714462.235588] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
[1714470.357763] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714470.364928] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714472.584598] RTL871X: send eapol packet
[1714472.595704] RTL871X: send eapol packet
[1714472.608691] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
[1714480.760502] RTL871X: ap recv deauth reason code(3) sta:52:ff:20:08:22:af
[1714480.767909] RTL871X: clear key for addr:52:ff:20:08:22:af, camid:4
[1714483.097033] RTL871X: send eapol packet
[1714483.107183] RTL871X: send eapol packet
[1714483.120613] RTL871X: set pairwise key camid:4, addr:52:ff:20:08:22:af, kid:0, type:AES
^C
root@wirenboard-AAA4DILM:~#

а можно ли к выходам A1-A3 подключить такой вентилятор?
чтобы он включался когда температура например выше 85 градусов и был установлен прямо на корпусе контроллера

Выход питания +5Vout больше подходит, но если вентилятор заклинит, то может сгореть выход.

спасибо
добавление резистора поможет? чтобы перестраховаться от сгорания

Поможет, но скорость вентилятора в рабочем режиме немного будет ниже.

Еще пока изучаю информацию выше. Так же жду диагархив после спада нагрузки.

diag_output_AAA4DILM_2025-05-13-13.52.17.zip (364,1 КБ)
diag_output_ASOI7OWQ_2025-05-13-13.53.10.zip (195,6 КБ)

нагрузка спала