Здравствуйте! Сегодня выходной день, поэтому сотрудники техподдержки ответят вам в рабочий день.
Пока что я, автоматический помощник, проанализировал ваш вопрос и постарался найти решение:
Судя по описанию, у вас Wiren Board 8.5.3c, периодически теряется соединение с Wiren Board Cloud и с Яндексом, при этом автоматическая перезагрузка по расписанию уже не всегда помогает. На других проектах WB7 с тем же ПО (testing) работают стабильно.
Так как у людей есть диагностические архивы, я опишу, что можно проверить сейчас самостоятельно, чтобы сузить причину и подготовить данные для инженеров.
1. Проверить базовую сетевую стабильность
-
Убедитесь, что сам контроллер не теряет интернет:
ping 8.8.8.8
ping wirenboard.com
ping mqtt.cloud.wirenboard.com
Запустите ping на длительное время (5–10 минут) и посмотрите, нет ли потерь пакетов / резких скачков задержки.
-
Если WB в локальной сети (Ethernet):
- Посмотрите, не моргает ли линк на порту коммутатора, нет ли ошибок / flapping порта.
- При возможности проверьте кабель/порт (подмените патч-корд, порт коммутатора).
-
Если используется LTE-модем:
2. Проверить сервисы облака / MQTT
На WB8.5 используется mosquitto и сервисы интеграции с облаком/Яндексом.
-
Статус системных сервисов:
systemctl status wb-mqtt-mosquitto.service
systemctl status wb-cloud-connection.service
systemctl status wb-mqtt-serial.service
Обратите внимание, не переходят ли они в состояние failed или не перезапускаются ли слишком часто.
-
Логи по MQTT и облаку:
journalctl -u wb-mqtt-mosquitto -n 200
journalctl -u wb-cloud-connection -n 200
Ищите:
- частые
connection lost, connection refused
- ошибки TLS, проблемы с DNS, переподключения к брокеру.
-
Если используете Yandex Smart Home через MQTT/облако, посмотрите, не совпадает ли момент «отвала» с переподключениями или ошибками в этих журналах.
3. Сравнение с WB7
Вы пишете, что WB7 на том же testing работают стабильно. Для инженеров будет важно:
-
Точная версия прошивки (из wb-diag или команда):
wb-release
— для WB7 и для WB8.5, чтобы понять, нет ли отличий в пакетах wb-cloud-*, wb-mqtt-mosquitto и др.
-
Сетевой профиль:
- одинаковый ли тип подключения (Ethernet vs LTE, тот же провайдер, схема NAT);
- есть ли на WB8 дополнительные сервисы (VPN, тяжелые скрипты, частые HTTP/MQTT-запросы), которых нет на WB7.
4. Проверить загрузку системы и память
Иногда облако перестаёт работать из-за нехватки ресурсов или зависания отдельных процессов.
-
Общая загрузка:
top
или
htop
Посмотрите, нет ли постоянного 100% по CPU или резкого роста нагрузок перед «отвалом».
-
Память и OOM:
dmesg | grep -i "out of memory"
Если ядро убивает процессы (в том числе MQTT/облако), это может объяснять поведение.
-
Пространство на диске:
df -h
Если раздел / почти заполнен, возможны проблемы с логами и работой сервисов.
5. Временное диагностическое логирование
Пока проблема повторяется 1–2 раза в день, можно попытаться «поймать» момент отваливания.
Создайте диагностический скрипт, который каждые N минут проверяет доступность облака и пишет расширенный лог, но не перезагружает контроллер:
#!/bin/bash
LOG=/var/log/cloud_diag.log
DATE=$(date '+%Y-%m-%d %H:%M:%S')
echo "[$DATE] --- check ---" >> "$LOG"
# Проверка сети
ping -c 3 8.8.8.8 >> "$LOG" 2>&1
ping -c 3 mqtt.cloud.wirenboard.com >> "$LOG" 2>&1
# Статус сервисов
systemctl status wb-mqtt-mosquitto.service >> "$LOG" 2>&1
systemctl status wb-cloud-connection.service >> "$LOG" 2>&1
# Последние строки журналов
journalctl -u wb-mqtt-mosquitto -n 50 >> "$LOG" 2>&1
journalctl -u wb-cloud-connection -n 50 >> "$LOG" 2>&1
echo "" >> "$LOG"
Положите, например, в /usr/local/bin/cloud_diag.sh, сделайте исполняемым:
chmod +x /usr/local/bin/cloud_diag.sh
И добавьте в cron раз в 10–15 минут. Потом, когда отвал произойдёт снова, этот лог очень поможет техподдержке.
6. Про перезагрузку по расписанию
Так как вы пишете, что раньше утренняя перезагрузка помогала, а сейчас уже нет:
- возможно, теперь «зависает» не только облако, но и сетевой стек (драйвер) или LTE-модем;
- либо после перезагрузки контроллер поднимается быстрее, чем сеть/модем, и соединение с облаком устанавливается с ошибкой (важно смотреть журналы
wb-cloud-connection сразу после старта).
Имеет смысл временно отключить авто-перезагрузку и попытаться поймать момент отвала «вживую», чтобы руками посмотреть состояние сервисов и сети.
Если сможете дополнительно приложить к теме вывод команд:
wb-release
ip a
ip route
systemctl status wb-mqtt-mosquitto wb-cloud-connection
journalctl -u wb-mqtt-mosquitto -n 200
journalctl -u wb-cloud-connection -n 200
это сильно ускорит разбор, когда инженеры выйдут.
Примечание: Я — искусственный интеллект, а не человек. В моих ответах могут быть неточности.