Периодически, контроллер(WB7) уходит в цикличную перезагрузку(каждые 2 минуты)

Не всегда, и не часто, контроллер начинает перезагружаться, я даже поставил оповещение в телегу, когда это происходит:

Wirenboard_has_rebooted_at_19-12-2024_21:39:44
Wirenboard_has_rebooted_at_19-12-2024_21:40:48
Wirenboard_has_rebooted_at_19-12-2024_21:41:49
Wirenboard_has_rebooted_at_19-12-2024_21:58:50
Wirenboard_has_rebooted_at_19-12-2024_22:01:16
Wirenboard_has_rebooted_at_19-12-2024_22:18:15
Wirenboard_has_rebooted_at_19-12-2024_22:20:41
Wirenboard_has_rebooted_at_19-12-2024_22:21:44
Wirenboard_has_rebooted_at_19-12-2024_22:22:48
Wirenboard_has_rebooted_at_19-12-2024_22:24:48
Wirenboard_has_rebooted_at_19-12-2024_22:41:48
Wirenboard_has_rebooted_at_19-12-2024_22:44:15
Wirenboard_has_rebooted_at_19-12-2024_23:01:12
Wirenboard_has_rebooted_at_19-12-2024_23:03:41
Wirenboard_has_rebooted_at_19-12-2024_23:04:46
Wirenboard_has_rebooted_at_19-12-2024_23:21:43
Wirenboard_has_rebooted_at_19-12-2024_23:24:11
Wirenboard_has_rebooted_at_19-12-2024_23:25:15
Wirenboard_has_rebooted_at_19-12-2024_23:42:19
Wirenboard_has_rebooted_at_19-12-2024_23:43:40

В логах особо ничего не заметил, кроме как происходит штатная перезагрузка.
Прошу помощи разобраться, такая карусель происходит 1 раз в пару недель, без видимых причин.

приложен диагностический архив, доступен только сотрудникам поддержки
(688,3 КБ)

Добрый день,

Судя по логам, возникли проблемы в настройках cron. Рекомендуется выполнить следующие действия:

  1. Проверьте содержимое файла /etc/crontab на наличие ошибочных записей. Если найдёте некорректные строки, исправьте их или временно закомментируйте.
  2. После внесения изменений проверьте, сохраняется ли проблема.

Обратите внимание на следующую ошибку:

Error: bad username; while reading /etc/crontab

Это указывает на возможные некорректные указания пользователей в строках cron.

Кроме того, для получения информации о том, кто инициировал последнюю перезагрузку системы, выполните команды:

last reboot
who -b

Эти данные помогут определить источник предыдущих изменений в системе.

1 Like

Крон проверил, в нем только одна запись, как раз та что отправляет в телегу сообщение о перезагрузке, я её добавил уже после того как она начал так “болеть”:


А список ребутов выглядит так

Строчку закоментил, понаблюдаю и дополню если продолжится.

Добрый день
Если повториться, то прошу собрать новый диагностический файл.

Уже могу дополнить, не помогло, ребуты продолжаются

приложен диагностический архив, доступен только сотрудникам поддержки
(605,2 КБ)
диагностические данные

Добрый день,

Рекомендую провести диагностику, следуя этой статье.

Кроме того, проверьте целостность памяти, так как ошибка:

markdown

Копировать код

[FAT-fs (mmcblk1p1)]: Invalid FSINFO signature: 0x00000000, 0x00000000 (sector = 1)

указывает на возможные проблемы с файловой системой.
После выполнения проверки предоставьте результаты для дальнейшего анализа.

Понял, попробую без флешки.
А поповоду статьи диагностики, речь про отключение watchdog? Программный или аппаратный?
Не может ли это быть глюком zigbee модуля в MOD, в первый раз когда такое было пару месяцев назад, я его отключил и это прошло. Сейчас опять включил, но неделю назад, а ребуты начались вчера вечером.

Добрый день,

В логах также наблюдаются проблемы с Zigbee, поэтому рекомендую проверить модуль.

Что касается статьи, необходимо убедиться, что перезагружает именно вочдог.

Вот ничего не делал и уже 3 часа контроллер работает без перезагрузок. ТОчно ли Watchdog надо отключать? Он же в лог пишет если проблема.
Или речь про аппаратный и он как раз из-за глючного зигби перезапускает?

Добрый день
Если проблема не сохраняется, то не требуется отключение.

Доброе утро.
5 дней всё работало хорошо, сегодня опять начались цикличесские перезагрузки(напомню, стенд работает в режиме пилота) минимум устройств, отсутствие скриптов. Просто смонтирован и крутится в холостую, посмотрите пожалуйста по логам, что же за причина.

приложен диагностический архив, доступен только сотрудникам поддержки
(599,0 КБ)

Добрый день!

Можете, пожалуйста, отключить все подключённые устройства и проверить, продолжит ли контроллер перезагружаться? Это поможет определить, связано ли поведение с подключённой периферией. Сообщите о результатах проверки.

К сожалению смогу только вечером, а тогда наверное уже не будет ребутов.
Можно ли программно отключить, или надо прям физически? и как быть с модулями расширения, их тоже вытаскивать?

Добрый день!

Нужно физически отключить все устройства от контроллера. Если перезагрузки прекратятся, подключайте устройства по одному, чтобы выявить то, которое вызывает проблему.

Сообщите о результате, чтобы мы могли продолжить диагностику.

приложен диагностический архив, доступен только сотрудникам поддержки
(589,0 КБ)
Сегодня утром было 14 перезагрузок

Спойлер

Wirenboard_has_rebooted_at_30-12-2024_06:36:22
Wirenboard_has_rebooted_at_30-12-2024_06:38:51
Wirenboard_has_rebooted_at_30-12-2024_06:55:57
Wirenboard_has_rebooted_at_30-12-2024_06:58:25
Wirenboard_has_rebooted_at_30-12-2024_06:59:49
Wirenboard_has_rebooted_at_30-12-2024_07:01:02
Wirenboard_has_rebooted_at_30-12-2024_07:18:02
Wirenboard_has_rebooted_at_30-12-2024_07:20:31
Wirenboard_has_rebooted_at_30-12-2024_07:37:28
Wirenboard_has_rebooted_at_30-12-2024_07:38:38
Wirenboard_has_rebooted_at_30-12-2024_07:40:41
Wirenboard_has_rebooted_at_30-12-2024_07:57:41
Wirenboard_has_rebooted_at_30-12-2024_08:00:09
Wirenboard_has_rebooted_at_30-12-2024_08:17:07

Сейчас к контроллеру подключены только модули WBE2R-R-ZIGBEE в MOD4. В MOD1 установлен WBE2-DI-DR-3, но к нему ничего не было подключено, их извлек сейчас физически, понаблюдаем
Если дело окажется в них, что делать?

Добрый день!

Рекомендую подключать модули по одному, чтобы выявить проблемный. После этого можно будет провести более предметное расследование.

Для более глубокого анализа вы также можете временно отключить watchdog, чтобы исключить его влияние на ситуацию.

Сейчас к контроллеру ничего не подключено, ни модули расширения ни по шинам, было 2 ребута.
diag_output_AVS3ZSVR_2025-01-03-01.48.02.zip (589,6 КБ)

коллеги, что же делать, его скоро на объект ставить, а он продолжает ребутиться

Добрый день!

Прошу выполнить обновление согласно данной инструкции.

Дополнительно выполните обновление системы через команды:

apt update && apt upgrade

Если поведение повторится, снимите новый диагностический файл