Зависает WB7.3.2

Здравствуйте.
Второй раз за неделю зависает WB7, пропадает web удалённый доступ, через ssh не выводит команду ввода пароля - висит, между сообщениями проходит время от 20 до 40 мин .
Прошивка testing, все обновления установлены.
До этого, около года, всё работало нормально.
Новые правила и шаблоны не добавлялись.
Что посоветуете посмотреть для устранения проблемы ?




2023-04-26_194202

приложен диагностический архив, доступен только сотрудникам поддержки (170,1 КБ)

Вывод top

Добрый день.
Обратите внимание на

апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journald.service: Main process exited, code=killed, status=6/ABRT
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journald.service: Failed with result 'watchdog'.
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journald.service: Consumed 19min 24.764s CPU time.
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journald.service: Scheduled restart job, restart counter is at 1.
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: Stopping Flush Journal to Persistent Storage...
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journal-flush.service: Control process exited, code=exited, status=1/FAILURE
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: systemd-journal-flush.service: Failed with result 'exit-code'.
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: Stopped Flush Journal to Persistent Storage.
апр 26 10:10:56 wirenboard-AWRJQZPY systemd[1]: Stopped Journal Service.

Ну и рекомендую для проверки остановить (отключить) процесс “java”.

Т.е. нужно отключить СпрутХаб, что-бы проверить от чего зависает контроллер ?

Я не программист, напишите пожалуйста, как это сделать ?

Если java - это SH - да, отключить его.

Сегодня утром опять завис, пришлось ехать, перезагружать.
Перешёл на ветку stable. Понаблюдаю.
Не может же такого быть, что-бы промышленный контроллер не работал со СпрутХабом :frowning:

По поведению это очень похоже на то, что какой-то сервис съел всю память. Пока не вернётесь на тестинг мы не сможем это диагностировать. Думаю следующим шагом надо посмотреть график потребления оперативной памяти от времени, пряом в веб-интерфейсе в истории.

1 лайк

Потестирую testing на выходных. На stable контроллер не зависал.
Подскажите пожалуйста, как называется сервис использования оперативной памяти ?

Топик называется metrics/ram_used

1 лайк

В stable в журнале в веб интерфейсе ram_used нет, нужно перейти на testing, что-бы появилось ?

2207, 2304 - есть
Screenshot_20230511_152716

Да, точно есть, не там искал (в системном журнале).


Сохраняются похоже только данные после перезагрузки :frowning:

И какой из сервисов увеличивает потребление памяти?

  1. Я не увидел, что значительно увеличивается значение памяти.
  2. Как посмотреть какой из сервисов увеличивает потребление памяти ?

Вывести значения по потреблению в текстовый, например, файл после часа работы перезагруженного контроллера, через сутки, например процедуру и сравнить.

Ну если потребление не увеличивается, то и смотреть там не на что.