Netmon зависает

Здраствуйте!
Понадобилось установить sms обработчик, полез по ssh на контроллер, и написал apt-get install gammu-smsd
затем он ругнулся на пакеты, и я написал apt-get update. после он выполнял эту команду около 5 минут.
в веб морде оно пишет Disconnected

кстати говоря, если в браузере установлен какой нибудь прокси, то будет точно также писать Disconnected.

  PID USER      PR  NI  VIRT  RES  SHR S  %CPU %MEM    TIME+  COMMAND
2043 root      20   0 10436  560  484 R  85.3  1.1  40144:13 wb-homa-adc 
  211 root      20   0     0    0    0 R   4.6  0.0   3124:24 w1_bus_master1
26528 root      20   0  3160 2072 1672 R   3.9  4.2   0:00.94 top
    3 root      20   0     0    0    0 R   3.0  0.0   2417:58 ksoftirqd/0
 2071 root      20   0 19648  572  472 S   1.5  1.2   1130:24 wb-homa-gpio
 2186 root      20   0 10408  416  348 S   0.9  0.8 495:02.05 wb-mqtt-timesta

как видим из top"а вешает его wb-homa-adc но почему - не знаю…
также вот че пишет mosquito

root@wirenboard:~# mosquitto_sub -v -t /#
Error: Connection refused

написал

root@wirenboard:~# wb-homa-adc restart

и также все повисло, пока больше ничего не делал.
есть предположения что за фигня?

в общем так ничего и не произошло, написал reboot но реакции небыло.
прибил висящий процесс kill -s 9
ребутнул
аптайм был 40 с половиной дня.

скрипт из автозагрузки не сработал ваще, до этого 3 раза перезагружал, всё было хорошо.

  1. Есть предположение, что у вас что-то (mosquitto) отъело всю свободную память.
    apt-get требует очень много памяти, поэтому линукс пошёл прибивать процессы по очереди.

В такой ситуации будет правильным сохранить вывод ps aux, dmesg и содержимое /var/log/messages и отправить сюда для изучения

  1. [quote=“CRazs, post:2, topic:553”]
    скрипт из автозагрузки не сработал ваще, до этого 3 раза перезагружал, всё было хорошо
    [/quote]

к сожалению, ничего не понял

про автозагрузку - просто не сработал скрипт на запуск gsm и питание на сухие контакты.

он опять повис, но по ssh уже не смог залезть.
messages
http://pastebin.com/S9BZyC9K

dmesg
http://pastebin.com/P3GePtiz
ps aux - немогу дать. ибо залогинится не мог.

  • после очередного ребута, автозагрузка прошла нормально. gsm сообщение выслал.

продолжу, после очередного зависания, (перестали уходить смс), было решено поковырятся и обновить его…
сделал apt-get update затем homeui, дальше открылась вэб морда, и работать она стала гораздо быстрее.
открыл конфиг, а он мне ошибку выдал mqtt … eror, ну и нашел в теме ответ про wb-rules
написал apt get install wb-rules и повис, ждал я в течении минут 20, затем решил глянуть что в веб морде, а она молчит. на пинги отвечает, лезу вторым окном, а он мне конекшн рефузед, потом в очередной раз пробился, но пароль он уже не принял и отвалился.
пошел в серверную снял его из стойки, пртащил к себе, зацепил юарт, а там его watchdog ребутит походу…

[ ok ] Starting MQTT Driver for ADC: wb-homa-adc.
[ ok ] Starting MQTT Driver for GPIO-controlled switches: wb-homa-gpio.
[FAIL] Can't start modbus driver: configuration file /etc/wb-homa-modbus.conf not found ... failed!
[ ok ] Starting board-specific initscript: wb-init.
[ ok ] Starting MQTT driver for SHT1x temperature and humidity sensor: wb-mqtt-sht1x.
[ ok ] Starting Firmware update monitor: wb-watch-update.
Starting watchdog keepalive daemon: wd_keepalive.
Starting httpd daemon: webfsdbind: Address already in use
.
[ ok ] zabbix_agentd starting...done.
[....] Stopping watchdog keepalive daemon...[  128.930000] w1_master_driver w1_bus_master1: Family 0 for 00.400000000000.46 is not registered.
. ok
[ ok ] Starting watchdog daemon....

Debian GNU/Linux 7 wirenboard ttyAMA0

wirenboard login: 

[  142.690000] watchdog watchdog1: watchdog did not stop!
[  148.100000] EXT4-fs (mmcblk0p2): re-mounted. Opts: (null)
[  148.150000] smsc95xx 1-1.1:1.0 eth0: hardware isn't capable of remote wakeup
[  148.170000] reboot: Restarting system
HTLCmxs_power_init(): mxs_power_init

P.S. я поставил туда apache, навесил сверху php
еще не работал крон. поставил ему каждый день посылать данные со счетчика, POST запрос curl"ом. но не работало. запихал в крон каждую минуту пихать данные, но ничего не изменилось.
файл создал прямо в etc/cron.d, синтаксис по вики.

подумываю обновить систему целиком, но не могу никак найти его.

а, и еще, попробовал service watchdog stop но сразу получил ту же надпись

] watchdog watchdog1: watchdog did not stop!

честно говоря я так и не понял как заливать туда образ… но да и фиг с ним пока что…

у меня было всего 3 секунды после полной загрузки. я сделал echo apt-get update и upgare в init.d/local
но проблему это не решило, хотя он полностью обновился, копал копал, и выкопал то что вываливается он по ngnix, а у меня поставлен апач, который занимал 80 порт и посылал ngnix нахрен, после чего watchdog посылал нахрен меня и уходил в ребут…
закомментил строку с nginx.pid и всё, проблема с ребутом ушла. в вебморде все появилось кроме configs

ошибки по w1_master_driver так и валятся, но что то мне подсказывает что это тоже проблема с конфигом…

[  304.770000] w1_master_driver w1_bus_master1: Family 0 for 00.a00000000000.af is not registered.
[  340.410000] w1_master_driver w1_bus_master1: Family 0 for 00.600000000000.65 is not registered.
[  378.050000] w1_master_driver w1_bus_master1: Family 0 for 00.e00000000000.e9 is not registered.
[  438.970000] w1_master_driver w1_bus_master1: Family 0 for 00.100000000000.9d is not registered.
[  475.640000] w1_master_driver w1_bus_master1: Family 0 for 00.900000000000.11 is not registered.
[  546.500000] w1_master_driver w1_bus_master1: Family 0 for 00.500000000000.db is not registered.

P.S. самый нормальный софт который видит и редактирует EXT4 разделы из под винды, это paragon extfs

как-то так Создание microSD-карты с образом — Wiren Board

решилось после apt-get install wb-mqtt-confed


причина нашлась, появляются какие то one-wire устройства и исчезают…

root@wirenboard:/sys/bus/w1/devices# ls -alR
.:
total 0
drwxr-xr-x 2 root root 0 Aug 16 07:49 .
drwxr-xr-x 4 root root 0 Aug 16 07:48 ..
lrwxrwxrwx 1 root root 0 Aug 16 07:49 00-582000000000 -> ../../../devices/w1_bus_master1/00-582000000000
lrwxrwxrwx 1 root root 0 Aug 16 07:48 00-982000000000 -> ../../../devices/w1_bus_master1/00-982000000000
lrwxrwxrwx 1 root root 0 Aug 16 07:50 00-d82000000000 -> ../../../devices/w1_bus_master1/00-d82000000000
lrwxrwxrwx 1 root root 0 Aug 16 07:48 w1_bus_master1 -> ../../../devices/w1_bus_master1

через 15 секунд ошибка по другому устройству.

[51403.770000] w1_master_driver w1_bus_master1: Family 0 for 00.382000000000.bd is not registered.`

дальше сразу ls


root@wirenboard:/sys/bus/w1/devices# ls -alR
.
total 0
drwxr-xr-x 2 root root 0 Aug 16 07:51 .
drwxr-xr-x 4 root root 0 Aug 16 07:48 ..
lrwxrwxrwx 1 root root 0 Aug 16 07:51 00-382000000000 -> ../../../devices/w1_bus_master1/00-382000000000
lrwxrwxrwx 1 root root 0 Aug 16 07:50 00-d82000000000 -> ../../../devices/w1_bus_master1/00-d82000000000
lrwxrwxrwx 1 root root 0 Aug 16 07:48 w1_bus_master1 -> ../../../devices/w1_bus_master1
root@wirenboard:/sys/bus/w1/devices#

из чего я делаю вывод что идут какие то наводки на порт, и он видит хлам…
как бы мне это обезвредить?

Господа, если я просто воткну любой датчик onewire, эта фигня перестанет происходить??? честно говоря за 3 дня она увешивает контроллер на 40 процентов. и это дико бесит. может её просто бросить на GND? или через сопротивление?

далее вопрос номер 2, как обновить wb-gsm ибо после апдейта, и мнипуляциями с gsm, вылетает вот это

[code][ ok ] Stopping network daemon:: mosquitto.
[…] Stopping update local time using GSM modem integrated RTC: wb-gsm-rtc/usr/lib/wb-gsm-common.sh: line 95: [: =: unary operator expected
/usr/lib/wb-gsm-common.sh: line 260: [: =: unary operator expected
/usr/lib/wb-gsm-common.sh: line 95: [: =: unary operator expected
/usr/lib/wb-gsm-common.sh: line 260: [: =: unary operator expected
connection test error!
/usr/lib/wb-gsm-common.sh: line 219: [: =: unary operator expected
Try to switch off GSM modem
Send power down command
/usr/lib/wb-gsm-common.sh: line 193: [: =: unary operator expected
physically switching off GSM modem using POWER FET
switching on GSM modem using POWER FET
toggle GSM modem state using PWRKEY
/usr/lib/wb-gsm-common.sh: line 235: [: =: unary operator expected
[351348.150000] EXT4-fs (mmcblk0p2): re-mounted. Opts: (null)
chat: Aug 19 19:02:24 OK

[/code]

на всякий случай…
по w1 [code]
root@wirenboard:/etc/network# apt-get install wb-homa-w1
Reading package lists… Done
Building dependency tree
Reading state information… Done
wb-homa-w1 is already the newest version.
[ 1783.010000] w1_master_driver w1_bus_master1: Family 0 for 00.240000000000.42 is not registered.
0 upgraded, 0 newly installed, 0 to remove and 1 not upgraded.

[/code]
и по gsm

Package: cmux
Status: install ok installed
Priority: optional
Section: misc
Installed-Size: 48
Maintainer: Evgeny Boger <boger@contactless.ru>
Architecture: armel
Version: 1.2
Depends: libc6 (>= 2.7)
Description: Enables GSM 0710 multiplex using n_gsm line dicipline
root@wirenboard:/etc/network# apt-get install cmux
Reading package lists... Done
Building dependency tree
Reading state information... Done
cmux is already the newest version.
0 upgraded, 0 newly installed, 0 to remove and 1 not upgraded.

ну и что бы совсем добить… сравнил свой файл и файл с git

---------------------------
Results :
---------------------------
Files Match
---------------------------
ОК   
---------------------------

также замена БП на более мощный от докстанции (4А), не изменила ситуацию по onewire

По 1-wire: попробуйте пожалуйста замкнуть вход на GND или +3.3В.

устал я от всего и запилил новую прошивку… почему то мак адрес сменился, был прибит гвоздями в домене…
однако проблемы это не решило. далее по W1
на GND никакой реакции, а вот на 3.3, все устройства исчезли и ошибки перестали валится. ура!

по GSM, поглядел скрипты и судя по всему переменная сравнивается с “ни с чем”. и ругается на “WB_GSM_HAS_STATUS_PIN”.

везде где стоят проверки типа

 if [ ${WB_GSM_HAS_STATUS_PIN} = "1" ]; then
[/code] нужно заменить на[code]
 if [[ ${WB_GSM_HAS_STATUS_PIN} = "1" ]]; then

тогда ошибки не валятся, при этом стартанулось и смс уходят.

после смены прошивки, заббикс так и не стал нормально окликатся по старому конфигу, везде zbx_notsupported
начал проверять и действительно ключ -k теперь не завершается совсем. раньше оно работало только на 1 сек.
Однако заработал ключ -C, что не может не радовать. так что практически все мои костыли которые были раньше больше не нужны. всё заработало из “коробки”. если конешно это можно так назвать))

и завершить эту тему наверно можно этим постом