Произвольная перезагрузка контроллера

Добрый день, сегодня опять произвольная перезагрузка:

Sep 10 04:45:15 wirenboard-AFNMUY2G user.notice serial: ModbusRTU::ReadRegisterRange(): failed to read 6 coil(s) @ 0 of device modbus:74: Serial protocol error: request timed out
Sep 10 04:46:01 wirenboard-AFNMUY2G authpriv.info CRON[17324]: pam_unix(cron:session): session opened for user root by (uid=0)
Sep 10 04:46:01 wirenboard-AFNMUY2G cron.info CRON[17328]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
Sep 10 04:46:05 wirenboard-AFNMUY2G authpriv.info CRON[17324]: pam_unix(cron:session): session closed for user root
Sep 10 04:46:59 wirenboard-AFNMUY2G user.notice wb-mqtt-db[605]: 2020-09-10 04:46:59.361 NOTICE: Bulk processing took 109ms
Sep 10 04:47:02 wirenboard-AFNMUY2G authpriv.info CRON[17395]: pam_unix(cron:session): session opened for user root by (uid=0)
Sep 10 04:47:02 wirenboard-AFNMUY2G cron.info CRON[17399]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
Sep 10 04:47:06 wirenboard-AFNMUY2G authpriv.info CRON[17395]: pam_unix(cron:session): session closed for user root
Sep 10 04:50:09 wirenboard-AFNMUY2G syslog.info syslogd started: BusyBox v1.22.1
Sep 10 04:50:09 wirenboard-AFNMUY2G daemon.err ntpdate[435]: Can’t find host 0.debian.pool.ntp.org: Name or service not known (-2)
Sep 10 04:50:09 wirenboard-AFNMUY2G daemon.err ntpdate[435]: Can’t find host 1.debian.pool.ntp.org: Name or service not known (-2)
Sep 10 04:50:09 wirenboard-AFNMUY2G daemon.err ntpdate[435]: Can’t find host 2.debian.pool.ntp.org: Name or service not known (-2)
Sep 10 04:50:10 wirenboard-AFNMUY2G daemon.err ntpdate[435]: Can’t find host 3.debian.pool.ntp.org: Name or service not known (-2)
Sep 10 04:50:10 wirenboard-AFNMUY2G daemon.err ntpdate[435]: no servers can be used, exiting
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: klogd started: BusyBox v1.22.1 (Debian 1:1.22.0-19+b3)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Booting Linux on physical CPU 0x0
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] Linux version 4.9.22-wb6 (root@wbdevenv) (gcc version 6.3.0 20170516 (Debian 6.3.0-18) ) #2 SMP Tue Sep 1 06:27:21 UTC 2020
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] CPU: ARMv7 Processor [410fc075] revision 5 (ARMv7), cr=10c5387d
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] CPU: div instructions available: patching division code
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] CPU: PIPT / VIPT nonaliasing data cache, VIPT aliasing instruction cache
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] OF: fdt:Machine model: Wiren Board rev. 6.5 (i.MX6UL/ULL)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] cma: Reserved 16 MiB at 0x9f000000
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Memory policy: Data cache writealloc
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] On node 0 totalpages: 131072
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] free_area_init_node: node 0, pgdat c0b4d880, node_mem_map deab3000
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] Normal zone: 1152 pages used for memmap
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] Normal zone: 0 pages reserved
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] Normal zone: 131072 pages, LIFO batch:31
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] percpu: Embedded 14 pages/cpu @defc8000 s25996 r8192 d23156 u57344
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] pcpu-alloc: s25996 r8192 d23156 u57344 alloc=14*4096
Sep 10 04:50:12 wirenboard-AFNMUY2G user.debug kernel: [ 0.000000] pcpu-alloc: [0] 0
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Built 1 zonelists in Zone order, mobility grouping on. Total pages: 129920
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] Kernel command line: console=ttymxc0,115200 root=/dev/mmcblk0p3 rootwait ro
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] PID hash table entries: 2048 (order: 1, 8192 bytes)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Dentry cache hash table entries: 65536 (order: 6, 262144 bytes)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Inode-cache hash table entries: 32768 (order: 5, 131072 bytes)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Memory: 491720K/524288K available (6144K kernel code, 312K rwdata, 2276K rodata, 1024K init, 342K bss, 16184K reserved, 16384K cma-reserved)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] Virtual kernel memory layout:
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] vector : 0xffff0000 - 0xffff1000 ( 4 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] fixmap : 0xffc00000 - 0xfff00000 (3072 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] vmalloc : 0xe0800000 - 0xff800000 ( 496 MB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] lowmem : 0xc0000000 - 0xe0000000 ( 512 MB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] modules : 0xbf000000 - 0xc0000000 ( 16 MB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] .text : 0xc0008000 - 0xc0700000 (7136 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] .init : 0xc0a00000 - 0xc0b00000 (1024 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] .data : 0xc0b00000 - 0xc0b4e140 ( 313 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.notice kernel: [ 0.000000] .bss : 0xc0b50000 - 0xc0ba5aec ( 343 kB)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] SLUB: HWalign=64, Order=0-3, MinObjects=0, CPUs=1, Nodes=1
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Hierarchical RCU implementation.
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Build-time adjustment of leaf fanout to 32.
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] RCU restricting CPUs from NR_CPUS=4 to nr_cpu_ids=1.
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] RCU: Adjusting geometry for rcu_fanout_leaf=32, nr_cpu_ids=1
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] NR_IRQS:16 nr_irqs:16 16
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000000] Switching to timer-based delay loop, resolution 41ns
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000016] sched_clock: 32 bits at 24MHz, resolution 41ns, wraps every 89478484971ns
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.000054] clocksource: mxc_timer1: mask: 0xffffffff max_cycles: 0xffffffff, max_idle_ns: 79635851949 ns
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.002552] Console: colour dummy device 80x30
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.002592] Calibrating delay loop (skipped), value calculated using timer frequency… 48.00 BogoMIPS (lpj=240000)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.002624] pid_max: default: 32768 minimum: 301
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.002890] Mount-cache hash table entries: 1024 (order: 0, 4096 bytes)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.002915] Mountpoint-cache hash table entries: 1024 (order: 0, 4096 bytes)
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.004400] CPU: Testing write buffer coherency: ok
Sep 10 04:50:12 wirenboard-AFNMUY2G user.err kernel: [ 0.004970] /cpus/cpu@0 missing clock-frequency property
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.005010] CPU0: thread -1, cpu 0, socket 0, mpidr 80000000
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.005067] Setting up static identity map for 0x80100000 - 0x80100070
Sep 10 04:50:12 wirenboard-AFNMUY2G user.info kernel: [ 0.007710] Brought up 1 CPUs

Добрый день!
А можете выложить больше лога перед перезагрузкой?
Сколько он проработал перед перезагрузкой?

Добрый день, менял кое что по подключению вечером, поэтому выключал и проработал часов 8 до перезагрузки.
До этого работал 16 дней без перезагрузок
В логах все очень однотипно, ошибки с опросом отдельных устройств и все

Предлагаю поменять контроллер на заведомо рабочий. Я не вижу ничего подозрительного в логах.

Вынес в отдельную тему чтобы названию соответствовала.

Добрый день, не очень понял, как это реализовать на практике - текущий то активно используется

Вот целый лог за 2 суток
Перезагрузка теперь раз в 2-3 дня
messages.txt (6.3 КБ) messages2.txt (867.1 КБ) messages1.txt (954.5 КБ)

Понятно.
Нам потребуется от вас:
Схема подключений оборудования с фото
То есть общий план, фото подключений соединения (клемм) каждого устройства.

Планируем поменять у вас все оборудование WB следующим образом: К вам приедет курьер, отдаст новое и заберет ваше. Согласуем время когда вам удобно.
Соответственно - сделайте бэкап всех настроек но ничего с контроллера не удаляйте и не меняйте.
Наша цель - воспроизвести вашу инсталляцию и понять причину перезагрузок.

Добрый день, также заметил вот что - на контроллере в некий момент в одной из папок пропала часть файлов. Руками их никто не стирал. Либо некое ПО (ваше или SprutHub), либо - там что-то с флешем (что более вероятно)

Сейчас согласуем технологию по доставке - забору, напишу. Мы протестируем и флешку тоже, благодарю.

Контроллер уже у вас должен быть

Новый контроллер уже 14 дней работает стабильно

У старого кстати gnd не была объединена, а питание (12в) шло от блока питания (одной его ветки) на каждое устройство через клеммы

Да, ваш тоже работает стабильно и не перезапускается - что ни делаю.

Думаю надо к боковым модулям присмотреться - пару раз они отваливались наглухо и переставали отвечать. Даже полный рестарт не помогал, только их физическое отсоединение. При прикручивании проводов в 15 и 16 выходы был эффект отключения также в момент макс усилия на завинчивание.

Фазы, кстати, разные на них подавались.

Видимо перезагрузился, более не числится вошедшим в sprut.hub

Посмотрите uptime.

Мой новый нормально, 21 сутки почти
Тот, что я вернул вышел

А, это неудивительно, мы его тестируем.

Добрый день, в воскресенье словил перезагрузку на новом контроллере.
При этом он затер файл wb-hardware.conf и оказался удаленным zigbee модуль из слота MOD3

Кусочек лога:

Jan 23 23:39:01 wirenboard-A77OOSWW authpriv.info CRON[12618]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 23 23:39:01 wirenboard-A77OOSWW cron.info CRON[12622]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
Jan 23 23:39:05 wirenboard-A77OOSWW authpriv.info CRON[12618]: pam_unix(cron:session): session closed for user root
Jan 23 23:39:17 wirenboard-A77OOSWW user.notice wb-mqtt-db[547]: 2021-01-23 23:39:17.079 NOTICE: Bulk processing took 59ms
Jan 23 23:40:02 wirenboard-A77OOSWW authpriv.info CRON[12639]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 23 23:40:02 wirenboard-A77OOSWW authpriv.info CRON[12638]: pam_unix(cron:session): session opened for user root by (uid=0)
Jan 23 23:40:02 wirenboard-A77OOSWW cron.info CRON[12646]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_wbrules.sh 2>&1 | logger -t wb-daemon-watchdogs)
Jan 23 23:40:02 wirenboard-A77OOSWW cron.info CRON[12647]: (root) CMD (/usr/share/wb-daemon-watchdogs/check_confed.sh 2>&1 | logger -t wb-daemon-watchdogs)
Jan 23 23:40:02 wirenboard-A77OOSWW user.notice wb-daemon-watchdogs: wb-rules check failed, reload wb-rules
Jan 23 23:40:04 wirenboard-A77OOSWW authpriv.info CRON[12639]: pam_unix(cron:session): session closed for user root
Jan 23 23:40:04 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: driver is created
Jan 23 23:40:04 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [wbgo_mqtt] rules-wirenboard-A77OOSWW-12684: MQTT connection established
Jan 23 23:40:04 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: driver loop is started
Jan 23 23:40:04 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: wait for driver to become ready
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: driver is ready
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [rule info] using file /var/lib/wirenboard/wbrules-persistent.db for persistent DB
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [wbgo_mqtt] wb-rules-engine-wirenboard-A77OOSWW-12684: MQTT connection established
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [engine] Starting main loop
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: the engine is ready
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [engine] Starting sync loop
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/buzzer.js is NOT under source root /etc/wb-rules
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/hwmon.js is NOT under source root /etc/wb-rules
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/network.js is NOT under source root /etc/wb-rules
Jan 23 23:40:05 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/power_status.js is NOT under source root /etc/wb-rules
Jan 23 23:40:06 wirenboard-A77OOSWW daemon.info wb-rules[12684]: ERROR: command ‘/bin/sh -c echo 0 > /sys/class/pwm/pwmchip0/export’ failed with exit status 1
Jan 23 23:40:06 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/system.js is NOT under source root /etc/wb-rules
Jan 23 23:40:06 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/wb-mqtt-dac.js is NOT under source root /etc/wb-rules
Jan 23 23:40:06 wirenboard-A77OOSWW authpriv.info CRON[12638]: pam_unix(cron:session): session closed for user root
Jan 23 23:40:06 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules-system/rules/wbmz-battery.js is NOT under source root /etc/wb-rules
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: /usr/share/wb-rules/load_alarms.js is NOT under source root /etc/wb-rules
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: all rule files are loaded
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.notice watchdog[3250]: stopping daemon (5.15)
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.info bluetoothd[7727]: Terminating
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.info bluetoothd[7727]: Stopping SDP server
Jan 23 23:40:07 wirenboard-A77OOSWW daemon.info bluetoothd[7727]: Exit
Jan 23 23:40:08 wirenboard-A77OOSWW auth.info sshd[2583]: Received signal 15; terminating.
Jan 23 23:40:08 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/Vin’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:08 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/A4’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:09 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/A1’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:09 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/5Vout’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:09 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/A2’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:09 wirenboard-A77OOSWW daemon.info wb-rules[12684]: WARNING: [driver] Failed to accept ‘/meta/order’ on control ‘wb-adc/A3’: strconv.Atoi: parsing “”: invalid syntax, ignored
Jan 23 23:40:10 wirenboard-A77OOSWW user.notice wb-mqtt-db[547]: 2021-01-23 23:40:10.405 NOTICE: Exit signal received, stopping
Jan 23 23:40:10 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [engine] Stopping sync loop
Jan 23 23:40:10 wirenboard-A77OOSWW daemon.info wb-rules[12684]: INFO: [engine] Stop main loop
Jan 23 23:40:10 wirenboard-A77OOSWW daemon.err netplugd[3077]: caught signal 15 - exiting
Jan 23 23:40:11 wirenboard-A77OOSWW user.notice kernel: klogd: exiting
Jan 23 23:40:12 wirenboard-A77OOSWW syslog.info syslogd exiting
Jan 23 23:40:48 wirenboard-A77OOSWW syslog.info syslogd started: BusyBox v1.22.1