Зависание плагина MegaD



  • Спасибо, обновлюсь.

    Тут уже методом перебора пытаюсь выявить из-за чего плагин зависает, поэтому отключаю по одному из датчиков. Отключил датчик СО2, показания по которому обрабатываются скриптом, убрав период опроса в Request, однако при старте плагина скрипт загружается, идет первый опрос и на этом заканчивается. По моему это не правильно. По идее если убрали период опроса, то и скрипт не должен загружаться? Ну или как-то так - Вы сами определите как должно быть правильно.

    08.01.2017 20:25:59 MegaD plugin has started.
    08.01.2017 20:25:59 Listening localhost:8020
    08.01.2017 20:25:59 Address 36 (IA36). Loading script
    08.01.2017 20:25:59 Polling   192.168.12.20:80/sec/?cmd=all, interval 0 sek
    08.01.2017 20:25:59 Polling   192.168.12.20:80/sec/?pt=30&cmd=get, interval 60 sek
    08.01.2017 20:25:59 Polling   192.168.12.20:80/sec/?pt=31&cmd=list, interval 60 sek
    08.01.2017 20:25:59 localhost => 192.168.12.20:80 HTTP GET /sec/?cmd=all
    08.01.2017 20:25:59 localhost <= 192.168.12.20:80 HTTP OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF;ON;OFF;ON;OFF;OFF;OFF;ON;OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF/0;OFF;OFF;OFF;OFF;ON;OFF;OFF;ON;temp:25.30/hum:14.10;;OFF;OFF;;OFF;160;ON
    08.01.2017 20:25:59 Address 36
    08.01.2017 20:25:59     run script: val=160 depo={}
    08.01.2017 20:25:59  script return:{ reqsek: 5 } depo={ res: [ 160 ] }
    08.01.2017 20:25:59 MG2?0=0&1=0&2=0&3=0&4=0&5=0&6=0&7=0&8=1&9=0&10=1&11=0&12=0&13=0&14=1&15=0&16=0&17=0&18=0&19=0&20=0&21=0&22=0&23=0&24=0&25=0&26=1&27=0&28=0&29=1&30_1=25.3&30_2=14.1&31=0&32=0&33=0&34=0&35=0&37=1&
    08.01.2017 20:26:59 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get
    08.01.2017 20:27:00 localhost <= 192.168.12.20:80 HTTP temp:24.80/hum:8.40
    08.01.2017 20:27:00 MG2?30_1=24.8&30_2=8.4&
    
    

    Сам скрипт, который Владимир на ab-log выкладывал:

    function (val, depo)
    {   var result;
    
       if (!depo.res) depo.res = [];   
       depo.res.push(val);  
    
       if (depo.res.length < 5)    return { reqsek:5 }; // Нужны еще измерения, значение не возвращаем
       depo.res.sort();   
    
       result = ((Math.round((depo.res[1] + depo.res[2] + depo.res[3]) / 3) - 100 ) * 10 + 350);
    
       depo.res = []; // Перед следующими измерениями сбрасываем массив
       return { val:result, reqsek:300 }; // Восстанавливаем период 5 мин
    }
    
    


  • @intrapro:

    Alex_Jet, спасибо, и Вас с Рождеством!!! Готово рождественское обновление 🙂

    1. В плагине MegaD - добавлено логирование событий сокета. Также сокет принудительно закрывается после каждого запроса.

    2. Добавлен флаг Debug - сохранение флагов трассировки, suspend и log для плагинов при перезагрузке.

    1. В логе плагина ничего не увидел нового… где смотреть? UPD: все увидел! Просто логи плагинов после обновления выключились....

    2. Где это найти?

    Нельзя ли в каналы плагинов вывести столбец "Период опроса"? Правда вероятно для маленьких разрешений экрана надо будет горизонтальный скролбар добавить... иначе, например, у меня при 1280х720 содержание столбца "Устройства в системе" уже обрезано.

    Вот такой вредный busy на канале с 1-wire bus! Так понимаю, что на протяжении примерно 30 минут запрос попадает на конвертацию температуры:

    08.01.2017 22:53:26 
    08.01.2017 22:53:26 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=31&cmd=list
    08.01.2017 22:53:26 localhost <=>192.168.12.20:80 socket handle=17\. Header: GET /sec/?pt=31&cmd=list HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    08.01.2017 22:53:26 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    08.01.2017 22:53:26 localhost <= 192.168.12.20:80 HTTP busy
    08.01.2017 22:53:26 MG2?
    08.01.2017 22:53:26 localhost <=>192.168.12.20:80 socket closed
    
    


  • @Alex_Jet:

    Отключил датчик СО2, показания по которому обрабатываются скриптом, убрав период опроса в Request, однако при старте плагина скрипт загружается, идет первый опрос и на этом заканчивается. По моему это не правильно. По идее если убрали период опроса, то и скрипт не должен загружаться?

    Сейчас скрипт грузится, если для канала стоит галка: "Запускать скрипт обработки данных" (колонка Скрипт).

    Если галку убрать, скрипт не пропадет, будет доступен для редактирования, просто не будет загружаться.

    Связи с периодом опроса канала нет, т.к. значение может читаться при общем опросе. Или как для двойных датчиков или 1-Wire - период м.б. ноль, но данные можно обработать скриптом.

    @Alex_Jet:

    Нельзя ли в каналы плагинов вывести столбец "Период опроса"? Правда вероятно для маленьких разрешений экрана надо будет горизонтальный скролбар добавить… иначе, например, у меня при 1280х720 содержание столбца "Устройства в системе" уже обрезано.

    Горизонтальный скролбар убирали из эстетических соображений :). В планах у нас включена задача: настраивать интерактивно ширину и состав столбцов таблиц в PM.

    @Alex_Jet:

    Просто логи плагинов после обновления выключились….

    Да, в новом релизе добавлен флаг Debug: "Запустить в режиме отладки".

    Устанавливается PM: Система - Системные настройки - Параметры запуска сервера.

    При установленном Debug после перезагрузки:

    • сохраняются флаги suspend и log для плагинов,

    • сохраняются системные флаги логирования (Трассировка).

    Если флаг сброшен, при перезагрузке все это сбрасывается (рабочий режим).



  • @Alex_Jet:

    Порт 31 сконфигурирован как 1-wire bus, на нем сейчас висит 3 датчика DS18B20. Период конвертации данных в MegaD - 30 секунд. Когда запрос попадает на момент конвертации, то MegaD выдает "busy". Однако это "busy" в логах плагина длилось порядка 1 часа, пока я не перезагрузил плагин.

    ….

    Вот такой вредный busy на канале с 1-wire bus! Так понимаю, что на протяжении примерно 30 минут запрос попадает на конвертацию температуры

    А сколько времени MegaD находится в состоянии busy? Если речь идет о 1-2 сек, то попав в зону busy, можно там и остаться, если период опроса кратен 30 сек ( в данном случае 60 сек). Вариант решения - сделать период не кратным 30 сек - 67 сек, например.



  • Как ответил разработчик MegaD - период конвертации для любого количества датчиков равен 750 мС. Конечно можно разносить период опроса вручную, но вероятно лучше программно обрабатывать тот же "busy" - если ответ такой, то повторяем запрос через 1 секунду, иначе следующий интервал опроса тот что в request.

    Кстати, в настройках железа устройств есть "Специальное значение, означающее ошибку датчика" как это работает? То есть впишу я туда "busy" и что сделает система когда датчик ответит ей "busy"? Надо бы это осветить!

    Пока больше зависаний плагина не могу зафиксировать. Спустя примерно 5 часов виснет сама MegaD! Сегодня поменяю железку на новую - тут виновата либо железо, либо система…



  • @Alex_Jet:

    Как ответил разработчик MegaD - период конвертации для любого количества датчиков равен 750 мС. Конечно можно разносить период опроса вручную, но вероятно лучше программно обрабатывать тот же "busy" - если ответ такой, то повторяем запрос через 1 секунду, иначе следующий интервал опроса тот что в request..

    Да, программно обрабатывать можно, просто не хотелось привязываться к деталям реализации…

    И жестко программировать повтор запросов, устройство довольно нежное 🙂

    Поскольку у нас нет возможности проверить (у нас есть только MegaD 238), проверьте пожалуйста, если цикл сдвинуть - ответ после busy все же придет?

    @Alex_Jet:

    Кстати, в настройках железа устройств есть "Специальное значение, означающее ошибку датчика" как это работает? То есть впишу я туда "busy" и что сделает система когда датчик ответит ей "busy"? Надо бы это осветить!

    Эту настройку плагин Mega пока не использует. Стандартное использование - если с канала читается что-то не то, то просто выставляется флаг ошибки датчика, будет алерт и соотв. индикация.

    @Alex_Jet:

    Пока больше зависаний плагина не могу зафиксировать. Спустя примерно 5 часов виснет сама MegaD! Сегодня поменяю железку на новую - тут виновата либо железо, либо система…

    Как в этом случае отрабатывает плагин? Ошибка индицируется? Что в логах?

    В последней версии плагина кроме логирования событий сокета делается принудительное закрытие сокета после каждого запроса.



  • @intrapro:

    Поскольку у нас нет возможности проверить (у нас есть только MegaD 238), проверьте пожалуйста, если цикл сдвинуть - ответ после busy все же придет?

    Да вот как это проверить? Например, запускается плагин и некоторое время все хорошо, а спустя 1-5 часов период опроса попадает на busy. И может час попадать на момент конвертации. Ждать больше не получалось пока (зависает MegaD или перезапускал плаги вручную).
    @intrapro:

    Эту настройку плагин Mega пока не использует. Стандартное использование - если с канала читается что-то не то, то просто выставляется флаг ошибки датчика, будет алерт и соотв. индикация.

    То есть на данный момент бесполезно там что-то писать?
    @intrapro:

    Как в этом случае отрабатывает плагин? Ошибка индицируется? Что в логах?

    В последней версии плагина кроме логирования событий сокета делается принудительное закрытие сокета после каждого запроса.

    Закрытие сокета вижу. MegaD уходит в зависание насовсем (ping нет, сам контроллер свои сценарии не отрабатывает), соответственно intrahouse говорит о том что "Контроллер MegaD. Ошибка!" и в лог такой:

    11.01.2017 01:30:16 MegaD plugin has started.
    11.01.2017 01:30:16 Listening localhost:8020
    11.01.2017 01:30:16 Address 36 (IA36). Loading script
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?cmd=all, interval 0 sek
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?pt=30&cmd=get, interval 60 sek
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?pt=36&cmd=get, interval 300 sek
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?pt=31&cmd=list, interval 60 sek
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1, interval 60 sek
    11.01.2017 01:30:16 Polling   192.168.12.20:80/sec/?pt=34&scl=35&i2c_dev=htu21d, interval 60 sek
    11.01.2017 01:30:16 
    11.01.2017 01:30:16 localhost => 192.168.12.20:80 HTTP GET /sec/?cmd=all
    11.01.2017 01:30:16 localhost <=>192.168.12.20:80 socket handle=16\. Header: GET /sec/?cmd=all HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    11.01.2017 01:30:20 localhost <= 192.168.12.20:80 Error EHOSTUNREACH.  Stopped.
    
    


  • @Alex_Jet:

    То есть на данный момент бесполезно там что-то писать?

    Да
    @Alex_Jet:

    Пока больше зависаний плагина не могу зафиксировать. Спустя примерно 5 часов виснет сама MegaD! Сегодня поменяю железку на новую - тут виновата либо железо, либо система…

    Удалось ли восстановить работоспособность MegaD? Не хочется добавлять новый функционал, пока не разобрались с зависанием.



  • @intrapro:

    Удалось ли восстановить работоспособность MegaD? Не хочется добавлять новый функционал, пока не разобрались с зависанием.

    Проблема примерно локализована - необходимо время для проведения еще нескольких тестов.

    С тех пор как добавили закрытие сокетов в плагине он ни разу не зависал. Последний uptime-работы плагина - 18 часов, однако убран опрос I2C датчика HTU21D. Большая вероятность что именно из-за его обработки виснит MegaD.



  • Проясните, пожалуйста, коды ошибок, которые выдает плагин при перезапуске. Сегодня когда в очередной раз перезапускал контроллер MegaD обратил внимание что плагин рестартовал несколько раз:
    MegaD-2561.png

    По зависанию MegaD. Конечно этого не должно быть в принципе, но пока складывается ощущение, что контроллер вешается только в том случае если с помощью intrahouse начинаю опрашивать HTU21D с помощью команды /%pwd%/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1. То есть как только ввожу в действие опрос этого датчика, то MegaD спустя 4-9 часов зависает. Замечено, что если опрашиваю сразу по обоим параметрам (температура и влажность), причем интервал опроса один и то же для обоих каналов - 60 секунд, то контроллер вешается быстрее - от 2 до 3-х часов.

    Мое мнение такое - intrahouse cлишком быстр, в отличие от php и в какой-то момент запросы по каждому каналу начинают сыпаться один за другим с минимальным промежутком, в итоге MegaD виснет от ddos-атаки.

    У разработчика MegaD моя конфигурация на php уже работает несколько суток без каких-либо сбоев (опрос датчиков каждые 8 секунд). Сейчас провожу повторный тест - опрашиваю все каналы, которые были, кроме HTU21D (в прошлый раз на протяжении 34 часов контроллер работал без сбоев, потом я начал делать другой тест). Следующий тест - разнос опроса каналов по времени и включение опроса всех каналов (в том числе HTU21D).



  • @Alex_Jet:

    Проясните, пожалуйста, коды ошибок, которые выдает плагин при перезапуске. Сегодня когда в очередной раз перезапускал

    контроллер MegaD обратил внимание что плагин рестартовал несколько раз:

    Коды ошибок плагинов, которые приводят к завершению работы:

    code 1 - плагин запустился, но сразу закончил работу.

    Для MegaD - не задан IP контроллера или порт для прослушивания занят.

    code 2, 3 Ошибка связи или ошибка чтения

    Для MegaD - это ошибка во время выполнения запроса GET (м.б. EHOSTUNREACH, ECONNREFUSED, ESOCKETTIMEDOUT,..) В логе плагина для всех этих ошибок есть расшифровка ошибки со словом Stopped

    16.01.2017 12:32:20 localhost <= 192.168.0.14:80 Error EHOSTUNREACH.  Stopped.
    
    

    code 143 - плагин получил сигнал на остановку от сервера, но какие-то операции не завершены.

    Собственно, это не ошибка, уберем.

    @Alex_Jet:

    ..в какой-то момент запросы по каждому каналу начинают сыпаться один за другим с минимальным промежутком, в итоге MegaD виснет от ddos-атаки….Следующий тест - разнос опроса каналов по времени и включение опроса всех каналов (в том числе HTU21D).

    Предлагаю прямо в коде плагина принудительно разнести запросы.

    Сейчас следующий запрос уходит не раньше чем через 200 мС.

    Сделаем 2-3-5 сек в коде плагина /opt/intrahouse/server/ihlib/equip/megad.js, стр.71

    		// Http клиент. Сформировать массив запросов reqarr и массив таймеров
    		prepareOutReqAndTimers();
    		setInterval( runOutReq, 2000);  // 200 -> 2000  
    	} catch (e) {	
    		traceMsg( e.message+' Stopped.');
    		process.exit(1);
    	}
    
    
    

    После редактирования файла плагин нужно перезапустить. Сервер перезагружать не требуется.

    Другой вариант - заменить асинхронный механизм отправки запросов на синхронный однопоточный, как, видимо, это происходит в php. Т.е. не отправлять следующий запрос, пока не получен ответ на предыдущий. Можно сделать и так.

    Еще версия - опрос HTU21D имеет специфические требования? Контроллер ждет еще чего-то от сервера, а плагин переходит к следующему запросу..



  • @intrapro:

    После редактирования файла плагин нужно перезапустить. Сервер перезагружать не требуется.

    Все понятно! Спасибо за описание.
    @intrapro:

    Другой вариант - заменить асинхронный механизм отправки запросов на синхронный однопоточный, как, видимо, это происходит в php. Т.е. не отправлять следующий запрос, пока не получен ответ на предыдущий. Можно сделать и так.

    Мне кажется, что это будет как раз правильным решением. Поскольку контроллер, построенный на AVR с Ethernet-контроллером ENC28J60, не может обрабатывать много потоков. Зная, немного прошивку, - там этого просто нет.
    @intrapro:

    Еще версия - опрос HTU21D имеет специфические требования? Контроллер ждет еще чего-то от сервера, а плагин переходит к следующему запросу..

    Нет - это все такой же обычный датчик. Если дать команду через веб, то контроллер сразу выводит значение и ему больше ничего не надо.



  • Разнес запросы по датчикам (см.ниже), однако спустя 4 часа 21 минуту MegaD завис. Разработчик MegaD проверяет версию по поводу ddos-атаки. Попробую внести изменения в работу плагина.

    17.01.2017 10:05:51 MegaD plugin has started.
    17.01.2017 10:05:51 Listening localhost:8020
    17.01.2017 10:05:51 Address 36 (IA36). Loading script
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?cmd=all, interval 0 sek
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?pt=30&cmd=get, interval 61 sek
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?pt=36&cmd=get, interval 300 sek
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?pt=31&cmd=list, interval 63 sek
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1, interval 65 sek
    17.01.2017 10:05:51 Polling   192.168.12.20:80/sec/?pt=34&scl=35&i2c_dev=htu21d, interval 67 sek
    
    


  • @intrapro:

    Предлагаю прямо в коде плагина принудительно разнести запросы.

    Сейчас следующий запрос уходит не раньше чем через 200 мС.

    Сделаем 2-3-5 сек в коде плагина /opt/intrahouse/server/ihlib/equip/megad.js, стр.71

    Вчера обновился, отредактировал megad.js (у меня была стр.53) и запустил плагин (в 22:20). До сих пор (~15 часов) полет нормальный, все работает.



  • Значит 200 мС период все же был короткий. Нужно конечно по крайней мере 24 часа uptime.

    Хорошо, тогда будем добавлять новые функции, в последней кодовой базе уже кое-что добавили, поэтому номер строки не совпал.



  • Само собой тест будет так долго сколько получится! Единственное - смущают периодические ошибки по всем датчикам. Лог журнала из веба не копируется! А из консоли где его можно посмотреть?

    Приведу пример, помогите разобраться - по журналу в 18.01.2017 13:51:30 Ошибка датчика температуры и влажности (DHT22), который висит на 30-м порте. Лог плагина в промежутке с 18.01.2017 13:50:29 по 18.01.2017 13:52:49 прилагаю. Периодичность опроса датчиков как в предыдущем посте.

    18.01.2017 13:50:29 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1
    18.01.2017 13:50:29 localhost <=>192.168.12.20:80 socket handle=55\. Header: GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1 HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:50:29 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:50:29 localhost <= 192.168.12.20:80 HTTP 26.14
    18.01.2017 13:50:29 MG2?341=26.14&
    18.01.2017 13:50:29 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:50:31 
    18.01.2017 13:50:31 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=31&cmd=list
    18.01.2017 13:50:31 localhost <=>192.168.12.20:80 socket handle=55\. Header: GET /sec/?pt=31&cmd=list HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:50:31 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:50:31 localhost <= 192.168.12.20:80 HTTP ff862a831501:24.06;ff6e2a831501:24.12;ff676b821503:23.68
    18.01.2017 13:50:31 MG2?31_ff862a831501=24.06&31_ff6e2a831501=24.12&31_ff676b821503=23.68&
    18.01.2017 13:50:31 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:50:33 
    18.01.2017 13:50:33 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get
    18.01.2017 13:50:33 localhost <=>192.168.12.20:80 socket handle=55\. Header: GET /sec/?pt=30&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:15 
    18.01.2017 13:51:15 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get
    18.01.2017 13:51:15 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=36&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:15 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:15 localhost <= 192.168.12.20:80 HTTP 158
    18.01.2017 13:51:15 Address 36
    18.01.2017 13:51:15     run script: val=158 depo={ res: [] }
    18.01.2017 13:51:15  script return:{ reqsek: 5 } depo={ res: [ 158 ] }
    18.01.2017 13:51:15 Address 36\. Shift request interval: 5 sek.
    18.01.2017 13:51:15 MG2?
    18.01.2017 13:51:15 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:21 
    18.01.2017 13:51:21 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get
    18.01.2017 13:51:21 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=36&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:21 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:21 localhost <= 192.168.12.20:80 HTTP 160
    18.01.2017 13:51:21 Address 36
    18.01.2017 13:51:21     run script: val=160 depo={ res: [ 158 ] }
    18.01.2017 13:51:21  script return:{ reqsek: 5 } depo={ res: [ 158, 160 ] }
    18.01.2017 13:51:21 MG2?
    18.01.2017 13:51:21 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:27 
    18.01.2017 13:51:27 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get
    18.01.2017 13:51:27 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=36&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:27 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:27 localhost <= 192.168.12.20:80 HTTP 148
    18.01.2017 13:51:27 Address 36
    18.01.2017 13:51:27     run script: val=148 depo={ res: [ 158, 160 ] }
    18.01.2017 13:51:27  script return:{ reqsek: 5 } depo={ res: [ 158, 160, 148 ] }
    18.01.2017 13:51:27 MG2?
    18.01.2017 13:51:27 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:33 
    18.01.2017 13:51:33 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get
    18.01.2017 13:51:33 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=36&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:33 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:33 localhost <= 192.168.12.20:80 HTTP 151
    18.01.2017 13:51:33 Address 36
    18.01.2017 13:51:33     run script: val=151 depo={ res: [ 158, 160, 148 ] }
    18.01.2017 13:51:33  script return:{ reqsek: 5 } depo={ res: [ 158, 160, 148, 151 ] }
    18.01.2017 13:51:33 MG2?
    18.01.2017 13:51:33 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:35 
    18.01.2017 13:51:35 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d
    18.01.2017 13:51:35 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=34&scl=35&i2c_dev=htu21d HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:35 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:35 localhost <= 192.168.12.20:80 HTTP 12.60
    18.01.2017 13:51:35 MG2?342=12.6&
    18.01.2017 13:51:35 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:37 
    18.01.2017 13:51:37 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1
    18.01.2017 13:51:37 localhost <=>192.168.12.20:80 socket handle=56\. Header: GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1 HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:39 
    18.01.2017 13:51:39 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=31&cmd=list
    18.01.2017 13:51:39 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=31&cmd=list HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:39 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:39 localhost <= 192.168.12.20:80 HTTP ff862a831501:24.00;ff6e2a831501:24.06;ff676b821503:23.62
    18.01.2017 13:51:39 MG2?31_ff862a831501=24.00&31_ff6e2a831501=24.06&31_ff676b821503=23.62&
    18.01.2017 13:51:39 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:41 
    18.01.2017 13:51:41 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get
    18.01.2017 13:51:41 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=30&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:41 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:41 localhost <= 192.168.12.20:80 HTTP temp:24.60/hum:10.20
    18.01.2017 13:51:41 MG2?30_1=24.6&30_2=10.2&
    18.01.2017 13:51:41 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:51:43 
    18.01.2017 13:51:43 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get
    18.01.2017 13:51:43 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=36&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:51:43 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:51:43 localhost <= 192.168.12.20:80 HTTP 151
    18.01.2017 13:51:43 Address 36
    18.01.2017 13:51:43     run script: val=151 depo={ res: [ 158, 160, 148, 151 ] }
    18.01.2017 13:51:43  script return:{ val: 880, reqsek: 300 } depo={ res: [] }
    18.01.2017 13:51:43 Address 36\. Shift request interval: 300 sek.
    18.01.2017 13:51:43 MG2?36=880&
    18.01.2017 13:51:43 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:52:43 
    18.01.2017 13:52:43 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d
    18.01.2017 13:52:43 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=34&scl=35&i2c_dev=htu21d HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:52:43 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:52:43 localhost <= 192.168.12.20:80 HTTP 12.67
    18.01.2017 13:52:43 MG2?342=12.67&
    18.01.2017 13:52:43 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:52:45 
    18.01.2017 13:52:45 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1
    18.01.2017 13:52:45 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1 HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:52:45 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:52:45 localhost <= 192.168.12.20:80 HTTP 26.05
    18.01.2017 13:52:45 MG2?341=26.05&
    18.01.2017 13:52:45 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:52:47 
    18.01.2017 13:52:47 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=31&cmd=list
    18.01.2017 13:52:47 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=31&cmd=list HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:52:47 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:52:47 localhost <= 192.168.12.20:80 HTTP ff862a831501:23.75;ff6e2a831501:23.81;ff676b821503:23.37
    18.01.2017 13:52:47 MG2?31_ff862a831501=23.75&31_ff6e2a831501=23.81&31_ff676b821503=23.37&
    18.01.2017 13:52:47 localhost <=>192.168.12.20:80 socket closed
    18.01.2017 13:52:49 
    18.01.2017 13:52:49 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get
    18.01.2017 13:52:49 localhost <=>192.168.12.20:80 socket handle=57\. Header: GET /sec/?pt=30&cmd=get HTTP/1.1
    Host: 192.168.12.20
    Connection: close
    
    18.01.2017 13:52:49 localhost <= 192.168.12.20:80 response: statusCode=200 contentType = text/html
    18.01.2017 13:52:49 localhost <= 192.168.12.20:80 HTTP temp:25.10/hum:10.30
    18.01.2017 13:52:49 MG2?30_1=25.1&30_2=10.3&
    18.01.2017 13:52:49 localhost <=>192.168.12.20:80 socket closed
    
    

    Мое предположение: на запрос 18.01.2017 13:50:33 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get от контроллера просто нет ответа! Почему время по журналу 18.01.2017 13:51:30??? В устройстве время не ответа стоит 120 секунд - на что это влияет?

    При детальном анализе лога плагина нашел, что частенько "множественный" опрос канала (с помощью скрипта) прерывается следующим образом:

    1. В 18.01.2017 13:51:15 идет запрос по каналу 36 (localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get), начинает работать скрипт - проходит 4 измерения

    2. Однако после 4-го следуют запросы по расписанию на порты шины I2C и 31,30:

    18.01.2017 13:51:35 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d

    18.01.2017 13:51:37 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=34&scl=35&i2c_dev=htu21d&i2c_par=1

    18.01.2017 13:51:39 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=31&cmd=list

    18.01.2017 13:51:41 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get

    3. Только потом очередь доходит до 5-го запроса по 36-му каналу, на основании которого делается расчет среднего значения:

    18.01.2017 13:51:43 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=36&cmd=get

    После этого идет в штатном порядке.

    Ладно, пусть данные по этому датчику формируются не за 25 секунд (5 измерений через 5 секунд), а за 28-40 секунд. Это не так плохо, однако отслеживая графики (выложу позже), я вижу проблемы по датчикам, в частности для СО2 (о котором веду речь) в 01:03, 05:36, 10:13, 14:51 (обратите внимание на промежутки времени между этими точками - 4:33, 4:37, 4:38) были нулевые показания! Не могу сейчас посмотреть логи из консоли что было в это время, однако проблема есть.

    В общем, веду все это я к тому, что придется скорее всего делать такой же опрос, как происходит в php. Последовательно и синхронно, при этом если выполняется скрипт, привязанный к каналу, то другие каналы пока не опрашиваем.

    UPD: разработчик MegaD просит привести пример HTTP пакета, который генерирует ваш плагин. Сам только вечером wireshark-ом могу глянуть.



  • @Alex_Jet:

    Лог журнала из веба не копируется! А из консоли где его можно посмотреть?

    Если речь о журнале, который доступен из основного интерфейса, запись ведется в ежедневные журналы. Папка /opt/intrahouse/base/journal/

    @Alex_Jet:

    Единственное - смущают периодические ошибки по всем датчикам.

    Мои догадки:

    1. На запрос 18.01.2017 13:50:33 localhost => 192.168.12.20:80 HTTP GET /sec/?pt=30&cmd=get от контроллера просто нет ответа! В устройстве время не ответа стоит 120 секунд - на что это влияет? Почему время по журналу 18.01.2017 13:51:30???

    Вы установили "Время ожидания данных до сигнализации об ошибке" по кнопке "Железо", и если данные с датчика не поступают в течение этого интервала, сервер устанавливает ошибку. Время считается с момента последнего поступления данных в ядро системы. Не в плагин!

    Посмотрите, видимо последний раз данные пришли в 18.01.2017 13:49:30 (-120 сек), а следующий раз - наверно позже.

    Аналогично для 36 канала - мы получаем значение только после нескольких измерений, а сервер то об этом не догадывается, он получит только конечный результат.

    В принципе, эта возможность (контроль за каждым датчиком) в основном используется для беспроводных устройств, их по другому не проконтролируешь. Для MegaD, если работа идет в штатном режиме, можно просто это время не использовать (установить в 0).

    Либо поставить время достаточно большое, чтобы учесть пропуск значений и обработку функцией до получения конечного значения.



  • @Alex_Jet:

    UPD: разработчик MegaD просит привести пример HTTP пакета, который генерирует ваш плагин. Сам только вечером wireshark-ом могу глянуть.

    HTTP через wiresark:

    Req: GET /sec/?cmd=all HTTP/1.1 Host: 192.168.0.14 Connection: close

    Resp: HTTP/1.0 200 OK Content-Type: text/html

    Больше там ничего нет, это все выводится в логе.

    Или нужен весь TCP?

    @Alex_Jet:

    В общем, веду все это я к тому, что придется скорее всего делать такой же опрос, как происходит в php. Последовательно и синхронно..

    Хорошо, не проблема, cделаем 🙂
    @Alex_Jet:

    при этом если выполняется скрипт, привязанный к каналу, то другие каналы пока не опрашиваем.

    Наверно, это все же слишком большое ограничение с учетом задержек, которые делаются во время опроса?



  • @intrapro:

    Если речь о журнале, который доступен из основного интерфейса, запись ведется в ежедневные журналы. Папка /opt/intrahouse/base/journal/

    ОК, посмотрю там.
    @intrapro:

    Либо поставить время достаточно большое, чтобы учесть пропуск значений и обработку функцией до получения конечного значения.

    Само собой значения везде "нужные". С самого начала опрос всех датчиков был через 60 секунд, а "Время ожидания данных до сигнализации об ошибке" установлено 120 секунд. Для датчика CO2, данные по которому формируются скриптом с периодом 300 секунд, "Время ожидания данных до сигнализации об ошибке" установлено 320 секунд.
    @intrapro:

    Наверно, это все же слишком большое ограничение с учетом задержек, которые делаются во время опроса?

    Вам как профессионалам виднее. Я самоучка необразованный :lol:



  • Контроллер снова повесился!!! :twisted: :twisted: :twisted: Uptime - ~19 часов. Интересна сама причина - от чего он вешается. Думаю, пока Андрей не установит у себя вашу систему, так ни к чему и не придем.


Авторизуйтесь, чтобы ответить