![]() |
ИСТИНА |
Войти в систему Регистрация |
Интеллектуальная Система Тематического Исследования НАукометрических данных |
||
В настоящее время, в связи с развитием систем автоматического и автоматизированного управления, предприятия накапливают большие объемы данных о состоянии технологических процессов. Множества физических датчиков фиксируют состояние системы в каждый момент времени, тем самым отвечая за управление системой и поддержку ее параметров в допустимых пределах. Одновременно с этим, значительную часть качественных характеристик таких процессов, в особенности, связанных с нефтехимической промышленностью, составляют лабораторные исследования. Такие исследования проводятся с нерегулярной частотой — существующие на практике средства их интерполяции основаны на линейных или же кусочно-постоянных интерпретациях. Математические модели, обобщающие лабораторные исследования на частоту, соответствующую физическим датчикам будем называть виртуальными датчиками. Таким образом, исследуемая в работе задача прогнозирования виртуальных датчиков, то есть получения химических показателей производственного процесса в реальном времени на основе значений физических датчиков является актуальной. Авторы исследуют набор данных, соответствующий нефтеперерабатывающей установке, содержащий около 10,000 показаний 300 физических датчиков, собираемых с частотой 1 час, однако соответствующие лабораторные исследования составляют набор всего в 300 показаний, собираемых с частотой около суток. Соответственно, возникает несколько задач, связанных с высокой размерностью входов, разреженностью и в целом небольшим числом показаний целевой переменной, а сама задача прогнозирования лабораторных исследований содержит подзадачу аппроксимации. Авторами были предложены несколько подходов, объединяющих задачи прогноза и заполнения пропусков для моделирования лабораторных исследований. Были рассмотрены методы отбора признаков на основе PLS регрессии (иерархическая кластеризация), градиентного бустинга, деревьев Байеса, графовой нейронной сети, базовые методы в виде Lasso и корреляций. Каждый из предложенных методов отбора был адаптирован для возможности учитывать экспертное мнение специалистов области. Были предложены методы прогнозирования лабораторных исследований на основе графовых нейросетей, генеративных подходов, полносвязных и рекуррентных сетей, рассмотрены интерполяции отклика с использованием Loess и сплайнов, а также вариант регуляризации, учитывающей корреляцию с откликом. Полученные авторами экспериментальные результаты показывают преимущество использования для данной задачи простых рекуррентных сетей, графовых нейросетей с предварительной интерполяцией, отбора признаков на основе деревьев Баейса. Отдельно стоит отметить неоднозначность оценки качества полученных моделей; авторами был предложен комбинированный подход, учитывающий адекватность модели, корреляцию ее с истинными значениями лаборатории и стандартные ошибки.