AN ADAPTIVE SOFT SENSOR DESIGN BASED ON A NEURAL NETWORK WITH A PREDICTIVE FILTER IN THE FEEDBACK LOOP FOR A REACTION DISTILATION TECHNOLOGICAL PROCESS
- Authors: Stabrov S.V1, Shtakin D.V1, Samotylova S.A1,2, Torgashov A.Y.1,2
- Affiliations:
- Far Eastern Federal University
- Institute of Automation and Control Processes Far Eastern Branch of the Russian Academy of Sciences
- Issue: No 1 (2022)
- Pages: 89-108
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/2042
- DOI: https://doi.org/10.15593/2499-9873/2022.1.05
- Cite item
Abstract
Rectification and reactive distillation columns are the main of all units in the petrochemical and refining industry. Soft sensors consist of mathematical models that estimate of the quality of an output product in real time are used for technological processes control. In general, changes in the composition of raw materials, catalyst deactivation, etc. result in inconsistency between obtained data and the current state of the technological process. Soft sensor design obtained on such data will loss of accuracy in estimating the necessary parameters of the output product. An adaptive soft sensor design based on a neural network with a predictive filter in the feedback loop for solve the mismatching obtained data and the current state of the technological process problem is proposed. “Moving window” conception is used for size window adapting to the actual state of the technological process. Parameter estimation based on a neural network using data matching to the technological process. A predictive filter in the feedback loop for improve the estimation accuracy of the quality parameter at the cost of predicting the error of the soft sensor designed is proposed. A comparative analysis of several adaptive soft sensors based on neural networks using the "moving window" conception for estimation a by-product concentration of in the output product of the reaction-distillation column and the effectiveness of the proposed approach are shown. Application of the predictive filter in the feedback loop allows to improve the accuracy of the soft sensor based on a neural network by 12.94 % (coefficient of determination) and by 39.81 % (mean absolute error) in comparison with that of without predictive filter.
Full Text
Введение Виртуальные анализаторы (ВА) представляют собой программно-алгоритмические комплексы (в состав которых входят математические модели), способные преобразовывать информацию из измеряемых технологических переменных (температура, давление, расход и т.д.) для оценки показателей качества [1]. Благодаря оценке требуемых параметров в режиме реального времени появилась возможность своевременного обнаружения отклонений от технологического регламента и оперативного управления процессом. Эффективность функционирования разработанных ВА зависит от массива данных, используемых для обучения [2]. ВА, построенные на массивах данных, представляют собой, как правило, модели авторегрессии или математические модели, представленные в виде сверточной суммы конечной импульсной характеристики и входных переменных модели [3]. При разработке ВА в используемом массиве данных могут присутствовать данные одного режима технологического процесса (ТП) [4], количество наблюдений может быть существенно меньше количества используемых входных переменных [5; 6], а выход (переменная отклика) зачастую измеряется один раз, а не серией [1]. Это приводит к несоответствию используемого массива данных текущему режиму ТП. Для построения ВА в большинстве практических случаев используют подходы линейной множественной регрессии из-за простоты реализации [7]. Однако на нефтеперерабатывающих заводах время от времени отличаются рабочие условия, изменяется сырье, происходит падение активности катализаторов, загрязняются теплообменники, что приводит к нерепрезентативности использованной выборки данных для построения ВА и ухудшению точности оценки выходной переменной [8; 9]. В связи с этим широкое распространение получили методы построения ВА на основе нейронных сетей [10]. Использование нейронных сетей при построении ВА позволяет учитывать динамические и нелинейные характеристики ТП. Одной из часто используемых является нейронная сеть прямого распространения и ее модификации [11; 12]. Следует отметить, что для поддержания точности оценки необходимых параметров ТП виртуальный анализатор должен быть построен таким образом, чтобы адаптироваться к изменяющимся условиям процесса. В связи с этим актуальным становится разработка подходов построения ВА, учитывающих изменения в массиве данных в соответствии с текущим режимом ТП. В работе предлагается подход для разработки адаптивных виртуальных анализаторов на основе нейронных сетей (АВАНС) с прогнозирующим фильтром (ПФ) в контуре обратной связи. Оптимальный размер окна используемого массива данных для обучения позволяет учитывать актуальные данные ТП. Оценка выходной переменной осуществляется на основе нейронной сети прямого распространения (НСПР) и каскадной нейронной сети прямого распространения (КНСПР), построенных с использованием соответствующей текущему режиму ТП области массива данных. Прогноз ошибки ВА позволяет приблизить расчетные значения необходимого параметра к действительным в период до получения следующих лабораторных значений. Данный подход позволяет построить более точную оценку нелинейного ТП. Описание технологического объекта и постановка задачи Рассматривается реакционно-ректификационный процесс, протекающий в технологическом аппарате колонного типа, с образованием метил-трет-бутилового эфира (МТБЭ), который является эффективным антидетонатором, применяемым для повышения октанового числа бензина и способствующим более полному сгоранию бензина, повышая его экологичность. Одним из побочных компонентов производства МТБЭ является метил-втор-бутиловый эфир (МВБЭ), для которого требуется оперативная оценка его концентрации в конечном продукте. Технологическая схема процесса производства МТБЭ представлена на рис. 1. Синтез МТБЭ происходит в реакционно-ректификационном блоке, состоящем из смесителя (С), предреактора (Р-1), ректификационных колонн (К-1) и (К-2), ребойлера (РБ), реактора (Р-2) и холодильника (Х). Бутан-бутиленовая фракция (ББФ) и метанол (MeOH) через смеситель (С) поступают в предреактор (Р-1), где происходит подогрев сырьевой смеси и частичный синтез МТБЭ. Подогретое сырьё и синтезированная в Р-1 часть МТБЭ поступают в колонну К-1, где происходит разделение сырья и МТБЭ. Далее сырьё поступает из К-1 в Р-2, где происходит синтез МТБЭ в условиях двухфазных потоков «пар - жидкость» при одновременном разделении продуктов реакции. Отработанные ББФ и MeOH отводятся в К-2, где часть смеси подается снова в К-2, а оставшаяся часть направляется на отмывку отработанной ББФ от MeOH. Для данного процесса необходимо оценить концентрацию побочного продукта МВБЭ (примеси) в конечном продукте - МТБЭ. Учитывая нелинейность ТП, предлагается разработать АВАНС с использованием ПФ в контуре обратной связи для повышения его точности. Рис. 1. Схема технологического процесса: С - смеситель; Р-1 - предреактор; К-1 - ректификационная колонна; РБ - ребойлер; Р-2 - реактор; К-2 - ректификационная колонна; Х - холодильник Подход к построению адаптивных виртуальных анализаторов на основе нейронных сетей с прогнозирующим фильтром в контуре обратной связи Предлагаемый подход состоит из трех шагов, которые описаны ниже. Шаг 1. Разработка виртуального анализатора на основе нейронной сети для оценки концентрации МВБЭ в конечном продукте. При обучении нейронной сети прямого распространения используется метод Байесовской регуляризации. Такой метод сводит к минимуму сумму квадратов ошибок (1): , (1) где - целевое значение, - выход нейросети, N - размер обучающей выборки. Использование целевой функции (1) приводит к переобучению сети. В результате получаются недостоверные результаты на выходе сети. Улучшить обобщающие свойства сети и снизить риск её переобучения можно за счет регуляризации. Основная идея регуляризации сводится к ограничению весовых коэффициентов сети, что приводит к преобразованию целевой функции в (2) [13]: , (2) где - сумма квадратов весовых коэффициентов нейронной сети; и - параметры целевой функции. От отношения параметров и зависит приоритет обучения. Если , алгоритм при обучении стремится уменьшить ошибки, в обратном случае ( ) уменьшаются весовые коэффициенты [13]. Описание алгоритма обучения заключается в следующем: 1. Параметрам целевой функции (2) присваиваются значения , . Инициализация весовых коэффициентов происходит методом Нгуена - Видроу [14]. 2. Минимизируется целевая функция (2) с использованием алгоритма Левенберга - Марквардта [15] в зависимости от приоритета обучения. 3. Вычисление параметра , необходимого для оценки параметров и , по формуле (3): , (3) где M - число параметров сети, H - Гессиан целевой функции. Гессиан вычисляется при помощи Гауссово-Ньютоновской аппроксимации по формуле (4): , (4) где J - Якобиан матрицы ошибок обучающей выборки. 4. Вычисляются оценки параметров и по формулам: , и происходит их сравнение. 5. Пункты 2-4 повторяются до сходимости алгоритма. В качестве функции активации нейронов скрытого слоя используется гиперболический тангенс (5): (5) где - значение, поступающее на вход скрытого нейрона. В выходном слое во всех случаях используется одинаковая функция активации. Выход нейронной сети прямого распространения определяется как (6): , (6) где LW - весовой коэффициент A-R-связи, b2 - смещение выходного слоя, m - количество входных переменных, - i-е значение входной переменной, IWi - i-е значение вектора весовых коэффициентов S-A-связи, b1 - смещение скрытого слоя. Модификацией нейронной сети прямого распространения является каскадная нейросеть прямого распространения. Особенностью этой сети являются дополнительные связи, соединяющие входные нейроны с выходным напрямую [16]. Выход каскадной сети определяется как (7): (7) где m - количество входных переменных, - i-е значение входной переменной, IW2i - i-е значение вектора весовых коэффициентов S-R-связи, LW - весовой коэффициент A-R-связи, b2 - смещение выходного слоя, IW1i - i-е значение вектора весовых коэффициентов S-A-связи, b1 - смещение скрытого слоя. Шаг 2. Построение ПФ для увеличения точности работы виртуального анализатора на основе нейронной сети. ПФ выбран из класса моделей авторегрессии скользящего среднего (АРСС), передаточная функция которого выглядит следующим образом (8): (8) где , - константы, - порядок авторегрессии, - порядок скользящего среднего, - оператор сдвига, - значение в момент времени , - прогноз на момент времени [17]. Применение ПФ в контуре обратной связи заключается в прогнозе ошибки , основанном на ряде известных ошибок в предыдущие моменты времени, и учете этого прогноза до получения следующих лабораторных данных. Ряд ошибок не стационарен, что показывает тест Квятковского - Филлипса - Шмидта - Шина [18], и содержит большое количество выбросов. Для нахождения значений коэффициентов фильтра широкое распространение получил генетический алгоритм (ГА). ГА доказал свою эффективность и обеспечивает нахождение глобального оптимума [19-21]. Построение ПФ сводится к: 1. Выбору порядка фильтра. 2. Нахождению коэффициентов применяемой модели. 3. Тестированию полученной модели при включении ПФ в контур обратной связи ВА. Шаг 3. Построение АВАНС с ПФ в контуре обратной связи. Применяется следующий алгоритм адаптации: 1. Получение вектора выходов нейронной сети на обучающей выборке с использованием матрицы входных переменных X. 2. Обучение ПФ на ошибках между выходами нейросети и соответствующими лабораторными данными . 3. Получение выхода нейронной сети для поступившего наблюдения из тестовой выборки. 4. Формирование новых обучающих выборок X и по принципу «движущегося окна». Новые выборки содержат данные как исходной обучающей выборки, так и данные исходной тестовой выборки. Размеры движущегося окна (mw) составляют: для НСПР , и для КНСПР , . 5. Построение вектора ошибок предыдущих измерений . 6. Получение прогноза ошибки для текущего измерения на основе построенного ранее вектора ошибок. 7. Коррекция полученного выхода нейронной сети . 8. Обучение нейронной сети методом Байесовской регуляризации на выборках X и Y. 9. Вывод скорректированного выхода нейронной сети . 10. Повторение п. 3-9 до прекращения поступления новых наблюдений. Шаг 4. Конец. Результаты и их обсуждение Для построения АВАНС в качестве входных переменных использовались технологические параметры, представленные в табл. 1 (рис. 1). Таблица 1 Технологические параметры, используемые для построения АВАНС № Обозначение Наименование Ед. x(1) FC-54 Поток МеОН в смеситель С м3/с x(2) FC-55 Поток дистиллята в К-2 м3/с x(3) FC-81 Поток жидких продуктов реакции в К-1 м3/с x(4) PD-62 Давление в среднем слое катализатора Р-2 МПа x(5) PD-65 Давление в верхнем слое катализатора Р-1 МПа x(6) TR-164 Температура в верхнем слое катализатора Р-2 °С x(7) TR-169 Температура в верхнем слое катализатора Р-2 °С x(8) TR-175 Температура в среднем слое катализатора Р-2 °С x(9) TR-176 Температура в среднем слое катализатора Р-2 °С x(10) TR-179 Температура в среднем слое катализатора Р-2 °С x(11) TR-183 Температура в нижнем слое катализатора Р-2 °С x(12) TR-185 Температура в нижнем слое катализатора Р-2 °С x(13) TR-187 Температура в нижнем слое катализатора Р-2 °С x(14) TR-218 Температура в среднем слое катализатора Р-1 °С x(15) TR-231 Температура в нижнем слое катализатора Р-1 °С x(16) TR-246 Температура продукта в кубе колонны К-1 °С x(17) TR-254 Температура промывной воды в Х °С x(18) TR-390 Температура паров на выходе К-1 °С На вход нейронной сети прямого распространения, содержащей один скрытый слой, подаются входные переменные (рис. 2). Рис. 2. Структура нейронной сети прямого распространения На рис. 3 представлена структура каскадной нейронной сети прямого распространения. Рис. 3. Структура каскадной нейронной сети прямого распространения Массив данных (1300 измерений) делится на две выборки: обучающую (с 1-го по 640-е наблюдение) и тестовую (с 641-го по 1300-е наблюдение). Тестовая выборка содержит наблюдения, отличные от наблюдений в обучающей выборке, так как была проведена переналадка оборудования в промежутке между наблюдениями в выборках. Ряд ошибок e получается путем разницы значений концентрации МВБЭ, предсказанных ВА на основе нейронной сети, и результатов, полученных в лаборатории. Точность построенных ВА определяется с помощью: коэффициента детерминации - (9) и средней абсолютной ошибки - САО (10): , , (9) , (10) где n - количество элементов в выборке, Y - наблюдаемое значение выхода, y - рассчитанное значение выхода. В табл. 2 приведено сравнение различных моделей ПФ - АРСС (P, Q). Как видно из табл. 2, точнее всего работает модель АРСС (3, 2), так как для обучающей и тестовой выборок достигаются минимальные значения САО. Таблица 2 Результаты вычислений САО для различных моделей ПФ Модель Обучающая выборка Тестовая выборка АРСС(1, 0) 0,0396 0,0422 АРСС(1, 1) 0,0396 0,0412 АРСС(2, 0) 0,0395 0,0427 АРСС(2, 1) 0,0393 0,0432 АРСС(2, 2) 0,0393 0,0409 АРСС(3, 0) 0,0396 0,0394 АРСС(3, 1) 0,0394 0,0423 АРСС(3, 2) 0,0391 0,0393 АРСС(3, 3) 0,0470 0,0441 АРСС(4, 0) 0,0396 0,0401 АРСС(4, 1) 0,0397 0,0411 АРСС(4, 2) 0,0407 0,0423 Таким образом, в качестве ПФ выбрана модель АРСС (3, 2), передаточная функция которой, согласно (8), выглядит следующим образом (11): (11) Коэффициенты в (11) получены при помощи ГА с использованием САО в качестве функции невязки. Как видно из табл. 3, такой подход позволяет значительно уменьшить значения САО в сравнении с наиболее часто используемым алгоритмом минимизации ошибки предсказания (АМОП), который основан на минимизации средней квадратичной ошибки (СКО) прогноза [22]. Таблица 3 Результаты вычислений САО и СКО при определении передаточной функции модели АРСС с использованием ГА и АМОП Метод Обучающая выборка Тестовая выборка САО СКО САО СКО ГА 0,0391 0,0664 0,0393 0,0892 АМОП 0,0448 0,0714 0,0480 0,0904 Матрица входных переменных X на шаге 3, п. 1, определяется (12): , (12) где x - входные переменные в обучающей выборке, - входные переменные в тестовой выборке, mw - размер движущегося окна, N - количество наблюдений в обучающей выборке. Вектор выхода нейронной сети определяется (13): (13) где - выход нейронной сети в обучающей выборке, - выход нейронной сети в тестовой выборке. Вектор истинных значений выхода определяется (14): (14) где - истинные значения выхода в обучающей выборке. Рассчитываются критерии точности (9) и (10) для разработанных АВАНС. Для определения влияния ПФ на повышение точности АВАНС расчёт критериев проводился с включением ПФ в контур обратной связи и без него. Результаты расчета критериев точности АВАНС представлены в табл. 4 для тестовой выборки. Таблица 4 Критерии точности АВАНС для тестовой выборки Метод R2 САО Без прогнозирующего фильтра в контуре обратной связи НСПР и адаптация по принципу «движущегося окна» 0,6952 0,0709 КНСПР и адаптация по принципу «движущегося окна» 0,5620 0,0891 С прогнозирующим фильтром в контуре обратной связи НСПР и адаптация по принципу «движущегося окна» 0,7986 0,0427 КНСПР и адаптация по принципу «движущегося окна» 0,7228 0,0553 ВА на основе НСПР с адаптацией по принципу «движущегося окна» с включением ПФ в контур обратной связи позволяет достичь более точной оценки переменной отклика (табл. 4). На рис. 4 представлен график функционирования наиболее точного АВАНС с применением ПФ и без него на тестовой выборке. Рис. 4. Функционирование разработанных АВАНС на примере технологического процесса производства МТБЭ Включение ПФ в контур обратной связи позволяет повысить R2 на 12,94 % и снизить САО на 39,81 % адаптивного ВА, разработанного на основе НСПР, в сравнении с аналогичным без ПФ. Заключение Представлен подход для разработки адаптивных виртуальных анализаторов на основе нейронных сетей с прогнозирующим фильтром в контуре обратной связи. Предложенный подход протестирован на промышленном технологическом процессе. Адаптация по принципу «движущегося окна» позволила учесть текущий режим технологического процесса, а прогнозирующий фильтр в контуре обратной связи увеличил точность разработанных адаптивных виртуальных анализаторов на основе нейронных сетей. Точность разработанного адаптивного виртуального анализатора на основе нейронной сети прямого распространения увеличилась на 12,94 % (R2) при этом САО снизилось на 39,81 %.About the authors
S. V Stabrov
Far Eastern Federal University
D. V Shtakin
Far Eastern Federal University
S. A Samotylova
Far Eastern Federal University; Institute of Automation and Control Processes Far Eastern Branch of the Russian Academy of Sciences
A. Yu Torgashov
Far Eastern Federal University; Institute of Automation and Control Processes Far Eastern Branch of the Russian Academy of Sciences
References
- Mohanta H.K., Pani A.K. Support vector regression modeling in recursive just-in-time learning framework for adaptive soft sensing of naphtha boiling point in crude distillation unit // Petroleum Science. - 2021. - Vol. 18, iss. 4. - P. 1230-1239. doi: 10.1016/j.petsci.2021.07.001
- Urhan A., Alakent B.Integrating adaptive moving window and just-in-time learning paradigms for soft-sensor design // Neurocomputing. - 2020. - Vol. 392. - P. 23-37. doi: 10.1016/j.neucom.2020.01.083
- Curreri F., Patanè L., Xibilia M.G. Soft sensor transferability: a survey // Applied Sciences. - 2021. - Vol. 11, iss. 16. - Art. 7710. doi: 10.3390/app11167710
- Kadlec P., Gabrys B. Local learning-based adaptive soft sensor for catalyst activation prediction // AIChE Journal. - 2011. - Vol. 57. - P. 1288-1301. doi: 10.1002/aic.12346
- Liu Y., Gao Z., Chen J. Development of soft-sensors for online quality prediction of sequential-reactor-multi-grade industrial processes // Chemical Engineering Science. - 2013. - Vol. 102. - P. 602-612. doi: 10.1016/j.ces.2013.07.002
- Kneale C., Brown S.D. Small moving window calibration models for soft sensing processes with limited history // Chemometrics and Intelligent Laboratory Systems. - 2018. - Vol. 183. - P. 36-46. doi: 10.1016/j.chemolab.2018.10.007
- Kano M., Ogawa M. The state of the art in advanced chemical process control in Japan // IFAC Proceedings. - 2009. - Vol. 42, iss. 11. - P 10-25. doi: 10.3182/20090712-4-TR-2008.00005
- Curreri F., Fiumara G., Xibilia M.G. Input selection methods for soft sensor design: a survey // Future Internet. - 2020. - Vol. 12, iss. 6. - Art. 97. doi: 10.3390/fi12060097
- Yuan X., Zhou J., Wang J. A spatial-temporal LWPLS for adaptive soft sensor modeling and its application for an industrial hydrocracking process // Chemometrics and Intelligent Laboratory Systems. - 2020. - Vol. 197. - Art. 103921. doi: 10.1016/j.chemolab.2019.103921
- Rani A., Singh V., Gupta J.R.P. Development of soft sensor for neural network based control of distillation column // ISA transactions. - 2013. - Vol. 52, iss. 3. - P. 438-449. doi: 10.1016/j.isatra.2012.12.009
- A dynamic CNN for nonlinear dynamic feature learning in soft sensor modeling of industrial process data / X. Yuan, S. Qi, Y. Wang, H. Xia // Control Engineering Practice. - 2020. - Vol. 104. - Art. 104614. doi: 10.1016/j.conengprac.2020.104614
- Soft sensor model for dynamic processes based on multichannel convolutional neural network / X. Yuan, S. Qi, Y.A. Shardt, Y. Wang, C. Yang, W. Gui // Chemometrics and Intelligent Laboratory Systems. - 2020. - Vol. 203. - Art. 104050. doi: 10.1016/j.chemolab.2020.104050
- Foresee F.D., Hagan M.T. Gauss-Newton approximation to Bayesian learning // Proceedings of international conference on neural networks (ICNN'97). - 1997. - Vol. 3. - P. 1930-1935. doi: 10.1109/ICNN.1997.614194
- Nguyen D., Widrow B. Improving the learning speed of 2-layer neural networks by choosing initial values of the adaptive weights // 1990 IJCNN International Joint Conference on Neural Networks. - 1990. - P. 21-26. doi: 10.1109/IJCNN.1990.137819
- Hagan M.T., Menhaj M.B. Training feedforward networks with the Marquardt algorithm // IEEE transactions on Neural Networks. - 1994. - Vol. 5, iss. 6. - P. 989-993. doi: 10.1109/72.329697
- Warsito B., Santoso R., Yasin H. Cascade forward neural network for time series prediction // Journal of Physics: Conference Series. - 2018. - Vol. 1025, iss. 1. - Art. 012097. DOI :10.1088/1742-6596/1025/1/012097
- Box G.E., Jenkins G.M., Reinsel G.C., Ljung G.M. Time series analysis: forecasting and control. - USA: John Wiley & Sons, 2015. - 712 p.
- Hamilton J.D. Time series analysis. - New Jersey: Princeton university press, 2020. - 816 p.
- Onnen C., Babuška R., Kaymak U., Sousa J.M., Verbruggen H.B., Isermann R. Genetic algorithms for optimization in predictive control // Control Engineering Practice. - 1997. - Vol. 5, iss. 10. - P. 1363-1372. doi: 10.1016/S0967-0661(97)00133-0
- Wang Z., Sobey A. A comparative review between Genetic Algorithm use in composite optimisation and the state-of-the-art in evolutionary computation // Composite Structures. - 2020. - Vol. 233. - Art. 111739. doi: 10.1016/j.compstruct.2019.111739
- Qu Y., Ma Z., Clausen A., Jørgensen B.N. A Comprehensive Review on Evolutionary Algorithm Solving Multi-Objective Problems // 22nd IEEE International Conference on Industrial Technology (ICIT). - 2021. - Vol. 1. - P. 825-831. doi: 10.1109/ICIT46573.2021.9453636
- Ljung L. System Identification: Theory for the User. - 2nd Edition. - New Jersey, Prentice Hall PTR, 1999. - 609 p.
Statistics
Views
Abstract - 166
PDF (Russian) - 167
Refbacks
- There are currently no refbacks.