USING THE ALGORITHM OF CONDITIONAL ALTERNATING MATHEMATICAL EXPECTATIONS TO MATHEMATICAL MODELS DESIGN TO ESTIMATE THE QUALITY INDICATORS OF OUTPUT PRODUCTS

Abstract


In order to increase production efficiency and improve the quality of an output product, the problem of mathematical models designs for estimating the quality indicators of output products in conditions of nonlinearity of the technological process is considered. The use of existing parametric approaches in the design of such models is limited by the need to obtain an analytically specified functional dependence (known the model structure) with a sequential refinement of the values of its coefficients. In turn, this leads to obtaining a mathematical model for estimating the quality indicators of output products of low-accuracy. In the case of nonlinearity of the technological process, the most promising are nonparametric methods such as the algorithm of alternating conditional mathematical expectations. It is proposed to use an algorithm of conditional alternating mathematical expectations to determine the structure of relationships between variables, the form of which is initially unknown and to identify nonlinear functional dependencies based on transformations of the variables used. The effectiveness of the proposed approach in designing a mathematical model using a synthetic example is shown. The proposed approach was tested on a mass-transfer technological object of the production process of a high-octane gasoline additive - methyl-tert-butyl ether. It was possible to improve the accuracy of the mathematical model for estimating the concentration of methanol in the output product up to 67.2 % MAE in comparison with the model obtained by the neural network.

Full Text

Введение В связи с повышающимися требованиями к качеству основных видов нефтепродуктов предприятия нефтеперерабатывающей и нефтехимической промышленности вынуждены непрерывно повышать экономическую эффективность производства и качество выпускаемой продукции. Эффективность производства может быть улучшена с помощью систем виртуального мониторинга и контроля показателей качества выходного продукта. Для этого необходима разработка точных математических моделей для оценки показателей качества выходных продуктов (ММОПК), описывающих нелинейные процессы, проходящие в ректификационных колонах (РК). Для построения ММОПК используются результаты лабораторных исследований и данные со встроенных измерительных приборов ректификационных колонн (РК). Если включить адекватную математическую модель для оценки качества выходного продукта РК в систему усовершенствованного управления технологическим процессом (СУУТП), то возможен мониторинг и контроль технологического процесса (ТП) в режиме реального времени. Методы, используемые для построения ММОПК выходных продуктов ректификационных колонн, можно разделить на два типа: параметрические и непараметрические. К параметрическим относятся регрессионные методы, такие как метод наименьших квадратов [1, 2], робастная регрессия [3, 4], гребневая регрессия [5-9], проекции на скрытые (латентные структуры) [10-12] и т.д. Такой подход построения ММОПК основан на предположении о возможности получения аналитически заданной функциональной зависимости (известной или заданной структуры) с последовательным уточнением значений ее коэффициентов. В реальных условиях большинство массообменных технологических объектов являются слабо формализуемыми из-за недостаточности имеющихся знаний о них и среде, в которой они функционируют, поэтому такой подход обычно не вносит ясности в выбор структуры модели. В случае нелинейности технологического процесса наиболее перспективными являются непараметрические методы [13], в частности нечеткая логика, искусственные нейронные сети (НС) [14] и алгоритм чередующихся условных математических ожиданий. Математические модели, построенные с помощью нечетких алгоритмов, часто успешно подходят для построения моделей сложных объектов, в которых входные данные могут быть неточными и слабо формализованными [15-17]. Основными недостатками такого подхода являются сложность и субъективность формирования правил нечеткой логики, на основе которых будет функционировать модель, а также выбор вида и параметров ее функций принадлежности. Для этого требуются эмпирические знания об объекте исследования и широкая обучающая выборка данных. Подход к построению ММОПК на основе нейронных сетей хорошо зарекомендовал себя для объектов, имеющих выраженные связи выходной переменной с входными. В случае, когда такие связи неявные (слабые), требуются дополнительные исследования, направленные на определение структуры и параметров прогнозирующего алгоритма нейронных сетей, от которых зависит успешность разрешения поставленной задачи [18]. Наиболее универсальным является вероятностный метод оценки идентифицируемости зависимостей из данных источника [19], однако он имеет существенный недостаток, заключающийся в невозможности извлечь характер (вид) нелинейных зависимостей. В связи с этим представляется перспективным использование непараметрических методов [13, 14] в интеллектуальном анализе данных, в частности алгоритма АСЕ (Alternating Conditional Expectation), так как появляется возможность понимания структуры нелинейностей. Алгоритм условных чередующихся математических ожиданий позволяет находить сложные зависимости входных переменных к выходным, определить структуру связей, вид которых первоначально неизвестен, и выявить нелинейные функциональные зависимости на основе преобразований используемых переменных [20-26]. В работах [27-30] приводятся результаты успешного применения данного метода для построения математических моделей для слабо формализованных объектов, но они ограничиваются выявлением структуры зависимостей выходных данных ко входным и построением модели с использованием этой информации. При этом применяются аппроксимирующие функции, параметры которых подбираются [31]. Других способов применения алгоритма АСЕ в предсказательном моделировании не встречалось. В работе предлагается использовать алгоритм АСЕ для построения математических моделей на основе экспериментальных данных, для оценки показателей качества выходных продуктов ректификационных колонн в условиях структурной неопределенности модели технологического объекта. 1. Алгоритм построения математических моделей для оценки показателей качества выходных продуктов Рассматривается объект, функционирующий в условиях неопределенности с p входными, контролируемыми переменными и выходом Y, связанными некоторой функциональной зависимостью: , (1) где - вектор входных контролируемых переменных, ; - вектор коэффициентов, ; - действующее на выходе неконтролируемое возмущение. В случае, когда вид истинной зависимости (структуры) F в формуле (1) неизвестен, приходится выбирать структуру, опираясь на имеющуюся априорную информацию об исследуемом объекте, и обращаться к регрессионным моделям вида , (2) где - предсказанное значение, соответствующее j-му значению выходной переменной Y; , , - некоторые функции входных контролируемых переменных ; - оценки коэффициентов из формулы (1). При этом их возможное количество в общем случае может быть бесконечным, но заранее неизвестно, удастся ли выбрать среди них модель, адекватно описывающую зависимость (1) в условиях заданных ограничений на функционирование объекта. При использовании алгоритма АСЕ переходим от модели вида (1) к выражению , (3) где q - функция выходной переменной U; - функции входов ; e - ошибка. Исходя из прямой аналогии с базовым ACE алгоритмом, минимизируем выражение (4) сохраняя , на протяжении серий минимизаций единичной функции, включающих двумерные условные математические ожидания. Для заданного набора функций минимизация выражения (4) в отношении к . (5) Следующий шаг - это минимизация выражения (4) в отношении к при заданном . Для этого минимизируем выражение (4) в отношении единичной функции при данном и определенном наборе . Решением является . (6) Алгоритм для построения математических моделей с целью оценки показателей качества выходных продуктов можно представить следующим образом: input: присвоить и while не перестанет убывать; while не перестанет убывать; for end end end output: , будут решениями для , . Цель алгоритма заключается в получении оптимальных преобразований . Среднеквадратичная ошибка : 2. Вычислительный эксперимент и анализ результатов Предложенная методика иллюстрируется синтетическим примером со сложной нелинейной структурой и применена для промышленного технологического объекта. При построении ММОПК важно решить такие задачи, как выбор регрессионного метода, обеспечивающего наилучшую точность, и выбор существенных (с точки зрения влияния на выходные показатели) входных переменных. Для этого приходится учитывать, что рассматриваемая промышленная ректификационная колонна функционирует в режиме, близком к предельному (захлебывание), а это существенно усложняет процесс построения ММОПК из-за нелинейности физико-химической модели данного режима. Синтетический пример. Пусть объект задается функциональной зависимостью вида: (7) По уравнению (7) и входным переменным , на которые наложены ограничения формируется выборка объемом K = 500, представляющая матрицу размером (K´5). Применяя алгоритм АСЕ к расширенной выборке, формируем базовый набор векторов оптимальных преобразований , графически представленный на рис. 1 и свидетельствующий о достаточно точно найденной структуре модели. По полученному представлению о парных отношениях (см. рис. 1) можно сделать вывод, что параметрические методы построения модели практически неэффективны. В свою очередь, применение алгоритма ACE позволяет восстановить соответствующий вид функции в уравнении (7). В случае отсутствия нелинейных зависимостей алгоритм ACE предлагает линейные преобразования, что приводит к хорошим результатам. Предлагаемый алгоритм построения математической модели для оценки показателей качества выходных продуктов сравнен с математическими моделями, полученными: нейронной сетью прямого распространения с одним скрытым слоем (НС-1), прямого распространения с пятью скрытыми слоями (НС-2) и обобщенно-регрессионной нейронной сетью (НС-3). В качестве обучающего алгоритма выбран алгоритм Левенберга - Марквардта [32]. Рис. 1. Оптимальные преобразования алгоритма АСЕ к синтетическим данным Сравнительный анализ проводили на основе критериев точности математической модели: коэффициента детерминации R2 средней абсолютной ошибки MAE на обучающей и проверочной выборках (табл. 1). По результатам, представленным в табл. 1, показано, что наиболее точно описывает исследуемый МТП непараметрическая модель, построенная на основе алгоритма ACE, по сравнению с другими методами. Результат применения непараметрической модели, построенной на основе алгоритма ACE, и данные модели (7) приведены на рис. 2. Таблица 1 Значения R2 и MAE для математических моделей, полученных различными методами Метод получения ММОПК Обучение Проверка MAE MAE НС-1 0,3168 0,9816 0,3139 0,9534 НС-2 0,5402 0,5739 0,5588 0,5928 НС-3 0,6936 0,6541 0,3860 0,9215 На основе алгоритма ACE 0,9996 0,0028 0,9709 0,1254 Рис. 2. Функционирование непараметрической модели на проверочной выборке Из рис. 2 можно сделать вывод, что получена точная математическая модель, о чем свидетельствуют критерии точности, приведенные в табл. 1, например . 3. Построение математической модели для оценки показателей качества выходного продукта на основе экспериментальных данных Эффективность предлагаемого подхода продемонстрирована на промышленном технологическом объекте - ректификационной колонне К-1 процесса производства высокооктановой добавки бензинов - метил-трет-бутилового эфира (МТБЭ). Схема РК К-1 и процесс массообмена в ней представлены на рис. 3. Рис. 3. Схематическое изображение процесса производства МТБЭ При осуществлении синтеза МТБЭ особое внимание уделяется выбору соотношения изобутилен-метанол. Определение и поддержание соотношения компонентов осуществляется на основании опыта технолога. Неправильно заданное количество метанола приводит к перерасходу исходного сырья, недополучению готовой продукции и снижению ее качества. По окончании процесса выход МТБЭ должен составлять 98 %. Основным показателем качества процесса является содержание метанола в МТБЭ. Для исследуемого объекта необходимо построить математическую модель с целью оценки концентрации метанола в нижнем (выходном) продукте при неизвестной структуре. Массовая доля метанола не должна превышать 1,5 % в товарном продукте МТБЭ по техническому регламенту. Номинальные значения четырех технологических параметров (входных переменных) РК К-1, используемых при создании математической модели для оценки содержания метанола в МТБЭ, приведены в табл. 2. Таблица 2 Наименование технологических переменных РК К-1 процесса производства МТБЭ № п/п Наименование переменных Обозначение Номинальные значения x1 Температура низа РК, °С Тнк1 136,00 x2 Давление низа РК, МПаг Рнк1 0,72 x3 Температура на 5-й тарелке РК, °С Т5т 125,00 x4 Температура верха РК, °С Твк1 60,00 Для построения математической модели с целью оценки концентрации метанола в нижнем продукте в качестве входных переменных модели использованы: - температура низа колонны К-1, °С (Тнк1) и - давление низа колонны К-1, МПаг (Рнк1). Применяя алгоритм АСЕ к экспериментальным данным, формируем базовый набор векторов оптимальных преобразований , графически представленный на рис. 4. Рис. 4. Оптимальные преобразования алгоритма АСЕ к экспериментальным данным технологического процесса Следует отметить, что алгоритм ACE не будет работать с экспериментальными данными так же хорошо, как на синтетическом примере. Это может быть связано с тем, что: а) зависимая переменная имеет более низкую связь с предикторами; б) предикторы существенно коррелированы; в) данные содержат погрешности измерений, и др. Из рис. 4 видно, что исследуемый объект нелинейный, и применение алгоритма ACE позволяет найти некоторый вид существующей функциональной зависимости. В табл. 3 представлены R2 и MAE математических моделей для оценки метанола в МТБЭ, полученных различными методами. Таблица 3 Значения R2 и МАЕ для математических моделей с целью оценки концентрации метанола в выходном продукте Метод получения ММОПК Обучение Проверка MAE MAE НС-1 0,6078 0,1725 0,7382 0,1548 НС-2 0,9875 0,0258 0,7439 0,0918 НС-3 0,6100 0,1298 0,6940 0,1102 На основе алгоритма ACE 0,9996 0,0032 0,9820 0,0301 По результатам, представленным в табл. 3, показано, что наиболее точную оценку содержания метанола в МТБЭ дает непараметрическая модель, построенная на основе алгоритма ACE, в сравнении с другими методами. Из рис. 5 видно, что использование непараметрической модели, построенной на основе алгоритма ACE, для оценки содержания метанола в высокооктановой добавке к бензинам на проверочной выборке позволяет достаточно точно описать исследуемый процесс. Рис. 5. Оценка концентрации метанола в МТБЭ на основе непараметрической модели При использовании предложенного подхода результат работы математической модели для оценки показателей качества выходного продукта точнее на в сравнении с НС-2 по критерию MAE (см. табл. 3). Заключение Предложен подход для построения математических моделей с целью оценки качества выходных продуктов с использованием непараметрического алгоритма АСЕ, что позволило повысить точность математической модели в условиях структурной неопределенности. Эффективность предложенного подхода продемонстрирована на синтетическом примере. Показан достаточно точный вид структуры модели с использованием векторов оптимальных преобразований. Предложенный подход протестирован на технологическом процессе производства МТБЭ и позволил повысить точность математической модели для оценки концентрации метанола в выходном продукте до 67,2 % MAE в сравнении с моделью, полученной методом нейронной сети прямого распространения с пятью скрытыми слоями, на проверочной выборке.

About the authors

I. S Mozharovskii

Vladivostok State University of Economics and service; Institute of Automation and Control Processes Far Eastern Branch of the Russian Academy of Sciences

S. A Samotylova

Institute of Automation and Control Processes Far Eastern Branch of the Russian Academy of Sciences; Far Eastern Federal University

E. S Baulin

LLL “Center of Digital Technology”

References

  1. Greene W.H. On the asymptotic bias of the ordinary least squares estimator of the Tobit model // Econometrica. - 1981. - Vol. 49, no. 2. - P. 505-513.
  2. Khatibisepehr S., Huang B. Dealing with irregular data in soft sensors: bayesian method and comparative study // Ind. Eng. Chem. Res. - 2008. - Vol. 47. - P. 8713-8723.
  3. Berger B. Robust Gaussian process modelling for engine calibration / B. Berger, F. Rauscher // IFAC Proceeding Volumes [Proceedings of the 7th Vienna International Conference on Mathematical Modelling. Vienna, Austria, 14-17 February, 2012]. - Vienna, Austria, 2012. - Vol. 45, iss. 2. - P. 159-164. doi: 10.3182/20120215-3-AT-3016/0028.
  4. Cateni S., Colla V., Vannucci M. Outlier detection methods for industrial applications // Advances in Robotics, Automation and Control / Ed. by J. Arámburo, A.R. Trevino. - Vienna: I-Tech, 2008. - P. 265-282.
  5. Marquardt D., Snee R. Ridge regression on practice // The American statistician. - 1975. - Vol. 29, no 1. - P. 37-41.
  6. Khalaf G., Shukur G. Choosing ridge parameter for regression problems // Communications in Statistics. - Theory and Methods. - 2005. - Vol. 34. - P. 1177-1182.
  7. Saunders C., Gammerman A., Vovk V. Ridge regression learning algorithm in dual variables // Proceedings of the 15th International Conference on Machine Learning (ICML 1998), Madison, Wisconsin, USA, July 24-27, 1998. - San Francisco: Morgan Kaufmann Publishers Inc., 1998. - P. 515-521.
  8. Hoerl A., Kennard R. Ridge regression: biased estimation for nonorthogonal problems // Technometrics. - 1970. - Vol. 12, no 1. - P. 55-67.
  9. Yan X. Modified nonlinear generalized ridge regression and its application to develop naphtha cut point soft sensor // Computers and Chemical Engineering. - 2008. - Vol. 32. - P. 608-621.
  10. Wold S., Sjostrom M., Eriksson L. PLS-regression: a basic tool of chemometrics // Chemometrics and Intelligent Laboratory System. - 2001. - Vol. 58. - P. 109-130.
  11. De Jong S. SIMPLS: An Alternative Approach to Partial Least Squares Regression // Chemometrics and Intelligent Laboratory Systems. - 1993. - Vol. 18. - P. 251-263.
  12. Souza F.A., Araujo R. Mixture of partial least squares experts and application in prediction settings with multiple operating modes // Chemometrics and Intelligent Laboratory Systems. - 2014. - Vol. 130. - P. 192-202.
  13. Data-based identifiability analysis of non-linear dynamical models / S. Hengl, C. Kreutz, J. Timmer, T. Maiwald // Bioinformatics. - 2007. - Vol. 23, no. 19. - P. 2612-2618.
  14. Di Ciaccio A., Montanari G.E. Non-parametric methods for data-mining applications // Atti della XLI Riunione Scientifica Della Societa Italiana di Statistica. Sessioni Plenarie e Sessioni Specializzate. CLEUP - Padova, 2002. - P. 339-348.
  15. Tun M.S., Lakshminarayanan S., Emoto G. Data selection and regression method and its application to soft sensing using multi rate industrial data // Chemical Engineering of Japan. - 2008. - Vol. 41, no 5. - P. 374-383.
  16. Kadlec P., Gabrys B., Strandt S. Data-driven soft sensors in the process industry // Computers & Chemical Engineering. - 2009. - Vol. 33. - P. 795-814.
  17. Genetic fuzzy system for data-driven soft sensors design / J. Mendes, F. Souza, R. Araújo, N. Goncalves // Applied Soft Computing. - 2012. - Vol. 12. - P. 3237-3245.
  18. Angelov P., Filev D. An approach to on-line identification of evolving Takagi-Sugeno models // IEEE Trans. on Systems, Man and Cybernetics. - 2004. - Vol. 34, no 1. - P. 484-498.
  19. Sedoglavic A. A probabilistic algorithm to test local algebraic observability in polynomial time // Journal of Symbolic Computation. - 2002. - Vol. 33, no. 5. - P. 735-755.
  20. Daş M.T., Dülger L.C. Off-line signature verification with PSO-NN algorithm // 2007 22nd International Symposium on Computer and Information Sciences, Ãnkara, Turkey, 7-9 November 2007. - IEEE, 2007. - Art. 9940017. doi: 10.1109/ISCIS.2007.4456842
  21. Box G.E.P., Tidwell P.W. Transformation of the independent variables // Technometrics. - 1962. - Vol. 4, no 4. - P. 531-550.
  22. Anscombe F.J., Tukey J.W. The examination and analysis of residuals // Technometrics. - 1963. - Vol. 5, no 2. - P. 141-160.
  23. Box G.E.P., Cox D.R. An analysis of transformations // Journal of the Royal Statistical Society. Series B (Methodological). - 1964. - Vol. 26, no. 2. - P. 211-252.
  24. Kruskal J.B. Analysis of factorial experiments by estimating monotone transformations of the data // Journal of the Royal Statistical Society. Series B (Methodological). - 1965. - Vol. 27, no 2. - P. 251-263.
  25. Draper N.R., Cox D.R. On distributions and their transformation to normality // Journal of the Royal Statistical Society. Series B (Methodological). - 1969. - Vol. 31, no 3. - P. 472-476.
  26. Box G.E.P., Hill W.J. Correcting inhomogeneity of variance with power transformation weighting // Technometrics. - 1974. - Vol. 16, no 3. - P. 385-389.
  27. Walter E., Pronzato L. On the identifiability and distinguishability of nonlinear parametric models // Mathematics and Computers in Simulation. - 1996. - Vol. 42. - P. 125-134.
  28. Bellman R., Astrom K.J. On structural Identifiability // Mathematical Biosciences. - 1970. - Vol. 7, no 3/4. - P. 329-339.
  29. Chapppell M.J., Godfrey K.R. Structural Identifiability of the parameters of a nonlinear batch reactor model // Mathematical Biosciences. - 1992. - Vol. 108. - P. 241-251.
  30. Cobelli C., Distefano J.J. Parameter and structural identifiability concepts and ambiquities: a critical review and analysis // American Physiological Society. - 1980. - Vol. 239, no 1. - P. 7-24.
  31. Wang D., Murphy M. Estimating optimal transformations for multiple regression using the ACE algorithm // Journal of Data Science. - 2004. - Vol. 2. - P. 329-346.
  32. Ranganathan A. The levenberg-marquardt algorithm // Tutoral on LM Algorithm. - 2004. - Vol. 11, no. 1. - P. 101-110.

Statistics

Views

Abstract - 5

PDF (Russian) - 3

Refbacks

  • There are currently no refbacks.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies