FINITE DIFFERENCES METHOD FOR SOCIO-ECONOMIC MODELING

Abstract


In the issue we consider socio-economic processes modeling based on first and second order finite differences models. Since commonly used modeling methods have drawbacks and thus are not universal it was necessary to develop alternative methods which are better in some aspects. Specifically multiple linear regression models have limited prediction abilities, and differential regression coefficient evaluation method is quite complex and have some economically uninterpreted excess tunings. In our research we replaced first and second order derivatives in differential regression models with their finite differences equivalents and thus gained a multiple linear regression model modification which includes first and second order auto regression items. Estimation of their parameters can be done using a modification of least-squares method in which we demand that factor coefficients signs for models with and without auto regression items are the same. Due to additional items in the modified linear regression models their approximation capacity is greater than of a common model. However for application purposes model forecasting capacity is more important, i.e. the forecasting efficiency criterion is the most significant for a decision making. In order to estimate forecasting potential of modified multiple linear regression models we performed coefficient estimation of unmodified and modified equations for 59 various socio-economic data sets. We used shortened time series, so we could calculate model values and compare them to actual data. It was determined that modified multiple linear regression models allowed to make better predictions in 49 (76.3 %) cases. We can now assume that addition of auto regression items into multiple linear regression model can increase short-term forecasting efficiency.

Full Text

Введение В настоящее время для принятия обоснованных управленческих решений в социально-экономических системах используются различные математические методы. Достаточно распространенной темой публикаций отечественных и зарубежных авторов является прогнозирование социально-экономических систем с применением линейных многофакторных моделей (ЛММ). Так, в источнике [1] построена линейная многофакторная модель, которая описывает динамику безработицы в РФ, выявлены закономерности изменения зависимости безработицы от начисленной заработной платы и доли занятых лиц. В работе [2] с помощью многофакторной линейной регрессии построена модель зависимости валового регионального продукта Краснодарского края от ключевых социально-экономических показателей региона. Авторы статьи [3] с помощью ЛММ получили прогноз энергопотребления РФ, а также выявили закономерности изменения динамики энергопотребления в зависимости от включенных в модель факторов. В статье [4] проведен анализ фактических данных о величине доли студентов, использующих образовательный кредит, и построена многофакторная модель линейной регрессии, на основе которой были вычислены прогнозные значения результативного признака. Авторы работы [5] модернизировали прогностические регрессионные модели в условиях расширения знаний о новой коронавирусной инфекции COVID-19. В источнике [6] предложена модель множественной линейной регрессии для прогнозирования активных случаев в ежедневных данных COVID-19 Индии и штата Одиша. В источнике [7] смоделировано грузовое производство сельскохозяйственных товаров в Индии с использованием множественной линейной регрессии. Авторы работы [8] приводят сравнение моделей «случайного леса» и множественной линейной регрессии для оценки активности внеклеточных ферментов почв Китая. Преимуществами данного метода являются простота построения модели и наличие экономической интерпретации ее коэффициентов. При этом прогнозирование на основании моделей данного типа дает недостаточно качественный результат, особенно в условиях существенной волатильности (вариации) входящих в модель показателей. С развитием компьютерной техники все большее распространение получает моделирование на основе панельных данных, являющееся развитием регрессионных моделей и позволяющее одновременно моделировать динамику и структуру изучаемых объектов. Авторы статьи [9] используют модель сглаженной квантильной регрессии для изучения асимметричного воздействия денежно-кредитной политики на деловой цикл с использованием данных по 40 странам. В источнике [10] предлагается новый интегрированный подход для оценки моделей панельных данных, когда ненаблюдаемые индивидуальные эффекты входят в модель нелинейно, причем данная методология работает даже в краткосрочных панелях среднего размера как в статических, так и в динамических моделях. В работе [11] предпринята попытка оценки роли природных ресурсов для международной торговли и финансового развития территорий на основании статистического анализа панельных данных по 30 различным странам, однако анализ проводится на макроуровне, а единый набор факторов в модели не позволяет учитывать специфику конкретного субъекта хозяйствования. Реализация данного метода предполагает составную структуру объекта исследования (например, регионы федерального округа), метод не может быть использован на уровне единичного (отдельного) объекта. Кроме того, ряд авторов используют регрессионно-дифференциальные модели для прогнозирования социально-экономических систем. Так, в статье [12] выбрана регрессионно-дифференциальная модель 2-го порядка, смоделированы показатели развития индекса человеческого развития на примере Германии. Авторы работы [13] построили модель на основе обыкновенного дифференциального уравнения 2-го порядка для осуществления прогноза развития горнодобывающей промышленности Пермского края. В работе [14] постороена регрессионно-дифференциальная модель 1-го и 2-го порядков, осуществлен прогноз реализации хлористого калия ПАО «Уралкалий» на внутреннем рынке. Авторы работы [15] на основании регрессионно-дифференциальной модели 2-го порядка получили прогноз факторов и динамики изменения туризма в Турции. В статье [16] разработана экономико-математическая модель на базе дифференциального уравнения 2-го порядка, позволяющая использовать статистические данные и прогнозировать тренд инвестиционной и строительной деятельности Российской Федерации. Авторы работы [17] исследуют модель ценового динамического равновесия, основанную на дифференциальном уравнении волны вероятности цены и объема на китайском фондовом рынке. Преимуществами данного метода являются достаточно высокое качество прогнозирования, а также присутствие в модели слагаемых, позволяющих учесть скорость изменения моделируемых процессов во времени, в результате чего динамика показателя оказывается более точной. Однако построение таких моделей является сложным процессом, имеющим большое количество настроек, часть из которых не может быть обоснована теоретически или эмпирически (наличие времени запаздывания влияния контролируемых факторов на зависимый показатель [18]), а практическая реализация метода требует специального программного обеспечения. В источнике [19] авторы применяют методы опорных векторов и дифференциальной эволюции для построения регрессионной модели прогнозирования уровня сахара в крови. В статье [20] исследуется точность прогнозов поставок материнских плат тайваньских производителей посредством опорной модели векторной регрессии с алгоритмом дифференциальной эволюции. Метод опорных векторов имеет смысл применять в задачах большой размерности; в случае малого числа факторов и наблюдений его использование нецелесообразно. Таким образом, существуют различные методы моделирования и прогнозирования экономических процессов, каждый из которых имеет как преимущества, так и недостатки и ограничения в использовании. Наиболее распространенными из них являются регрессионные - множественные линейные и дифференциальные. В данном исследовании сделана попытка разработки комплексного метода на основании ЛММ и РДМ, объединяющего их преимущества и лишенного недостатков. При этом в качестве базы сравнения при разработке и исследовании комплексного метода целесообразно рассматривать его отдельные составляющие. Такой метод представляет существенный интерес как с научной, так и с прикладной точки зрения, поскольку позволяет прогнозировать значения моделируемых показателей в краткосрочной перспективе, а значит, принимать обоснованные решения для целей управления ими. Разработка метода предполагает анализ данных официальной статистики с целью формирования информационной базы исследования, разработку конкретной экономико-математической модели, позволяющей как адекватно описывать имеющиеся данные, так и делать на их основе краткосрочные прогнозы приемлемого качества. 1. Теория В рамках данной статьи нашей задачей является построение модификации множественной линейной модели путем включения в нее авторегрессионных слагаемых 1-го и 2-го порядков и проверки ее лучших аппроксимационных и прогностических свойств по сравнению с базовой линейной моделью. Разработку и проверку работоспособности соответствующего метода выполним на основании имеющихся в нашем распоряжении 59 наборов статистических данных, характеризующих экономические объекты различной природы. На основании этих данных были построены модели ЛММ и их соответствующие модификации и выполнено их сравнение, при этом особое внимание уделялось качеству, адекватности объясняющих свойств и экономической интерпретации полученных на их основании результатов. На основании статистических данных могут быть построены различные модели экономических объектов. Наиболее простой и часто используемой является линейная многофакторная модель (ЛММ), в общем случае имеющая вид Yрасч(tk) = a + c1X1(tk) + c2X2(tk) +…+ cpXp(tk) = , (1) где tk - момент времени, k = 1, 2, …, K; Yрасч(tk) - расчетное значение моделируемой величины в момент времени tk; a - постоянная линейной многофакторной модели, определяющая уровень моделируемой величины при нулевых значениях факторов; Xi(tk) - значения факторов, определяющих значение моделируемой величины, в момент времени tk, i = 1,2, …, m; ci - коэффициенты линейной множественной модели, показывающие, на сколько изменится моделируемая величина при увеличении соответствующего фактора Xi на 1. Для определения коэффициентов модели по статистическим данным - набору векторов вида Y(tk), X1(tk), X2(tk),…, Xp(tk), k = 1, 2, …, K, - минимизируется сумма квадратов отклонений фактических и модельных значений вида . (2) Для целей прогнозирования хорошо зарекомендовали себя регрессионно-дифференциальные модели 1-го и 2-го порядков, имеющие соответственно вид (3) и (4) где a - константа, характеризующая влияние второй производной d2Y(tk)/dt2 при построении тренда; b - коэффициент обратной связи, отражающий влияние моделируемой величины Y(t) на ее вторую производную d2Y(tk)/dt2; d - коэффициент обратной связи, отражающий влияние производной моделируемой величины dY(tk)/dt на ее вторую производную d2Y(tk)/dt2; ci - коэффициент влияния факторов, i = 1,2,…,m. Неизвестными являются все коэффициенты (a, b, ci, d) и начальное условие Y'0 для РДМ 2-го порядка. Их определение представляет собой решение задачи безусловной минимизации суммы квадратов отклонений фактических значений моделируемой величины Y(t) в заданные моменты времени tk, k = 1,2,…,K, от соответствующих модельных значений Yрасч(t), т.е. (Y'0, a, b, ci, d): S(Y'0, a, b, ci, d) = ®min. Поскольку моделирование осуществляется по статистическим данным, информация о функции Y(t) и ее производных ограничена имеющимся набором значений Y(tk), k = 1, 2,…,K. Из численных методов известно, что оценка первой и второй производных функции может быть выполнена по формулам, основанным на конечных разностях: , (5) (6) . (6¢) Подставляя формулу (6') в формулу (3), получим . В силу того, что временной шаг по статистическим данным составляет 1 год, т.е. ∆t = 1, выражая из полученного уравнения Y(tk), получим (7) Аналогично подставляя формулы (5) и (6) в формулу (4), получим . При ∆t = 1 имеем , откуда . (8) Понятно, что Y(tk-1) представляют собой значение моделируемой величины в момент времени, предшествующий текущему значению Y(tk), а Y(tk-2) есть значение моделируемой величины в момент времени, предшествующий Y(tk-1). Очевидно, что выражение (7) представляет собой сумму правой части множественной линейной модели (1) и величины, пропорциональной Y(tk-1), а выражение (8) есть сумма правой части (1) и величин, пропорциональных Y(tk-1) и Y(tk-2). Это означает, что значения моделируемой величины зависят от их уровней в предшествующие моменты времени, а переход к разностным оценкам производных в РДМ позволил получить модификации ЛММ с авторегрессионными слагаемыми 1-го и 2-го порядков. Оценка параметров полученных уравнений, как и в случае ЛММ, может быть выполнена с помощью метода наименьших квадратов путем минимизации функционала (2). 2. Данные и методы Назовем уравнения (7) и (8) конечно-разностными моделями 1-го и 2-го порядков (КРМ-1 и КРМ-2) соответственно. Наличие в КРМ дополнительных объясняющих факторов позволяет утверждать, что они обладают лучшими аппроксимационными свойствами по сравнению с ЛММ. Однако с практической точки зрения больший интерес представляют прогностические свойства моделей и интерпретируемость оценок их параметров. Поскольку КРМ-1 и КРМ-2, по сути, представляют собой сумму ЛММ и авторегрессионных моделей 1-го и 2-го порядков соответственно, для оценки коэффициентов КРМ целесообразно использовать следующий алгоритм: - на основании имеющихся статистических данных выполнить корреляционный анализ изучаемого показателя Y и определяющих его значение факторов Xi; - на основании результатов корреляционного анализа исключить из модели факторы с высокой взаимной корреляцией, что позволяет обеспечить интерпретируемость коэффициентов и их качественную оценку; - путем минимизации выражения (2) оценить неизвестные коэффициенты ЛММ a и ci, i = 1,2, …, m, проверить соответствие их значений и знаков сущности и специфике изучаемого объекта; - путем минимизации выражения (2) при условии сохранения коэффициентами a и ci, i = 1,2, …, m, знаков, полученных для ЛММ, оценить неизвестные коэффициенты моделей КРМ-1 и КРМ-2. Отметим, что мультиколлинеарность в экономических моделях приводит к несостоятельности оценок их параметров только в сочетании с иными негативными факторами [21]. При этом исключение тесно коррелированных факторов только на основании анализа парных коэффициентов корреляции не всегда корректно [22]. Таким образом, отбор факторов в модель выполнялся для каждого объекта исследования исходя из экономических соображений с учетом результатов анализа матрицы парных коэффициентов корреляции [23]. Оценка неизвестных параметров ЛММ и КРМ была выполнена средствами Visual Basic for Applications в MS Excel. Оценка прогностических свойств КРМ была выполнена следующим образом: - рассчитана относительная погрешность прогноза с использованием ЛММ как отношение разности фактического и модельного значений изучаемого показателя к его фактическому уровню, выраженное в процентах; - рассчитана относительная погрешность прогноза с использованием КРМ как отношение разности фактического и модельного значений изучаемого показателя к его фактическому уровню, выраженное в процентах; - показатель качества прогнозирования с использованием КРМ был рассчитан как частное от деления относительной погрешности прогнозирования КРМ на относительную погрешность прогнозирования ЛММ, умноженное на 100 %. 3. Полученные результаты Как уже отмечалось ранее, проверка применимости КРМ для прогнозирования социально-экономических процессов была выполнена на основании 59 наборов данных различной природы с исключенными по результатам корреляционного анализа тесно связанными факторами. В результате реализации алгоритма оценки коэффициентов конечно-разностных моделей были выполнены постпрогнозы и построены сравнительные графики для ЛММ, КРМ-1 и КРМ-2 с постпрогнозами на 1 (рис. 1) и 2 года (рис. 2). Сравнительный анализ по совокупности данных позволил установить, что в подавляющем большинстве случаев на основании КРМ удается добиться лучшего качества прогнозирования, а именно: - в 76,3 % случаев хотя бы один прогноз КРМ оказывается лучше, чем ЛММ; - в 22,0 % случаев все прогнозы КРМ оказываются лучше, чем ЛММ; - в 35,6 % случаев оба КРМ-прогноза на 2 года оказываются лучше ЛММ; - в 39,0 % случаев оба КРМ-прогноза на 1 год оказываются лучше ЛММ; - в 32,2 % случаев оба КРМ-1 прогноза оказываются лучше, чем ЛММ; - в 35,6 % случаев оба КРМ-2 прогноза оказываются лучше ЛММ. Рис. 1. Пример прогнозирования экономико-статистического показателя на 1 год: исходные данные; ЛММ; КРМ-1; КРМ-2 Рис. 2. Пример прогнозирования экономико-статистического показателя на 2 года: исходные данные; ЛММ; КРМ-1; КРМ-2 Заключение Таким образом, разработанная в рамках исследования модификация ЛММ с авторегрессионными слагаемыми 1-го и 2-го порядков показала свою лучшую работоспособность в 49 случаях из 59 рассмотренных наборов данных. По результатам оценки значений коэффициентов моделей и прогнозирования на их основе оказалось, что в 76,3 % случаев по крайней мере один из КРМ-прогнозов оказывается точнее ЛММ и в 35,6 % случаев прогнозы КРМ на 1 и 2 года оказываются точнее, чем ЛММ (см. рис. 1 и 2). Это означает, что использование моделей КРМ для моделирования и прогнозирования сложных социально-экономических процессов в определенных условиях дает лучшие результаты по сравнению с традиционно используемыми методами прогнозирования и, следовательно, эти модели могут быть использованы в дальнейших исследованиях.

About the authors

N. A Sirotina

Perm National Research Polytechnic University

A. V Kopoteva

Perm National Research Polytechnic University

A. V Zatonskiy

Perm National Research Polytechnic University

References

  1. Медведев А.С., Стариков И.О. Исследование уровня безработицы в Российской Федерации на основе линейной многофакторной модели // Управление инвестициями и инновациями. - 2017. - № 3. - С. 70-79. doi: 10.14529/iimj170308
  2. Павлова Ю.С. Прогнозирование валового регионального продукта Краснодарского края в контексте оценки экономической безопасности региона // Финансы и учетная политика. - 2019. - № 5. - С. 37-42.
  3. Шульга А.С., Затонский А.В. Прогнозирование динамики потребления электроэнергии в России на основе линейной многофакторной модели // Juvenis Scientia. - 2016. - № 3. - С. 15-18.
  4. Решетникова А.А., Королюк Е.В. Оценка и перспективы развития образовательного кредитования в Российской Федерации // Современные научные исследования и разработки. - 2017. - Т. 2, № 1 (9). - С. 433-435.
  5. Модернизация прогностических регрессионных моделей для оценки количества летальных исходов при новой коронавирусной инфекции / Н.Н. Карякин, Н.В. Саперкин, А.П. Баврина, О.В. Другова, В.И. Климко, А.С. Благонравова, О.В. Ковалишена // Современные технологии в медицине. - 2020. - № 4. - С. 6-12. doi: 10.17691/stm2020.12.4.01
  6. Rath S., Tripathya A., Tripathya A.R. Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model // Diabetes & Metabolic Syndrome: Clinical Research & Reviews. - 2020. - Vol. 14. - P. 1467-1474.
  7. Sowjanya D., Patil G.R. Freight production of agricultural commodities in India using multiple linear regression and generalized additive modelling // Transport Policy. - 2020. - Vol. 97. - P. 245-258.
  8. Comparison of random forest and multiple linear regression models for estimation of soil extracellular enzyme activities in agricultural reclaimed coastal saline land / X. Xie, T. Wu, M. Zhu, G. Jiang, W. Xu // Ecological Indicators. - 2021. - Vol. 120. - Art. 106925.
  9. Hang Y., Xue W. The asymmetric effects of monetary policy on the business cycle: Evidence from the panel smoothed quantile regression model // Economics Letters. - 2020. - Vol. 195. - Art. 109450.
  10. Schumann M., Severini T., Tripathi G. Integrated likelihood based inference for nonlinear panel data models with unobserved effects // Journal of Econometrics. - 2020. (В печати). doi: 10.1016/j.jeconom.2020.10.001
  11. Redmond T., Nasir M.A. Role of natural resource abundance, international trade and financial development in the economic development of selected countries // Resources Policy. - 2020. - Vol. 66. - P. 65-78.
  12. Варламова С.А., Котков П.В. Моделирование показателя развития человеческого потенциала в Германии // Вестник Южно-Уральского государственного университета. Серия: компьютерные технологии, управление, радиоэлектроника. - 2020. - Т. 20, № 3. - С. 85-95. doi: 10.14529/ctcr200309
  13. Ракаева Т.Г., Беккер В.Ф. Регрессионно-дифференциальная модель динамики горной промышленности Пермского края // Системный анализ в науке и образовании. - 2019. - № 2. - С. 45-51.
  14. Малинин Д.Б. Прогнозирование продаж калийных удобрений ПАО «Уралкалий» на внутреннем рынке для сельхозпроизводителей // Управление строительством. - 2018. - № 3 (12). - С. 96-104.
  15. Затонский А.В., Тугашова Л.Г., Барова А.Е. Моделирование и прогнозирование развития внутреннего и внешнего туризма в Турции // Прикладная математика и вопросы управления. - 2019. - № 2. - С. 135-150.
  16. Гераськина И.Н., Затонский А.В. Моделирование тренда инвестиционной и строительной деятельности Российской Федерации // Вестник МГСУ. - 2017. - Т. 12, вып. 11 (110). - С. 1229-1239.
  17. A price dynamic equilibrium model with trading volume weights based on a price-volume probability wave differential equation / L. Shi, B. Wang, X. Guo, X. Li // International Review of Financial Analysis. - 2021. - Vol. 74. - Art. 101603.
  18. Finite-differential models used as a basis for IT support in problem-solving / A. Zatonskiy, N. Sirotina, R. Bazhenov, I. Altukhova, E. Alutina // IOP Conference Series: Materials Science and Engineering. - 2021. - Vol. 1047. - Art. 12040.
  19. Hamdi T., Ben Ali J., Di Costanzo V. Accurate prediction of continuous blood glucose based on support vector regression and differential evolution algorithm // Biocybernetics and Biomedical Engineering. - 2018. - Vol. 38. - P. 362-372.
  20. Wang F.K., Du T. Implementing support vector regression with differential evolution to forecast motherboard shipments // Expert Systems with Applications. - 2014. - Vol. 41, iss. 8. - P. 3850-3855. doi: 10.1016/j.eswa.2013.12.022
  21. Доугерти К. Введение в эконометрику: учеб. - 2-е изд. - М.: ИНФРА-М, 2007 - 432 c.
  22. Эконометрика / И.И. Елисеева, С.В. Курышева [и др.]. - М.: Финансы и статистика, 2007. - 576 c.
  23. Кремер Н.Ш. Эконометрика: учеб. для вузов - М.: ЮНИТИ-ДАНА, 2002. - 311 c.

Statistics

Views

Abstract - 39

PDF (Russian) - 10

Refbacks

  • There are currently no refbacks.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies