FINITE DIFFERENCES METHOD FOR SOCIO-ECONOMIC MODELING

N. A Sirotina; Сиротина Н. А; A. V Kopoteva; Копотева А. В; A. V Zatonskiy; Затонский А. В

doi:10.15593/2499-9873/2021.1.10

МЕТОД КОНЕЧНО-РАЗНОСТНОГО СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО ПРОГНОЗИРОВАНИЯ

Авторы: Сиротина Н.А¹, Копотева А.В¹, Затонский А.В¹
Учреждения:
1. Пермский национальный исследовательский политехнический университет
Выпуск: № 1 (2021)
Страницы: 174-189
Раздел: Статьи
URL: https://ered.pstu.ru/index.php/amcs/article/view/2093
DOI: https://doi.org/10.15593/2499-9873/2021.1.10
Цитировать

Аннотация
Полный текст
Об авторах
Список литературы
Статистика

Аннотация

Посвящена проблеме математического моделирования социально-экономических процессов на основе конечно-разностных моделей 1-го и 2-го порядков. Необходимость разработки и оценки качества таких моделей возникает в силу того, что классические математические методы обладают рядом недостатков. В частности, множественные линейные регрессионные модели не дают удовлетворительного качества прогнозирования, а алгоритм оценки параметров регрессионно-дифференциальных моделей сложен в реализации и имеет ряд неинтерпретируемых настроек. Путем замены в регрессионно-дифференциальных моделях 1-го и 2-го порядков значений производных моделируемого показателя их эквивалентами в конечных разностях были получены модификации линейной множественной регрессии, включающие авторегрессионные слагаемые 1-го и 2-го порядков. Для оценки неизвестных параметров полученных уравнений возможно применение метода наименьших квадратов, при этом накладывается дополнительное условие сохранения коэффициентами при факторах знаков, которые характерны для них в линейной регрессионной модели. Аппроксимационные свойства полученных уравнений в силу наличия большего числа объясняющих переменных превосходят обычные регрессионные модели. Однако с практической точки зрения более важным критерием является качество получаемых на их основе прогнозных значений изучаемых показателей. С целью оценки прогностических свойств предложенных уравнений была выполнена оценка параметров классических линейных и модифицированных уравнений по укороченным наборам статистических данных для 59 социально-экономических объектов различной природы. Расчет и сравнение прогнозных значений для последних временных периодов показали, что множественные линейные модели с авторегрессионными слагаемыми дают лучшее качество прогнозирования по сравнению с классическими множественными линейными моделями для 49 из 59 рассмотренных наборов данных. Это позволяет утверждать, что предложенная модификация множественной линейной модели может быть эффективна для целей краткосрочного прогнозирования в социально-экономических системах.

Ключевые слова

математическое моделирование, корреляционный анализ, множественная линейная регрессия, метод наименьших квадратов, регрессионно-дифференциальная модель, конечно-разностная модель, социально-экономические процессы, прогнозирование, авторегрессия, аппроксимация, относительная погрешность.

Полный текст

Введение В настоящее время для принятия обоснованных управленческих решений в социально-экономических системах используются различные математические методы. Достаточно распространенной темой публикаций отечественных и зарубежных авторов является прогнозирование социально-экономических систем с применением линейных многофакторных моделей (ЛММ). Так, в источнике [1] построена линейная многофакторная модель, которая описывает динамику безработицы в РФ, выявлены закономерности изменения зависимости безработицы от начисленной заработной платы и доли занятых лиц. В работе [2] с помощью многофакторной линейной регрессии построена модель зависимости валового регионального продукта Краснодарского края от ключевых социально-экономических показателей региона. Авторы статьи [3] с помощью ЛММ получили прогноз энергопотребления РФ, а также выявили закономерности изменения динамики энергопотребления в зависимости от включенных в модель факторов. В статье [4] проведен анализ фактических данных о величине доли студентов, использующих образовательный кредит, и построена многофакторная модель линейной регрессии, на основе которой были вычислены прогнозные значения результативного признака. Авторы работы [5] модернизировали прогностические регрессионные модели в условиях расширения знаний о новой коронавирусной инфекции COVID-19. В источнике [6] предложена модель множественной линейной регрессии для прогнозирования активных случаев в ежедневных данных COVID-19 Индии и штата Одиша. В источнике [7] смоделировано грузовое производство сельскохозяйственных товаров в Индии с использованием множественной линейной регрессии. Авторы работы [8] приводят сравнение моделей «случайного леса» и множественной линейной регрессии для оценки активности внеклеточных ферментов почв Китая. Преимуществами данного метода являются простота построения модели и наличие экономической интерпретации ее коэффициентов. При этом прогнозирование на основании моделей данного типа дает недостаточно качественный результат, особенно в условиях существенной волатильности (вариации) входящих в модель показателей. С развитием компьютерной техники все большее распространение получает моделирование на основе панельных данных, являющееся развитием регрессионных моделей и позволяющее одновременно моделировать динамику и структуру изучаемых объектов. Авторы статьи [9] используют модель сглаженной квантильной регрессии для изучения асимметричного воздействия денежно-кредитной политики на деловой цикл с использованием данных по 40 странам. В источнике [10] предлагается новый интегрированный подход для оценки моделей панельных данных, когда ненаблюдаемые индивидуальные эффекты входят в модель нелинейно, причем данная методология работает даже в краткосрочных панелях среднего размера как в статических, так и в динамических моделях. В работе [11] предпринята попытка оценки роли природных ресурсов для международной торговли и финансового развития территорий на основании статистического анализа панельных данных по 30 различным странам, однако анализ проводится на макроуровне, а единый набор факторов в модели не позволяет учитывать специфику конкретного субъекта хозяйствования. Реализация данного метода предполагает составную структуру объекта исследования (например, регионы федерального округа), метод не может быть использован на уровне единичного (отдельного) объекта. Кроме того, ряд авторов используют регрессионно-дифференциальные модели для прогнозирования социально-экономических систем. Так, в статье [12] выбрана регрессионно-дифференциальная модель 2-го порядка, смоделированы показатели развития индекса человеческого развития на примере Германии. Авторы работы [13] построили модель на основе обыкновенного дифференциального уравнения 2-го порядка для осуществления прогноза развития горнодобывающей промышленности Пермского края. В работе [14] постороена регрессионно-дифференциальная модель 1-го и 2-го порядков, осуществлен прогноз реализации хлористого калия ПАО «Уралкалий» на внутреннем рынке. Авторы работы [15] на основании регрессионно-дифференциальной модели 2-го порядка получили прогноз факторов и динамики изменения туризма в Турции. В статье [16] разработана экономико-математическая модель на базе дифференциального уравнения 2-го порядка, позволяющая использовать статистические данные и прогнозировать тренд инвестиционной и строительной деятельности Российской Федерации. Авторы работы [17] исследуют модель ценового динамического равновесия, основанную на дифференциальном уравнении волны вероятности цены и объема на китайском фондовом рынке. Преимуществами данного метода являются достаточно высокое качество прогнозирования, а также присутствие в модели слагаемых, позволяющих учесть скорость изменения моделируемых процессов во времени, в результате чего динамика показателя оказывается более точной. Однако построение таких моделей является сложным процессом, имеющим большое количество настроек, часть из которых не может быть обоснована теоретически или эмпирически (наличие времени запаздывания влияния контролируемых факторов на зависимый показатель [18]), а практическая реализация метода требует специального программного обеспечения. В источнике [19] авторы применяют методы опорных векторов и дифференциальной эволюции для построения регрессионной модели прогнозирования уровня сахара в крови. В статье [20] исследуется точность прогнозов поставок материнских плат тайваньских производителей посредством опорной модели векторной регрессии с алгоритмом дифференциальной эволюции. Метод опорных векторов имеет смысл применять в задачах большой размерности; в случае малого числа факторов и наблюдений его использование нецелесообразно. Таким образом, существуют различные методы моделирования и прогнозирования экономических процессов, каждый из которых имеет как преимущества, так и недостатки и ограничения в использовании. Наиболее распространенными из них являются регрессионные - множественные линейные и дифференциальные. В данном исследовании сделана попытка разработки комплексного метода на основании ЛММ и РДМ, объединяющего их преимущества и лишенного недостатков. При этом в качестве базы сравнения при разработке и исследовании комплексного метода целесообразно рассматривать его отдельные составляющие. Такой метод представляет существенный интерес как с научной, так и с прикладной точки зрения, поскольку позволяет прогнозировать значения моделируемых показателей в краткосрочной перспективе, а значит, принимать обоснованные решения для целей управления ими. Разработка метода предполагает анализ данных официальной статистики с целью формирования информационной базы исследования, разработку конкретной экономико-математической модели, позволяющей как адекватно описывать имеющиеся данные, так и делать на их основе краткосрочные прогнозы приемлемого качества. 1. Теория В рамках данной статьи нашей задачей является построение модификации множественной линейной модели путем включения в нее авторегрессионных слагаемых 1-го и 2-го порядков и проверки ее лучших аппроксимационных и прогностических свойств по сравнению с базовой линейной моделью. Разработку и проверку работоспособности соответствующего метода выполним на основании имеющихся в нашем распоряжении 59 наборов статистических данных, характеризующих экономические объекты различной природы. На основании этих данных были построены модели ЛММ и их соответствующие модификации и выполнено их сравнение, при этом особое внимание уделялось качеству, адекватности объясняющих свойств и экономической интерпретации полученных на их основании результатов. На основании статистических данных могут быть построены различные модели экономических объектов. Наиболее простой и часто используемой является линейная многофакторная модель (ЛММ), в общем случае имеющая вид Yрасч(tk) = a + c1X1(tk) + c2X2(tk) +…+ cpXp(tk) = , (1) где tk - момент времени, k = 1, 2, …, K; Yрасч(tk) - расчетное значение моделируемой величины в момент времени tk; a - постоянная линейной многофакторной модели, определяющая уровень моделируемой величины при нулевых значениях факторов; Xi(tk) - значения факторов, определяющих значение моделируемой величины, в момент времени tk, i = 1,2, …, m; ci - коэффициенты линейной множественной модели, показывающие, на сколько изменится моделируемая величина при увеличении соответствующего фактора Xi на 1. Для определения коэффициентов модели по статистическим данным - набору векторов вида Y(tk), X1(tk), X2(tk),…, Xp(tk), k = 1, 2, …, K, - минимизируется сумма квадратов отклонений фактических и модельных значений вида . (2) Для целей прогнозирования хорошо зарекомендовали себя регрессионно-дифференциальные модели 1-го и 2-го порядков, имеющие соответственно вид (3) и (4) где a - константа, характеризующая влияние второй производной d2Y(tk)/dt2 при построении тренда; b - коэффициент обратной связи, отражающий влияние моделируемой величины Y(t) на ее вторую производную d2Y(tk)/dt2; d - коэффициент обратной связи, отражающий влияние производной моделируемой величины dY(tk)/dt на ее вторую производную d2Y(tk)/dt2; ci - коэффициент влияния факторов, i = 1,2,…,m. Неизвестными являются все коэффициенты (a, b, ci, d) и начальное условие Y'0 для РДМ 2-го порядка. Их определение представляет собой решение задачи безусловной минимизации суммы квадратов отклонений фактических значений моделируемой величины Y(t) в заданные моменты времени tk, k = 1,2,…,K, от соответствующих модельных значений Yрасч(t), т.е. (Y'0, a, b, ci, d): S(Y'0, a, b, ci, d) = ®min. Поскольку моделирование осуществляется по статистическим данным, информация о функции Y(t) и ее производных ограничена имеющимся набором значений Y(tk), k = 1, 2,…,K. Из численных методов известно, что оценка первой и второй производных функции может быть выполнена по формулам, основанным на конечных разностях: , (5) (6) . (6¢) Подставляя формулу (6') в формулу (3), получим . В силу того, что временной шаг по статистическим данным составляет 1 год, т.е. ∆t = 1, выражая из полученного уравнения Y(tk), получим (7) Аналогично подставляя формулы (5) и (6) в формулу (4), получим . При ∆t = 1 имеем , откуда . (8) Понятно, что Y(tk-1) представляют собой значение моделируемой величины в момент времени, предшествующий текущему значению Y(tk), а Y(tk-2) есть значение моделируемой величины в момент времени, предшествующий Y(tk-1). Очевидно, что выражение (7) представляет собой сумму правой части множественной линейной модели (1) и величины, пропорциональной Y(tk-1), а выражение (8) есть сумма правой части (1) и величин, пропорциональных Y(tk-1) и Y(tk-2). Это означает, что значения моделируемой величины зависят от их уровней в предшествующие моменты времени, а переход к разностным оценкам производных в РДМ позволил получить модификации ЛММ с авторегрессионными слагаемыми 1-го и 2-го порядков. Оценка параметров полученных уравнений, как и в случае ЛММ, может быть выполнена с помощью метода наименьших квадратов путем минимизации функционала (2). 2. Данные и методы Назовем уравнения (7) и (8) конечно-разностными моделями 1-го и 2-го порядков (КРМ-1 и КРМ-2) соответственно. Наличие в КРМ дополнительных объясняющих факторов позволяет утверждать, что они обладают лучшими аппроксимационными свойствами по сравнению с ЛММ. Однако с практической точки зрения больший интерес представляют прогностические свойства моделей и интерпретируемость оценок их параметров. Поскольку КРМ-1 и КРМ-2, по сути, представляют собой сумму ЛММ и авторегрессионных моделей 1-го и 2-го порядков соответственно, для оценки коэффициентов КРМ целесообразно использовать следующий алгоритм: - на основании имеющихся статистических данных выполнить корреляционный анализ изучаемого показателя Y и определяющих его значение факторов Xi; - на основании результатов корреляционного анализа исключить из модели факторы с высокой взаимной корреляцией, что позволяет обеспечить интерпретируемость коэффициентов и их качественную оценку; - путем минимизации выражения (2) оценить неизвестные коэффициенты ЛММ a и ci, i = 1,2, …, m, проверить соответствие их значений и знаков сущности и специфике изучаемого объекта; - путем минимизации выражения (2) при условии сохранения коэффициентами a и ci, i = 1,2, …, m, знаков, полученных для ЛММ, оценить неизвестные коэффициенты моделей КРМ-1 и КРМ-2. Отметим, что мультиколлинеарность в экономических моделях приводит к несостоятельности оценок их параметров только в сочетании с иными негативными факторами [21]. При этом исключение тесно коррелированных факторов только на основании анализа парных коэффициентов корреляции не всегда корректно [22]. Таким образом, отбор факторов в модель выполнялся для каждого объекта исследования исходя из экономических соображений с учетом результатов анализа матрицы парных коэффициентов корреляции [23]. Оценка неизвестных параметров ЛММ и КРМ была выполнена средствами Visual Basic for Applications в MS Excel. Оценка прогностических свойств КРМ была выполнена следующим образом: - рассчитана относительная погрешность прогноза с использованием ЛММ как отношение разности фактического и модельного значений изучаемого показателя к его фактическому уровню, выраженное в процентах; - рассчитана относительная погрешность прогноза с использованием КРМ как отношение разности фактического и модельного значений изучаемого показателя к его фактическому уровню, выраженное в процентах; - показатель качества прогнозирования с использованием КРМ был рассчитан как частное от деления относительной погрешности прогнозирования КРМ на относительную погрешность прогнозирования ЛММ, умноженное на 100 %. 3. Полученные результаты Как уже отмечалось ранее, проверка применимости КРМ для прогнозирования социально-экономических процессов была выполнена на основании 59 наборов данных различной природы с исключенными по результатам корреляционного анализа тесно связанными факторами. В результате реализации алгоритма оценки коэффициентов конечно-разностных моделей были выполнены постпрогнозы и построены сравнительные графики для ЛММ, КРМ-1 и КРМ-2 с постпрогнозами на 1 (рис. 1) и 2 года (рис. 2). Сравнительный анализ по совокупности данных позволил установить, что в подавляющем большинстве случаев на основании КРМ удается добиться лучшего качества прогнозирования, а именно: - в 76,3 % случаев хотя бы один прогноз КРМ оказывается лучше, чем ЛММ; - в 22,0 % случаев все прогнозы КРМ оказываются лучше, чем ЛММ; - в 35,6 % случаев оба КРМ-прогноза на 2 года оказываются лучше ЛММ; - в 39,0 % случаев оба КРМ-прогноза на 1 год оказываются лучше ЛММ; - в 32,2 % случаев оба КРМ-1 прогноза оказываются лучше, чем ЛММ; - в 35,6 % случаев оба КРМ-2 прогноза оказываются лучше ЛММ. Рис. 1. Пример прогнозирования экономико-статистического показателя на 1 год: исходные данные; ЛММ; КРМ-1; КРМ-2 Рис. 2. Пример прогнозирования экономико-статистического показателя на 2 года: исходные данные; ЛММ; КРМ-1; КРМ-2 Заключение Таким образом, разработанная в рамках исследования модификация ЛММ с авторегрессионными слагаемыми 1-го и 2-го порядков показала свою лучшую работоспособность в 49 случаях из 59 рассмотренных наборов данных. По результатам оценки значений коэффициентов моделей и прогнозирования на их основе оказалось, что в 76,3 % случаев по крайней мере один из КРМ-прогнозов оказывается точнее ЛММ и в 35,6 % случаев прогнозы КРМ на 1 и 2 года оказываются точнее, чем ЛММ (см. рис. 1 и 2). Это означает, что использование моделей КРМ для моделирования и прогнозирования сложных социально-экономических процессов в определенных условиях дает лучшие результаты по сравнению с традиционно используемыми методами прогнозирования и, следовательно, эти модели могут быть использованы в дальнейших исследованиях.

Об авторах

Н. А Сиротина

Пермский национальный исследовательский политехнический университет

А. В Копотева

Пермский национальный исследовательский политехнический университет

А. В Затонский

Пермский национальный исследовательский политехнический университет

Список литературы

Медведев А.С., Стариков И.О. Исследование уровня безработицы в Российской Федерации на основе линейной многофакторной модели // Управление инвестициями и инновациями. - 2017. - № 3. - С. 70-79. doi: 10.14529/iimj170308
Павлова Ю.С. Прогнозирование валового регионального продукта Краснодарского края в контексте оценки экономической безопасности региона // Финансы и учетная политика. - 2019. - № 5. - С. 37-42.
Шульга А.С., Затонский А.В. Прогнозирование динамики потребления электроэнергии в России на основе линейной многофакторной модели // Juvenis Scientia. - 2016. - № 3. - С. 15-18.
Решетникова А.А., Королюк Е.В. Оценка и перспективы развития образовательного кредитования в Российской Федерации // Современные научные исследования и разработки. - 2017. - Т. 2, № 1 (9). - С. 433-435.
Модернизация прогностических регрессионных моделей для оценки количества летальных исходов при новой коронавирусной инфекции / Н.Н. Карякин, Н.В. Саперкин, А.П. Баврина, О.В. Другова, В.И. Климко, А.С. Благонравова, О.В. Ковалишена // Современные технологии в медицине. - 2020. - № 4. - С. 6-12. doi: 10.17691/stm2020.12.4.01
Rath S., Tripathya A., Tripathya A.R. Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model // Diabetes & Metabolic Syndrome: Clinical Research & Reviews. - 2020. - Vol. 14. - P. 1467-1474.
Sowjanya D., Patil G.R. Freight production of agricultural commodities in India using multiple linear regression and generalized additive modelling // Transport Policy. - 2020. - Vol. 97. - P. 245-258.
Comparison of random forest and multiple linear regression models for estimation of soil extracellular enzyme activities in agricultural reclaimed coastal saline land / X. Xie, T. Wu, M. Zhu, G. Jiang, W. Xu // Ecological Indicators. - 2021. - Vol. 120. - Art. 106925.
Hang Y., Xue W. The asymmetric effects of monetary policy on the business cycle: Evidence from the panel smoothed quantile regression model // Economics Letters. - 2020. - Vol. 195. - Art. 109450.
Schumann M., Severini T., Tripathi G. Integrated likelihood based inference for nonlinear panel data models with unobserved effects // Journal of Econometrics. - 2020. (В печати). doi: 10.1016/j.jeconom.2020.10.001
Redmond T., Nasir M.A. Role of natural resource abundance, international trade and financial development in the economic development of selected countries // Resources Policy. - 2020. - Vol. 66. - P. 65-78.
Варламова С.А., Котков П.В. Моделирование показателя развития человеческого потенциала в Германии // Вестник Южно-Уральского государственного университета. Серия: компьютерные технологии, управление, радиоэлектроника. - 2020. - Т. 20, № 3. - С. 85-95. doi: 10.14529/ctcr200309
Ракаева Т.Г., Беккер В.Ф. Регрессионно-дифференциальная модель динамики горной промышленности Пермского края // Системный анализ в науке и образовании. - 2019. - № 2. - С. 45-51.
Малинин Д.Б. Прогнозирование продаж калийных удобрений ПАО «Уралкалий» на внутреннем рынке для сельхозпроизводителей // Управление строительством. - 2018. - № 3 (12). - С. 96-104.
Затонский А.В., Тугашова Л.Г., Барова А.Е. Моделирование и прогнозирование развития внутреннего и внешнего туризма в Турции // Прикладная математика и вопросы управления. - 2019. - № 2. - С. 135-150.
Гераськина И.Н., Затонский А.В. Моделирование тренда инвестиционной и строительной деятельности Российской Федерации // Вестник МГСУ. - 2017. - Т. 12, вып. 11 (110). - С. 1229-1239.
A price dynamic equilibrium model with trading volume weights based on a price-volume probability wave differential equation / L. Shi, B. Wang, X. Guo, X. Li // International Review of Financial Analysis. - 2021. - Vol. 74. - Art. 101603.
Finite-differential models used as a basis for IT support in problem-solving / A. Zatonskiy, N. Sirotina, R. Bazhenov, I. Altukhova, E. Alutina // IOP Conference Series: Materials Science and Engineering. - 2021. - Vol. 1047. - Art. 12040.
Hamdi T., Ben Ali J., Di Costanzo V. Accurate prediction of continuous blood glucose based on support vector regression and differential evolution algorithm // Biocybernetics and Biomedical Engineering. - 2018. - Vol. 38. - P. 362-372.
Wang F.K., Du T. Implementing support vector regression with differential evolution to forecast motherboard shipments // Expert Systems with Applications. - 2014. - Vol. 41, iss. 8. - P. 3850-3855. doi: 10.1016/j.eswa.2013.12.022
Доугерти К. Введение в эконометрику: учеб. - 2-е изд. - М.: ИНФРА-М, 2007 - 432 c.
Эконометрика / И.И. Елисеева, С.В. Курышева [и др.]. - М.: Финансы и статистика, 2007. - 576 c.
Кремер Н.Ш. Эконометрика: учеб. для вузов - М.: ЮНИТИ-ДАНА, 2002. - 311 c.

Статистика

Просмотры

Аннотация - 133

PDF (Russian) - 40

Ссылки

Ссылки не определены.

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Прикладная математика и вопросы управления

МЕТОД КОНЕЧНО-РАЗНОСТНОГО СОЦИАЛЬНО-ЭКОНОМИЧЕСКОГО ПРОГНОЗИРОВАНИЯ

Аннотация

Ключевые слова

Полный текст

Об авторах

Н. А Сиротина

А. В Копотева

А. В Затонский

Список литературы

Статистика

Просмотры

Ссылки

Данный сайт использует cookie-файлы