CORRELATION and REGRESSIONAL ANALYSIS OF THE DEPENDENCE of ENTERPRISE receipts from THE FOREIGN ECONOMIC ACTIVITY FACTORS
- Authors: Malakhova O.S1, Kuznetsova O.A1, Kuznetsov A.V2
- Affiliations:
- Samara National Research University
- International Market Institute
- Issue: No 1 (2019)
- Pages: 113-123
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/2167
- DOI: https://doi.org/10.15593/2499-9873/2019.1.08
- Cite item
Abstract
A correlation-regression analysis of the company's revenue dependence on the foreign economic activity factors was performed using the example of the Center for Appraisal and Analytical Technologies “Analytics.” The employees number ( x 1), rate $ ( x 2), rate € ( x 3), number of new open representative offices and branches for the period ( x 4) and service names in the company's nomenclature at the end of the period ( x 5) and number of suppliers at the end of the period ( x 6) revenue from the sale of medical equipment for the period ( x 7) and revenues from equipment maintenance and repair activities for the period ( x 8) and revenues from other activities for the period ( x 9), customs duties on equipment imports for the period ( x 10) and imports for the period ( x 11) and number of protectionism measures applied to the Russian Federation for the period ( х 12) and the number of measures of liberalization of foreign economic activity applied to the Russian Federation for the period ( x 13) was chosen as an external factor. The number of explanatory variables was reduced from 12 to 7 after the logical relationship between the factors analysis. Correlation analysis showed that many variables are intercorrelated. So, 8 regression models were constructed to avoid the negative effect of multicollinearity. These models do not contain strongly related factors. Statistical measures such as confidence intervals, the coefficient of determination, the Student’s index and the Fisher coefficient are given to assess the quality of the constructed models. It is shown that the constructed regression models are statistically significant. It’ll become possible to predict the results of the activity of the Center for Information Technologies "Analytics" in future periods if we used the regression models found. Also we could to minimize the risks due to the determination of the company's sources of income which determines the practical significance of the work.
Full Text
Построение регрессионных зависимостей становилось предметом исследования многих авторов [1, 2], в том числе и для прогнозирования и анализа влияния экономических параметров на макроэкономические показатели [3, 4], а также деятельности отдельных предприятий [5, 6]. Построение регрессионной модели на основе корреляционной матрицы имеет ряд особенностей, которые обсуждались в работах [7-10]. Объектом исследования являются результаты экономической деятельности ООО «ЦМТ „Аналитика“» за 95 периодов (с 2011 по 2018 г.). Компания ведет деятельность по импорту, продаже и обслуживанию медицинского оборудования в России и за рубежом [11]. Деятельность предприятия ООО «ЦМТ „Аналитика“» подразумевает наличие широких внешнеэкономических связей, а также зависимость выручки от множества факторов, объектов и субъектов внутренней и внешней экономической деятельности [12, 13]. Предложено отразить эту зависимость в виде регрессионной модели [14]. В целях реализации этой задачи на первом этапе был отобран ряд показателей, отражающих как внешние, так и внутренние изменения рынка (табл. 1). Таблица 1 Введенные обозначения для показателей деятельности компании № п/п Наименование фактора, ед. Введенное обозначение 1 Списочная численность сотрудников, чел. х1 2 Курс доллара, руб. х2 3 Курс евро, руб. х3 4 Число новых открытых представительств и филиалов за период, ед. х4 5 Наименований услуг в номенклатуре компании на конец периода, ед. х5 6 Число поставщиков на конец периода, ед. х6 7 Выручка от продажи медицинского оборудования за период, тыс. руб. х7 8 Выручка от деятельности по содержанию и ремонту оборудования за период, тыс. руб. х8 9 Выручка от прочих видов деятельности за период, тыс. руб. х9 10 Таможенные пошлины на ввоз оборудования за период, тыс. руб. х10 11 Импорт за период, т х11 12 Число мер протекционизма, применяемых к РФ за период, ед. х12 13 Число мер либерализации ВЭД, применяемых к РФ за период, ед. х13 В качестве результирующего значения модели выбран показатель Y - выручка предприятия, тыс. руб. На первом этапе, с целью выявления факторов, оказывающих наиболее высокое влияние на выручку Y, произведен корреляционный анализ исходных данных. С помощью встроенного анализа в табличном процессоре Microsoft Excel построена матрица корреляционной зависимости факторов и целевой функции (рис. 1). Как это видно из матрицы, наблюдается высокая степень зависимости сразу между несколькими факторами. Ячейки, содержащие информацию о мультиколлинеарности факторов, выделены цветом. Означает это, что объясняющие переменные модели тесно связаны между собой. Y х1 х2 х3 х4 х5 х6 х7 х8 х9 х10 х11 х12 х13 Y 1,00 х1 0,70 1,00 х2 0,82 0,63 1,00 х3 0,82 0,63 0,99 1,00 х4 0,01 0,05 -0,02 -0,01 1,00 х5 0,90 0,75 0,87 0,89 -0,02 1,00 х6 0,92 0,77 0,86 0,89 -0,04 0,97 1,00 х7 0,90 0,76 0,66 0,66 -0,01 0,83 0,82 1,00 х8 0,86 0,55 0,79 0,76 0,00 0,75 0,72 0,69 1,00 х9 -0,07 0,03 -0,13 -0,11 -0,07 -0,02 -0,03 -0,01 -0,03 1,00 х10 0,32 0,43 0,29 0,27 0,09 0,26 0,21 0,38 0,41 0,32 1,00 х11 0,17 0,33 0,12 0,11 0,03 0,15 0,12 0,25 0,25 0,59 0,88 1,00 х12 -0,15 0,02 -0,05 -0,07 -0,06 -0,15 -0,18 -0,15 -0,08 -0,08 0,18 0,10 1,00 х13 0,21 0,16 0,15 0,14 0,01 0,20 0,18 0,16 0,19 -0,07 0,04 -0,01 0,08 1,00 Корреляционная матрица факторов для ООО «ЦМТ „Аналитика“» Первый столбец матрицы отображает зависимость результирующего параметра Y от xi. Наиболее весомые полученные значения обозначены в таблице полужирным шрифтом и подчеркнуты. Применяя метод главных компонент для борьбы с мультиколлинеарностью факторов, определим, что в наибольшей мере выручка Y связана с переменными факторами: х1, х2, х3, х5, х6, х7, х8. Как видно из рис. 1, модели регрессионных зависимостей - парные. На следующем этапе был произведен регрессионный анализ данных. Пример вычислений для х1 отображен на рис. 2. Коэффициент b0 = -79 189,5, что говорит нам о пересечении с осью координат. С экономической точки зрения данный параметр х1 не может быть интерпретирован, поскольку при нулевом числе сотрудников выручка не может быть отрицательной. Поскольку Y-пересечение меняет свой знак, построим данную итерацию без свободного члена (рис. 3). Таким образом, регрессионная модель принимает следующий вид: Y = 643,39х1. Экономический смысл данной зависимости: один сотрудник приносит 643,39 руб. выручки компании. Коэффициент детерминации данной модели равен 0,827, что соответствует примерно 83 %. Это означает, что численность сотрудников оказывает значительное влияние на показатели выручки и подтверждает правильность выбора фактора для построения данной модели. Чем выше коэффициент детерминации, тем качественнее модель. Если R-квадрат > 0,95, говорят о высокой точности аппроксимации (модель хорошо описывает явление). Если R-квадрат лежит в диапазоне от 0,80 до 0,95, говорят об удовлетворительной аппроксимации (модель в целом адекватна описываемому явлению). Если R-квадрат < 0,6, принято считать, что точность аппроксимации недостаточна и модель требует улучшения (введения новых независимых переменных, учета нелинейностей и т.д.) [15]. Рис. 2. Спецификация искомого в MS Excel уравнения регрессии Y = a*x1 + b Рассчитанный уровень значимости (значимость критерия Фишера F из рис. 3) мал. Данный показатель означает допустимую вероятность ошибки первого рода (ложноположительного решения). Поскольку она близка к 0, то данный критерий подтверждает полученную значимость R2. S = 30,36 - стандартная ошибка оценки. Стандартная ошибка регрессии рассматривается в качестве меры разброса данных наблюдений от смоделированных значений. Чем меньше значение стандартной ошибки регрессии, тем качество модели выше. С помощью критерия Фишера проверяется статистическая значимость уравнения. Для проверки сравним табличное значение с фактическим, представленным на рис. 3. Fтабл = 3,98, это меньше фактического значения. Следовательно, переменная является значимой. Рис. 3. Спецификация искомого в MS Excel уравнения регрессии Y = a*x1 при отсутствии свободного члена Найденное по данным наблюдения значение t-критерия - 21,18 (его еще называют наблюдаемым или фактическим) [16] сравниваем с табличным (критическим) значением, определяемым по таблицам распределения Стьюдента, - 1,984. Если значение статистики по абсолютной величине выше критического значения, то отличие коэффициента является статистически значимым (неслучайным), как в нашем случае. Если же наоборот, то незначимым (случайным), т.е. истинный коэффициент вероятно равен или очень близок к предполагаемому значению. Поля «Нижние 95 %», «Верхние 95 %» на рис. 3 означают доверительный интервал для параметра, т.е. с надежностью 0,95 этот коэффициент лежит в интервале от 583,10 до 703,68. Аналогично произведем расчеты для отобранных факторов xi. Результаты вычислений объединим в табл. 2. Как видно из табл. 2, значения коэффициентов детерминации для полученных уравнений регрессии достаточно высоки, что говорит о значительном весе данных факторов в полученных моделях. Значения расчетных критериев Фишера в разы больше, чем критическое, полученное из таблицы, F = 3,98. Аналогично, критерий Стьюдента превосходит критическое значение, F = 1,984. Это позволяет говорить нам о том, что переменные являются статистически значимыми и их включение в уравнение регрессии необходимо. Таблица 2 Результаты регрессионного анализа факторов xi Уравнение регрессии R2 Критерий Фишера Критерий Стьюдента Доверительный интервал x1 Y = 643,39x1 0,83 448,99 21,18 583,10-703,68 x2 Y = 1531,212x2 0,89 794,73 28,19 1423,36-1639,06 x3 Y = 1284,212x3 0,87 646,69 25,43 1183,81-1384,32 x5 Y = 7192,84 + 419,88x5 0,82 416,02 20,39 379,00-460,76 x6 Y = 98,55 + 4352,95x6 0,84 479,41 21,89 3958,16-4747,74 x7 Y = 2,0784x7 0,94 1388,93 37,27 1,97-2,19 x8 Y = 28177,88+ 2,1x8 0,73 259,10 16,10 1,84-2,36 Используя данные факторы и регрессионные модели, мы сможем прогнозировать результаты деятельности компании в будущих периодах, минимизировать риски за счет детерминации источников дохода компании.About the authors
O. S Malakhova
Samara National Research University
O. A Kuznetsova
Samara National Research University
A. V Kuznetsov
International Market Institute
References
- Регрессионный анализ и его применение / О.В. Хохлова, К.В. Невдаха, И.С. Казакова, О.В. Агафонова // Актуальные проблемы агропромышленного комплекса: сб. тр. науч.-практ. конф. преподавателей, студентов, магистрантов и аспирантов, посвященный 80-летию Новосибир. гос. аграр. ун-та. - Новосибирск: Золотой колос, 2016. - С. 327-332.
- Касьяненко Т.Г., Полоско А.С. Применение корреляционно-регрессионного анализа в оценке бизнеса сравнительным подходом // Российское предпринимательство. - 2015. - Т. 16, № 20. - С. 3611-3622.
- Змушко А.А., Ковалева Л.Ю. Эконометрическая модель как инструмент анализа и прогнозирования национальной экономики // Концепции развития науки. - 2016. - С. 85-88.
- Кочегарова О.С., Лажаунинкас Ю.В. Построение статистической модели общей численности населения Российской Федерации на основе ретроспективного прогноза // Современные исследования социальных проблем. - 2017. - Т. 4, № 6-1. - С. 56-66.
- Кудратова Г.М., Тарасов Р.В., Макарова Л.В. Прогнозирование свойств строительной продукции методом регрессионного анализа [Электронный ресурс] // Теория. Практика. Инновации: электрон. науч.-техн. журн. - 2017. - С. 55-60. - URL: http://www.Tpinauka.Ru/2017/10/10_2017.pdf (дата обращения: 04.01.2019).
- Крымов С.М., Петрушина А.В., Белоедова Н.П. Прогнозирование объема продаж торгового предприятия ООО «Техника» // Инновационная экономика: перспективы развития и совершенствования. - 2017. - № 6 (24). - С. 50-54.
- Ризванова Э.Р. Корреляционная матрица в анализе статистической информации структуры внешней торговли // Изв. Санкт-Петерб. гос. эконом. ун-та. - № 6 (108). - 2017. - С. 159-163.
- Орлова И.В. Подход к решению проблемы мультиколлинеарности при анализе влияния факторов на результирующую переменную в моделях регрессии // Фундаментальные исследования. - 2018. - № 3. - С. 58-63.
- Родионова Т.Е. Возможности методов регрессионного анализа для преодоления эффекта мультиколлинеарности при получении модели описания технического объекта // Современные проблемы проектирования, производства и эксплуатации радиотехнических систем. - 2017. - С. 135-138.
- Орлова И.В., Филонова Е.С. Выбор экзогенных факторов в модель регрессии при мультиколлинеарности данных // Междунар. журнал прикладных и фундаментальных исследований. - 2015. - № 5-1. - С. 108-116.
- АО «ЦМТ «Аналитика» [Электронный ресурс]. - URL: http://cmt-analitika63.samaragid24.ru/ (дата обращения: 04.01.2019).
- Мицель А.А., Телипенко Е.В. Оценка влияния показателей финансово-хозяйственной деятельности предприятия на выручку от реализации продукции // Экономический анализ: теория и практика. - 2011. - № 27 (234). - С. 57-63.
- Гераськин М.И., Боргардт Е.А. Комплексная оптимизация показателей хозяйственной деятельности предприятий // Вестник Самарского государственного аэрокосмического университета им. академика С.П. Королева (национального исследовательского университета). - 2006. - № 3. - С. 88-98.
- Беккер Р.В., Пятаев М.В. Прогноз финансовых показателей предприятий складского хозяйства с учетом различных сценариев социально-экономического развития России // Научные исследования: науч.-практ. журн. - 2016. - № 10 (11). - С. 33-40.
- Носов В.В., Цыпин А.П. Выявление и измерение влияния внутренних факторов на величину выручки предприятий вида деятельности «производство машин и оборудования» // Ученый XXI века. - 2016. - № 3-4 (16). - С. 67-70.
- Гусарова О.М. Аналитический аппарат моделирования корреляционно-регрессионных зависимостей // Международный журнал прикладных и фундаментальных исследований. - 2016. - № 8. - С. 219-222.
Statistics
Views
Abstract - 64
PDF (Russian) - 300
Refbacks
- There are currently no refbacks.