A method for constructing non-elementary Cobb – Douglas production functions
- Authors: Bazilevskiy M.P.1
- Affiliations:
- Irkutsk State Transport University
- Issue: No 1 (2023)
- Pages: 102-115
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/3831
- DOI: https://doi.org/10.15593/2499-9873/2023.1.07
- Cite item
Abstract
The actual scientific problem in machine learning is the development of new interpretable mathematical models, as well as methods and programs for their construction. Many well-known regression models have good interpretative properties, for example, linear and power models (Cobb – Douglas production functions). Previously, the author developed non-elementary linear regressions, the problem of constructing which was reduced to the mixed integer 0–1 linear programming problem.Based on non-elementary linear regressions, in this paper, for the first time, non-elementary Cobb-Douglas production functions are proposed, which include not only explanatory variables in degrees, but also all their possible pair combinations, transformed using binary operations min and max. The proposed models are linearized, which makes it possible to apply for their construction the mixed integer 0–1 linear programming problem formulated in the same way as for non-elementary linear regressions. As a result of its solution, the optimal structure model is automatically determined. The advantage of such a formulation is that the solution of the problem can be obtained faster than using enumeration procedures, and also that the signs of the estimates of the constructed model are guaranteed to be consistent with the meaningful meaning of the factors. At the same time, it is possible to control the requirements for the structure of the model using linear constraints on binary variables. In particular, the problem can be used to select the optimal structures for traditional elementary Cobb – Douglas production functions.The problem of modeling the gross regional product of the Tomsk region is solved. The following variables were chosen as explanatory variables: average per capita cash income of the population, investments in fixed capital, costs of innovative activities of organizations, average annual number of employees, cost of fixed assets, internal costs for research and development. The LPSolve package was chosen as the solver of the mixed integer 0–1 linear programming problem. As a result of solving this problem, the optimal structure of the non-elementary Cobb – Douglas production function was chosen, which contains all six explanatory variables in three regressors. The coefficient of determination for the constructed model turned out to be 0.997. All regression coefficients turned out to be significant according to Student's t-test, and their signs satisfy the meaningful meaning of the factors. An interpretation for the constructed model is given.
Keywords
regression analysis, non-elementary linear regression, non-elementary power regression, Cobb – Douglas production function, elasticity, ordinary least squares method, standardized regression, correlation coefficient, coefficient of determination, interpretability, mixed integer 0–1 linear programming problem, gross regional product of the Tomsk region.
Full Text
В настоящее время для выявления статистической зависимости между исследуемыми переменными активно применяются методы регрессионного анализа [1; 2]. Построенная в результате его применения регрессионная модель может быть использована как для прогнозирования значений зависимой переменной, так и для объяснения характера влияния на последнюю независимых переменных. Регрессионный анализ широко используется в различных областях человеческой деятельности. Его приложения в экономике можно найти, например, в работах [3–6]: в [3] построена регрессионная модель валового внутреннего продукта Саудовской Аравии, в [4] исследуется влияние структуры капитала на результаты деятельности компаний в России, а в [5] – взаимосвязь между урожайностью кукурузы и размером ферм в Северном Китае. Приложение регрессионного анализа в геологии можно найти в работе [6], в которой исследуется скорость инфильтрации почвы в зависимости от ее свойств. В работе [7] регрессионный анализ применен для решения технической задачи исследования возможных размеров сверхзвукового транспортного самолета на основе существующих сверхзвуковых конструкций. Решение медицинской задачи с помощью регрессионного анализа можно найти в статье [8], в которой исследуется связь между артериальной гипертензией и исходом у пациентов с пневмонией, вызванной коронавирусной инфекцией COVID-19.В экономике зависимости между выпуском продукции и факторами производства принято называть производственными функциями (ПФ). На сегодняшний день существует множество известных ПФ [9; 10]: линейная, Леонтьева, Кобба – Дугласа [11; 12], Аллена, с постоянной эластичностью замены факторов CES (Constant Elasticity of Substitutions), с линейной эластичностью замены факторов LES (Linear Elasticity of Substitutions), Солоу, многорежимная, линейного программирования, Джири, логарифмическая, Сато, Лу – Флетчера, Лиу – Хильдебранда, Кадияла, Бруно, Сато – Гофмана и др. Вместе с тем продолжается процесс поиска новых форм связи между переменными. К их числу относится класс так называемых кусочно-линейных регрессий [13–17], образованных из ПФ Леонтьева. Оценивание этих моделей в работах [13–17] производится с помощью метода наименьших модулей. Параллельно в статьях [18–21] развивались алгоритмы оценивания подобных регрессий с помощью метода наименьших квадратов (МНК). Сначала в [18] был предложен алгоритм МНК-оценивания ПФ Леонтьева с двумя объясняющими переменными. А в [19] впервые была введена неэлементарная линейная регрессия (НЛР), в которую помимо объясняющих переменных входят преобразованные с помощью бинарных операций min или max все возможные комбинации их пар. Под бинарной операцией min (max) понимается математическая функция, принимающая два аргумента и возвращающая их минимум (максимум). Затем в [20] были предложены две стратегии построения НЛР. После чего в [21] состав НЛР был расширен, и она стала включать в себя и операцию min, и операцию max, а задача ее построения была формализована в виде задачи частично-булевого линейного программирования (ЧБЛП). Регулируя в этой задаче ограничения на бинарные переменные, можно контролировать математическую форму НЛР, а именно количество входящих в нее регрессоров, их типы и состав объясняющих переменных. Достоинством предложенного в [21] метода также является то, что знаки коэффициентов при переменных в полученной НЛР согласуются со знаками их коэффициентов корреляции с зависимой переменной, что делает модель вполне интерпретируемой. Стоит заметить, что проблема построения интерпретируемых моделей [22–24] машинного обучения является весьма актуальной.Построенная в [21] вполне интерпретируемая НЛР позволила выявить новые закономерности функционирования железнодорожного транспорта в Иркутской области, недоступные при использовании линейной регрессии. Известно, что ПФ Кобба – Дугласа [11; 12] так же, как и линейная регрессия, довольно просто интерпретируется. Поэтому целью данной работы является разработка неэлементарной ПФ Кобба – Дугласа и сведение задачи ее построения с помощью МНК к задаче ЧБЛП.About the authors
M. P. Bazilevskiy
Irkutsk State Transport University
References
- Gunst R.F., Mason R.L. Regression analysis and its application: a data-oriented approach. – CRC Press. – 2018.
- Montgomery D.C., Peck E.A., Vining G.G. Introduction to linear regression analysis. – John Wiley and Sons. – 2021.
- Amirat A., Zaidi M. Estimating GDP growth in Saudi Arabia under the government’s vision 2030: a knowledge-based economy approach // Journal of the Knowledge Economy. 2020. – Vol. 11, № 3. – P. 1145–1170. DOI: https://doi.org/10.1007/s13132-019-00596-2
- Company performance and optimal capital structure: evidence of transition economy (Russia) / V. Spitsin, D. Vukovic, S. Anokhin, L. Spitsina // Journal of Economic Studies. – 2020. – Vol. 48, № 2. – P. 313–332. DOI: https://doi.org/10.1108/JES-09-2019-0444
- Sheng Y., Ding J., Huang J. The relationship between farm size and productivity in agriculture: Evidence from maize production in Northern China // American Journal of Agricultural Economics. – 2019. – Vol. 101, № 3. – P. 790–806. DOI: https://doi.org/10.1093/ajae/aay104
- Estimation of infiltration rate from soil properties using regression model for cultivated land / G.T. Patle, T.T. Sikar, K.S. Rawat, S.K. Singh // Geology, Ecology, and Landscapes. – 2019. – Vol. 3, № 1. – P. 1–13. DOI: https://doi.org/10.1080/24749508.2018.1481633
- Joiner K.F., Zahra J., Rehman O. Conceptual sizing of next supersonic passenger aircraft from regression of the limited existing designs // MATEC Web of Conferences. EDP Sciences. – 2018. – Vol. 198. – P. 05001. DOI: https://doi.org/10.1051/matecconf/201819805001
- Hypertension is associated with increased mortality and severity of disease in COVID-19 pneumonia: a systematic review, meta-analysis and meta-regression / R. Pranata, M.A. Lim, I. Huang, S.B. Raharjo, A.A. Lukito // Journal of the renin-angiotensin-aldosterone system: JRAAS. – 2020. – Vol. 21, № 2. DOI: https://doi.org/10.1177/1470320320926899
- Клейнер Г.Б. Производственные функции: теория, методы, применение. – М.: Финансы и статистика, 1986.
- Хацкевич Г.А., Проневич А.Ф., Чайковский М.В. Двухфакторные производственные функции с заданной предельной нормой замещения // Экономическая наука сегодня. – 2019. – № 10. – С. 169–181.
- The effect of gross domestic product and population growth on CO2 emissions in Indonesia: An application of the ant colony optimisation algorithm and Cobb-Douglas model / S. Sukono, W. Albra, T. Zulham, I. Majid, J. Saputra, B. Subartini, F. Thalia // International Journal of Energy Economics and Policy. – 2019. – Vol. 9, № 4. – P. 313. DOI: https://doi.org/ 10.32479/ijeep.8011
- Dritsaki C., Stamatiou P. Cobb-Douglas production function: The case of Poland’s economy // International Conference on Applied Economics. Springer, Cham, 2018. – P. 465–483. DOI: https://doi.org/10.1007/978-3-030-02194-8_31
- Носков С.И., Лоншаков Р.В. Идентификация параметров кусочно-линейной регрессии // Информационные технологии и проблемы математического моделирования сложных систем. – 2008. – № 6. – С. 63–64.
- Носков С.И., Хоняков А.А. Программный комплекс построения некоторых типов кусочно-линейных регрессий // Информационные технологии и математическое моделирование в управлении сложными системами. – 2019. – № 3 (4). – С. 47–55.
- Носков С.И., Хоняков А.А. Применение функции риска для моделирования экономических систем // Южно-Сибирский научный вестник. – 2020. – № 5 (33). – С. 85–92.
- Носков С.И. Построение кусочно-линейной регрессии с интервальной неопределенностью в данных для зависимой переменной // Вестник кибернетики. – 2022. – № 2 (46). – С. 61–65.
- Носков С.И. Построение кусочно-линейной авторегрессионной модели произвольного порядка // Вестник Югорского государственного университета. – 2022. – № 2 (65). – С. 89–94.
- Базилевский М.П. МНК-оценивание параметров специфицированных на основе функций Леонтьева двухфакторных моделей регрессии // Южно-Сибирский научный вестник. – 2019. – № 2 (26). – С. 66–70.
- Базилевский М.П. Оценивание линейно-неэлементарных регрессионных моделей с помощью метода наименьших квадратов // Моделирование, оптимизация и информационные технологии. – 2020. – Т. 8, № 4 (31).
- Базилевский М.П. Отбор информативных операций при построении линейно-неэлементарных регрессионных моделей // International Journal of Open Information Technologies. – 2021. – Т. 9, № 5. – С. 30–35.
- Базилевский М.П. Метод построения неэлементарных линейных регрессий на основе аппарата математического программирования // Проблемы управления. – 2022. – № 4. – С. 3–14. DOI: https://doi.org/10.25728/pu.2022.4.1
- Molnar C. Interpretable machine learning. – Lulu.com, 2020.
- Doshi-Velez F., Kim B. Towards a rigorous science of interpretable machine learning // arXiv preprint arXiv:1702.08608. – 2017. DOI: https://doi.org/10.48550/arXiv.1702.08608
- Miller T. Explanation in artificial intelligence: Insights from the social sciences // Artificial intelligence. – 2019. – Vol. 267. – P. 1–38. DOI: https://doi.org/10.1016/j.artint.2018.07.007
- Базилевский М.П. Построение вполне интерпретируемых линейных регрессионных моделей с помощью метода последовательного повышения абсолютных вкладов переменных в общую детерминацию // Вестник Воронежского государственного университета. Серия: Системный анализ и информационные технологии. – 2022. – № 2. – С. 5–16. DOI: https://doi.org/10.17308/sait/1995-5499/2022/2/5-16
Statistics
Views
Abstract - 131
PDF (Russian) - 92
Refbacks
- There are currently no refbacks.