APPLICATION OF MACHINE LEARNING TECHNOLOGY TO PREDICT THE TIMING OF PRODUCTION UNDER CONDITIONS OF UNCERTAINTY
- Authors: Vlasov R.G1, Korobov Y.S1,2, Kuznetsova E.Y.1
- Affiliations:
- Ural Federal University named after B.N. Yeltsin
- M.N. Mikheev Institute of Metal Physics
- Issue: No 37 (2021)
- Pages: 104-120
- Section: Articles
- URL: https://ered.pstu.ru/index.php/elinf/article/view/2446
- DOI: https://doi.org/10.15593/2224-9397/2021.1.06
- Cite item
Abstract
The object of the presented research is the production process of the MK2000 utility vehicle in the conditions of the assembly shop of PJSC MZiK. The MK2000 is a technically complex product that is produced together with ten other types of technically complex products within the same workshop. The uncertainty factor in the production process is the unknown duration of the test cycle that each product is subjected to after the end of assembly. The purpose of the study: development of a method for calculating the duration of the production cycle of a product under conditions of uncertainty. Evaluation of the possibility of production planning and calculation of the annual schedule of shipment of finished products to the consumer by predicting the duration of the cycle. Methods: to solve the problem of predicting the duration of the production cycle, the dependence between the number of products of all types already in the process of testing at the time of the transfer of the product under consideration for testing, and the duration of the test of the transferred product is used. Since the production of various types of products is carried out at the same facilities, the regularity of the mutual influence of the production processes of various types of products is considered as the main one. The duration is calculated using a mathematical model obtained as a result of training the Random Forest algorithm. Results: a new method has been developed for calculating the duration of the production cycle of technically complex products for small-scale production enterprises based on statistical analysis of the results of the previous production activity of the enterprise. The pre-trained Random Forest machine learning algorithm was used for the calculation. Evaluation of the calculation results obtained using a mathematical model of the production process suggests that the prediction of the duration of the production cycle of products with an unknown duration of the test stage is possible using machine learning methods, and the accuracy of the forecast depends on the chosen method and the size of the training sample. Practical significance: the proposed method allows us to predict the duration of production and testing of technically complex products under conditions of uncertainty and can be used as a tool for calculating the annual schedule of product shipment to the consumer.
Full Text
Введение Для любого промышленного предприятия планирование - тот стержень, на котором основывается его благополучие. Динамическая природа экономики требует постоянной и неуклонной актуализации методов управления предприятием, внедрения передовых разработок в области производственного планирования и контроля. Проведённый авторами анализ публикаций в области производственного планирования показал, что современная научная мысль в России развивается в двух основных направлениях: - совершенствование традиционных, уже устоявшихся методов; - использование методов математической статистики и анализа данных. Первое направление представлено следующими подходами: - внедрение на предприятиях комплексных информационных систем [2, 7, 10, 11]; - совершенствование традиционных методик алгоритмов расчёта [1, 3, 5, 6, 8, 9, 12, 13]; - реализация графических моделей планирования и управления [4]. Второе направление можно разделить: - на анализ состояния предприятия методами математической статистики [12]; - математические методы сценарного планирования [15]; - анализ данных [16, 17]. В современной России методы, связанные с математической статистикой (эконометрика) и анализом данных, всё ещё недостаточно активно используются промышленными предприятиями в качестве инструментов для аналитической обработки производственных показателей. Наблюдается существенная неравномерность в использовании этих методов объектами экономики: без эконометрики невозможно себе представить функционирование финансовых учреждений и ритейла, анализ данных получил бурное развитие в рамках информационных технологий и обработки научных данных, внедрение же указанных технологий на производственных предприятиях развито слабо. В данной статье представлен метод расчёта длительности производственного цикла (ДПЦ) сложного технического изделия, процесс производства которого заканчивается приёмо-сдаточными испытаниями (ПСИ) [18] с неизвестной заранее длительностью. Метод представляет второе направление в производственном планировании и реализован в рамках статистического (машинного) обучения [19], которое, в свою очередь, является частью области научных знаний, называемой анализом данных. Разработанный метод является новым и основан на предположении о существовании зависимости между промежуточным и конечным результатом производственной деятельности для предприятия с неизвестным заранее ДПЦ изделий. Проблема улучшения производственного планирования для снижения издержек, повышения качества продукции и минимизации риска срыва сроков поставки готовой продукции потребителю так или иначе решается на каждом предприятии. Присутствие неопределённости в процессах, протекающих на производстве, значительно усложняет планирование. В связи с этим возможность прогнозирования длительности производства изделий с высоким уровнем неопределённости является особенно актуальной. Важно также отметить перспективы использования представленного метода в качестве инструмента для расчёта плана-графика выпуска готовых изделий: в случае, когда в распоряжении аналитика имеется «затравка» (данные на начало периода планирования), последовательный расчёт ДПЦ изделий позволит предсказать будущее состояние производства и рассчитать график отгрузки готовой продукции на период планирования. 1. Методика исследования 1.1. Описание модели. Для решения задачи прогнозирования ДПЦ использована зависимость между количеством изделий, одновременно находящихся на ПСИ в момент передачи рассматриваемого изделия на испытания, и длительностью ПСИ передаваемого изделия. Поскольку производство различных типов изделий идет на единых мощностях, закономерность взаимного влияния процессов производства изделий различных типов рассматривается как основная. Поиск зависимости между входными переменными и результатом квалифицируется как задача регрессии [20, 21], следовательно, статистическую модель можно формализовать как . (1) где Y - количественное значение, которое необходимо предсказать (ДПЦ); f - фиксированная неизвестная функция; x - входная переменная; e - ошибка, не зависящая от x, имеющая нулевое математическое ожидание. Решение задачи прогнозирования заключается в поиске неизвестной функции f [19]. Прогностическая модель ДПЦ технически сложного изделия была построена применительно к коммунальной машине МК-2000, выпускаемой на ПАО МЗИК [22]. Анализ информации о ДПЦ этого изделия показал, что показатели ПСИ интегрально отражают отклонения от графика производственного цикла, поскольку здесь проявляются брак, отклонения от графика при производстве, а также и отказы при ПСИ. Кроме этого на длительность сдаточных испытаний этого изделия влияет и то, что на ПСИ находятся и другие виды продукции (дизельные погрузчики, ричтраки, коммунальные машины), всего 10 видов. Исходя из этого, ДПЦ была разбита на этапы: производственный (производство машинокомплекта; комплектование покупными узлами и деталями; сборка изделия) и приёмо-сдаточные испытания готового изделия (ПСИ). А в качестве входной переменной X принято количество изделий, одновременно находящихся на ПСИ. 1.2. Исходные данные. Исходные данные для построения модели были собраны за последние два года для 50 коммунальных машин МК-2000. Для примера данные четырех ДПЦ из генеральной совокупности представлены в таблице. ДПЦ коммунальной машины МК-2000 для четырех изделий, с учетом нахождения на ПСИ другой продукции № п/п Другая продукция на ПСИ ДПЦ МК-2000 A B C D E F G H I J 1 2 1 0 2 1 1 0 0 2 0 40 2 0 0 0 0 2 0 0 1 2 3 54 3 1 0 0 0 2 0 0 1 2 3 47 4 3 0 0 0 2 0 0 1 2 3 52 В первом столбце - порядковые номера МК-2000, последовательно передаваемые после производственного этапа для проведения ПСИ. В разделе «Другая продукция на ПСИ» приведено количество изделий других типов, уже находящихся на этапе ПСИ на момент передачи конкретной МК-2000 на испытания. Матрица, содержащая значения столбцов A - J для конкретной МК-2000, является вектором входных переменных. В последний столбец занесена ДПЦ для МК-2000, размерность - количество рабочих смен. 1.3. Инструменты для построения регрессионной модели. В качестве инструмента построения регрессионной модели применены программное обеспечение для статистической обработки данных (специализированный язык программирования «R») [23, 24] и программный пакет Random Forest (RF) [25], реализующий одноименный алгоритм машинного обучения. В алгоритме RF производится построение множества (ансамбля) регрессионных деревьев с применением случайного выбора переменных для разделения и последующего усреднения результатов, вычисленных каждым деревом [26]. Поэтому результат работы RF в значительной степени зависит от значения встроенного генератора случайных чисел. С целью контроля точности прогноза генеральная совокупность была случайным образом разделена на обучающую (45 наблюдений) и тестовую (5 наблюдений). Настройку RF производили при помощи следующих параметров: - mtry - количество переменных, случайно выбираемых для вычисления критерия разделения конкретного узла при «выращивании» каждого дерева; - ntree - количество выращиваемых деревьев; - nodesize - минимальное количество терминальных узлов. Оценку точности прогноза RF на тестовой выборке производили при помощи среднеквадратичной ошибки прогноза MSE (от. англ. Mean square error): (2) где - предсказанное значение количественного отклика; - количественный отклик из обучающей выборки; n - количество наблюдений. Во время настройки RF оценка точности прогноза производилась при помощи параметра OOB Error (от англ: Out of bag error - тест по наблюдениям, не попавшим в выборку), представляющего собой MSE, вычисленную для наблюдений из обучающей выборки, не использовавшихся при обучении RF (примерно, треть от общего количества наблюдений в выборке [23]). Поиск оптимального параметра mtry для построения каждого дерева RF выполнен функцией tuneRF [27]. Оценка важности переменных получена с использованием функции VarImPlot [27], которая вычисляет важность переменных следующим образом: - из обучающего набора исключается одна из переменных (в нашем случае остаётся 9); - обучается RF с использованием оставшихся; - вычисляется RSS (от англ. Residual sum of square - сумма квадратов остатков) на обучающей выборке из оставшихся переменных по уравнению: (3) - вычисляется разница между RSS на полных данных и RSS, вычисленной в п. 3; - по результатам строится точечная диаграмма. Чем больше значение RSS после удаления переменной, тем больше её важность для модели. 2. Результаты и обсуждение 2.1. Выбор параметров обучения RF. Обучение RF было начато по функции tuneRF для выбора оптимального количества переменных, случайно выбираемых для вычисления критерия разделения конкретного узла при «выращивании» каждого дерева (mtry). По величине ошибки OOB Error, вычисленной по уравнению (2), получено оптимальное значение mtry = 2 (рис. 1). Рис. 1. Графическая интерпретация поиска mtry С целью поиска правильного баланса между дисперсией и смещением будущей модели запуск процесса обучения RF был произведён 40 раз. При каждом запуске в процессе обучения RF «выращивали» до 500 деревьев. Ошибку OOB Error вычисляли после выращивания 50, 100 и 500 деревьев соответственно. На рис. 2 показано изменение уровня ошибки OOB Error, вычисленной по уравнению (2) в зависимости от значения генератора случайных чисел, изменяющегося при каждом запуске обучения RF. Прямая штриховая линия - уровень минимально возможной ошибки RF с 500 деревьями, равной 83,1. Кривая из точек представляет собой дисперсию ошибки для 500 деревьев, штриховая кривая - для 100 деревьев и сплошная демонстрируют дисперсию ошибки для 50 деревьев. Видно, что дисперсия ошибки RF со 100 деревьями существенно ниже (min = 80,2), чем у RF с 50 деревьями. Рис. 2. Дисперсия ошибки для 50, 100 и 500 деревьев Это позволяет получить модель с меньшей ошибкой прогноза, чем у RF с 500 деревьями. Параметр ntree установлен равным 100. Поскольку в рамках данного исследования каждая из десяти входных переменных может принимать любое значение, все переменные признаны необходимыми, минимальное количество терминальных узлов nodesize имеет значение 10. 2.2. Обучение модели. Учитывая значительное влияние генератора случайных чисел на уровень ошибки прогноза (рис. 2), обучение RF было реализовано в цикле c условием. Циклический запуск обучения RF продолжался до тех пор, пока MSE на тестовой выборке не снизилась ниже 50. Значение MSE = 50 было получено путём последовательного снижения значения условия остановки цикла. Результатом циклического выбора минимальной MSE на тестовой выборке стала модель с MSE = 49,7, количество запусков составило 22 156. 2.3. Оценка важности переменных. На основании расчёта RSS по уравнению (3) построена точечная диаграмма (рис. 3). Рис. 3. Диаграмма влияния количества изделий определённого типа, находящихся на этапе ПСИ, на ДПЦ МК2000 2.4. Оценка точности прогноза. Точность прогноза была оценена на тестовой выборке в сравнении с фактическим количеством смен, в течение которых пять случайно выбранных коммунальных машин МК-2000 за последние два года находились на ПСИ. Ошибка прогноза на тестовой выборке составила в среднем 9,7 % (рис. 4, предсказанные значения - светлые столбики). Рис. 4. Сравнение тестовых и предсказанных начений ДПЦ для случайно выбранных коммунальных машин МК2000 за последние два года Таким образом, расчет по предложенной модели позволяет с высокой точностью для производственных условий предсказать ДПЦ планируемого выпуска продукции. Данный прогноз основан на анализе предыдущего выпуска аналогичной технически сложной продукции на конкретном предприятии. В результатах анализа интегрально отражены особенности предприятия, связанные с техническим уровнем его производства, колебаниями поставок, длительностью ПСИ. При этом отсутствуют явные зависимости ДПЦ от указанных факторов, они выражены в виде статистически обработанных данных за предшествующий период деятельности. Заключение 1. Разработана методика прогноза длительности производственного цикла изготовления технически сложной продукции. Она основана на статистическом анализе предшествующих данных по выпуску аналогичной продукции методом машинного обучения по методике «Random forest» в программном пакете «R». 2. Применительно к выпуску коммунальной машины МК-2000 ошибка результатов расчета в сравнении с данными выпуска за последние 2 года не превысила 10 %. 3. Применение описанной в статье методики позволит избежать издержек, связанных с неравномерной загрузкой производственных мощностей при определении сроков выпуска продукции методом экспертных опросов. Также появится математически обоснованная возможность расчёта годового графика отгрузки готовых изделий, это сведёт к минимуму риск срыва сроков поставки. 4. Дальнейшее исследование производственных процессов на предприятиях с высокой степенью неопределённости производственного цикла в перспективе может привести к созданию экспертной системы путём агрегирования нескольких предсказательных моделей.About the authors
R. G Vlasov
Ural Federal University named after B.N. Yeltsin
Yu. S Korobov
Ural Federal University named after B.N. Yeltsin; M.N. Mikheev Institute of Metal Physics
E. Yu Kuznetsova
Ural Federal University named after B.N. Yeltsin
References
- Титов В.В., Безмельницын Д.А., Напреева С.К. Планирование функционирования предприятия в условиях риска и неопределённости во внешней и внутренней среде // Мир экономики и управления. - 2017. - Т. 17, № 3. - С. 179-191. doi: 10.25205/2542-0429-2017-17-3-179-191
- Мызникова Т.Н., Бажанова М.И., Белов М.В. Внедрение системы управленческого учёта и контроллинга на промышленном предприятии // Вестник ЮУрГУ. Сер. Экономика и менеджмент. - 2020. - Т. 14, № 2. - С. 119-128. doi: 10.14529/em200211
- Коновалова Г.И. Операционная модель оперативного управления цифровым производством на машиностроительном предприятии // Организатор производства. - 2020. - Т. 14, № 1. - С. 37-45. doi: 10.25987/VSTU.2019.89.30.004
- Евченко А.В. Реализация графических моделей информационных потоков и документооборота в системах сквозного производственного планирования и оперативного управления на предприятиях // Инновационная экономика: перспективы развития и совершенствования. - 2020. - № 2(44). - С. 95-104.
- Сидорович Н.И. Совершенствование оперативно-календарного планирования на промышленных предприятиях // Наука и инновации. - 2015. - № 8(15). - С. 23-26.
- Батьковский М.А., Кравчук П.В., Трофимец Я.В. Развитие оперативного управления производственными процессами на предприятиях оборонно-промышленного комплекса // Национальные интересы: приоритеты и безопасность. - 2019. - Т. 15, № 2. - С. 328-342.
- Батьковский М.А., Кравчук П.В., Судаков В.А. Системы поддержки принятия решений в многокритериальных задачах управления инновационным развитием предприятий и интегрированных структур // Актуальные вопросы современной экономики. - 2019. - № 4. - С. 140-146.
- Васенев К.П. Построение системы интегрированного планирования на промышленном предприятии для турбулентных условий // Вестник Моск. ун-та. - 2017. - № 4. - С. 118-141.
- Зубкова Н.В. Математическое моделирование оптимизации системы оперативного планирования на машиностроительных предприятиях [Электронный ресурс] // Современные научные исследования и инновации. - 2016. - № 9. - URL: http://web.snauka.ru/issues/ 2016/09/72094 (дата обращения: 06.01.2021).
- Дронь Е.А., Погороелв Г.И., Куликов Г.Г. Разработка функциональных моделей производства при внедрении автоматизированных информационных систем // Вестник ЮУрГУ. Сер. Компьютерные технологии, управление, радиоэлектроника. - 2018. - Т. 18, № 3. - С. 68-80. doi: 10.14529/ctcr180308
- Анохов И.В. Уровни кодирования информации промышленного предприятия и предпосылки его взаимодействия с поставщиками и подрядчиками // Вестник Пермского университета. Сер. Экономика. - 2020. - Т. 15, № 1. - С. 131-149. doi: 10.17072/1994-9960-2020-1-131-149
- Алексеев М.А., Фрейдина Е.В. Методологические основы развития теории робастного управления экономическими системами // Вестник НГУЭУ. - 2017. - № 2. - С. 19-29.
- Сидоренко Ю.А. Особенности и методология планирования на машиностроительном предприятии // Вестник Нижегород. ун-та им. Лобачевского. Сер. Социальные науки. - 2015. - № 2(38). - С. 35-41.
- Войташ Л.В., Харченко Е.В. Упреждающий проход к управлению развитием промышленного предприятия в условиях неопределённости и риска // Научные ведомости. Сер. История. Политология. Экономика. Информатика. - 2012. - № 19(138). - Вып. 24/1. - С. 5-10.
- Оптимизация распределения заказов при оперативном планировании поставок материальных ресурсов для авиационной техники / В.В. Короленко, В.В. Грибанов, А.Б. Дорошенко, В.С. Логойда // Воздушно-космические силы. Теория и практика. - 2018. - № 5. - С. 60-71.
- Ченгарь О.В., Шевченко В.И., Мащенко Е.Н. Экспериментальное исследование адекватности модели организационного планирования загрузки технологического оборудования машиностроительного производства // Фундаментальные и прикладные проблемы техники и технологии. - 2019. - № 5(337). - С. 95-102.
- Батьковский А.М., Судаков В.А., Хрусталёв Е.Ю. Нейро-нечёткая модель управления инновационно - активным предприятием // Научный журнал КубГАУ. - 2019. - № 153(09). - С. 1-16.
- ГОСТ 15.309-98. Система разработки и постановки продукции на производство. Испытания и приемка выпускаемой продукции. Основные положения // Доступ из справ.-правовой системы КонсультантПлюс.
- Хасти Т., Тибширани Р., Фридман Д. Основы статистического обучения: интеллектуальный анализ данных, логический вывод и прогнозирование. - 2-е изд. - М.: Диалектика, 2017. - 768 с.
- Куликов Г.Г., Дронь Е.А. Формализация моделей планирования при организационном управлении на производственном предприятии // Вестник Южно-Урал. гос. ун-та. Сер. Компьютерные технологии, управление, радиоэлектроника. - 2016. - № 2. - С. 91-100.
- Красс М.С., Чупрынов Б.П. Математика в экономике: математические методы и модели: учеб. для СПО / под ред. М.С. Красса. - 2-е изд., испр. и доп. - М.: Юрайт, 2019. - 541 с. - (Сер. Профессиональное образование).
- Коммунальная вакуумная подметально-уборочная машина МК2000 [Электронный ресурс]. - URL: http://zik-ekb.ru/mashina-kommunalnaya-mk2000/
- Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R. - 2017. - 351 с. - URL: https://github.com/ranalytics/data-mining
- Шипунов А.Б., Балдин Е.М., Волкова П.А. Наглядная статистика. Используем R! - М.: ДМК Пресс, 2012. - 295 с.
- Летова М.С. Реализация регрессионных и классификационных задач с помощью метода Random Forest // E-SCIO. - 2017. - № 8(11). - С. 15-21.
- Breiman Leo. Random Forests // Machine Learning. - 2001. - Vol. 45, № 1. - P. 5-32. doi: 10.1023/A:1010933404324
- Liaw A. Package ‘randomForest’ // CRAN. - 2018. doi: 10.1023/A:1010933404324
Statistics
Views
Abstract - 52
PDF (Russian) - 29
Refbacks
- There are currently no refbacks.