APPLICATION OF MACHINE LEARNING TECHNOLOGY TO PREDICT THE TIMING OF PRODUCTION UNDER CONDITIONS OF UNCERTAINTY

R. G Vlasov; Власов Р. Г; Yu. S Korobov; Коробов Ю. С; E. Yu Kuznetsova; Кузнецова Е. Ю

doi:10.15593/2224-9397/2021.1.06

ПРИМЕНЕНИЕ ТЕХНОЛОГИИ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ПРОГНОЗИРОВАНИЯ СРОКОВ ВЫПУСКА ПРОДУКЦИИ В УСЛОВИЯХ НЕОПРЕДЕЛЁННОСТИ

Авторы: Власов Р.Г¹, Коробов Ю.С¹^,2, Кузнецова Е.Ю¹
Учреждения:
1. Уральский федеральный университет им. первого Президента России Б.Н. Ельцина
2. Институт физики металлов им. М.Н. Михеева УрО РАН
Выпуск: № 37 (2021)
Страницы: 104-120
Раздел: Статьи
URL: https://ered.pstu.ru/index.php/elinf/article/view/2446
DOI: https://doi.org/10.15593/2224-9397/2021.1.06
Цитировать

Аннотация
Полный текст
Об авторах
Список литературы
Статистика

Аннотация

Объектом представленного исследования является процесс производства коммунальной машины МК2000 в условиях сборочного цеха, ПАО МЗиК. МК2000 является технически сложным изделием, производящимся совместно c десятью другими типами технически сложных изделий в рамках одного цеха. Фактором неопределённости в процессе производства является неизвестная заранее длительность цикла испытаний, которым подвергается каждое изделие после окончания сборки. Цель исследования: разработка методики расчёта длительности производственного цикла изделия в условиях неопределённости; оценка возможности производственного планирования и расчёта годового графика отгрузки готовых изделий потребителю при помощи прогнозирования длительности цикла. Методы: для решения задачи прогнозирования длительности производственного цикла использована зависимость между количеством изделий всех типов, уже находящихся в процессе испытаний в момент передачи рассматриваемого изделия на испытания, и длительностью испытания передаваемого изделия. Поскольку производство различных типов изделий осуществляется на единых мощностях, закономерность взаимного влияния процессов производства изделий различных типов рассматривается как основная. Расчёт длительности производится при помощи математической модели, полученной в результате обучения алгоритма Random Forest. Результаты: разработан новый метод расчёта длительности производственного цикла технически сложных изделий для предприятий мелкосерийного типа производства на основе статистического анализа результатов предыдущей производственной деятельности предприятия. Для расчёта использован предварительно обученный алгоритм машинного обучения Random Forest. Оценка результатов расчёта, полученных при помощи математической модели производственного процесса, позволяет утверждать, что прогнозирование длительности производственного цикла изделий с неизвестной заранее продолжительностью этапа испытаний возможно с применением методов машинного обучения, а точность прогноза зависит от выбранного метода и величины обучающей выборки. Практическая значимость: предложенный метод позволяет прогнозировать длительность производства и испытания технически сложных изделий в условиях неопределённости и может быть использован в качестве инструмента для расчёта годового графика отгрузки продукции потребителю.

Ключевые слова

планирование, модель, неопределённость, машинное обучение, прогноз.

Полный текст

Введение Для любого промышленного предприятия планирование - тот стержень, на котором основывается его благополучие. Динамическая природа экономики требует постоянной и неуклонной актуализации методов управления предприятием, внедрения передовых разработок в области производственного планирования и контроля. Проведённый авторами анализ публикаций в области производственного планирования показал, что современная научная мысль в России развивается в двух основных направлениях: - совершенствование традиционных, уже устоявшихся методов; - использование методов математической статистики и анализа данных. Первое направление представлено следующими подходами: - внедрение на предприятиях комплексных информационных систем [2, 7, 10, 11]; - совершенствование традиционных методик алгоритмов расчёта [1, 3, 5, 6, 8, 9, 12, 13]; - реализация графических моделей планирования и управления [4]. Второе направление можно разделить: - на анализ состояния предприятия методами математической статистики [12]; - математические методы сценарного планирования [15]; - анализ данных [16, 17]. В современной России методы, связанные с математической статистикой (эконометрика) и анализом данных, всё ещё недостаточно активно используются промышленными предприятиями в качестве инструментов для аналитической обработки производственных показателей. Наблюдается существенная неравномерность в использовании этих методов объектами экономики: без эконометрики невозможно себе представить функционирование финансовых учреждений и ритейла, анализ данных получил бурное развитие в рамках информационных технологий и обработки научных данных, внедрение же указанных технологий на производственных предприятиях развито слабо. В данной статье представлен метод расчёта длительности производственного цикла (ДПЦ) сложного технического изделия, процесс производства которого заканчивается приёмо-сдаточными испытаниями (ПСИ) [18] с неизвестной заранее длительностью. Метод представляет второе направление в производственном планировании и реализован в рамках статистического (машинного) обучения [19], которое, в свою очередь, является частью области научных знаний, называемой анализом данных. Разработанный метод является новым и основан на предположении о существовании зависимости между промежуточным и конечным результатом производственной деятельности для предприятия с неизвестным заранее ДПЦ изделий. Проблема улучшения производственного планирования для снижения издержек, повышения качества продукции и минимизации риска срыва сроков поставки готовой продукции потребителю так или иначе решается на каждом предприятии. Присутствие неопределённости в процессах, протекающих на производстве, значительно усложняет планирование. В связи с этим возможность прогнозирования длительности производства изделий с высоким уровнем неопределённости является особенно актуальной. Важно также отметить перспективы использования представленного метода в качестве инструмента для расчёта плана-графика выпуска готовых изделий: в случае, когда в распоряжении аналитика имеется «затравка» (данные на начало периода планирования), последовательный расчёт ДПЦ изделий позволит предсказать будущее состояние производства и рассчитать график отгрузки готовой продукции на период планирования. 1. Методика исследования 1.1. Описание модели. Для решения задачи прогнозирования ДПЦ использована зависимость между количеством изделий, одновременно находящихся на ПСИ в момент передачи рассматриваемого изделия на испытания, и длительностью ПСИ передаваемого изделия. Поскольку производство различных типов изделий идет на единых мощностях, закономерность взаимного влияния процессов производства изделий различных типов рассматривается как основная. Поиск зависимости между входными переменными и результатом квалифицируется как задача регрессии [20, 21], следовательно, статистическую модель можно формализовать как . (1) где Y - количественное значение, которое необходимо предсказать (ДПЦ); f - фиксированная неизвестная функция; x - входная переменная; e - ошибка, не зависящая от x, имеющая нулевое математическое ожидание. Решение задачи прогнозирования заключается в поиске неизвестной функции f [19]. Прогностическая модель ДПЦ технически сложного изделия была построена применительно к коммунальной машине МК-2000, выпускаемой на ПАО МЗИК [22]. Анализ информации о ДПЦ этого изделия показал, что показатели ПСИ интегрально отражают отклонения от графика производственного цикла, поскольку здесь проявляются брак, отклонения от графика при производстве, а также и отказы при ПСИ. Кроме этого на длительность сдаточных испытаний этого изделия влияет и то, что на ПСИ находятся и другие виды продукции (дизельные погрузчики, ричтраки, коммунальные машины), всего 10 видов. Исходя из этого, ДПЦ была разбита на этапы: производственный (производство машинокомплекта; комплектование покупными узлами и деталями; сборка изделия) и приёмо-сдаточные испытания готового изделия (ПСИ). А в качестве входной переменной X принято количество изделий, одновременно находящихся на ПСИ. 1.2. Исходные данные. Исходные данные для построения модели были собраны за последние два года для 50 коммунальных машин МК-2000. Для примера данные четырех ДПЦ из генеральной совокупности представлены в таблице. ДПЦ коммунальной машины МК-2000 для четырех изделий, с учетом нахождения на ПСИ другой продукции № п/п Другая продукция на ПСИ ДПЦ МК-2000 A B C D E F G H I J 1 2 1 0 2 1 1 0 0 2 0 40 2 0 0 0 0 2 0 0 1 2 3 54 3 1 0 0 0 2 0 0 1 2 3 47 4 3 0 0 0 2 0 0 1 2 3 52 В первом столбце - порядковые номера МК-2000, последовательно передаваемые после производственного этапа для проведения ПСИ. В разделе «Другая продукция на ПСИ» приведено количество изделий других типов, уже находящихся на этапе ПСИ на момент передачи конкретной МК-2000 на испытания. Матрица, содержащая значения столбцов A - J для конкретной МК-2000, является вектором входных переменных. В последний столбец занесена ДПЦ для МК-2000, размерность - количество рабочих смен. 1.3. Инструменты для построения регрессионной модели. В качестве инструмента построения регрессионной модели применены программное обеспечение для статистической обработки данных (специализированный язык программирования «R») [23, 24] и программный пакет Random Forest (RF) [25], реализующий одноименный алгоритм машинного обучения. В алгоритме RF производится построение множества (ансамбля) регрессионных деревьев с применением случайного выбора переменных для разделения и последующего усреднения результатов, вычисленных каждым деревом [26]. Поэтому результат работы RF в значительной степени зависит от значения встроенного генератора случайных чисел. С целью контроля точности прогноза генеральная совокупность была случайным образом разделена на обучающую (45 наблюдений) и тестовую (5 наблюдений). Настройку RF производили при помощи следующих параметров: - mtry - количество переменных, случайно выбираемых для вычисления критерия разделения конкретного узла при «выращивании» каждого дерева; - ntree - количество выращиваемых деревьев; - nodesize - минимальное количество терминальных узлов. Оценку точности прогноза RF на тестовой выборке производили при помощи среднеквадратичной ошибки прогноза MSE (от. англ. Mean square error): (2) где - предсказанное значение количественного отклика; - количественный отклик из обучающей выборки; n - количество наблюдений. Во время настройки RF оценка точности прогноза производилась при помощи параметра OOB Error (от англ: Out of bag error - тест по наблюдениям, не попавшим в выборку), представляющего собой MSE, вычисленную для наблюдений из обучающей выборки, не использовавшихся при обучении RF (примерно, треть от общего количества наблюдений в выборке [23]). Поиск оптимального параметра mtry для построения каждого дерева RF выполнен функцией tuneRF [27]. Оценка важности переменных получена с использованием функции VarImPlot [27], которая вычисляет важность переменных следующим образом: - из обучающего набора исключается одна из переменных (в нашем случае остаётся 9); - обучается RF с использованием оставшихся; - вычисляется RSS (от англ. Residual sum of square - сумма квадратов остатков) на обучающей выборке из оставшихся переменных по уравнению: (3) - вычисляется разница между RSS на полных данных и RSS, вычисленной в п. 3; - по результатам строится точечная диаграмма. Чем больше значение RSS после удаления переменной, тем больше её важность для модели. 2. Результаты и обсуждение 2.1. Выбор параметров обучения RF. Обучение RF было начато по функции tuneRF для выбора оптимального количества переменных, случайно выбираемых для вычисления критерия разделения конкретного узла при «выращивании» каждого дерева (mtry). По величине ошибки OOB Error, вычисленной по уравнению (2), получено оптимальное значение mtry = 2 (рис. 1). Рис. 1. Графическая интерпретация поиска mtry С целью поиска правильного баланса между дисперсией и смещением будущей модели запуск процесса обучения RF был произведён 40 раз. При каждом запуске в процессе обучения RF «выращивали» до 500 деревьев. Ошибку OOB Error вычисляли после выращивания 50, 100 и 500 деревьев соответственно. На рис. 2 показано изменение уровня ошибки OOB Error, вычисленной по уравнению (2) в зависимости от значения генератора случайных чисел, изменяющегося при каждом запуске обучения RF. Прямая штриховая линия - уровень минимально возможной ошибки RF с 500 деревьями, равной 83,1. Кривая из точек представляет собой дисперсию ошибки для 500 деревьев, штриховая кривая - для 100 деревьев и сплошная демонстрируют дисперсию ошибки для 50 деревьев. Видно, что дисперсия ошибки RF со 100 деревьями существенно ниже (min = 80,2), чем у RF с 50 деревьями. Рис. 2. Дисперсия ошибки для 50, 100 и 500 деревьев Это позволяет получить модель с меньшей ошибкой прогноза, чем у RF с 500 деревьями. Параметр ntree установлен равным 100. Поскольку в рамках данного исследования каждая из десяти входных переменных может принимать любое значение, все переменные признаны необходимыми, минимальное количество терминальных узлов nodesize имеет значение 10. 2.2. Обучение модели. Учитывая значительное влияние генератора случайных чисел на уровень ошибки прогноза (рис. 2), обучение RF было реализовано в цикле c условием. Циклический запуск обучения RF продолжался до тех пор, пока MSE на тестовой выборке не снизилась ниже 50. Значение MSE = 50 было получено путём последовательного снижения значения условия остановки цикла. Результатом циклического выбора минимальной MSE на тестовой выборке стала модель с MSE = 49,7, количество запусков составило 22 156. 2.3. Оценка важности переменных. На основании расчёта RSS по уравнению (3) построена точечная диаграмма (рис. 3). Рис. 3. Диаграмма влияния количества изделий определённого типа, находящихся на этапе ПСИ, на ДПЦ МК2000 2.4. Оценка точности прогноза. Точность прогноза была оценена на тестовой выборке в сравнении с фактическим количеством смен, в течение которых пять случайно выбранных коммунальных машин МК-2000 за последние два года находились на ПСИ. Ошибка прогноза на тестовой выборке составила в среднем 9,7 % (рис. 4, предсказанные значения - светлые столбики). Рис. 4. Сравнение тестовых и предсказанных начений ДПЦ для случайно выбранных коммунальных машин МК2000 за последние два года Таким образом, расчет по предложенной модели позволяет с высокой точностью для производственных условий предсказать ДПЦ планируемого выпуска продукции. Данный прогноз основан на анализе предыдущего выпуска аналогичной технически сложной продукции на конкретном предприятии. В результатах анализа интегрально отражены особенности предприятия, связанные с техническим уровнем его производства, колебаниями поставок, длительностью ПСИ. При этом отсутствуют явные зависимости ДПЦ от указанных факторов, они выражены в виде статистически обработанных данных за предшествующий период деятельности. Заключение 1. Разработана методика прогноза длительности производственного цикла изготовления технически сложной продукции. Она основана на статистическом анализе предшествующих данных по выпуску аналогичной продукции методом машинного обучения по методике «Random forest» в программном пакете «R». 2. Применительно к выпуску коммунальной машины МК-2000 ошибка результатов расчета в сравнении с данными выпуска за последние 2 года не превысила 10 %. 3. Применение описанной в статье методики позволит избежать издержек, связанных с неравномерной загрузкой производственных мощностей при определении сроков выпуска продукции методом экспертных опросов. Также появится математически обоснованная возможность расчёта годового графика отгрузки готовых изделий, это сведёт к минимуму риск срыва сроков поставки. 4. Дальнейшее исследование производственных процессов на предприятиях с высокой степенью неопределённости производственного цикла в перспективе может привести к созданию экспертной системы путём агрегирования нескольких предсказательных моделей.

Об авторах

Р. Г Власов

Уральский федеральный университет им. первого Президента России Б.Н. Ельцина

Ю. С Коробов

Уральский федеральный университет им. первого Президента России Б.Н. Ельцина; Институт физики металлов им. М.Н. Михеева УрО РАН

Е. Ю Кузнецова

Уральский федеральный университет им. первого Президента России Б.Н. Ельцина

Список литературы

Титов В.В., Безмельницын Д.А., Напреева С.К. Планирование функционирования предприятия в условиях риска и неопределённости во внешней и внутренней среде // Мир экономики и управления. - 2017. - Т. 17, № 3. - С. 179-191. doi: 10.25205/2542-0429-2017-17-3-179-191
Мызникова Т.Н., Бажанова М.И., Белов М.В. Внедрение системы управленческого учёта и контроллинга на промышленном предприятии // Вестник ЮУрГУ. Сер. Экономика и менеджмент. - 2020. - Т. 14, № 2. - С. 119-128. doi: 10.14529/em200211
Коновалова Г.И. Операционная модель оперативного управления цифровым производством на машиностроительном предприятии // Организатор производства. - 2020. - Т. 14, № 1. - С. 37-45. doi: 10.25987/VSTU.2019.89.30.004
Евченко А.В. Реализация графических моделей информационных потоков и документооборота в системах сквозного производственного планирования и оперативного управления на предприятиях // Инновационная экономика: перспективы развития и совершенствования. - 2020. - № 2(44). - С. 95-104.
Сидорович Н.И. Совершенствование оперативно-календарного планирования на промышленных предприятиях // Наука и инновации. - 2015. - № 8(15). - С. 23-26.
Батьковский М.А., Кравчук П.В., Трофимец Я.В. Развитие оперативного управления производственными процессами на предприятиях оборонно-промышленного комплекса // Национальные интересы: приоритеты и безопасность. - 2019. - Т. 15, № 2. - С. 328-342.
Батьковский М.А., Кравчук П.В., Судаков В.А. Системы поддержки принятия решений в многокритериальных задачах управления инновационным развитием предприятий и интегрированных структур // Актуальные вопросы современной экономики. - 2019. - № 4. - С. 140-146.
Васенев К.П. Построение системы интегрированного планирования на промышленном предприятии для турбулентных условий // Вестник Моск. ун-та. - 2017. - № 4. - С. 118-141.
Зубкова Н.В. Математическое моделирование оптимизации системы оперативного планирования на машиностроительных предприятиях [Электронный ресурс] // Современные научные исследования и инновации. - 2016. - № 9. - URL: http://web.snauka.ru/issues/ 2016/09/72094 (дата обращения: 06.01.2021).
Дронь Е.А., Погороелв Г.И., Куликов Г.Г. Разработка функциональных моделей производства при внедрении автоматизированных информационных систем // Вестник ЮУрГУ. Сер. Компьютерные технологии, управление, радиоэлектроника. - 2018. - Т. 18, № 3. - С. 68-80. doi: 10.14529/ctcr180308
Анохов И.В. Уровни кодирования информации промышленного предприятия и предпосылки его взаимодействия с поставщиками и подрядчиками // Вестник Пермского университета. Сер. Экономика. - 2020. - Т. 15, № 1. - С. 131-149. doi: 10.17072/1994-9960-2020-1-131-149
Алексеев М.А., Фрейдина Е.В. Методологические основы развития теории робастного управления экономическими системами // Вестник НГУЭУ. - 2017. - № 2. - С. 19-29.
Сидоренко Ю.А. Особенности и методология планирования на машиностроительном предприятии // Вестник Нижегород. ун-та им. Лобачевского. Сер. Социальные науки. - 2015. - № 2(38). - С. 35-41.
Войташ Л.В., Харченко Е.В. Упреждающий проход к управлению развитием промышленного предприятия в условиях неопределённости и риска // Научные ведомости. Сер. История. Политология. Экономика. Информатика. - 2012. - № 19(138). - Вып. 24/1. - С. 5-10.
Оптимизация распределения заказов при оперативном планировании поставок материальных ресурсов для авиационной техники / В.В. Короленко, В.В. Грибанов, А.Б. Дорошенко, В.С. Логойда // Воздушно-космические силы. Теория и практика. - 2018. - № 5. - С. 60-71.
Ченгарь О.В., Шевченко В.И., Мащенко Е.Н. Экспериментальное исследование адекватности модели организационного планирования загрузки технологического оборудования машиностроительного производства // Фундаментальные и прикладные проблемы техники и технологии. - 2019. - № 5(337). - С. 95-102.
Батьковский А.М., Судаков В.А., Хрусталёв Е.Ю. Нейро-нечёткая модель управления инновационно - активным предприятием // Научный журнал КубГАУ. - 2019. - № 153(09). - С. 1-16.
ГОСТ 15.309-98. Система разработки и постановки продукции на производство. Испытания и приемка выпускаемой продукции. Основные положения // Доступ из справ.-правовой системы КонсультантПлюс.
Хасти Т., Тибширани Р., Фридман Д. Основы статистического обучения: интеллектуальный анализ данных, логический вывод и прогнозирование. - 2-е изд. - М.: Диалектика, 2017. - 768 с.
Куликов Г.Г., Дронь Е.А. Формализация моделей планирования при организационном управлении на производственном предприятии // Вестник Южно-Урал. гос. ун-та. Сер. Компьютерные технологии, управление, радиоэлектроника. - 2016. - № 2. - С. 91-100.
Красс М.С., Чупрынов Б.П. Математика в экономике: математические методы и модели: учеб. для СПО / под ред. М.С. Красса. - 2-е изд., испр. и доп. - М.: Юрайт, 2019. - 541 с. - (Сер. Профессиональное образование).
Коммунальная вакуумная подметально-уборочная машина МК2000 [Электронный ресурс]. - URL: http://zik-ekb.ru/mashina-kommunalnaya-mk2000/
Шитиков В.К., Мастицкий С.Э. Классификация, регрессия и другие алгоритмы Data Mining с использованием R. - 2017. - 351 с. - URL: https://github.com/ranalytics/data-mining
Шипунов А.Б., Балдин Е.М., Волкова П.А. Наглядная статистика. Используем R! - М.: ДМК Пресс, 2012. - 295 с.
Летова М.С. Реализация регрессионных и классификационных задач с помощью метода Random Forest // E-SCIO. - 2017. - № 8(11). - С. 15-21.
Breiman Leo. Random Forests // Machine Learning. - 2001. - Vol. 45, № 1. - P. 5-32. doi: 10.1023/A:1010933404324
Liaw A. Package ‘randomForest’ // CRAN. - 2018. doi: 10.1023/A:1010933404324

Статистика

Просмотры

Аннотация - 103

PDF (Russian) - 58

Ссылки

Ссылки не определены.

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления