CLASSIFICATION OF THE TECHNICAL CONDITION OF WATER PUMPING EQUIPMENT USING CONVOLUTIONAL NEURAL NETWORKS

Abstract


The problem of equipment repair management in water supply systems is considered. The purpose of the study is to study the issues of the possibility of classifying the technical condition of pumping equipment through the use of modern machine learning models. Classification is carried out on the data that were obtained by vibration diagnostics during the maintenance of pumping units. The initial data is converted into chalk spectrograms, the results of the conversion are presented as images. The model classifies time series according to one of three states: satisfactory, acceptable, not acceptable. Accuracy assessment is carried out by calculating indicators such as: precision, recall, F1-score. Since each class has a different number of measurements in the source data, the accuracy is determined by calculating each of the indicators for each class separately and then averaging them. Convolutional neural networks are used to classify images. To solve the problem, a network with a deep ResNet-50 architecture was chosen. The accuracy indicators that the network showed in other classification tasks and the speed of network learning determined the choice of this configuration. The average value of the precision indicator reaches 0.81, recall 0.90, and F1-score 0.85, which is a good result for the top-1 criterion. Classification of chalk spectrograms obtained from the initial data shows good results, despite the fact that the data has not been cleared of noise. The proposed methods and models have been tested on real data, which confirms the possibility of their use in the development of an intelligent information system for managing the technical condition of pumping equipment.

Full Text

Введение Одним из немаловажных факторов комфортных условий для жизни является бесперебойно работающая система водоснабжения. Отсутствие своевременного ремонта, технического обслуживания и превышение гарантийного срока эксплуатации оборудования приводит к значительному физическому износу, как следствие - к поломкам коммуникаций, обеспечивающих водоснабжение [1]. Отказы в работе водоносного оборудования приводят к неблагоприятным последствиям во всех сферах: перебои с поставкой воды гражданам, простои на предприятиях или снижение темпов производимой продукции, перебои в работе социально значимых объектов. Управление техническим состоянием оборудования на предприятии - одна из интересных и обсуждаемых проблем. Для обеспечения беспрерывной работы насосных агрегатов водоснабжающие компании проводят плановые проверки состояния оборудования с различными видами диагностики, внедряют системы мониторинга. Выявление симптомов некорректной работы оборудования является стратегически важной задачей. Найденные на ранних стадиях проблемы могут быть устранены в кратчайшие сроки, не доводя оборудование до аварийных ситуаций. Используя данные, полученные при помощи систем мониторинга, можно спрогнозировать возможные поломки [2]. Для выявления отказов оборудования создаются сложные системы, которые позволяют управлять процессами, связанными с техническим состоянием оборудования на предприятии [3]. Подача воды в системы водоснабжения начинается с насосных станций, которые обеспечивают забор и перекачку воды с необходимым напором. Они являются главными сооружениями в системах водоснабжения и водоотведения. На них размещаются насосные агрегаты, измерительные приборы, трубопроводы, электрооборудование. Все станции разделяют по назначению на четыре типа: водопроводные, канализационные, ирригационные, дренажные. В работе будем рассматривать водопроводные станции, так как они обеспечивают водоснабжение поселений и предприятий. По использованию их разделяют на станции первого и второго подъема. Станции первого подъема осуществляют перекачку воды из источника в резервуары или очистные сооружения. На них могут использоваться несколько групп насосов, например, первая группа насосов осуществляет перекачку воды на очистку, а вторая отвечает за передачу воды потребителям. Станции второго подъема отвечают за подачу очищенной воды потребителю. Иногда станции второго подъема объединяют со станциями первого подъема и с очистными сооружениями. По надежности все станции делятся на три категории. Первая категория - это насосные станции, которые с определенной доверительной вероятностью не должны допускать перерывов в подаче воды. К станциям первой категории относятся объекты противопожарных водопроводов. На станциях второй категории допускают с определенной вероятностью снижение расхода, напора, а также перерыв в подаче воды на время включения резервного энергоснабжения обслуживающим персоналом. В эту категорию входят станции, на которых имеется емкость с запасом воды, или эта станция относится к населенному пункту с населением, превышающем три тысячи жителей. Третья категория станций - это станции, которые допускают с определенной вероятностью снижение расхода и напора, а также перерывы в ее подаче на время ликвидации аварии, но не более двадцати четырех часов. Такие станции устанавливают в населенных пунктах с населением менее трех тысяч человек [4]. В настоящее время выявление и прогнозирование поломок производится при помощи вибромониторинга насосных агрегатов. На водяные насосы устанавливают вибродатчики, которые с определенной частотой дискретизации снимают показания виброскорости или виброускорения. Данные, полученные при помощи вибродатчиков, поступают на пульт управления. На основании полученных данных оператор принимает решение о исправности насоса. Решения принимаются на основе ГОСТа ИСО 10816-1-97, в котором описаны границы показаний виброскорости для машин различных классов. В большинстве случаев границы разделяют на четыре класса, основываясь на показаниях виброскорости. В первый класс входят машины, только что введенные в эксплуатацию, состояние этих машин позиционируется как хорошее. Машины, попавшие во второй класс, считаются пригодными для дальнейшего использования, состояние таких машин считают удовлетворительным. Если показатели насосного агрегата попали в третью зону, то он считается непригодным для длительной эксплуатаций, состояние аппарата считают допустимым. Показатели вибрации в четвертой зоне считаются достаточно серьезными и могут вызвать повреждение агрегата, это считается недопустимым состоянием [5]. Как только показатели виброскорости достигают допустимой зоны, оператор вызывает на участок бригаду вибродиагностов, которая проводит обследование и, основываясь на результатах замеров, выдает заключение о исправности аппарата. Основываясь на прогнозных значениях, полученных при помощи нейросетевой модели, появится возможность отследить переход агрегата из удовлетворительного в неудовлетворительное состояние. Данное решение позволит уменьшить затраты на ремонт оборудования. Для прогнозирования предлагается использовать как статистические методы регрессии, так и модели машинного обучения. Классификация технического состояния осуществляется при помощи искусственных нейронных сетей. С помощью прогнозирования и классификации технического состояния оборудования можно определить остаточный ресурс оборудования. Плановый ремонт оборудования приводит к остановкам в производстве и уменьшению получаемой прибыли. Оценка остаточного ресурса оборудования позволит уменьшить интервалы между техническим обслуживанием установок и сократить материальные потери. Например, в исследовании [6] применяется метод нейросетевого моделирования для определения остаточного ресурса насосного оборудования. Прогнозирование отказов оборудования осуществляют не только при помощи датчиков, которые снимают показания вибрации, но и используя остальные параметры системы. Также важной задачей является оценка состояния агрегата при помощи статистического анализа и контроля стабильности вибрации [7]. Для извлечения пространственных свойств из многомерных сенсорных данных автор использует сверточные слои, а рекуррентные сети - для моделирования долговременных зависимостей. Также для выявления аномалий используют методы кодирования и декодирования при помощи сетей, обладающих долговременной краткосрочной памятью [8]. В таких системах модель учат конструировать «нормальное» поведение временных рядов и используют ошибку реконструкции для выявления аномалий. Для автоматизированной оценки состояния узлов электроприводного центробежного насоса (ЭЦН) используются экспертные системы, основанные на знаниях и нечеткой логике [9]. Для определения остаточного ресурса также возможно прогнозировать параметры, полученные с датчиков, и на их основании принимать решение о работоспособности агрегата. Для решения задачи применяют как статистические методы, так и методы искусственного интеллекта. В статье [10] была разработана новая архитектура сети Informer. Авторы проводят эксперимент на различных наборах данных, который показывает, как изменяются показатели точности в зависимости от количества предсказанных значений, и сравнивают результаты с показателями уже известных моделей. В статье [11] представлено оценочное исследование, в котором сравнивается производительность моделей глубокого обучения для прогнозирования временных рядов на несколько шагов вперед. Производится сравнение рекуррентных нейронных сетей, сетей с кратковременной долгосрочной памятью, двунаправленных сетей LSTM и сверточных нейронных сетей. Кроме того, существуют методы, при помощи которых можно улучшить уже существующие модели. Например, в статье [12] разработан алгоритм Queryselector, который позволяет подобрать правильную конфигурацию моделей машинного обучения. Также разрабатываются новые архитектуры сетей по типу Transformer. В работе [13] разработана модель Transformer основанная на механизме внимания. Она сочетает в себе высокопроизводительное многозонное прогнозирование с интерпретируемым пониманием временной динамики. Чтобы изучить временные отношения в разных масштабах, Transformer использует повторяющиеся слои для локальной обработки и интерпретируемые слои самоконтроля для долгосрочных зависимостей. Для прогнозирования, помимо прочего, используются авторегрессионные модели, такие как ARIMA. Авторы работы [14] сравнивают точность предсказания финансовых временных рядов при помощи авторегрессионных моделей и моделей LSTM. LSTM-модели используют и при прогнозировании показателей работы электроприводного центробежного насоса [15]. Прогнозирование достигает хороших результатов для первых 12 часов работы установки. Таким образом, в данной работе предлагается использовать нейронные сети сверточного типа для решения задачи классификации. Постановка и метод решения задачи классификации Для определения состояния насосного оборудования требуется решить задачу классификации. Техническое состояние оборудования определяют при помощи мониторинга различных показателей, таких как напряжение, температура двигателя, виброскорость, давление. Самым часто используемым показателем является виброускорение. Проанализировав спектр, можно сделать выводы о состоянии оборудования при помощи выявления соответствующих гармоник в исходном сигнале. Были получены показатели виброускорения с частотой дискретизации 1000 Гц. Вибродиагносты выделяют три основных состояния системы: не неудовлетворительное, удовлетворительное, хорошее. Проанализировав показания, полученные с датчиков, вибродиагносты составляют отчет, в котором относят каждый замер к одному из трех классов. На основе полученных данных требуется разработать модель классификации показателей виброускорения. Результатом работы модели будет являться состояние насосного оборудования. Пусть x - вектор-функция, которая содержит в себе значения показателей работы оборудования при различном состоянии системы. Тогда X - множество описаний объектов x, а Y - конечное множество меток классов. Предполагается существование целевой функции отображения f : X → Y, значения которого известны только на объектах обучающей выборки D = {(x1, y1), . . . ,(xm, ym)} X × Y. Требуется построить классификатор k: X → Y, максимально приближенный к функции f на множестве X. Для классификации изображений используются алгоритмы, в основе которых лежат сверточные нейронные сети (CNN). В работе [19] авторы решают задачу распознавания микроструктуры материалов. Точность прогнозирования составляет 92,1 % по критерию Top-3 и 66,2 % по Top-1. Для классификации объектов авторы используют сеть ResNet-152. Также CNN применяют для классификации рентгеновских снимков. В статье [20] авторы разрабатывают систему диагностики для выявления случаев COVID-19 на основе CNN. Показатели точности и полноты равны 0,981 и 0,962 соответственно. Поэтому в данной работе также использовались CNN. Отметим, что сверточная нейронная сеть - однонаправленная многослойная нейронная сеть, в которой чередуются слои двух видов - сверточные (convolution) и объединяющие (pooling). Сверточные слои предназначены для выполнения операции свертки - умножение каждой точки изображения на матрицу свертки. Объединяющие слои отвечают за уменьшение размерности карты признаков, что помогает ускорить вычисления. CNN при помощи своей архитектуры способна распознавать объекты со сложной иерархией признаков. Для решения задачи была выбрана модель ResNet-50. ResNet-50 - это вариант архитектуры ResNet с 50 глубокими слоями. Самый простым способом повышения точности классификации CNN является увеличение глубины обучения сети. Однако при увеличении размера сети возникает проблема затухающего градиента. ResNet решает эту проблему при помощи соединений быстрого доступа. В реализации ResNet есть два типа модулей быстрого доступа. Первый - это идентификационный блок, который не имеет слоя свертки в месте быстрого доступа. В этом случае вход имеет те же размеры, что и выход. Другой блок - сверточный, который имеет слой свертки в соединении быстрого доступа. В этом случае входные размеры меньше выходных. Соединения быстрого доступа пропускают один или несколько слоев и выполняют сопоставление идентификаторов. Архитектура ResNet-50 состоит из последовательностей сверточных блоков со средним объединением. На последнем слое для классификации объектов используется Softmax. Как только входное изображение загружено, оно проходит через сверточный слой с 64 фильтрами и размером ядра 7×7, за которым следует максимальный объединяющий слой. После объединяющего слоя идут четыре блока из сверточных слоев, которые содержат различное количество признаков. Существуют различные методы классификации частотных показателей. Автор статьи [16], используя в качестве входных данных значения, полученные с вибродатчиков, применяет алгоритм Левенберга - Марквардта для классификации состояния оборудования. Так как частотные показатели представлены в качестве временного ряда, то для их классификации можно применить рекуррентные нейронные сети. В статье [17] выполняют классификацию шумов, связанных с возникновением респираторных заболеваний. Анализ существующих решений показал, что самым эффективным методом классификации временных рядов является построение сверточных нейронных (CNN) сетей [18]. CNN обучаются на наборах изображений, исходя из этого, требуется преобразовать исходный сигнал в набор изображений. В работе для преобразования использовались мел-спектрограммы. Мел-спектрограмма - это спектрограмма, на которой частота выражена не в герцах, а в мелах. Преобразование к мелам осуществляют при помощи применения к спектрограмме, полученной при помощи быстрого преобразования Фурье, мел-фильтров. Исходный сигнал представлен на рис. 1, а полученная мел-спектрограмма показана на рис. 2. Рис. 1. Исходные данные (виброскорость) Рис. 2. Мел-спектрограмма В задачах классификации оценку качества модели осуществляют при помощи составления матрицы ошибок. Матрица формируется отдельно для каждого класса, класс, для которого ведется подсчет, называется «положительным», все остальные «отрицательные». Производится подсчет четырех значений: истинно-положительные (TP), истинно-отрицательные (TN), ложноположительные (FP), ложноотрицательные (FN). На их основе рассчитываются такие показатели, как точность (precision), полнота (recall) и F1-мера (F1-measure). (1) (2) (3) где b - коэффициент, определяющий вес recall в метрике. Для подсчета F1-меры коэффициент b равнялся 1, поскольку показатели precision и recall равно значимы при решении задачи. Однако в задачах многоклассовой классификации требуется построить матрицу ошибок для каждого класса и усреднить полученные значения. Но в случае дисбаланса классов модель будет игнорировать классы, которые содержат меньше количество объектов. Так как в обучающей выборке различное количество элементов в каждом классе, расчет точности был произведен при помощи вычисления precision и recall для каждого класса отдельно и усреднением полученных показателей для всех классов. Усреднение показателей позволило равно значимо оценить точность модели для всех искомых классов. Анализ результатов В качестве демонстрационного примера рассмотрим данные, полученные и проанализированные вибродиагностами. Показания снимались при помощи акселерометра с частотой дискретизации 1000 Гц. По каждому замеру был составлен отчет, в котором было заключение по состоянию агрегата и имеющимся неполадкам. Набор данных был разбит на три класса: удовлетворительное, допустимое и недопустимое состояния. Общий объем данных составлял 327 замеров. Из них к классу «удовлетворительное состояние» относилось 87 замеров, к классу «допустимое» - 188 и к классу «недопустимое» - 52. Для увеличения объемов обучающего множества был применен метод аугментации данных. Каждый из замеров был поделен на куски интервалом в 2 с, что позволило увеличить обучающее множество в 4 раза. Для каждого из элементов обучающего множества были получены мел-спектрограммы, на основе которых и производилось обучение сети. Обучение производилось на компьютере, оснащенном двумя видеокартами nvidiagtx 1080 ti, процессором Intel Core i7, оперативной памятью 64gb. Реализация и обучение сети было осуществлено при помощи фреймворка Tensorflow. Для обучения нейронной сети понадобилось 4 часа. Исходный набор данных был разбит на три части: обучающая, валидационная и тестовая. Обучающая часть равнялась 70 % от общей выборки, валидационная - 20 %, а тестовая - 10 %. Обучение сети осуществлялось на обучающей и валидационной выборках. Тестовая выборка в обучении не участвовала, а использовалась для подсчета F1-меры. Для обучения применялась модель ResNet-50. Инициализация начальных весов осуществлялась на основе модели, обученной на базе изображений ImageNet. На вход сети подавались трехканальные изображения размером 224×224 пикселя. Для обучения сети использовалась функция оптимизации Adam, batch_size равнялся 16, количество эпох 25. Функция обратного распространения ошибки представлена на рис. 3. Рис. 3. Функция обратного распространения ошибки (пунктиром показаны значения функции на обучающем множестве, а сплошной линией - значения на валидационном множестве) На основе функции обратного распространения ошибки можно сделать вывод, что сеть обучилась, так как значения функции перестают уменьшаться. В табл. 1 представлены значения полноты, точности, F1-меры и среднего показателя точности для каждого класса на основе валидационной выборки. Таблица 1 Показатели точности, построенные на валидационной выборке* Класс Precision Recall F1-score Удовлетворительное состояние 0,98 0,92 0,94 Допустимое состояние 0,98 0,96 0,97 Недопустимое состояние 0,85 0,91 0,88 Средняя точность 0,94 0,93 0,93 Усреднённый показатель F1-меры для трех классов равен 0,93. Показатели точности и полноты также дают хорошие результаты, однако показатель precision в классе «недопустимое состояние» заметно меньше, чем у других классов. Можно предположить, что это связано с малым объемом обучающей выборки для данного класса. В табл. 2 представлены значения полноты, точности, F1-меры и среднего показателя точности для каждого класса на основе тестовой выборки. Таблица 2 Показатели точности, построенные на тестовой выборке* Класс Precision Recall F1-score Удовлетворительное состояние 0,82 0,90 0,86 Допустимое состояние 0,85 0,91 0,88 Недопустимое состояние 0,77 0,88 0,82 Средняя точность 0,81 0,90 0,85 При проверке модели на данных, которые не участвовали в обучении сети, можно заметить, что точность по показателю recall почти не изменилась, но при этом значения показателя precision уменьшились. Точность классификации временных рядов на данных, которые исходная модель не встречала при обучении, практически не изменилась. Из этого можно сделать вывод, что модель устойчива к различным входным данным и показывает хорошие результаты при классификации временных рядов. Заключение В результате проведенных исследований был опробован метод классификации вибрации насосного оборудования при помощи искусственных нейронных сетей. Анализ результатов показал, что применяемый подход показывает хорошую точность при прогнозировании состояния насосного оборудования. Для увеличения значения показателя precision требуется увеличить количество исходных данных для каждого класса и очистить исходные данные от шумов, полученных при снятиях показаний с двигателей. Классификация показателей виброскорости, полученных при работе двигателя, позволит экспертной системе более точно спрогнозировать поведение системы и за счет этого уменьшит затраты на обслуживание электроприводного центробежного насоса.

About the authors

I. V Karakulov

Perm National Research Polytechnic University

References

  1. Шевцов М.Н., Шкамардина Е.А. Чрезвычайные ситуации на системах водоснабжения // Вестник науки и образования. - 2020. - №1 - 1 (79).
  2. Ковалев А.В., Трушин Н.Н., Сальников В.С. Прогнозирование технического состояния технологического оборудования // Известия ТулГУ. Технические науки. - 2014. - №11 - 2.
  3. Сай Ван Квонг, Щербаков М.В. Архитектура системы предсказательного технического обслуживания сложных многообъектных систем в концепции Индустрии 4.0 // Программные продукты и системы. - 2020. - №2.
  4. Надежность водозаборных сооружений [Электронный ресурс] / Нормативы качества функционирования систем водоснабжения. - URL: https://mydocx.ru/2-106586.html (дата обращения: 15.04.2022).
  5. Контроль состояния машин по результатам измерений вибрации на не вращающихся частях [Электронный ресурс] - URL: https://docs.cntd.ru/document/1200008666 (дата обращения: 15.04.2022).
  6. Абраменкова К.Н., Леонов Д.Г. Применение нейронных сетей для определения остаточного ресурса безотказной работы насосного оборудования нефтегазовой промышленности // Актуальные проблемы нефти и газа. - 2020. - №1 (28).
  7. Клячкин В.Н., Кувайскова Ю.Е., Иванова А.В. Система статистического анализа и контроля стабильности вибраций гидроагрегата // Программные продукты и системы. - 2018. - №3.
  8. Сай Ван Квонг, Щербаков М.В. Прогнозирование отказов сложных много объектных систем на основе комбинации нейросетей: пути повышения точности прогнозирования // Прикаспийский журнал: управление и высокие технологии. - 2020. - №1 (49).
  9. Истомин, Д.А., Столбов В.Ю., Платон Д.Н. Экспертная система оценки технического состояния узлов электроцентробежных насосов на основе продукционного представления знаний и нечеткой логики // Вестник ЮУрГУ. Серия «Компьютерные технологии, управление, радиоэлектроника». - 2020. - Т. 20, № 1. - С. 133-143. doi: 10.14529/ctcr200113
  10. Informer: beyond Efficient transformer for long sequence time - series forecasting [Электронный ресурс] / Haoyi Zhou, Shanghang Zhang, Jieqi Peng, Shuai Zhang, Jianxin Li, Hui Xiong, Wancai Zhang. - URL: https://arxiv.org/pdf/2012.07436v3.pdf (дата обращения: 15.04.2022).
  11. Chandra R., Goyal S., Gupta R. Evaluation of deep learning models for multi - step ahead time series prediction [Электронный ресурс] // IEEE Access. - 2021. - Vol. 9. - P. 83105 - 83123. - URL: https://ieeexplore.ieee.org/abstract/document/9444453 (дата обращения: 22.02.2022).
  12. Long-term series forecasting with Query Selector - efficient model of sparse attention [Электронный ресурс] / Jacek Klimek, Jakub Klimek, Witold Kraskiewicz, Mateusz Topolewski. - URL: https://arxiv.org/pdf/2107.08687v2.pdf (дата обращения: 22.02.2022).
  13. Temporal fusion Transformers for interpretable multi - horizon time series forecasting / Bryan Lim, Sercan Ö. Arık, Nicolas Loeff, Tomas Pfister // International Journal of Forecasting. - 2021. - Vol. 37, iss. 4. - P. 1748 - 1764. doi: 10.1016/j.ijforecast.2021.03.012.
  14. Sima Siami-Namini, Neda Tavakoli, Akbar Siami Namin. A comparative analysis of forecasting financial time series using ARIMA, LSTM, and BiLSTM [Электронный ресурс]. - URL: https://arxiv.org/pdf/1911.09512.pdf (дата обращения: 22.02.2022).
  15. Каракулов И.В., Клюев А.В., Столбов В.Ю. Прогнозирование технического состояния электроцентробежного насоса на основе нейросетевого моделирования // Вестник Южно-Уральского государственного университета. Серия: Компьютерные технологии, управление, радиоэлектроника. - 2020. - Т. 20. - № 4. - С. 37-46. - doi: 10.14529/ctcr200404.
  16. Клячкин В.Н., Санталов А.А. Разработка нейронной сети для оценки исправности гидроагрегата по результатам вибромониторинга // Программные продукты и системы. - 2020. - № 4. - С. 629-634. - doi: 10.15827/0236-235X.132.629-634.
  17. Respiratory sound classification using long - short term memory [Электронный ресурс] / Chelsea Villanueva, Joshua Vincent, Alexander Slowinski, Mohammad - Parsa Hosseini. - URL: https://arxiv.org/ftp/arxiv/papers/2008/2008.02900.pdf (дата обращения: 22.02.2022).
  18. Wei-Han Hsu, Bo-Yu Chen, Yi-Hsuan Yang. Deep learning based EDM subgenre classification using mel-spectrogram and tempogram features [Электронный ресурс]. - URL: https://arxiv.org/abs/2110.08862
  19. Клестов Р.А., Клюев А.В., Столбов В.Ю. Алгоритмическая устойчивость нейронных сетей глубокого обучения при распознавании микроструктуры материалов // Вестник ЮУрГУ. Серия: Компьютерные технологии, управление, радиоэлектроника. - 2021. - Т. 21, № 1. - С. 159-166. doi: 10.14529/ctcr210114
  20. Daniel Kvak, Marian Bendik, Anna Chromcova. Towards clinical practice: design and implementation of convolutional neural network - based assistive diagnosis system for COVID-19 case detection from chest X-Ray images [Электронный ресурс]. - URL: https://arxiv.org/pdf/2203.10596.pdf

Statistics

Views

Abstract - 107

PDF (Russian) - 181

Refbacks

  • There are currently no refbacks.

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies