AUTOMATED EVALUATION OF PARAMETERS FOR ELECTRICAL EQUIPMENT DIAGNOSTIC MODELS USING FUZZY CLUSTERING

Abstract


The development of the country's electric power industry is focused on ensuring high reliability and efficient management of power grids with different configurations. The solution of these problems assumes a certain energy-information infrastructure. In addition to electrical equipment, it must include a set of software and hardware for data acquisition, processing and analyzing during monitoring, diagnostic and subsequent management of the grid elements condition and their operating modes. The heterogeneity of the data obtained requires the development of certain mechanisms for their processing that will allow information and diagnostic systems automatically synthesize and adapt diagnostic models to the power supply facilities operation conditions. It is proposed to develop a methodology that allows to determine the parameters of electrical equipment diagnostic models, oriented to high result reliability using data mining algorithms, in particular, fuzzy clustering. The using of fuzzy clustering on the example of the construction of membership functions that evaluate the values of equipment parameters as input variables of diagnostic models was considered. The analysis of various fuzzy clustering algorithms is carried out and a technique for processing data on the equipment operation with the membership functions construction based on the fuzzy matrix partitioning and cluster centers is proposed. The technique allows us to approximate the membership functions by typical curves and choose the most effective variant of the diagnostic model synthesis. A practical example of using the results of clustering in the development of fuzzy models for assessing the condition of the power transformer elements is considered. We obtained a high level of compliance of simulation results with experimental data on the operation of equipment in power supply systems for oil production facilities. This indicates the possibility of using the technique to ensure the accuracy of electrical equipment diagnostics by reducing errors in the recognition of critical and insignificant defects.

Full Text

Введение. Электроэнергетические системы нового поколения основаны на концепции использования активно-адаптивных сетей (Smart Grid), характеризуются высокой надежностью, отказоустойчивостью, гибкостью и адаптивностью и предполагают комплексное внедрение современных информационно-телекоммуникационных и информационно-управляющих технологий [1-3]. Одна из приоритетных задач таких систем - обеспечить контроль и поддержание работоспособности элементов сети, в частности электротехнического оборудования (ЭО), а также оперативное, с высокой степенью автоматизации, управление режимами его работы в рамках единых принципов управления энергосистемой в целом [1]. Для решения данной задачи современные информационно-аналитические системы диагностики и управления работоспособностью ЭО должны быть интегрированы с программно-аппаратными комплексами мониторинга, позволяющими собирать и накапливать данные об объекте для последующей обработки, анализа и управления на основе как традиционных, так и качественно новых подходов (SCADA, DMCS, WAMS/WACS/WAPS, EMS/NMS, AMI и др.) и [1-7]. Учитывая высокую разнородность данных о работе ЭО, их возможную неоднозначность и недостоверность, для построения информационных систем диагностики целесообразно использовать интеллектуальные технологии и опыт экспертов в области эксплуатации электроэнергетических объектов [6-10]. Постановка цели и задач исследования. Проблема диагностики состояния ЭО в общем виде может быть представлена как задача классификации или установления соотношения между вектором X контролируемых технических параметров (диагностических признаков) и множеством классов состояния ЭО или видов дефектов в его элементах при помощи определенного набора логических правил [6, 8]: X = (x1, x2,…, xm) → Yϵ(y1, y2,…,yn). (1) Модель (1), представляя собой задачу классификации, предполагает отнесение фактического состояния ЭО к одному из возможных классов состояния (как правило, заранее известных). Для удобства вектор параметров X может быть разбит на составляющие, каждая из которых характеризуется набором параметров по отдельному элементу ЭО (узла, агрегата, подсистемы), либо определенному методу мониторинга (тепловизионный контроль, вибродиагностика, контроль разрядной активности и т.д.). Данный подход позволяет решить две задачи: оценить состояние отдельных элементов ЭО (например, система охлаждения, вводы, контактная система и др.), а также сравнить результаты применения различных методов контроля состояния, подтвердить наличие/отсутствие дефекта и локализовать его. Очевидно, что для обеспечения достоверной оценки состояния ЭО согласно (1) необходим тщательный выбор параметров, входящих в X, изменения значений которых будут являться признаками наличия дефектов определенной степени тяжести. Данный факт свидетельствует о важности не только формализации вектора X, но и установления нормативных границ изменения входящих в него технических параметров. Для решения задачи (1), которая является сложно формализуемой, предлагается использовать модели, основанные на нечеткой логике [6, 8, 11-13]. Исходя из особенностей объекта исследования, а также специфики алгоритма нечеткой классификации, для этого необходимо: - определить перечень контролируемых параметров xi i = 1:m, а также набор классов состояния («Хорошее» (отсутствуют дефекты), «Критическое» (критический дефект) и т.д.) или видов контролируемых дефектов («частичные разряды в масле», «перегрев контактов» и т.д.), которые будут являться входными и выходными переменными нечеткой модели; - определить для каждой переменной xi число термов, характеризующих ее вербальные оценки (например, уровень масла «низкий», «средний», «высокий»); - описать каждый терм соответствующей функцией принадлежности (ФП); - построить базу правил, связывающих значения переменных X с классом yj, j = 1:n (ЕСЛИ «значения параметров», ТО «состояние ЭО»). Формируемые таким образом нечеткие модели диагностики состояния ЭО составляют основу системы интеллектуальной поддержки принятия решений при эксплуатации и обеспечении работоспособности электроэнергетических систем [6, 8-10]. Структура подобной системы, ориентированной на использование как ретроспективных, так и экспертных данных и эффективных методов их обработки для повышения качества результата (вычисление уровня фактического и прогнозного технического состояния, формирование рекомендаций и планирование управляющих воздействий), показана на рис. 1. Из схемы видно, что задачи структурно-параметрического синтеза нечетких моделей диагностики ЭО, построенных по принципу (1), могут быть решены с использованием имеющихся данных по работе оборудования. Это касается, в первую очередь, задач построения ФП, а также синтеза базы знаний. Данные операции могут осуществляться вручную экспертом, что является достаточно трудоемким и не обеспечивает высокой гибкости (адаптивности) моделей диагностики, а также требуемой достоверности результатов диагностирования. Рис. 1. Концептуальная схема интеллектуальной экспертно-диагностической оценки состояния ЭО на базе нечеткого моделирования: 1 - формирование базы знаний на основе правил нечеткой логики; 2 - выбор вида и определение параметров ФП; 3 - настройка весов правил базы знаний; 4 - оценка прогнозных значений технических параметров В данной работе предлагается автоматизировать процесс построения моделей диагностики ЭО, в частности, определять параметры ФП (блок № 2, см. рис. 1) для каждого параметра xi в автоматизированном/ автоматическом режиме, используя накопленную информацию о работе ЭО, либо генерируемую системой мониторинга, а также методы интеллектуального анализа данных, в частности, нечеткую кластеризацию [8, 9, 11-16]. Разработка методики построения моделей диагностики. Рассмотрим основные этапы процессы анализа данных о работе ЭО при синтезе экспертно-диагностических моделей с автоматизированным построением ФП (рис. 2): 1. Формирование наборов исходных данных Z (блок № 1) со значениями каждого контролируемого параметра ЭО, входящего в X. 2. Нечеткая кластеризация данных, предполагающая поиск координат центров кластеров C = (c1, c2,…, cm) и матрицы принадлежности µ = [µik] измерений параметров каждому кластеру (блок № 3). Рис. 2. Блок-схема методики использования нечеткой кластеризации для построения моделей диагностики ЭО Процесс кластеризации рассмотрен на примере алгоритмов fuzzy c-means (FCM), Gustafson-Kessel (GK), Gath-Geva (GG) [13-19]. Указанные методы отличаются видом используемой целевой функции, а также способами задания метрики (нормы), что позволяет выделять кластеры различной формы. Например, метод FCM минимизирует целевую функцию вида: , а в методе GK используется адаптивная норма для каждого j-го кластера за счет наличия индивидуальной нечеткой ковариационной матрицы кластера Ai, изменяемой в процессе выполнения итераций: , где m - экспоненциальный вес, µik- матрица разбиения, с - количество кластеров, А - диагональная матрица. Метод GG минимизирует сумму квадратов между точками данных и прототипом формируемой группы, используя распределение Гаусса. Алгоритм кластеризации в общем виде разделяется на два этапа. На этапе инициализации (блок № 2) случайно заполняется матрица принадлежности для всех элементов входного множества и выбираются необходимые параметры (количество кластеров, экспоненциальный вес, параметр остановки). Этап вычислений (блок № 3) является итеративным с выполнением определенных шагов согласно алгоритмам нечеткой кластеризации: - определяются центры кластеров: ; - в случае методов GK и GG рассчитывается ковариационная матрица кластера: - определяются расстояния между новыми центрами кластеров и точками множества данных: для метода FCM (евклидово расстояние); для метода GK; для метода GG, где ; - выполняется перерасчет матрицы нечеткого разбиения (метод FCM): , если DikA > 0 и где , если DikA = 0. Для методов GK и GG вместо DikA используется : - оценивается целесообразность останова алгоритма: ˂ ɛ, либо ˂ ɛ. 3. Оценка качества кластерного анализа, используя (блок № 4) коэффициент разбиения принимающий значение от 1/c до 1 (чем ближе к 1, тем разбиение более чёткое) и энтропию разбиения в диапазоне от 0 до lnС (чем ближе к 0, тем лучше). Критерии предлагается использовать для предварительной проверки качества кластеризации, которая используется при построении ФП для моделей нечеткой классификации (1) и, как следствие, влияет на их точность. 4. Формирование ФП (блок № 6) с учетом полученных координат центров кластеров и матрицы нечеткого разбиения. Поскольку нечеткое разбиение содержит набор точек (степеней принадлежности), соответствующих каждому значению параметра ЭО в выборке данных, ФП могут быть построены точечно, но, как правило, в таком виде результаты не удобно использовать при нечетком моделировании. В работе предлагается применить методику аппроксимации ФП типовыми формами кривых (например, гауссовы, колоколообразные, пи-подобные). 5. Формирование нечетких моделей, связывающих переменные X и Y (блок № 7) по принципу (1) для каждого варианта построения ФП (по различным алгоритмам кластеризации), синтез базы правил, оценка адекватности (блок № 8) моделей (например, по критерию χ2). 6. Оценка точности моделей, используя критерии качества классификации (блок № 9). В простейшем случае используется критерий [12, 13, 20-23]: (2) где MCS - доля верно распознанных классов состояния (accuracy) при заданном наборе данных и параметрах модели; Δk = 1, если результат моделирования совпадает с результатом в выборке, и Δk = 0 при неверно распознанном классе. Дополнительно может оцениваться среднеквадратическая ошибка (RMSE) [12]: (3) где µl(Y(k)) и µl(Y’(k)) - степени принадлежности к классу в k-й строке выборки и в результате моделирования. При более детальном анализе могут быть использованы метрики, характеризующие ошибки I и II рода, которые указывают на способность модели правильно определять дефектные и бездефектные состояния ЭО [21-23]: (4) (5) где CP - доля позиций выборки (объектов), по которым моделью правильно дано заключение о хорошем состоянии ЭО (положительное решение) из всех позиций, которые классифицированы как положительные (precision); CR - доля правильно определенных моделью положительных решений из всего имеющегося в выборке количества положительных решений (recall); Δ11k - истинно-положительное решение; Δ01k - ложно-положительное решение (пропуск дефектного состояния); Δ00k - ложно-отрицательное решение (выявление дефекта у исправного оборудования). Для нахождения данных метрик в большом числе классов может быть использована матрица неточностей (confusion matrix) [21-23]. По результатам расчетов осуществляется выбор нечеткой модели, наиболее удовлетворяющей критериям качества (блок № 10). Исследование методики. Рассмотрим процедуру синтеза нечетких моделей с использованием кластеризации в задаче диагностики состояния элементов силового маслонаполненного трансформатора напряжения (СМТН). В качестве примера рассмотрим упрощенную задачу оценки состояния бака СМТН по результатам тепловизионного контроля. В качестве исходных данных используем значения параметров X = (x1, x2), полученные из отчетов по ИК-мониторингу подстанций, осуществляющих электроснабжение объектов нефтедобычи Пермского края, где x1 - избыточная температура болтовых соединений колокола бака; x2 - максимальная разность температур по поверхности бака и элементов системы охлаждения [24, 25]. Соответствующие заключения о состоянии оборудования сформированы специализированными сервисными организациями по результатам измерений параметров и анализа термограмм, вид которых, на примере бака трансформатора ТДТН-16000/110 У1, приведен на рис. 3. а б Рис. 3. Трансформатор ТДТН-16000/110 У1: внешний вид (а); вид термограммы бака, полученной при помощи тепловизора ThermoShot (б) В соответствии с методикой диагностики СМТН, согласно регламенту сервисной организации и рекомендациям нормативно-технической документации для оценки состояния трансформаторного бака Y, были выбраны классы: «Нет дефектов» (1), «Развившийся дефект» (2), «Критический дефект» (3) (табл. 1). Таким образом, каждая строка в выборке данных содержит значения измеренных параметров x1, и x2 (в °C), заключение о состоянии оборудования и интерпретацию заключения в виде класса состояния (1, 2 или 3). Исходя из изложенного, сформирована структура нечеткой модели для диагностики состояния бака СМТН, которая включает две входных и одну выходную лингвистическую переменную с тремя оценочными термами каждая. Для построения ФП термов выполнена обработка 70 % выборки данных при помощи трех алгоритмов нечеткой кластеризации (FCM, GK, GG) при трех заданных кластерах (в соответствии с набором классов состояния) (рис. 4). Эффективность кластеризации оценивалась коэффициентом разбиения (PC) и энтропией разбиения (PE). На основе полученных в результате кластеризации (данные упорядочены) матриц нечеткого разбиения построены ФП переменных x1 и x2 для трех термов, оценивающих температуру элементов СМТН: «Низкая», «Средняя» и «Высокая» (рис. 5). а б в Рис. 4. Нечеткая кластеризация данных о температуре элементов СМТН: FCM (PC=0,69, PE=0,55) (a), GK (PC=0,91, PE=0,18) (б), GG (PC=0,42, PE=0,16) (в) 0 10 20 30 40 50 60 70 80 х2 х1 0 10 20 30 40 50 60 70 m 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 m 1 0,9 0,8 0,7 0,6 0,5 0,4 0,3 0,2 0,1 0 Рис. 5. Пример построения ФП с использованием матрицы нечеткого разбиения и аппроксимации (метод GK) Таким образом, сформированы 3 нечеткие модели оценки теплового состояния бака СМТН типа Такаги-Сугено, в которых ФП были определены разными методами кластеризации. База знаний каждой из моделей состоит из девяти правил вида (см. табл. 1): IF x1 = «Низкая» AND x2 = «Низкая», THEN Y = «Развившийся дефект». Пример построения нечеткой модели в среде MatLab представлен на рис. 6. Таблица 1 Структура базы правил нечеткой логики для оценки теплового состояния бака СМТН Класс состояния Избыточная температура, x1 Высокая 3 3 3 Средняя 2 2 3 Низкая 2 1 3 Низкая Средняя Высокая Максимальная разность температур, x2 а б в Рис. 6. Интерфейс разработки нечетких моделей в Fuzzy LogicToolbox пакета MatLab: структура модели (а), ФП переменных (б), база правил (в) Для настройки (определения весов правил) и тестирования нечетких моделей использованы 70 % выборки данных, а также градиентные методы оптимизации на базе составного критерия [20]. Поверхности отклика нечетких моделей после обучения представлены на рис. 7. Адекватность моделей оценивалась на тестовом наборе данных с использованием критерия χ2. Результаты расчетов свидетельствуют о том, что гипотезы об адекватности принимаются с вероятностью 95-99 %. Для выбора наилучшей модели, соответствующей наиболее эффективному методу кластеризации, рассчитана точность классификации (accuracy) для различных наборов данных (табл. 2). 60 40 20 0 0 20 40 60 80 0,8 0,6 0,4 X2 X1 60 40 20 0 0 20 40 60 80 0,8 0,6 0,4 X2 X1 60 40 20 0 0 20 40 60 80 0,6 0,4 0,2 X2 X1 0,8 1 а б в Рис. 7. Поверхности отклика моделей: FCM (a), GK (б), GG (в) Таблица 2 Оценка точности нечетких моделей диагностики СМТН. Среднее число верно идентифицированных состояний MCS, % (2) Наименование FCM GK GG До После До После До После Обучающая выборка 72,39 91,67 71,03 91,93 83,65 94,48 Тестовая выборка 73,33 90,54 72,41 91,24 84,11 94,89 Вся выборка 72,68 91,33 71,44 91,72 83,79 94,61 Количество верно распознанных классов (дефектов в оборудовании) на тестовой выборке для разных алгоритмов составляет от 90,5 до 94,9 %, что указывает на хорошую точность результата, которую обеспечивает использование кластеризации при построении ФП. На практике, в случае анализа неисправностей оборудования, сокращение ошибок при распознавании дефектов позволит сократить время его аварийного или планового простоя. В этом случае целесообразно провести оценку качества моделей по дополнительным критериям, например (4) и (5). Выводы. В работе рассмотрены вопросы построения методики, позволяющей в автоматизированном режиме формировать параметры ФП при синтезе моделей диагностики ЭО с использованием алгоритмов нечеткой кластеризации. Показано, что использование нечеткой кластеризации позволяет строить ФП в автоматизированном режиме, сводя к минимуму участие эксперта и принимая во внимание особенности эксплуатации ЭО, содержащиеся в доступных статистических данных. При этом наблюдается ухудшение или улучшение качества моделей диагностики оборудования в зависимости от параметров кластеризации. Тем не менее применение как нечеткой кластеризации, так и нечеткого моделирования дает высокие результаты в оценке состояния ЭО и обеспечивает адаптивность моделей диагностики при изменении содержания и объема данных. Опираясь на полученные результаты, целесообразно рассмотреть иные задачи автоматизированного синтеза моделей диагностики ЭО (построение базы правил по результатам анализа имеющихся данных, оптимизация параметров и др.), а также возможность адаптации методики к различным видам энергетических установок при проектировании экспертно-диагностических систем оценки и управления их состоянием. Решение указанных задач сопряжено с совершенствованием технологий сбора и подготовки данных о работе ЭО и формированием интегрированной информационной среды [2, 5-7] для объектов энергетики (системы мониторинга, локальные информационные системы и EAM-системы предприятий).

About the authors

D. K Eltyshev

Perm National Research Polytechnic University

K. A Gnutova

“The Perm Gunpowder Mill” FС

D. A Litvinenko

Perm National Research Polytechnic University

References

  1. Дорофеев В.В., Макаров А.А. Активно-адаптивная сеть - новое качество ЕЭС России // Энергоэксперт. - 2009. - № 4. - С. 29-34.
  2. Кобец Б.Б., Волкова И.О. Smart Grid: Концептуальные положения // Энергорынок. - 2010. - № 03(75). - С. 67-72.
  3. Елтышев Д.К. Выбор приоритетов при обслуживании, модернизации и обеспечении безопасности объектов энергетики // Энергобезопасность и энергосбережение. - 2017. - № 2. - С. 5-10. doi: 10.18635/2071-2219-2017-2-5-10
  4. Hardware-in-the-loop Simulation of an Active-adaptive Power Grid / A.B. Petrochenkov, T. Frank, A.V. Romodin, A.V. Kychkin // Russian Electrical Engineering. - 2013. - Vol. 84. - № 11. - P. 652-658. doi: 10.3103/S1068371213110102
  5. Кычкин А.В., Артемов С.А., Белоногов А.В. Распределенная система энергомониторинга реального времени на основе технологии IOT // Датчики и системы. - 2017. - № 8-9(217). - С. 49-55.
  6. Елтышев Д.К. К вопросу о разработке интеллектуальной экспертно-диагностической системы для оценки состояния электротехнического оборудования // Системы. Методы. Технологии. - 2017. - № 3 (35). - С. 57-63. doi: 10.18324/2077-5415-2017-3-57-63
  7. Кычкин А.В., Квитко Я.И. Архитектурно-функциональная организация информационной системы управления большими данными в промышленности и энергетике // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. - 2018. - № 25. - С. 109-125.
  8. Eltyshev D.K., Boyarshinova V.V. Intelligent Decision Support in the Electrical Equipment Diagnostics // Proceedings of the 19th International Conference on Soft Computing and Measurements (SCM 2016). - 2016. - P. 157-160. doi: 10.1109/SCM.2016.7519714
  9. Хорошев Н.И. Интеллектуальная поддержка принятия решений при эксплуатации энергетического оборудования на основе адаптивного кластерного анализа // Системы. Методы. Технологии. - 2016. - № 3(31). - С. 123-128. doi: 10.18324/2077-5415-2016-3-123-128
  10. Елтышев Д.К. Многокритериальный анализ решений в интеллектуальных системах оценки и управления состоянием энергетического оборудования // Информатика и системы управления. - 2018. - № 2(56). - С. 96-107. doi: 10.22250/isu.2018.56.96-107
  11. Борисов В.В., Круглов В.В., Федулов А.С. Нечеткие модели и сети. - 2-е изд., стер. - М: Горячая линия - Телеком, 2012. - 284 с.
  12. Штовба, С.Д. Введение в теорию нечетких множеств и нечеткую логику [Электронный ресурс]. - URL: http://matlab.exponenta.ru/ fuzzylogic/book1/index.php (дата обращения: 30.05.2018).
  13. Барсегян А.А., Куприянов М.С., Степаненко В.В., Холод И.И. Методы и модели анализа данных: OLAP и Data Mining. - СПб.: БХВ-Петербург, 2004. - 336 с.
  14. Jain A.K., Murty M.N., Flynn P.J. Data clustering: a review // ACM Computing Surveys. - 1999. - Vol. 31. - № 3. - P. 264-323.
  15. Eltyshev D.K., Gnutova K.A. Identification of the parameters of electrical equipment condition assessment models using fuzzy clustering // Proceedings of the 20th IEEE International Conference on Soft Computing and Measurements (SCM 2017). - 2017. - P. 42-144. doi: 10.1109/SCM.2017.7970520
  16. Eltyshev D., Gnutova K. Influence of fuzzy clustering on the accuracy of electrical equipment diagnostic models // Proceedings of the 6th International Conference on Applied Innovations in IT. - 2018. - P. 23-28.
  17. Bezdek J.C., Ehrlich R., Full W. FCM: The fuzzy c-means clustering algorithm // Computers & Geosciences. - 1984. - Vol. 10. - № 2-3. - P. 191-203.
  18. Babuska R., van der Veen P.J., Kaymak U. Improved covariance estimation for Gustafson-Kessel clustering // Proceedings of the 2002 IEEE international conference on fuzzy systems. - Honolulu: Technische Universitet Eindhoven, 2002. - P. 1081-1085. doi: 10.1109/FUZZ.2002.1006654
  19. Gath I., Geva A.B. Unsupervised optimal fuzzy clustering // IEEE Transactions on Pattern Analysis and Machine Intelligence. - 1989. - Vol. 11. - № 7. - P. 773-781.
  20. Shtovba S.D., Pankevich O.D., Nagorna A.V. Analyzing the Criteria for Fuzzy Classifier Learning // Automatic Control and Computer Sciences. - 2015. - Vol. 49. - № 3. - P. 123-132. doi: 10.3103/S0146411615030098
  21. Kohavi R., Foster P. Glossary of Terms // Machine Learning. - 1998. - № 30. - P. 271-274.
  22. Davis J., Goadrich M. The Relationship Between Precision-Recall and ROC Curves // Proceedings of the 23rd International Conference on Machine Learning. - 2006.
  23. Congalton R. A Review of Assessing the Accuracy of Classifications of Remotely Sensed Data // Remote Sensing of Environment. - 1991. - Vol. 37. - P. 35-46.
  24. Алексеев Б.А. Крупные силовые трансформаторы: контроль состояния в работе и при ревизии. - М.: Энергопрогресс, 2010. - 88 с.
  25. Eltyshev D.K., Khoroshev N.I. Diagnostics of the Power Oil-filled Transformer Equipment of Thermal Power Plants // Thermal Engineering. - 2016. - Vol. 63. - № 8. - P. 558-566. doi: 10.1134/S004060151608005X

Statistics

Views

Abstract - 21

PDF (Russian) - 8

Refbacks

  • There are currently no refbacks.

Copyright (c) 2022 PNRPU Bulletin. Electrotechnics, Informational Technologies, Control Systems

This website uses cookies

You consent to our cookies if you continue to use our website.

About Cookies