FUNCTIONAL DATA PREPROCESSING APPLICATION TO OIL-TRANSFER PUMPS VIBRATION PARAMETERS FORECASTING
- Authors: Okunev A.A1
- Affiliations:
- Perm State University
- Issue: No 3 (2020)
- Pages: 51-72
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/2106
- DOI: https://doi.org/10.15593/2499-9873/2020.3.03
- Cite item
Abstract
This work describes functional data preprocessing algorithm. This algorithm provides a way to reduce error in forecasting problems solution. The algorithm is a part of oil-transfer pumps vibration parameters forecasting system that enables pump failures dynamics forecasting. The author analyses existing approaches to vibration monitoring and decides to solve failure-forecasting problem as a long-term forecasting problem although researchers usually solve such problems with classification methods. An insufficiency of labeled data is the main reason of such a decision. Main ideas of the problem solution are the following. Neural network model takes and calculates periodical metered values characteristics. Time is split into periods using scales with different periods. We use shorter periods for short-term forecasting and longer periods for long-term forecasting. Functional data preprocessing provides a way to increase forecasting quality. Preprocessing key idea is following. Functions sequence transforms one of model’s inputs in order to increase correlation between input and output. Metered values distributions and dependencies between values can be variant because of observed time series nonstationarity. Author decided to modify original preprocessing algorithm to solve a nonstationarity problem. Idea of the modification is to add steps that provide preprocessing robustness i.e. allow to reduce difference between preprocessing results on different datasets. Preliminary preprocessing functions selection provides robustness. There are two variants of preliminary selection. The first one is following: function with the least difference between correlations between input and output in data subsets pass the selection. The second one is following: functions that increase correlation on both subsets pass the selection. Experiments on two pumps data prove the hypothesis that data preprocessing in vast majority of cases allows to decrease forecasting error. Modified algorithm often has less test error than original one.
Full Text
Введение В процессе обслуживания промышленного оборудования необходима возможность точного определения его состояния, в том числе зарождающихся дефектов, степени изношенности и деградации. Данную возможность обеспечивает мониторинг состояния машин, заключающийся в непрерывном сборе и анализе данных о состоянии компонентов оборудования [1]. Мониторинг состояния машин позволяет осуществить переход от устранения негативных последствий сбоев к обслуживанию по состоянию [2]. В обеих приведенных работах определение состояния оборудования выполняется интеллектуальными системами, построенными на основе нейронных сетей. Анализ параметров вибрации, заключающийся в извлечении необходимой информации из вибрационных сигналов, является одним из основных подходов к диагностике роторных машин [3]. Рассмотрим решение задачи прогнозирования развития дефектов нефтеперекачивающих агрегатов на основе их параметров вибрации. Задача была решена в ходе работ по построению системы вибродиагностики в рамках НИОКР по заказу ООО НПП «ТИК». Требование заказчика заключалось в том, что данная система на основе исторических данных должна быть способна определять состояние оборудования и прогнозировать динамику изменения его состояния. Идеи, лежащие в основе решения данной задачи, представлены в работе [4]. 1. Описание контролируемой системы Контролируемая система представляет собой множество агрегатов, включающих в себя двигатель, насос и другие элементы. К каждому элементу агрегата подключаются датчики, снимающие вибрационный сигнал. Значения виброускорения снимаются с заданным шагом (10 с - 10 мин) в течение 2 с, после чего выполняется аналого-цифровое преобразование сигнала с частотой 30 кГц. Среднеквадратичные значения (СКЗ) виброскорости и виброперемещения вычисляются путем аппаратного интегрирования с шагом 2 с. Кроме СКЗ виброскорости, виброускорения и виброперемещения на основе снятого сигнала программным путем вычисляются применяемые для диагностики величины - контрольные показатели (КП), например частота проявления тел качения, частота проявления рабочего колеса машины, гармоники оборотной части и т.д. 2. Анализ существующих подходов к решению задач вибродиагностики В работах [1] и [2] описаны системы вибродиагностики, работающие со спектрами сигналов. Эти системы основаны на нейронных сетях ARTMAP. В работе [3] рассмотрено распознавание дефектов подшипников роторной машины с использованием многослойных персептронов. В работе [5] представлена система, которая позволяет при помощи формирования трендов вейвлет-коэффициентов на основе АЧВС вибрационных сигналов определять факторы вибрации, вызывающие возрастание коэффициентов полос спектра. Общими чертами приведенных выше подходов является то, что исследователи при обучении опираются на достаточные по объему и размеченные экспертами наборы данных и используют алгоритмы, позволяющие строить модели с дискретными выходами, т.е. модели, подходящие только для решения задач классификации. Подходы, в основе которых лежит предположение о наличии размеченного набора данных достаточного объема, не могут быть применены для решения рассматриваемой задачи вследствие отсутствия у заказчика подобного набора данных. Основная причина отсутствия такого набора данных заключается в том, что разметка данных экспертами является дорогостоящей процедурой, так как она требует остановки, разбора и простоя агрегата. 3. Переход к задаче прогнозирования Ввиду того, что поставленную задачу не удалось свести к задаче классификации, было решено воспользоваться эвристикой: рост СКЗ виброскорости напрямую связан с развитием дефектов, а превышение им заданного экспертами и(или) нормативами предельного значения (уставки) является признаком критического состояния агрегата [1]. В ходе решения задачи автор делает предположение, что СКЗ виброскорости может быть спрогнозировано по предыдущим и текущим значениям СКЗ и КП, вычисленным на основе снятого вибрационного сигнала. Таким образом, поставленная изначально задача вибродиагностики сводится к задаче определения времени превышения уставки, для решения которой обучается модель прогнозирования СКЗ по предыдущим и текущим СКЗ и КП - модель прогнозирования значений одной из компонент многомерного временного ряда. Временной ряд где - значения контрольных показателей с номерами 1,2, …, m в моменты времени t; - СКЗ виброускорения, виброскорости, виброперемещения в момент времени t. Необходимо найти функцию f, такую, что выполняется равенство где 4. Анализ существующих подходов к решению задач прогнозирования временных рядов Традиционный подход к прогнозированию многомерных временных рядов при помощи нейронных сетей сводится к тому, что при обучении нейронной сети ей на вход подаются предыдущие и текущие значения компонент рассматриваемого временного ряда, а ее выходным значением является значение той компоненты временного ряда, для которой строится прогноз. Для прогнозирования на N шагов вперед строится N нейронных сетей. Проблема заключается в том, что начиная с некоторого N качество прогнозирования становится неприемлемым. В статье [6] рассмотрен подход к долгосрочному прогнозированию, основанный на выделении тренда, предобработке данных и прогнозировании подаваемых на вход модели прогнозирования значений компонент рассматриваемого многомерного временного ряда. Необходимо, чтобы значения, подаваемые на вход модели, могли быть прогнозируемы с достаточно малой ошибкой для большого числа будущих периодов. Данный подход в описанном в работе виде неприменим для представленной в данной статье задачи, так как последовательности СКЗ и КП немонотонны и зашумлены, но можно применить идею предобработки данных с целью уменьшения ошибки прогнозирования. В работах [7-10], посвященных прогнозированию одномерных временных рядов, утверждается, что применение предобработки данных, позволяющей удалить тренд и сезонность, позволяет уменьшить ошибку прогнозирования. Подходы, описанные в указанных статьях, неприменимы для решения задачи, которой посвящена настоящая статья, так как, как было сказано ранее, последовательности СКЗ и КП не являются ни монотонными, ни периодическими. В статье [11] описан такой метод долгосрочного прогнозирования одномерных временных рядов, как множественная нейросетевая модель. Такая модель включает в себя определенное количество нейронных сетей, каждая из которых отвечает за прогнозирование значений временного ряда на заданное количество шагов вперед. Затем ее выходное значение добавляется к уже известным значениям ряда и полученные значения подаются на вход следующей нейронной сети. Данный метод применим только для одномерных временных рядов, так как в случае многомерных рядов необходимо решать задачу прогнозирования для каждой компоненты ряда, что приводит к накоплению и увеличению ошибки. В статье [12] представлен алгоритм построения модели, основанной на нейронных сетях, позволяющей прогнозировать значения многомерных временных рядов на один шаг вперед, причем учитывается, что ряды могут быть зашумленными. Для уменьшения ошибки прогнозирования и для обеспечения устойчивости авторы данной работы обучают сети различной структуры на различных фрагментах обучающего множества и объединяют лучшие нейронные сети (среди дающих разные выходные значения при одинаковых входных значениях) в ансамбль. Описанный метод не может быть применен для решения рассматриваемой в настоящей статье задачи вследствие невозможности использования нескольких фрагментов при достаточно большой длительности периода. В работе [13] строится ансамбль нейронных сетей, причем во всех сетях лаг между значениями определяющих и прогнозируемого показателей различен. Данный подход неприменим для рассматриваемой задачи ввиду отсутствия возможности использования достаточно большого количества периодов для построения каждой из сетей. 5. Построение модели прогнозирования Условимся называть выход модели прогнозируемым показателем, а входы, которые вычисляются на основе СКЗ и КП, - определяющими. Горизонт прогнозирования решено принять равным суткам. Будем считать, что показатель превышает уставку, если его среднее значение за заданный промежуток времени больше, чем уставка. Значение прогнозируемого показателя в будущие периоды времени вычисляется несколькими нейросетевыми моделями, каждая из которых соответствует отдельному периоду, т.е. выходы моделей составляют непрерывный фрагмент ряда значений прогнозируемого показателя. Обучающая выборка формируется из данных о работе агрегатов, находящихся на предприятиях, и о работе стенда, на котором имитируется развитие дефекта начиная от нормального состояния до критического. 6. Многократное разбиение времени Поскольку компоненты рассматриваемого многомерного временного ряда зашумлены из-за особенностей наблюдаемого процесса, а прогнозирование является долгосрочным и уставка должна быть превышена на протяжении целого периода, может быть применен такой подход, как многократное разбиение времени с различными шкалами. Он заключается в том, что время разбивается на равные периоды, причем период каждой следующей шкалы больше периода предыдущей в целое число раз. Шкалы с меньшим периодом могут быть применены для получения краткосрочного прогноза, с большим - для долгосрочного. … 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 ... Периоды, содержащие определяющие показатели Периоды, для которых строится прогноз Рис. 1. Многократное разбиение периодов времени На рис. 1 изображено разбиение времени с тремя шкалами и отмечено, значения показателей за какие периоды подаются на вход модели и значения в какие будущие периоды эта модель позволяет прогнозировать. Кроме того, необходимо разбивать временную шкалу на периоды так, чтобы они могли пересекаться и становиться длиннее, например период вместо 60 мин становится равным 75 мин. Данная модификация необходима для того, чтобы можно было учесть возможные локальные экстремумы на границах периодов. Как говорилось ранее, прогнозирование выполняется несколькими моделями, причем каждая модель соответствует одному из будущих периодов. Необходимо отметить, что периоды, для которых строится прогноз, могут находиться на разных временных шкалах (см. рис. 1). 7. Вычисление определяющих и прогнозируемых показателей Важной деталью является то, что модель прогнозирования принимает на вход не сами значения СКЗ и КП, а их характеристики, вычисленные в периоды времени. Следовательно, для каждого СКЗ и КП в конкретный период вычисляются среднее значение за период, среднее ± стандартное отклонение, среднее и максимальное скользящие средние за период. Применение скользящего среднего какого-либо СКЗ или КП с периодом, меньшим, чем период временной шкалы, дает возможность исключить резкие скачки, учесть тренды и экстремумы на границах периодов. Пусть имеется величина (СКЗ или КП) Vk, для нее одна из характеристик вычисляется с помощью функции fj. Тогда соответствующая компонента временного ряда имеет вид - значения величины в текущий период, - в предыдущие. Пусть имеется K величин, J функций вычисления характеристик величин, для прогнозирования используются данные за L прошлых периодов, тогда имеется определяющих показателей вида где 1 ≤ j ≤ J, 1 ≤ k ≤ K, 0 ≤ l ≤ L. Обозначим определяющие показатели как xi, где а прогнозируемый показатель для рассматриваемого будущего периода обозначим как y. Здесь и далее будет рассматриваться построение модели прогнозирования для одного заданного будущего периода. В качестве прогнозируемого показателя было решено взять максимальное скользящее среднее СКЗ виброскорости за период, для которого строится прогноз. Это решение обосновывается тем, что основной задачей является прогнозирование момента превышения уставки и она должна быть превышена в течение периода времени, равного периоду скользящего среднего. 8. Отбор определяющих показателей модели Известно полное множество определяющих показателей До построения модели необходимо выполнить отбор определяющих показателей и тем самым определить, какие из них несут полезную информацию. Перед тем как начать его выполнение, отметим, что множество отобранных показателей пустое: по окончании процедуры отбора оно будет включать в себя N определяющих показателей, причем N неизвестно заранее. Для каждого показателя xi введем индикаторную переменную Ii, равную 1 в том случае, если данный показатель рассматривался для добавления, и 0 в противном случае. Процедура отбора показателей включает в себя следующие шаги: 1. Исключить из дальнейшего рассмотрения определяющие показатели, такие, что где - стандартное отклонение показателя 2. Для каждого определяющего показателя вычислить коэффициент корреляции с прогнозируемым показателем y. 3. Исключить из дальнейшего рассмотрения определяющие показатели, такие, что где - средний коэффициент корреляции, - стандартное отклонение. 4. Выбрать определяющий показатель с максимальным коэффициентом корреляции: (на данном этапе множество X включает в себя один показатель и будет дополняться в дальнейшем). 5. Обучить нейронную сеть, на вход которой подаются значения показателей из X, найти ошибку обучения ε. 6. Из определяющих показателей выбрать самый некоррелированный с уже выбранными, т.е. выбрать определяющий показатель такой, что где - коэффициент корреляции между показателями и 7. Обучить нейронную сеть, которая принимает на вход значения показателей из множества найти ошибку обучения 8. Если принять 9. Принять 10. Если остались нерассмотренные показатели вернуться к п. 5. 9. Функциональная предобработка данных В работе [6] сформулирована идея, применимая для решения данной задачи: использование функциональной предобработки данных может повышать качество прогнозирования. Такая же идея формулируется в работе [14], в которой приведен исходный алгоритм функциональной предобработки данных, и в последующей работе [15]. В предыдущих версиях алгоритма делаются следующие предположения: 1. Данные однородны в плане распределения наблюдаемых величин и вида зависимостей между ними. 2. Функции, с помощью которых выполняется предобработка, определяются на всем обучающем множестве и так же хорошо подходят для тестирующего множества. Поскольку наблюдаемые временные ряды нестационарны, возможны ситуации, когда в течение периода, на котором формируется обучающее множество, меняется распределение одной из компонент ряда и/или вид зависимостей между ними. Следовательно, необходимо модифицировать исходный алгоритм и сделать предобработку более устойчивой, т.е. разница результатов ее работы на разных множествах должна быть минимальной. Для этого вводится такая модификация алгоритма, как дополнительный шаг, на котором выполняется предварительный отбор функций, после которого уже выбирается одна лучшая функция (заключительный шаг из исходного алгоритма). Методы предварительного отбора, позволяющего сделать предобработку более устойчивой, будут рассмотрены далее. 10. Используемые функции и их параметры Для предобработки данных используются семейства функций: где α и β - параметры. Обозначим множество семейств как G, семейства будем обозначать как для каждого семейства задается множество параметров (векторов параметров, если их несколько) Рассмотрим выбор значений параметра для семейства функций с одним параметром. Для семейств с двумя и более параметрами правила аналогичны. Итак, при выборе значений параметра необходимо обратить внимание на близость и сходство графиков функций и и на их наклоны на отрезке [-1; 1]. Необходимо рассматривать только те функции и соответствующие значениям параметров и при которых графики функций и отличаются друг от друга в достаточной степени, т.е. средняя разность функций в точках из отрезка [-1; 1] была не меньше наперед заданной величины. Данная величина была принята равной 0,05-0,1. Если на некотором отрезке, лежащем внутри отрезка [-1; 1] и имеющем длину, не меньшую заданной, значения функций близки к некоторой константе, то такую функцию необходимо исключить из рассмотрения, так как она делает различные значения показателей практически равными друг другу. Отрезок [-1; 1] используется для единообразия (нейронные сети принимают на вход и выдают на выход значения из этого промежутка) и простоты подбора параметров. Благодаря переходу к этому отрезку можно подобрать параметры таких функций, как логарифм или обратная пропорциональность, так, чтобы они были определены на всем отрезке и в окрестностях его границ. Определенность в окрестностях границ за пределами отрезка необходима, так как на тестирующем множестве возможна ситуация, когда нормированный результат предобработки по модулю превысит 1. Исходя из практических соображений, было решено допустить выход за пределы на 20 % от длины отрезка. Следуя указанным правилам, проанализировали различные значения α для всех вышеуказанных функций. Для xα следует взять значения параметра: 1/7; 1/5; 1/3; 2; 3. Для следует взять значения параметра: 1,7; 1,6; 1,5; 1,4; 1,3; 1,2; 1,1; 0,95; 0,8; 0,65; 0,5; 0,35; 0,2 (и эти же значения с противоположным знаком). Для cos(αx) следует взять значения параметра: 3; 2,8; 2,65; 2,5; 2,35; 2,2; 2,05; 1,9; 1,75; 1,6; 1,45; 1,3; 1,15; 0,95; 0,7. Для sin(αx) следует взять значения параметра: 3; 2,8; 2,6; 2,3; 2,05; 1,75; 1,45; 1,25; 1,1; 0,95; 0,8; 0,65; 0,5; 0,38; 0,27; 0,15 (и эти же значения с противоположным знаком). Для ch(αx) следует взять значения параметра: 2; 1,9; 1,8; 1,7; 1,6; 1,5; 1,4; 1,3; 1,2; 1; 0,8; 0,6. Для sh(αx) следует взять значения параметра: 2; 1,9; 1,8; 1,7; 1,55; 1,4; 1,25; 1,1; 0,95; 0,75; 0,55; 0,35; 0,15 (и эти же значения с противоположным знаком). Для th(αx) следует взять значения параметра: 3; 2,2; 1,7; 1,35; 1,1; 0,9; 0,7; 0,55; 0,4; 0,25; 0,1 (и эти же значения с противоположным знаком). Для arctg(αx) следует взять значения параметра: 3; 2,5; 2,1; 1,7; 1,4; 1,15; 0,95; 0,75; 0,55; 0,4; 0,25; 0,1 (и эти же значения с противоположным знаком). Для следует взять значения параметра: 1,2; 1,25; 1,3; 1,35; 1,4; 1,45; 1,5; 1,6; 1,7; 1,8; 1,9; 2; 2,1; 2,2; 2,3; 2,4; 2,5; 2,6; 2,7; 2,8; 2,9; 3; 3,1; 3,2; 3,3; 3,4; 3,5. Для следует взять значения параметра: 4; 2,5; 1,7; 1,1; 0,5 (и эти же значения с противоположным знаком). Для следует взять значения параметра α: 1) 0,6; 0,7; 0,9; 1,1; 1,3; 1,6; 2; 2,5; 3; 4; 5; 6; 7; 8 (при β = 1,1); 2) 0,6; 0,65; 0,7; 0,75; 0,8; 0,9; 1; 1,1; 1,2; 1,3; 1,4; 1,6; 1,8; 2; 2,5 (при β = 1,5); 3) 0,2; 0,25; 0,3; 0,35; 0,4; 0,45; 0,5; 0,55; 0,6; 0,7; 0,8; 0,9; 1,1; 1,2 (при β = 2). Множество, включающее в себя все возможные преобразования, обозначим как Мощность данного множества 11. Общий алгоритм предобработки данных Рассмотрим общий алгоритм построения последовательности функций, используемой для функциональной предобработки данных. Он описан для i-го определяющего показателя. Для показателя xi строится последовательность функций Li, в которую входят непосредственно функции предобработки (описаны ранее) и функции нормировки, причем количество функций предобработки может быть ограничено сверху числом M (M > 0). Ограничение количества функций будет рассмотрено далее. До выполнения непосредственно шагов алгоритма необходимо следующее: 1. Нормировать значения показателей - привести их к отрезку [-1; 1]. Далее подразумевается, что значения всех определяющих и прогнозируемого показателей нормированы, т.е. 2. Разделить обучающее множество T на два примерно равных по размеру непересекающихся подмножества T1 и T2. 3. Принять t = 1, где t - номер итерации алгоритма. Алгоритм: 1. Вычислить коэффициент корреляции r0 определяющего показателя xi с прогнозируемым показателем y. 2. Преобразовать значения определяющего показателя xi каждой из функций, т.е. вычислить 3. Для каждого результата преобразования вычислить коэффициент корреляции rj с прогнозируемым показателем y: 4. Выполнить предварительный отбор функций предобработки, т.е. построить множество где Ig - индикаторная переменная, принимающая значение, равное 1, если заданные условия (будет рассмотрено далее) выполняются для функции g. 5. Проверить, есть ли функции, которые прошли предварительный отбор, т.е. проверить условие а) если таких функций нет то построение последовательности для данного показателя можно считать завершенным; б) если такие функции есть то выполнить выбор оптимальной функции предобработки. Оптимальной считается функция, для которой на обучающем множестве T выполняется условие: коэффициент корреляции между прогнозируемым и преобразованным с помощью нее определяющим показателями максимальный. Иными словами, найти функцию 6. Если выполняется условие то построение последовательности для данного показателя можно считать завершенным. 7. Применить выбранную функцию к значениям определяющего показателя и нормировать полученные значения (привести их к отрезку [-1; 1]): 8. Добавить выбранные на предыдущих шагах функции к последовательности 9. Принять 10. Если число функций предобработки не превысило ограничение перейти к шагу 1. Иначе построение последовательности для данного показателя можно считать завершенным. После того как последовательности функций построены, они могут быть применены к значениям показателей из обучающего и тестирующего множеств текущим значениям, подаваемым на вход модели прогнозирования, т.е. показатель до подачи на вход модели преобразуется функцией, которая имеет вид 12. Обеспечение устойчивости с помощью предварительного отбора функций преобразования Вариант 1. Выполнить следующие шаги: 1. Вычислить для всех функций разности коэффициентов корреляции на обоих подмножествах обучающего множества. 2. Выбрать заданный процент функций, для которых разность минимальна. Вариант 2. Предварительный отбор проходят те функции, применение которых к значениям показателей увеличивает коэффициенты корреляции на обоих подмножествах обучающего множества. Вариант 3. Предварительный отбор функций не выполняется. Считается, что все функции его проходят. Данный вариант описан в исходной версии алгоритма. 13. Ограничение количества функций предобработки Необходимо рассмотреть следующие варианты длины последовательности функций: количество функций не ограничено, количество функций принимается равным 1, количество функций принимается равным 2, количество функций принимается равным 3. Ограничение количества функций предобработки в последовательности может иметь смысл в плане уменьшения ошибки на тестирующем множестве, так как подобное ограничение можно рассматривать как простой аналог механизма ранней остановки. 14. Время выполнения Функциональная предобработка данных может быть выполнена как до отбора определяющих показателей, так и после. Приведем аргументы за и против каждого из вариантов. Если выполнять предобработку до отбора, то в ходе отбора не будут исключены из рассмотрения те показатели, которые несут полезную информационную нагрузку, но без повышения их коэффициента корреляции с прогнозируемым показателем не учитываются моделью. Если предобработку выполнять после отбора, то возможно исключение из рассмотрения полезных показателей. При этом можно оценить влияние предобработки на ошибку прогнозирования без учета того, как был выполнен отбор. Это возможно благодаря тому, что при каждом эксперименте выполняется предобработка одних и тех же показателей. 15. Эксперименты В ходе экспериментов использовались оба описанных выше способа предварительного отбора функций, также последовательности функций строились и без предварительного отбора. Кроме того, проводилось сравнение результатов работы алгоритма с ограничением длины последовательности и без него (табл. 1-6). В табл. 1-6 приняты следующие обозначения способа предварительного отбора функций: «-» - его отсутствие, 1 - 1-й способ, 2 - 2-й способ. Во всех таблицах время приведено в минутах. Эксперименты на стенде (предобработка до отбора) Всего было сформировано 40 наборов данных. Таблица 1 Уменьшение ошибки для экспериментов на стенде (предобработка до отбора) A B С В процентных пунктах Относительное среднее, % максимальное, % среднее, % максимальное, % - - 12 1,18 1,23 16,87 100,00 - 1 13 1,10 4,14 11,59 48,47 - 3 14 0,79 1,95 8,08 21,77 1 - 12 0,80 1,80 9,04 21,94 1 1 18 1,12 2,79 11,41 27,40 1 3 9 0,90 2,09 9,53 24,40 2 - 16 0,97 2,26 9,88 20,87 2 1 16 0,93 3,23 9,83 37,79 2 2 13 1,19 2,85 11,99 26,76 2 3 17 1,54 4,51 15,69 50,31 Примечание: А - способ предварительного отбора функций; В - ограничение количества функций («-» означает отсутствие ограничения); С - количество наборов данных, когда ошибка стала меньше. Таблица 2 Результаты прогнозирования для некоторых наборов данных (эксперименты на стенде, предобработка до отбора) Длина периода Период скользящего среднего Перекрытие Номер периода Без предобработки, % С предобработкой, % 120 30 14 1 6,78 7,24 120 30 14 2 9,10 7,31 120 15 14 2 10,87 7,80 180 30 14 2 10,65 8,17 180 30 14 3 6,79 8,02 240 15 14 3 8,79 6,76 240 30 14 2 10,85 6,34 360 30 29 2 7,04 5,69 360 30 29 4 8,54 4,25 60 15 14 6 9,72 8,80 Применение предобработки данных привело к уменьшению ошибки на тестирующем множестве для 32 наборов данных. Предобработка с применением предварительного отбора функций дает результат лучше, чем без него, для 30 наборов данных. При наличии ограничения длины последовательности функций (от 1 до 3) ошибка на тестирующем множестве меньше для 35 наборов данных. Эксперименты на агрегате З-205А (предобработка до отбора) Всего было сформировано 80 наборов данных. Таблица 3 Уменьшение ошибки для экспериментов на агрегате Р-205А (предобработка до отбора) A B C В процентных пунктах Относительное среднее, % максимальное, % среднее, % максимальное, % - - 18 1,32 4,79 9,02 25,28 - 1 36 1,39 3,69 10,10 31,81 - 2 24 1,05 3,55 7,31 22,56 1 - 20 1,10 3,63 8,70 28,25 1 1 32 1,48 3,98 10,29 23,62 1 2 26 0,96 3,21 7,35 18,48 2 - 32 1,28 4,69 8,89 26,89 2 1 42 1,50 4,72 10,85 26,48 Примечание: А - способ предварительного отбора функций; В - ограничение количества функций («-» означает отсутствие ограничения); С - количество наборов данных, когда ошибка стала меньше. Таблица 4 Результаты прогнозирования для некоторых наборов данных (эксперименты на агрегате Р-205А, предобработка до отбора) Длина периода Период скользящего среднего Перекрытие Номер Без предобработки, % С предобработкой, % 120 15 14 1 7,03 5,79 120 15 14 2 11,02 8,72 180 15 14 4 16,61 13,91 180 30 29 1 10,96 7,47 180 30 29 5 15,20 13,50 240 15 14 1 12,20 8,52 240 30 29 5 15,20 12,86 360 30 14 3 14,89 11,53 360 30 29 1 12,49 10,36 60 15 14 2 6,72 6,05 Применение предобработки данных привело к уменьшению ошибки на тестирующем множестве для 66 наборов данных. Предобработка с применением предварительного отбора функции дает результат лучше, чем без него, для 56 наборов данных. При наличии ограничения длины последовательности функций (от 1 до 2) ошибка на тестирующем множестве меньше для 59 наборов данных. Эксперименты на стенде (предобработка после отбора) Всего было сформировано 40 наборов данных. Таблица 5 Уменьшение ошибки для экспериментов на стенде (предобработка после отбора) A B С В процентных пунктах Относительное среднее, % максимальное, % среднее, % максимальное, % 1 1 14 0,98 3,64 12,32 61,42 1 - 14 0,79 2,42 8,68 21,90 2 1 22 0,97 2,20 11,31 23,83 2 2 18 1,07 2,86 12,55 39,41 2 - 22 0,85 2,64 10,81 44,62 - 1 18 0,83 2,58 9,35 26,03 - 3 16 1,04 2,59 11,72 26,09 - - 16 1,08 3,98 15,98 78,87 Примечание: А - способ предварительного отбора функций; В - ограничение количества функций («-» означает отсутствие ограничения); С - количество наборов данных, когда ошибка стала меньше. Применение предобработки данных привело к уменьшению ошибки на тестирующем множестве для 36 наборов данных. Предобработка с применением предварительного отбора функции дает результат лучше, чем без него, для 28 наборов данных. При наличии ограничения длины последовательности функций (от 1 до 3) ошибка на тестирующем множестве меньше для 28 наборов данных. Эксперименты на агрегате Р-205А (предобработка после отбора) Всего было сформировано 80 наборов данных. Таблица 6 Уменьшение ошибки для экспериментов на агрегате Р-205А (предобработка после отбора) A B С В процентных пунктах Относительное среднее, % максимальное, % среднее, % максимальное, % 1 1 29 0,98 3,07 6,60 20,49 1 2 28 1,14 4,70 7,29 23,71 1 - 23 1,11 2,83 7,63 16,09 2 2 19 1,27 4,04 8,53 24,41 2 3 26 1,15 5,12 7,50 25,80 2 - 24 1,15 3,65 7,49 20,15 - 2 22 0,93 3,76 6,20 20,14 - 3 21 1,38 6,66 8,70 33,59 - - 17 1,03 3,79 6,41 19,13 Примечание: А - способ предварительного отбора функций; В - ограничение количества функций («-» означает отсутствие ограничения); С - количество наборов данных, когда ошибка стала меньше. Применение предобработки данных привело к уменьшению ошибки на тестирующем множестве для 59 наборов данных, предобработка с применением предварительного отбора функции дает результат лучше, чем без него, для 56 наборов данных. При наличии ограничения длины последовательности функций (от 1 до 3) ошибка на тестирующем множестве меньше для 67 наборов данных. 16. Анализ результатов Из приведенных результатов можно сделать вывод, что применение функциональной предобработки данных в подавляющем большинстве случаев приводит к повышению качества прогнозирования. Более чем в половине случаев применение предварительного отбора приводит к уменьшению ошибки на тестирующем множестве. В большинстве случаев ограничение количества функций предобработки в последовательности позволяет получить меньшую ошибку, чем без него. Заключение В работе представлены решение задачи долгосрочного прогнозирования и алгоритм функциональной предобработки данных. Приведено сравнение результатов его работы с разными параметрами и разными методами предварительного отбора функций. Продемонстрировано применение алгоритма на практике при работе с реальными данными. Эксперименты показали целесообразность применения функциональной предобработки данных в целом и модификаций, обеспечивающих устойчивость в частности.About the authors
A. A Okunev
Perm State University
References
- Lin C.C. Intelligent vibration signal diagnostic system using artificial neural network / ed. by K. Suzuki // Artificial Neural Networks - Industrial and Control Engineering Applications. - London: IntechOpen Limited, 2011. - P. 421-440.
- Knapp G.M., Javadpour R., HsuPin Wang. An ARTMAP neural network based machine condition monitoring system // Journal of Quality in Maintenance Engineering. - 2000. - Vol. 6, no. 2. - P. 86-105.
- Khoualdia T., Lakehal A., Chelli Z. Practical investigation on bearing fault diagnosis using massive vibration data and artificial neural network // Big Data and Networks Technologies. BDNT 2019. Lecture Notes in Networks and Systems. - 2019. - Vol. 81. - P. 110-116.
- Гусев А.Л., Еремин И.В., Окунев А.А. Долгосрочное прогнозирование параметров вибрации нефтеперекачивающих агрегатов при помощи нейронных сетей // Нейрокомпьютеры и их применение: материалы ХVI Всерос. науч. конф., г. Москва, 13 марта 2018 г. / ФГБОУ ВО МГППУ. - М., 2018. - С. 198-202.
- Кацив С.Ш. Подход к прогнозированию развития дефектов гидроагрегата на основе использования искусственной нейронной сети // Научные труды Винницкого национального технического университета. - 2012. - № 1. - С. 1-6.
- Longterm forecasting of solid waste generation by the artificial neural networks / A.M. Abdoli, M.F. Nezhad, R.S. Sede, S. Behboudian // Environmental Progress & Sustainable Energy. - 2012. - Vol. 31, no. 4. - P. 68-636.
- Peter Zhang G., Qi Min. Neural network forecasting for seasonal and trend time series // European Journal of Operational Research. - 2005. - No. 160. - P. 501-514.
- Solar radiation forecasting using ad-hoc time series preprocessing and neural networks / C. Paoli, C. Voyant, M. Muselli, M.L. Nivet // Emerging Intelligent Computing Technology and Applications. ICIC 2009. Lecture Notes in Computer Science. - 2009. - Vol. 5754. - P. 898-907.
- The effects of pre-processing methods on forecasting improvement of artificial neural networks / A. Azadeh, M. Sheikhalishahi, M. Tabesh, A. Negahban // Australian Journal of Basic and Applied Sciences. - 2011. - Vol. 5, no. 6. - P. 570-580.
- Time-series extreme event forecasting with neural networks at uber / N. Laptev, J. Yosinski, S. Smyl, Li. Li Erran // International Conference on Machine Learning, Sydney, Australia, 6-11 August 2017. - Sydney, Australia, 2017. - P. 1-5.
- Nguyen H.H., Chan C.W. Multiple neural networks for a long term time series forecast // Neural Computing & Applications. - 2004. - Vol. 13, no. 1. - P. 90-98.
- Ruta D., Gabrys B. Neural network ensembles for time series prediction // International Joint Conference on Neural Networks, Orlando, FL, USA, 12-17 August 2007. - Orlando, FL, USA, 2007. - P. 1204-1209.
- Multi-stage algorithm based on neural network committee for prediction and search for precursors in multi-dimensional time series / S. Dolenko, A. Guzhva, I. Persiantsev, J. Shugai // Artificial Neural Networks - ICANN 2009. Lecture Notes in Computer Science. - 2009. - Vol. 5769. - P. 295-304.
- Гусев А.Л., Черепанов Ф.М., Ясницкий Л.Н. Функциональная предобработка входных сигналов нейронной сети // Нейрокомпьютеры. Разработка и применение, 2013. - Т. 5. - С. 19-21.
- Гусев А.Л., Гильманов А.Р., Окунев А.А. Предобработка статистических данных для повышения качества прогноза нейронной сети // Современная наука: актуальные проблемы теории и практики. Серия Естественные и технические науки. - 2018. - № 03. - С. 49-51.
Statistics
Views
Abstract - 87
PDF (Russian) - 45
Refbacks
- There are currently no refbacks.