Evaluation applying ConvLSTM neural network for the prediction of epileptic seizures
- Authors: Volodin M.V.1, Sedykh I.A.1
- Affiliations:
- Lipetsk State Technical University
- Issue: No 3 (2023)
- Pages: 55-66
- Section: ARTICLES
- URL: https://ered.pstu.ru/index.php/amcs/article/view/4044
- DOI: https://doi.org/10.15593/2499-9873/2023.3.04
- Cite item
Abstract
The COVID-19 pandemic has affected many aspects of people's lives and territories. It has a destabilizing effect on the economy due to both direct and indirect factors. In order to develop an effective policy to combat such emergencies, the problem of studying its consequences seems urgent.To form effective responses to the consequences of the pandemic, adequate scientific tools are needed to assess them. In many of the studies conducted, the impact of the pandemic was assessed without considering the previously existing socio-economic trends in the regions.The purpose of the article is to conduct a retrospective analysis of the consequences of economic instability caused by the COVID-19 pandemic on the socio-economic development of the region on the example of the Sverdlovsk region. The monthly values of twelve main socio-economic indicators from January 2016 to December 2021 were analyzed. The study is based on the use of regression models with dummy variables and seasonal autoregression for forecasting, which allow considering the seasonal dependence of socio-economic indicators.To determine the seasonality of individual indicators, a graphical method, autocorrelation correlograms and spectral analysis were used. When determining the uniformity between the predicted and actual values during the pandemic, the parametric Student's criterion and the nonparametric Wilcoxon criterion were applied, which allowed us to obtain a statistically significant result regardless of the normality of the compared aggregates.The retrospective analysis made it possible to establish a significant heterogeneous impact of the COVID-19 pandemic on most of the analyzed spheres of life in the Sverdlovsk region.
Full Text
Введение Эпилепсия - одно из наиболее распространенных неврологических заболеваний во всем мире. Основным симптомом являются эпилептические приступы, представляющие серьезную опасность из-за их внезапности и возможности причинить травмы, которые могут быть фатальными [1-3]. Поэтому важной задачей современной медицины является предотвращение этих приступов. На основе анализа научных публикаций можно выделить следующие направления исследований в данной области: · применение методов машинного обучения, таких как метод опорных векторов и метод случайного леса [4-6]. В данных исследованиях удалось достичь среднего значения чувствительности (также значение AUС) 70 %; · применение сверточных нейронных сетей [7]. В данном исследовании среднее значение чувствительности составило 75 %; · комбинация байесовских моделей, в том числе байесовская сверточная нейронная сеть [8]. Среднее значение чувствительности в данном исследовании составило 71 %. Среднее значение чувствительности классификаторов (также значение AUC) в приведенных выше исследованиях не превышает 75 %. Наибольшей чувствительности удалось достигнуть в исследовании применения сверточных нейронных сетей для прогнозирования эпилептических припадков [7]. Не менее важным аспектом являются методы предварительной обработки данных, которые сходятся к следующему подходу: данные обрабатываются с помощью оконного преобразования Фурье, далее логарифмируются для повышения низкочастотной компо-ненты сигнала и нормализуются [9]. Целью данной работы является разработка архитектуры нейронной сети на основе ConvLSTM [10] для классификации входных сигналов на предприступные и межприступ-ные участки ЭЭГ, а также сравнение полученных результатов с результатами исследова-ний, основанных на иных подходах. 1. Сверточная Long Short-Term Memory-нейронная сеть ConvLSTM сочетает в себе преимущества LSTM [11; 12] и сверточных нейронных сетей. Главной особенностью является использование операции свертки как во входных, так и в рекуррентных преобразованиях. Математическая модель ConvLSTM: (1) (2) (3) (4) (5) (6) В данной модели в качестве функций активации используются: · гиперболический тангенс ( ) в формуле (1); · сигмоидальная функция (σ) в формулах (2)-(4). Коэффициенты b с различными индексами используются для обозначения свободных членов (смещений). Операция свертки обозначена символом*, а произведение Адамара, в формулах (5) и (6), обозначено символом ⊙. Рис. 1. Схема блока сверточной LSTM-нейронной сети Принцип работы ConvLSTM (рис. 1) заключается в подаче на вход двух векторов: нового вектора входных сигналов xt и вектора скрытого состояния предыдущей ячейки на предыдущем шаге ht-1. Оба вектора перед прохождением каждого из гейтов умножаются на соответствующие веса Wx и Wh. Кроме того, внутри каждого блока ConvLSTM есть ячейка состояния кандидатов значений (ячейка памяти), которая выполняет функции запоминания значений. Также на вход подается вектор значений кандидатов ct-1 на предыдущем шаге. В гейтах (рис. 2) по формулам (1)-(4) вычисляются значения соответствующих им скрытых состояний: · вектор состояния выходного гейта · вектор ячейки состояния кандидатов · вектор выходного гейта · вектор забывающего гейта С помощью полученных скрытых состояний забывающего гейта и входного по формуле (6) отсеиваются предыдущие значения кандидатов и вычисляются новые значения кандидатов . С помощью функции активации (гиперболического тангенса) и коэффициента o_t вычисляется скрытое состояние по формуле (6). Рис. 2. Структура гейта ConvLSTM Таким образом, данные, проходящие через ячейки ConvLSTM, являются не просто одномерным вектором признаков, а сохраняют размерность входа, что можно использовать для проектирования сложной архитектуры сети. 2. Анализ исходных данных Для реализации программы прогнозирования эпилептических припадков была использована выборка [13] которая содержит данные сигналов ЭЭГ для трех собак и двух людей. Данные разделены на предприступные, межприступные и тестовые. В табл. 1 представлены данные о количестве таких сегментов для каждого из пациентов. Таблица 1 Количественные характеристики выборки для каждого пациента Пациент Предприступные сегменты Межприступные сегменты Тестовые сегменты Dog_1 24 480 502 Dog_2 42 500 1000 Dog_3 30 450 191 Patient_1 50 18 195 Patient_2 42 18 150 При анализе исходных данных было установлено количество приступов для каждого пациента, а также общее количество приступных сегментов. Исходя из этого, была сформирована табл. 2, содержащая данные о количестве приступных и беcприступных сегментов, а также количество приступов для каждого пациента. Таблица 2 Анализ исходных данных Пациент Кол-во электродов Кол-во приступных эпизодов Кол-во беcприступных эпизодов Кол-во приступов Dog_1 16 178 418 4 Dog_2 16 172 1148 7 Dog_3 16 480 4760 12 Patient_1 68 70 104 3 Patient_2 16 151 2990 3 По данным, представленным в табл. 2, вычисляется значение отношения приступных к беcприступным по формуле где - отношение приступных к без приступным, - количество приступных сегментов, - количество бесприступных сегментов. Также вычисляется значение перекрытия: где - значения перекрытия событий приступов приступными сегментами, - количество приступов. Полученные значения занесены в табл. 3. Таблица 3 Значения ratio и overlap Пациент Ratio Overlap Dog_1 0,425837321 0,025 Dog_2 0,149825784 0,045 Dog_3 0,100840336 0,025 Patient_1 0,673076923 0,07 Patient_2 0,050501672 0,08 3. Обработка исходных данных Загружаются ЭЭГ-файлы, а каждый файл разбивается на сэмплы (отрезки сигнала). Для оптимизации был произведен ресэмплинг с понижением частоты дискретизации: 200 Гц для собак, 1000 Гц для людей. Так как в данном исследовании используется размер кадра 15 секунд, то необходимо найти длину такого кадра в семплах, так как для собак и людей используются различные значения окна дискретизации. ConvLSTM способно выделять признаки из пространственной информации, следовательно, данные необходимо преобразовать в вид, подходящий для сверточного слоя с двумя измерениями. Таким образом, данные следует представить в виде матриц, имеющих схожую структуру с обычным изображением. Для извлечения частотных признаков использовано оконное преобразование Фурье (также ОПФ) с размером кадра 15 секунд [14-16]. Полученная таким образом спектрограмма является двумерной матрицей, измерениями которой являются время и частота сигнала. Полученные данные обрабатываются функцией log_10 (x) для выделения амплитудных характеристик. Далее значения приводятся к виду, удобному для подачи на вход сверточного слоя с двумя измерениями. Затем данные будут представлены в виде особого математического объекта - тензора. Полученные данные можно представить в графическом виде - в виде спектрограмм (рис. 3). Для увеличения количества обучающих данных, относящихся к классу предприступ-ных сигналов, были получены дополнительные сегменты (рис. 4). Полученные дополнительные сегменты группируются с ранее полученными последовательно, согласно времени их записи. Рис. 3. Пример полученной спектрограммы Рис. 4. Отбор дополнительных сегментов Далее полученные данные нормализуются и делятся на обучающую, валидационную и тестовую выборки, согласно значению ratio, представленному в табл. 3. Каждая из выборок отличается по временному периоду, что исключает ошибку переобучения в процессах валидации и тестирования модели. 4. Архитектура нейронной сети Рассмотрим архитектуру нейронной сети (рис. 5). Входной слой модели принимает данные в виде пятимерных тензоров, полученных в ходе предварительной обработки. Для ускорения обучения и классификации, а также в качестве нормализации используется слой пакетной нормализации. Далее используется двумерный слой ConvLSTM с параметрами: 32 фильтра, размер ядра 4×4 и функцией активации ReLU. Для увеличения количества обучающих параметров далее параллельно вычисляются три слоя, состоящие из двумерного ConvLSTM и трехмерного MaxPooling-слоя. Параллельные слои конкатенируются, и к ним применяется dropout с шансом отбрасывания 35 %. Следующий слой - слой выравнивания (flatten). Далее следуют полносвязные слои для классификации данных, для предотвращения переобучения количество нейронов для каждого слоя было ограничено 32 и 16 нейронами соответственно, в качестве функции активации для каждого слоя была выбрана ReLU. Рис. 5. Архитектура нейронной сети Параллельные полносвязные слои конкатенируются, и к ним применяется dropout с шансом отбрасывания 35 %. Финальным слоем является полносвязный слой с двумя нейронами для классификации с функцией активации для этого слоя softmax. Таким образом, выходом модели будет вероятность принадлежности данных к каждому из двух классов - предприступному и межприступному. В качестве оптимизатора модели был выбран оптимизатор AMSgrad [17]. Он является логическим продолжением идей Adam по комбинации стохастического градиентного спуска и адаптивного градиента. Но, в отличие от него, не позволяет градиенту расти слишком быстро, использует более консервативную оценку второго момента градиента, что позволяет ему более стабильно работать в таких ситуациях. В качестве метрики для анализа точности прогнозов выбрана ROC AUC (Receiver Operating Characteristic Area Under the Curve), широко используемая в задачах бинарной и многоклассовой классификации. Метрика AUC представляет собой численное значение ROC-кривой, являясь площадью под этой кривой. 5. Обучение и валидация Обучение модели проходило в течение 10 эпох отдельно для каждого пациента. Лучшие результаты для каждого из пациентов представлены в табл. 4. Таблица 4 Данные обучения и валидации Метрика Пациент Dog_1 Dog_2 Dog_3 Patient_1 Patient_2 loss 0,06 0,05 0,01 0,15 0,01 accuracy 0,97 0,98 0,99 0,94 0,99 val_loss 2,83 0,34 0,17 0,18 1,6 val_accuracy 0,52 0,89 0,95 0,92 0,72 По данным валидации, а именно по валидационной точности, можно сделать вывод о том, что представленная выше модель работает в качестве случайного предиктора для Dog_1. Что свидетельствует о возможно недостаточном количестве данных обучения или об иных проблемах в данных данного пациента, которые оказывают воздействие на сигнал электроэнцефалограммы. 6. Тестирование модели Тестирование модели проводилось с помощью метрик ROC AUC, данные по каждому пациенту по метрике AUC представлены в табл. 5. Таблица 5 Значения AUC для каждого пациента Метрика Пациент Dog_1 Dog_2 Dog_3 Patient_1 Patient_2 AUC 0,5012 0,9844 0,4985 0,9606 0,8045 По метрикам AUC, представленным в табл. 5, можно сделать вывод, что для обоих пациентов и одной из трех собак классификатор намного лучше предсказывает эпилептические приступы, чем случайный предиктор. Однако в процессе валидации модель показала хорошие результаты для пациента Dog_3. Также форма ROC-кривой (рис. 6) показывает, что для пациента Dog_3 при достаточном количестве данных обучения классификатор мог бы показать лучшую точность. Заключение Так как среднее значение чувствительности для данной модели приблизительно равно 75 %, данная нейросетевая модель показала себе более эффективной, чем модели, представленные в исследованиях [4-6; 8]. Результаты, полученные в ходе исследования, коррелируют с результатами исследования [7]. Из этого можно сделать вывод об эффективности использования сверточных слоев при работе со схожими по структуре данными. Так как результаты вышеупомянутого [7] и проведенного в ходе данной работы исследований имеют схожие результаты, можно сделать вывод, что нейронная сеть, основанная на LSTM-блоках со сверткой, не дает весомого преимущества над классической сверточной архитектурой при прогнозировании эпилептических припадков. Однако это означает, что она также может использоваться в качестве классификатора мозговой активности на основе ЭЭГ. Таким образом, задачей дальнейших исследований может являться улучшение блоков ConvLSTM, например, интеграция механик обучения с вниманием [18]. Рис. 6. Кривые ROC Имеющаяся точность предсказания, хоть и не является высокой, может быть полезной для пациентов. Люди, больные эпилепсией, могли бы получать своевременные уведомления о возможном возникновении припадка, чтобы они могли принять соответствующие меры для обеспечения собственной безопасности.About the authors
M. V. Volodin
Lipetsk State Technical University
I. A. Sedykh
Lipetsk State Technical University
References
- Epilepsy across the spectrum: Promoting healthand understanding. A summary of the institute of medicine report / M.J. England, C.T. Liverman, A.M. Schultz, L.M. Strawbridge // Epilepsy and Behavior. - 2012. - Vol. 25, iss. 2. - P. 266-276.
- Weyhenmeyer J., Gallman E.A. Rapid Review Neuroscience E-Book. - Philadelphia: Elsevier Health Sciences, 2006. - 320 p.
- Lieberman M.D.Intuition: a social cognitive neuroscience approach // Psychological bulletin. - 2000. - Vol. 126, iss. 1. - P. 109-112.
- Ben Messaoud R., Chavez M. Random Forest Classifier for EEG-based Seizure Prediction // arXiv. 2021. doi: 10.48550/arXiv.2106.04510
- Usman S.M., Usman M., Fong S. Epileptic Seizures prediction using machine learning methods // Computational and Mathematical Methods in Medicine. - 2017. - Vol. 2017. - Art. 9074759. doi: 10.1155/2017/9074759.
- Ouichka O., Echtioui A., Hamam H. Deep Learning Models for Predicting Epileptic Seizures Using iEEG Signals // Electronics. - 2022. - Vol. 11, № 4. - Art. 605. doi: 10.3390/electronics11040605
- A Generalised Seizure Prediction with Convolutional Neural Networks for Intracranial and Scalp Electroencephalogram Data Analysis / N. D. Truong, A. D. Nguyen, L. Kuhlmann, M. R. Bonyadi, J. Yang, O. Kavehei // arXiv. 2017. doi: 10.48550/arXiv.1707.01976.
- Seizure Susceptibility Prediction in Uncontrolled Epilepsy / N.D. Truong, Y. Yang, C. Maher, L. Kuhlmann, A. McEwan, A. Nikpour, O. Kavehei // Frontiers in Neurology. - 2021. - Vol. 12. - Art. 721491. doi: 10.3389/fneur. 2021.721491.
- Sejnowski T.J., Koch C., Churchland P.S.Computational neuroscience // Science. 1988. - Vol. 241, iss. 4871. - P. 1299-1306. doi: 10.1126/science.3045969.
- Convolutional LSTM network: A machine learning approach for precipitation nowcasting / X. Shi, Z. Chen, H. Wang, D. Y. Yeung, W.K. Wong, W.C. Woo // Advances in Neural Information Processing Systems 28, 7-12 December 2015, Montreal, Quebec, Canada, 2015. - P. 802-810.
- LSTM: A search space odyssey / K. Greff, R.K. Srivastava, J. Koutník, B.R. Steunebrink, J. Schmidhuber / IEEE transactions on neural networks and learning systems. - 2017. - Vol. 10. - P. 2222-2232. doi: 10.1109/TNNLS.2016.2582924
- Hochreiter S., Schmidhuber J. Long short-term memory // Neural com-putation. - 1997. - Vol. 9, iss. 8. - P. 1735-1780. doi: 10.1162/neco.1997.9.8.1735.
- American Epilepsy Society Seizure Prediction Challenge / Kaggle [Электронный ресурс]. - URL: https://www.kaggle.com/competitions/seizure-prediction (дата обращения: 01.06.2023).
- Seizure prediction in EEG signals using STFT and domain adaptation / P. Peng, Y. Song, L. Yang, H. Wei / Frontiers in Neuroscience. - 2022. - Vol. 15. - Art. 825434. DOI 10.3389/ fnins.2021.825434
- Epileptic Seizure Forecasting with Generative Adversarial Networks / N.D. Truong, L. Kuhlmann, M.R. Bonyadi, D. Querlioz, L. Zhou, O. Kavehei // IEEE Access. - 2019. - Vol. 7. - P. 143999-144009. doi: 10.1109/ACCESS.2019.294469
- Classification of EEG Signals for Prediction of Epileptic Seizures / M. Aslam, S.M. Usman, S. Khalid, A. Anwar, R. Alroobaea, S. Hussain, A. Yasin // Applied Sciences. - 2022. - Vol. 12, iss. 14. - P. 7251. doi: 10.3390/app12147251
- Reddi S., Satyen K., Sanjiv K. On the convergence of Adam and Beyond // arXiv. - 2019. doi: 10.48550/arXiv.1904.0923
- Liu B., Lane I. Attention-Based Recurrent Neural Network Models for Joint Intent Detection and Slot Filling // arXiv. - 2016. doi: 10.48550/arXiv.1609.01454
Statistics
Views
Abstract - 114
PDF (Russian) - 74
Refbacks
- There are currently no refbacks.