ВОПРОСЫ ПРИМЕНЕНИЯ ИЕРАРХИЧЕСКИХ СИСТЕМ РАСПОЗНАВАНИЯ В СИСТЕМАХ ВИДЕОНАБЛЮДЕНИЯ
- Авторы: Тур А.И1, Кокоулин А.Н1, Ахметзянов К.Р1, Южаков А.А1
- Учреждения:
- Пермский национальный исследовательский политехнический университет
- Выпуск: № 34 (2020)
- Страницы: 75-89
- Раздел: Статьи
- URL: https://ered.pstu.ru/index.php/elinf/article/view/2480
- DOI: https://doi.org/10.15593/2224-9397/2020.2.05
- Цитировать
Аннотация
Системы видеонаблюдения с функцией распознавания имеют ряд минусов в случае организации по стандартным подходам к построению. Эти минусы не позволяют создать систему, одновременно удовлетворяющую всем основным требованиям заказчика (максимально возможное качество изображения, охват большой площади (большое количество камер), высокое быстродействие при низкой общей себестоимости). Для решения поставленной задачи предложено применение иерархического подхода, сутью которого является последовательное поэтапное уточнение области распознавания объекта. Это достигается благодаря применению камеры Internet of Things (IoT) - Smart Camera (SC). Она позволяет генерировать поток информации только во время появления объекта в кадре, а также предварительно обрабатывать информацию (производятся обнаружение Region of Interest (ROI), обрезка изображения согласно контуру объекта и программно установленным правилам). Smart Camera представляет собой одноплатный микрокомпьютер и модуль видеокамеры. Изображение, снимаемое модулем камеры, обрабатывается простыми алгоритмами для выделения важной для системы информации. Цель исследования: разработка модели системы видеонаблюдения с функцией распознавания, демонстрирующей преимущества иерархического подхода распознавания над стандартным. Результаты: была разработана имитационная модель, представляющая собой программу анализа работы системы массового обслуживания, основанной на генерации времени возникновения входных заявок (стационарный стохастический процесс) и расчёте времени, требуемого для обслуживания каждой заявки (модель учитывает возможность одновременной обработки нескольких заявок). В ходе измерений показателей было промоделировано прохождение пяти тысяч заявок в такой системе распознавания за 5 отдельных итераций и рассчитаны основные показатели, характеризующие систему. На основании этих данных произведён расчёт усреднённых общих показателей систем, использующих как стандартный, так и иерархический подход. По итогам моделирования видно, что применение иерархического подхода, позволяющего генерировать поток информации только во время появления объекта в кадре, а также предварительно обрабатывать информацию, значительно снижает вычислительную нагрузку на сервер.
Ключевые слова
Полный текст
Введение. Система видеонаблюдения - это комплекс охранных устройств, предназначенный для постоянного визуального наблюдения над защищаемой территорией. Она включает в себя набор камер, регистратор или сервер с устройством для записи, кабель и коммутационное оборудование для передачи информации. При заказе подобных систем люди хотят иметь максимально возможное качество изображения, охват большой площади (большое количество камер), высокое быстродействие при низкой общей себестоимости [1-3]. При монтаже систем видеонаблюдения с функцией распознавания объектов данные требования почти не выполнимы при применении стандартных подходов. 1. Стандартные подходы к построению системы видеонаблюдения. Стандартный общепринятый подход к построению систем видеонаблюдения с интеллектуальным распознаванием визуальной информации строится на централизации вычислительных мощностей. Создаётся сервер (или серверы при большой нагрузке), занимающийся предварительной обработкой входящей визуальной информации (корректировка качества и свойств изображения, различные манипуляции с блоками информации) и распознаванием образов. Формируется кластер средств получения визуальной информации - камер. Кластер камер и сервер связывают устройство для объединения узлов в единую сеть (на рис. 1 представлена система распознавания с сетевым концентратором). Рис. 1. Система распознавания визуальных образов, организованная по общепринятому подходу Для оценки такой системы можно использовать закон Литтла (англ. Little's law). В теории массового обслуживания законом Литтла называют сформулированную американским учёным Джоном Литтлом теорему (1): долгосрочное среднее количество L заявок в стационарной системе равно долгосрочной средней интенсивности λ входного потока, умноженной на среднее время W пребывания заявки в системе: (1) Среднее время обработки каждой отдельной заявки в такой системе будет зависеть от загруженности сервера. Из фундаментальных законов производительности вычислительных систем известна зависимость среднего времени обработки заявки от состояния загруженности системы в конкретный момент времени (коэффициент использования). Когда коэффициент использования достигает 100 %, т.е. сервер оказывается перегруженным, время обработки стремится к бесконечности из-за ограниченности вычислительных ресурсов. На рис. 2 представлен график зависимости времени обработки запроса от загруженности сервера. Рис. 2. Влияние загруженности сервера на время обработки заявки Компонент, испытывающий перегрузки, вынуждает систему выстраивать заявки на обработку информации в очередь, означающую, что каждый последующий запрос должен ожидать полного завершения предшествующего ему для получения необходимого количества вычислительных ресурсов [4]. Согласно графику, представленному на рис. 2, точкой перегиба можно считать отметку, где коэффициент использования принимает значение 70 %. При меньших показателях увеличение времени обработки можно считать приемлемым, при больших - увеличение времени обработки происходит слишком быстро. Таким образом, для обеспечения продуктивной работы системы необходимо поддерживать коэффициент использования менее 0,7. Данный коэффициент рассчитывается следующим образом: (2) где λ - интенсивность потока заявок, а µ - интенсивность обработки заявок системой [4, 5]. Для примера промоделируем такую систему на примере проходного коридора. Допустим, система состоит из 20 камер, каждая из которых снимает контролируемую зону (размерами 6 м в ширину и 40 м в длину). Сервер с помощью специального коммутационного устройства опрашивает камеры для сбора информации. Внутри контролируемой зоны периодически появляются объекты (процесс появления описывается стационарным пуассоновским потоком), которые двигаются в среднем со скоростью 3 км/ч и в среднем на расстоянии 5 м друг от друга. В случае применения стандартного подхода нагрузка на сервер преимущественно зависит от используемых камер. Это обусловлено тем, что опрос камер производится независимо от наличия объектов в контролируемой зоне. Предположим, что мы используем камеры с качеством записи 1920´1080 пикселей (матрица 2 Мп), скоростью съёмки 15 FPS (англ. Frames per Second - кадровая частота). Средний размер одного кадра такой камеры равен 700 Кб. Значит, за одну секунду камера генерирует поток информации 10,25 Мб/с (10500 Кб/с), а 20 камер - 205 Мб/с. Следовательно, сервер должен обладать скоростью обработки не ниже 292,85 Мб/с согласно требованиям, основанным на коэффициенте загруженности (см. табл. 2). Для решения этой проблемы применяют следующие подходы [6-10]: - снижение качества изображения (за счёт замены камер на более простые с меньшими характеристиками или программной настройкой текущих камер) - подход возможен в системах обнаружения, но не подходит для систем распознавания из-за низкого качества графической информации; - создание систем параллельной обработки информации (покупка однотипного оборудования обработки информации и перераспределение вычислительной нагрузки между ними) и иные способы увеличения вычислительных возможностей системы (замена сервера на более мощный) - подход решающий данную проблему, но требующий ощутимых дополнительных денежных инвестиций; - использование «интеллектуальных» решений (замена камер на аналогичные, но с датчиком движения) - подход способен значительно сократить нагрузку на сервер в случае большого времени отсутствия объектов в контролируемой зоне, однако в случае постоянного потока объектов будет генерировать такой же поток информации, что и решение с обычными камерами (см. табл. 2). Применение иерархического подхода к таким системам позволяет частично интегрировать рассмотренные выше подходы, оставив все их преимущества и минимизировав недостатки. В данном случае будет произведена замена камер на Smart Camera (далее - SC), позволяющими генерировать поток информации только во время появления объекта в кадре, а также предварительно обрабатывать информацию (производится обнаружение ROI, обрезка изображения согласно контуру объекта и программно установленным правилам), т.е. с одним этапом уточнения информации [11]. 2. Применение иерархического подхода. Примером модификации системы с применением иерархического подхода может служить вариант, предложенный на рис. 3. Рис. 3. Система распознавания визуальных образов, организованная по иерархическому подходу Иерархичность данного подхода заключается в том, что происходит постепенное уточнение информации на всём пути распознавания. Существенным отличием является отказ от обычным камер. Вместо них предложено использовать камеры IoT - SC. SC представляют собой одноплатный микрокомпьютер и модуль видеокамеры. Изображение, снимаемое модулем камеры, обрабатывается простыми алгоритмами для выделения важной для системы информации. На основании полученной информации может производиться включение передачи информации (во время обнаружения объекта в кадре) или передача только области интереса алгоритма (ROI) [11-15]. Этот шаг добавляет незначительное время на обработку первичного изображения (так как используются простые алгоритмы), но уменьшает объём трафика, передаваемого в сети системы (во время отсутствия событий камера не генерирует трафик, а при появлении объекта отправляет значительно меньше информации по сравнению с обычной камерой), а следовательно, значительно уменьшает время передачи информации. Серверная часть остаётся почти без изменений, используются те же алгоритмы распознавания, что и при стандартном походе, но исключаются алгоритмы предобработки изображения. Это обусловлено тем, что данный шаг уже был выполнен SC. Однако общее время распознавания (без учёта времени предобработки) будет ниже, так как сложным алгоритмам распознавания будет необходимо обработать меньшое количество информации (чаще всего таким алгоритмам требуется полный попиксельный обход всего изображения). Первый этап распознавания (рис. 4) производится на оригинальном изображении со значительно сниженным разрешением. Это снижает время поиска и количество ресурсов, затрачиваемых на обработку изображения (по сравнению с обработкой оригинального изображения). На изображении отмечаются ROI, которые удовлетворяют критериям грубого поиска (происходит поиск по заданному шаблону, но порог отсеивания ложных срабатываний значительно ниже, чем при обычном распознавании). Алгоритм по координатам ROI определяет, какие фрагменты исходного изображения необходимо проанализировать, и загружает их из памяти, используя поисковую информацию, прикрепленную на подготовительном этапе. На втором этапе происходит обработка фрагментов исходного изображения в стандартном режиме распознавания (с высоким порогом отсеивания ложных срабатываний) - точный поиск [12, 14, 16, 17]. В более продвинутых системах таких итераций грубого поиска может быть больше (см. рис. 4). Это позволяет снизить количество ложных вызовов после грубого поиска, так как каждый фрагмент изображения будет распознаваться более одного раза. Для этого могут проводиться как независимые оценки изображений разной степени сжатия (результат грубого распознавания - области, имеющие больше количество распознанных участков изображения), так и постепенное уточнение изображения (в каждой следующей итерации берётся изображение с меньшей степенью сжатия, но оценивается только область вокруг участка изображения, распознанного на предшествующей итерации) [16, 17]. Для проверки вышеизложенных утверждений была разработана имитационная модель, представляющая собой программу анализа работы системы массового обслуживания. Входные параметры у этой системы представлены следующим образом. Интенсивность потока заявок: (3) где v - средняя скорость перемещения объекта в контролируемой зоне (3 км/ч), I - среднее расстояние между объектами (5 м), n - количество камер (20). Время обслуживания: (4) где d - средний путь преодолеваемый объектом (40 м), v - средняя скорость перемещения объекта в контролируемой зоне (3 км/ч), t - среднее время, необходимое серверу для анализа изображения (0,7 с, согласно экспериментальным данным). Первое слагаемое обусловлено тем, что камеры вынуждены передавать информацию до тех пор, пока объект не покидает контролируемую зону. Процесс является стационарным - стохастический процесс, у которого не изменяется распределение вероятности при смещении во времени. Моделирование ограничено N числом заявок (1000 шт.) для приближения к реальным условиям проходной. Итераций грубого поиска - 1. В ходе эксперимента были получены данные, представленные в табл. 1. Таблица 1 Результаты имитационного моделирования процесса работы системы с применением иерархического подхода № эксперимента Общее время симуляции (мин) Максимальное количество одновременно обрабатываемых заявок (шт.) 1 4770,342 2 2 4705,456 3 3 4888,511 2 4 4864,429 3 5 5020,779 1 Среднее 4849,903 2,2 Основная вычислительная нагрузка на сервер приходится в моменты одновременной обработки нескольких объектов. Smart Camera передаёт серверу только область ROI, программно заблокированную на величине 0,2 кадра (камера обнаруживает силуэт объекта и ставит его в середину динамического окна заданной площади). В случае использования камер с идентичными техническими характеристиками (качество записи 1920´1080 пикселей (матрица 2 Мп), скорость съёмки 15 FPS) объём потока информации от такой камеры составит приблизительно 2 Мб/с (2100 Кб/с) в момент, когда в контролируемой зоне находится 1 объект. Как показал эксперимент, максимальное количество одновременно обрабатываемых заявок составляет 3, а значит, в момент пиковой нагрузки одна камера будет передавать чуть более 6 Мб/с (6300 Кб/с). В таком случае информационный поток от 20 таких камер составит 123 Мб/с (126 000 Кб/с). Тогда сервер должен обладать скоростью обработки не ниже 175,71 Мб/с согласно требованиям, основанным на коэффициенте загруженности. В моменты средней активности (две одновременно обрабатываемые заявки) - 117,18 Мб/с. В моменты простоя камеры не генерируют информационный поток (см. табл. 2). В случае обеспечения продуктивной работы сервера время обработки каждого отдельного изображения будет ниже, так как алгоритмы распознавания используют «скользящее окно», которое друг за другом анализирует каждый пиксель изображения. Отсюда очевидно, что изображение, в котором содержится в 5 раз меньше пикселей, будет обработано быстрее. Таблица 2 Сопоставление требование к ресурсам сервера при применении различных подходов в различных условиях Подход Требование к ресурсам сервера при отсутствии объектов Требование к ресурсам сервера при 2 объектах в контролируемой зоне Требование к ресурсам сервера при 3 объектах в контролируемой зоне Стандартный подход 292,85 Мб/с 292,85 Мб/с 292,85 Мб/с Стандартный подход (камеры с датчиком движения) 0 Мб/с 292,85 Мб/с 292,85 Мб/с Иерархический поход 0 Мб/с 175,71 Мб/с 117,18 Мб/с Возвращаясь к теореме Литтла (1), можно утверждать, что среднее время пребывания заявки в системе (W) снизится, исходя из (4) (камера вынуждена передавать информацию до тех пор, пока объект не покидает контролируемую зону, однако время анализа сервером самого изображения значительно уменьшится). А вот средняя интенсивность входного потока (λ) будет значительно ниже из-за сократившегося объёма генерируемых данных для каждой из заявок. Поэтому произведение этих величин - среднее количество заявок (L) будет ниже. Выводы. Стандартный общепринятый подход к построению систем видеонаблюдения с интеллектуальным распознаванием визуальной информации строится на централизации вычислительных мощностей. Такие системы часто страдают от высокой загруженности из-за большого количества входящей информации. Применение иерархического подхода позволяет генерировать поток информации только во время появления объекта в кадре, а также предварительно обрабатывать информацию (производится обнаружение ROI, обрезка изображения согласно контуру объекта и программно установленным правилам), что значительно снижает вычислительную нагрузку на сервер. Подобный подход может быть применён не только в области видеонаблюдения, но и в проектах, требующих либо обработку большого потока данных от видеокамер (системы стереоскопического зрения), либо в проектах, основанных на компьютерах малой вычислительной мощности (автоматизированные устройства для обработки графической информации, получаемой от камер, - передвигающиеся роботы, автоматы обслуживания).Об авторах
А. И Тур
Пермский национальный исследовательский политехнический университет
А. Н Кокоулин
Пермский национальный исследовательский политехнический университет
К. Р Ахметзянов
Пермский национальный исследовательский политехнический университет
А. А Южаков
Пермский национальный исследовательский политехнический университет
Список литературы
- Казакова М.Г., Кирин Ю.П. Проектирование системы информационного сервиса по реализации и сборке систем видеонаблюдения // Современные информационные технологии. - 2019. - № 9. - С. 21-22.
- Барташевич П.В. Разработка методики проектирования систем ip-видеонаблюдения на примере системы видеонаблюдения BVMS производства компании BOSCH // Проблемы передачи информации в инфокоммуникационных системах: сб. докл. и тезисов всерос. науч.-практ. конф. - Волгоград, 2013. - С. 6-10.
- ГОСТ Р 51558-2014 Средства и системы охранные телевизионные. Классификация. Общие технические требования. Методы испытаний // Доступ из справ.-правовой системы КонсультантПлюс.
- От хранения данных к управлению информацией. - 2-е изд. - СПб.: Питер, 2016. - 544 с.
- Крылов В.В., Самохвалова С.С. Теория телетрафика и её приложения. - СПб.: БХВ-Петербург, 2005. - 288 с.
- Шепелев К.В. Расширение существующих систем видеонаблюдения в системах безопасности до маркетингостатистических систем анализа клиентопотока // SCIENCE TIME. - 2016. - № 4(28). - С. 944-947.
- Новые направления применения видеотехнологий в системах безопасности / А.Н. Членов, Ф.В. Демёхин, Т.А. Буцынская, И.Г. Дровникова // Вестник Московского энергетического ин-та. - 2009. - № 3. - С. 88-93.
- Малявкина Л.И., Меньшова М.В. Системы видеоанализа в розничной торговле // Научные записки ОРЕЛГИЭТ. - 2015. - № 1(11). - С. 25-28.
- Булгакова Е.В., Булгаков В.Г. Хранилище видеоархивов данных о динамических признаках человека, предназначенное для решения криминалистических задач // Правовая информатика. - 2013. - № 4. - С. 28-31.
- Шкуропат И.И. Системы видеорегистрации для локомотивов // Локомотив. - 2018. - № 6. - С. 2-3.
- Kokoulin A. Methods for Large Image Distributed Processing and Storage // IEEE EUROCON Conference; Zagreb, CROATIA. - 2013. - Jul. 01-04. - Р. 1600-1603.
- Тур А.И., Кокоулин А.Н., Дзыгарь А.В. Иерархическая система поиска и распознавания штрихкода на повреждённой таре в автомате раздельного сбора отходов // Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления. - 2019. - № 29. - С. 44-57.
- Южаков А.А., Кокоулин А.Н., Тур А.И. Иерархическая архитектура сверточной нейронной сети в распределенной системе распознавания лиц // Нейрокомпьютеры: разработка, применение. - 2019. - Т. 21, № 3. - С. 28-34. doi: 10.18127/j19998554-201903-04
- Тур А.И., Кокоулин А.Н., Князев А.И. Применение иерархического подхода для распознавания объектов в автоматах по приему использованной тары [Электронный ресурс] // Материалы XIII Всерос. совещания по проблемам управления (ВСПУ-2019); 17-20 июня 2019, г. Москва / Ин-т проблем управления им. В.А. Трапезникова РАН. - М.: Изд-во ИПУ им. В.А. Трапезникова РАН, 2019. - 5 с. - 1 USB flash-drive.
- Kokoulin A. Development of hierarchical distributed GIS system // International Multidisciplinary Scientific GeoConference Surveying Geology and Mining Ecology Management, SGEM. - 2019. - № 19(2.1). - P. 833-839.
- Бабилунга О.Ю. Модель иерархического формирования образов объектов в системах обработки и распознавания изображений // Электромашиностроение и электрооборудование. - 2007. - № 69. - С. 56-60.
- Савченко А.В., Милов В.Р. Иерархическая система интеллектуального анализа и распознавания аудио- и видеообъектов // Нейрокомпьютеры: разработка, применение. - 2014. - № 11. - С. 23-30.
Статистика
Просмотры
Аннотация - 62
PDF (Russian) - 27
Ссылки
- Ссылки не определены.