SENSOR PATTERN NOISE USAGE FOR VIDEO CAMERA IDENTIFICATION

P. D Gusev; Гусев П. Д; G. I Borzunov; Борзунов Г. И

doi:10.15593/вестник пермского национального исследовательского политехнического университета. электротехника, информационные технологии, системы управления.v0i24.2618

Использование шумового портрета сенсора для определения соответствия видеозаписи конкретной видеокамере

Авторы: Гусев П.Д¹, Борзунов Г.И¹^,2
Учреждения:
1. Национальный исследовательский ядерный университет «МИФИ»
2. Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)
Выпуск: № 24 (2017)
Страницы: 32-47
Раздел: Статьи
URL: https://ered.pstu.ru/index.php/elinf/article/view/2618
DOI: https://doi.org/10.15593/вестник%20пермского%20национального%20исследовательского%20политехнического%20университета.%20электротехника,%20информационные%20технологии,%20системы%20управления.v0i24.2618
Цитировать

Аннотация
Полный текст
Об авторах
Список литературы
Статистика

Аннотация

Рассматриваются вопросы идентификации цифровых видеозаписывающих устройств на основе их шумовых портретов. В настоящее время проблема экспертизы изображений и видеозаписей приобрела огромное значение. Одной из важнейших задач такой экспертизы является определение соответствия видеозаписи конкретной видеокамере (техники, использующие шумовой портрет камеры). Это часто необходимо в ходе расследования преступлений, например, связанных с детской порнографией. На качество изображения в ходе его получения фотокамерой может влиять большое число факторов на каждом этапе. Даже если сенсор запечатлит равномерно освещенную монотонную картину (например, равномерно освещенный белый лист бумаги), получающееся цифровое изображение будет содержать различные по интенсивности пиксели. Это связано с двумя шумовыми компонентами - дробовым шумом, т.е. беспорядочными флуктуациями напряжений и токов относительно их среднего значения в цепях радиоэлектронных устройств, обусловленными дискретностью носителей электрического заряда и так называемым шумовым портретом сенсора. Дробовой шум представляет собой случайный шум, в то время как шумовой портрет - постоянная характеристика сенсора, связанная с его внутренним устройством. В настоящей работе рассматриваются подходы к определению конкретного устройства, когда имеется в качестве входных данных только набор видеопоследовательностей. Помимо этого подробно разобран процесс получения фото- и видеоизображения, рассмотрены различные алгоритмы и методы реализации данного подхода, включая экспериментальные результаты. В заключение отмечается эффективность подхода, рассматриваются перспективы направления и даются рекомендации по дальнейшим исследованиям.

Ключевые слова

идентификация, видеозапись, шумовой портрет, неоднородность фотоотклика, шумовой узор.

Полный текст

Введение. В настоящее время проблема экспертизы изображений и видеозаписей приобрела огромное значение. В конце декабря 2014 г. Президиумом Верховного суда Российской Федерации утвержден «Обзор судебной практики Верховного суда Российской Федерации», в котором содержится раздел III «Разъяснения по вопросам применения Кодекса Российской Федерации об административных правонарушениях». Согласно разъяснениям судья не вправе отказать в приобщении к материалам дела видеозаписи, сделанной при помощи видеорегистратора, которая впоследствии должна быть оценена по правилам ст. 26.11 КоАП РФ наряду со всеми иными собранными по делу доказательствами. Таким образом, выходят на первый план задачи соответственно фото- и видеотехнической экспертизы. Одной из важнейших задач такой экспертизы является определение соответствия видеозаписи конкретной видеокамере (техники, использующие шумовой портрет камеры). Это часто необходимо в ходе расследования преступлений, например, связанных с детской порнографией. В данной работе рассматриваются основные подходы к решению этой задачи. 1. Процесс получения фото- и видеоизображения. В работе [1] отмечается, что общая структура и последовательность шагов для получения изображения при фотосъемке одинаковы для всех цифровых камер (рис. 1). После того как свет проходит сквозь линзу, к нему применяется набор фильтров, в том числе шумоподавляющий фильтр. Главным компонентом цифровой камеры является так называемый детектор прибора с зарядовой связью (ПЗС). Рис. 1. Этапы получения изображения Детектор замеряет интенсивность света на каждом пикселе своей поверхности. В идеальном случае ПЗС должен использоваться отдельно для каждого из трех цветовых каналов RGB, однако во избежание непомерных затрат производители идут другим путем. Для каждого пикселя используется один и тот же детектор, но перед тем, как свет попадает на детектор, для каждого пикселя применяют различные спектральные фильтры. Такие фильтры также называют массивом цветовых фильтров (МЦФ) (рис. 2). Рис. 2. Пример МЦФ Из решеток массива цветовых фильтров видно, что на каждый конкретный пиксель попадает лишь один компонент цвета. Для получения отсутствующих значений применяются техники интерполяции для каждого из пикселей. Существует несколько различных алгоритмов интерполяции, и разные производители используют различные интерполяционные техники. После цветовой декомпозиции детектор используется для получения цифрового представления интенсивности света в каждой цветовой полосе. Вслед за этим к этому цифровому представлению применяется набор алгоритмов, включающих в себя уже упомянутую интерполяцию цвета, гамма-коррекцию, цветовую обработку и прочее, в том числе сжатие. И хотя описанные операции и шаги являются стандартными, конкретные детали обработки на каждой стадии отличаются у разных производителей и даже у разных моделей одного производителя. В своей работе авторы формируют перечень из 34 особенностей, которые в сумме можно использовать для идентификации модели цифровой камеры. В работе отмечается, что наибольшее влияние на получаемое изображение оказывают конфигурация МЦФ и цветовая обработка. В результате такой обработки в изображении остаются следы и узоры, не связанные с оригинальным содержимым изображения. Авторы предлагают использовать следующие характеристики: - среднее значение пикселей - среднее значение всех пикселей для каждого из трех цветовых каналов (3 характеристики); - корреляция пар RGB - в зависимости от структуры камеры могут различаться корреляции между различными цветовыми каналами (3 характеристики); - соседнее распределение центра масс - для каждого значения пикселя в каждой цветовой полосе считается количество «соседних» пикселей, т.е. отличающихся на единицу. Полученное распределение показывает чувствительность камеры к различным уровням интенсивности (3 характеристики); - коэффициенты энергии пар RGB - эти коэффициенты используется в цветовой коррекции (3 характеристики); - статистика области вейвлет-преобразования - каждая цветовая полоса изображения раскладывается с использованием квадратичных зеркальных фильтров и вычисляется среднее значение в каждой из этих подполос (9 характеристик). В дополнение к цветовым характеристикам авторы также предлагают использовать 13 характеристик, связанных с качеством изображения. В качестве характеристик используются так называемые метрики качества изображения, которые включают в себя: - меры различия пикселей (средняя квадратичная ошибка, средняя абсолютная ошибка); - меры корреляции (нормализованная кросс-корреляция); - меры спектрального расстояния (ошибки спектральной фазы и магнитуды). На основе предложенных характеристик авторы провели эксперимент по различению двух фотокамер и получили точность свыше 90 %. Похожий эксперимент был проведен для различения 5 разных камер, точность определения камеры оказалась выше 75 %. Исходя из представленных результатов, можно сделать вывод, что использование такого набора характеристик для определения цифрового устройства эффективно работает только на небольшом наборе фотокамер. 2. Шумовой портрет. В работе [2] впервые используется понятие шумового портрета для идентификации фотокамер. В работе [3] эти исследования расширяются на область видеопоследовательностей. На качество изображения в ходе его получения фотокамерой может влиять большое число факторов на каждом этапе. Даже если сенсор запечатлит равномерно освещенную монотонную картину (например, равномерно освещенный белый лист бумаги), получающееся цифровое изображение будет содержать различные по интенсивности пиксели. Это связано с двумя шумовыми компонентами - дробовым шумом, т.е. беспорядочными флуктуациями напряжений и токов относительно их среднего значения в цепях радиоэлектронных устройств, обусловленными дискретностью носителей электрического заряда и так называемым шумовым портретом сенсора. Дробовой шум представляет собой случайный шум, в то время как шумовой портрет - постоянная характеристика сенсора, связанная с его внутренним устройством. Случайный шум меняется от изображения к изображению, а шумовой портрет остается неизменным во всех изображениях, снятых этим сенсором. Таким образом, эту характеристику можно использовать для идентификации камеры. Двумя основными компонентами шумового портрета являются фиксированный шумовой узор (ФШУ) и шум за счет неоднородности фотоотклика (НФО) (рис. 3). Фиксированный шумовой узор возникает, когда на сенсор не падает свет, и зависит от выдержки и температуры. Рис. 3. Шумовой портрет сенсора В обычных изображениях основную часть шумового портрета составляет шум за счет неоднородности фотоотклика. Этот шум вызван разной чувствительностью пикселей к свету из-за неоднородности кремниевых элементов и неточностей в процессе производства сенсора. На этот шум не влияет ни температура, ни влажность. В шумовой портрет также включают низкочастотные дефекты, вызываемые отражением света от частичек пыли и оптических поверхностей. Эти низкочастотные компоненты не являются характеристикой сенсора, поэтому их нельзя использовать для идентификации сенсора. Экспериментально показано, что каждый фотосенсор имеет свой собственный уникальный шумовой портрет, при помощи которого становится возможным определять принадлежность цифровой фотографии не только модели фотокамеры, но и конкретному устройству, на которое это изображение было снято. В работе [2] также описывается математическая модель процесса получения изображения. Поступающий на вход сенсора свет можно обозначить как , где - разрешение сенсора. Обозначив шум съемки за , аддитивный случайный шум за и темновой ток за , сигнал на выходе сенсора можно представить следующим образом: . (1) После этого сигнал y проходит множественную обработку. Некоторые операции, применяемые к сигналу, могут быть нелинейными. Таким образом, окончательные значения пикселей , которые принимают значение в пределах , можно выразить следующим выражением: (2) где P - нелинейная функция, зависящая от , расположения пикселя i ,j и значений y локальной окрестности . Подавить шумовой портрет можно, если от сигнала, получаемого на выходе сенсора, вычесть пустой кадр - усредненный сигнал K однородно освещенных кадров. Потребительские камеры не выполняют эту операцию, поскольку затруднительно добиться однородной освещенности сенсора внутри камеры. Присутствие шума за счет неоднородности фотоотклика в изображении можно обнаружить, используя метод корреляции, обычно применяемый для обнаружения устойчивых водяных знаков. Для определения того, снято ли изображение p на камеру С, необходимо сначала определить эталонный узор камеры РС, который является приближением к шуму НФО. Наличие эталонного узора в p устанавливается методом корреляции. Приближение к шуму за счет неоднородности фотоотклика возможно достигнуть, усредняя большое число изображений Этот процесс можно ускорить, подавляя содержимое сцены в изображении. Этого можно достичь, используя шумоподавляющий фильтр F и усредняя шумовые составляющие вместо самих изображений: . (3) Другим преимуществом работы с шумовыми составляющими является то, что низкочастотные компоненты НФО автоматически подавляются. Чем больше обрабатывается изображений Np, тем более подавляется случайных шумовых компонентов. В ходе экспериментов было установлено, что число изображений должно быть больше 50, а шумоподавляющим фильтром с лучшими показателями оказался фильтр на основе вейвлет-преобразования. Для определения того, снято ли изображение p на камеру C, необходимо подсчитать корреляцию между шумовой составляющей изображения и эталонным узором камеры : (4) где символы с чертой означают среднее значение. В работе также отмечается, что хотя этот метод и позволяет различить две разные камеры одной модели одного производителя в случаях, если над изображением были проведены какие-то геометрические преобразования, например, обрезание, изменение размера, вращение, цифровое приближение/отдаление, то идентификация камеры с большой долей вероятности будет неуспешной. Для решения этой проблемы авторы предлагают использовать предложенный метод в совокупности с другими техниками, устойчивыми к геометрическим преобразованиям. 1. Применение упрощенной модели сигнала на выходе сенсора. В предыдущих работах предлагалось использовать дефективные пиксели и темновые токи. Предлагались методы, отслеживающие следы обработки изображения, уникальные для каждой модели видеозаписывающего устройства. Однако эти методы не позволяют отличить разные видеозаписывающие устройства одной модели. В работе [3] описываются техника идентификации видеозаписывающего устройства с использованием упрощенной модели сигнала на выходе сенсора, процесс извлечения шумового портрета из последовательности видеокадров, подробный метод идентификации видеозаписывающего устройства, основанный на нормализованной кросс-корреляции и его реализация. Упрощенная модель сигнала на выходе сенсора выглядит следующим образом. Пусть I[i, j] - сигнал в одной цветовой полосе в пикселе (i, j), i = 1, …, m, j = 1,…,n для одного кадра до применения операции демозаикинга, а Y[i, j] - интенсивность света в пикселе [i, j]. Отбросив индексы пикселей для удобочитаемости, модель сигнала на выходе сенсора имеет вид: (5) где g - усиление цветового канала, - фактор гамма-коррекции, K - нулевое среднее значение, отвечающее за шумовой портрет, а обозначают следующие виды шумов: темновой ток, дробовой шум, шум считывания и шум квантования соответственно. Упрощая это выражение, используя только первый член разложения в ряд Тейлора, получаем: (6) где I(0) - выходной сигнал сенсора в отсутствие шума или потерь при сжатии, ; - комплекс независимых шумовых компонентов. Как и в случае со статическими изображениями, идентификация видеозаписывающего устройства состоит из двух подзадач [4]. Первая - установление шумового портрета по нескольким различным видеозаписям, вторая - определение устройства путем обнаружения в видеозаписи схожего портрета. Для определения K прежде всего необходимо подавить полезный сигнал, оставив только шумовые составляющие в кадрах. Для подавления влияния полезного сигнала из обеих частей предыдущего выражения необходимо вычесть оценку сигнала , полученную с использованием шумоподавляющего фильтра F: (7) (8) В работе авторы предлагают использовать шумоподавляющий фильтр на основе вейвлет-преобразования, который извлекает гауссовский шум заданной дисперсии . Символ означает комбинацию и дополнительного искажения за счет шумоподавляющего фильтра. Использование в работе только шумовых составляющих сильно улучшает качество и точность процесса идентификации видеозаписывающего устройства. Пусть имеется видеозапись, состоящая из N кадров . Из предыдущего выражения для каждого k = 1, …, N (9) В программных потоках, например, в DVD и большинстве видео, распространяемых через Интернет, обычно используется кодирование с переменной скоростью передачи данных, которое сжимает видеопоследовательность, насколько это возможно, для поддержания одного уровня качества изображения [5]. Следовательно, дисперсия в формуле (9) должна быть приблизительно постоянной для всех кадров независимо от их типа (I-, P-, B-кадры, статические и динамические кадры и пр.). С другой стороны, в транспортных потоках, например в DTV и широковещательных потоках, используется кодирование с постоянной скоростью передачи данных, которое создает поток бит с постоянной скоростью, но переменным качеством, что делает дисперсию зависящей от кадра. В этом случае для определения шумового портрета K необходимо дополнительно учитывать дисперсию в зависимости от качества разных типов кадра либо осторожно проводить выборку кадров. Однако если рассматривать все кадры одинаково, считая, что дисперсия не зависит от индекса кадра k, то это сильно упрощает процесс оценки. Предполагая, что для каждого пикселя (i, j) последовательность является белым гауссовским шумом с дисперсией , из выражения (9) мы можем вывести оценку K методом максимального правдоподобия: (10) Поскольку видимые данные линейно зависят от неизвестного параметра, оценка методом максимального правдоподобия является несмещенной оценкой с минимальной дисперсией, и ее дисперсию можно получить из нижней границы Крамера-Рао: (11) Оценка дисперсии (11) дает некоторую ясность насчет того, как качество оценки K зависит от числа и качества кадров видеопоследовательности. В своей работе авторы отметили следующие наблюдения, которые затем подтверждаются экспериментально. С одной стороны, при одинаковом уровне качества ( - постоянна) дисперсия оценки шумового портрета пропорциональна 1/N, т.е. оценка тем более точная, чем больше кадров видеозаписи используется. С другой стороны, если число кадров фиксировано, видео низкого качества даст оценку шумовому портрету хуже, чем видео высокого качества [6], поскольку их дисперсия шума квантования выше. Далее в работе авторы описывают метод, который может быть использован для определения, созданы ли две видеозаписи A и B одним и тем же видеозаписывающим устройством. Пусть и - шумовые портреты, установленные из обеих видеозаписей. Поскольку шумовой портрет является уникальным для камеры, задача определения источника эквивалентна задаче различения и . В зависимости от ошибок оценки и различного качества и длины видеозаписей, точность оценки шумовых портретов и может также различаться. Более того, может иметь место трансляционный сдвиг (a, b) между и из-за леттербоксинга, т.е. технологии показа широкоэкранных кинофильмов по телевидению стандартной четкости с сохранением исходного соотношения сторон изображения. При такой технологии кинокадр занимает не всю площадь телеизображения, а сверху и снизу передаются черные каше, заполняющие остальной экран. Таким образом, проблему идентификации видеозаписывающего устройства можно представить в виде проверки простых гипотез: (12) где - белый гауссовский шум с неизвестной дисперсией. Известно, что для проблемы такого типа оптимальным детектором является нормализованная кросс-корреляция. Подытоживая все вышеизложенное для того, чтобы принять решение о том, были ли две оценки шумового портрета и получены с одного видеозаписывающего устройства, сначала необходимо подсчитать нормализованную кросс-корреляцию между и : (13) Затем необходимо исследовать поверхность C[u,v] нормализованной кросс-корреляции и принять гипотезу H1 (т.е. две видеозаписи были сделаны одним видеозаписывающим устройством), если будет обнаружен пик на C[u,v], что можно сделать различными измерениями. В своей статье авторы предлагают использовать пик корреляционной энергии (Npeak - небольшая окрестность пика): (14) Поскольку шумовые портреты двух разных сенсоров должны быть некоррелированы, если обе видеозаписи записаны одним видеозаписывающим устройством, в C[u,v] должен быть острый пик (большой пик корреляционной энергии), в противном случае C[u,v] должна выглядеть как случайный шум с низкой энергией. Однако почти во всех видеозаписывающих устройствах используется кодирование на основе ДКП, например MPEG-x и H.26x [7]. Это создает, во-первых, артефакты на границах кадра, появляющиеся за счет того, что кадр не делится на блоки без остатка и не попавшие в блоки пиксели приходится отбрасывать, а также за счет операций определения и компенсации движения за пределы кадра. Во-вторых, возникают артефакты блоков 16×16 внутри кадра, поскольку большинство стандартных кодеков использует макроблоки 16×16. Эти периодические пульсирующие сигналы проходят через шумоподавляющий фильтр прямо в шумовой портрет, что вызывает ложные срабатывания между некоррелированными шумовыми портретами. Поэтому они должны быть удалены до подсчета нормализованной кросс-корреляции. Артефакты границы могут быть легко удалены путем обрезания примерно 8 пикселей у границы кадра в пространственной области. Периодические пульсирующие артефакты за счет блоков в области Фурье можно удалить, уменьшая коэффициенты Фурье на частотах, в которых находится самая большая энергия артефактов. Для того чтобы проиллюстрировать, как обнаружить частоты этих периодических сигналов, предположим, что имеется периодический сигнал , ДПФ которого X(r) выглядит следующим образом: (15) где , а r - индекс ДПФ. Уравнение (15) показывает, что энергия концентрируется вокруг частот с номерами, кратными N/16. Таким образом, установив X(r) = 0 для этих частот и их окрестностей, сила периодического сигнала значительно уменьшится. Авторы использовали похожую идею для создания фильтра в области БПФ для смягчения разрушающего воздействия деления на блоки на нормализованную кросс-корреляцию. Поскольку на практике нормализованная кросс-корреляция считается в пространстве Фурье, можно в то же время легко удалить эффект деления на блоки. Более того, можно удалить другие артефакты, появляющиеся как пики в частотной области, например, артефакты за счет интерполяции цветовых фильтров и других аппаратных и программных операций. В своей работе авторы провели несколько экспериментов с 25 видеозаписывающими устройствами. Оказалось, что достаточно всего 40 с видео со скоростью передачи данных 450 Кбит/с для уверенного принятия решения о том, записаны ли две видеозаписи на одно видеозаписывающее устройство. С уменьшением качества видео (увеличением сжатия) и уменьшением пространственного разрешения длина видеозаписи, необходимая для принятия однозначного решения, должна увеличиться. Для видеозаписей так называемого интернет-качества [8] (видеозаписи, распространенные в Интернете), т.е. с разрешением 264×352 и скоростью передачи данных 150 Кбит/с, хорошие результаты получаются для видеозаписей с минимальной длительностью - около 10 мин. Выводы. В заключение стоит отметить, что применение техники идентификации камеры на основе шумового портрета является на данный момент самым эффективным методом определения принадлежности видеозаписей конкретному видеозаписывающему устройству [9]. В отличие от метаданных, которые можно легко подделать без особого труда вручную или с помощью специального программного обеспечения, шумовой портрет является постоянной характеристикой сенсора, и удаление его из конкретного фото или видеозаписи сопряжено с определенными техническими трудностями. Из недостатков подхода стоит отметить, что в большинстве случаев для выявления эталонного узора камеры необходимо иметь доступ к самой камере, так как узор извлекается из равномерно освещенных фотографий/кадров видеозаписи, сделанных на этом устройстве. Таким образом, формирование базы данных эталонных узоров является неким аналогом процесса обучения в системах машинного обучения, а потому имеет те же недостатки [10]. К недостаткам систем машинного обучения относятся: - длительный процесс обучения; - серьезные предъявляемые требования к полноте обучающей выборки для уменьшения вероятности ложных срабатываний; - возможность обхода заданной модели злоумышленником при понимании принципа ее работы. Дальнейшее развитие этого направления авторы видят в усовершенствовании существующих алгоритмов с целью уменьшения количества необходимых для выделения эталонного узора кадров.

Об авторах

П. Д Гусев

Национальный исследовательский ядерный университет «МИФИ»

Г. И Борзунов

Национальный исследовательский ядерный университет «МИФИ»; Российский государственный университет им. А.Н. Косыгина (Технологии. Дизайн. Искусство)

Список литературы

Kharazi M. Blind source camera identification [Электронный ресурс]. - URL: http://sina.sharif.ir/~kharrazi/pubs/icip04_1.pdf (дата обращения: 01.07.2017).
Lukas J. Digital camera identification from sensor pattern noise [Электронный ресурс]. - URL: http://ws2.binghamton.edu/fridrich/ Research/double.pdf (дата обращения: 01.07.2017).
Chen M. Source digital camcorder identification using sensor photo response non-uniformity [Электронный ресурс]. - URL: http://www.ws.binghamton.edu/fridrich/Research/CamcorderID_06.pdf (дата обращения: 01.07.2017).
Lin C. Issues and solutions for authenticating MPEG video [Электронный ресурс]. - URL: https://pdfs.semanticscholar.org/5d30/4fcbba7bae0e 865fc5e02b7495f9fbb81a28.pdf (дата обращения: 01.07.2017).
Video authentication using relative correlation information and SVM / S. Upadhyay, S.K. Singh, M. Vatsa, R. Singh // Computational Intelligence in Multimedia Processing: Recent Advances (Springer Verlag). - Ed. by A.E. Hassanien, J. Kacprzyk, A. Abraham, 2007.
Hany Farid. Digital doctoring: how to tell the real from fake // Significance, 2006. - Vol. 3. - Iss. 4. - Р. 162-166.
Ankita Gupta, Shilpi Gupta, Anu Mehra. Video authentication in digital forensic, 1st ABLAZE, 2015.
Teerasak Kroputoponchai, Nikom Suvonvorn. Video authentication using spatio-temporal signature for surveillance system // 12th International JCSSE. - 2015.
Upadhyay S. Video authentication - an overview // International Journal of Computer Science & Engineering Survey. - 2011. - Vol. 2. - № 4.
Гусев П.Д. Обзор существующих алгоритмов построения цифровых отпечатков // Безопасность информационных технологий. - 2015. - № 4. - С. 63-67.

Статистика

Просмотры

Аннотация - 69

PDF (Russian) - 35

Ссылки

Ссылки не определены.

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Имя пользователя
Пароль
Запомнить меня

Забыли пароль?	Регистрация

Вестник Пермского национального исследовательского политехнического университета. Электротехника, информационные технологии, системы управления