Цифровая стеганография - Вадим Грибунин
Шрифт:
Интервал:
Закладка:
Воспользовавшись информацией о маскировании по частоте для системы слуха человека, мы можем определить спектральные характеристики внедряемой информации. Обработка импульсных сигналов, таких как звук кастаньет, может привести к образованию слышимого пре-эхо. Для устранения этого эффекта при внедрении информации его также необходимо учитывать.
Рассмотрим конкретный метод внедрения ЦВЗ (псевдослучайной последовательности) с использованием эффекта маскирования, предложенный в работе [3]. Каждый аудиосигнал помечается уникальным кодовым словом. Для того, чтобы использовать маскирующие характеристики системы слуха человека по частоте необходимо соотнести ПСП с порогом маскирования сигнала, при этом необходимо также учесть эффект временного маскирования. Невозможно внести большое количество информации в сигнал малой мощности, в противном случае внедренная информация может стать слышимой. Это происходит из-за того, что преобразование Фурье фиксированной длины не может сразу обладать хорошей локализацией в частотной и временной областях. Если время длительности сигнала высокой мощности больше длительности окна, то его энергия распространяется по всем частотам. Следовательно, необходимо взвешивать ЦВЗ с энергией сигнала.
Для внедрения ЦВЗ необходимо вычислить порог маскирования сигнала. Порог маскирования определяется для сегментов аудиосигнала длиной 512 отсчетов, взвешенных при помощи окна Хэмминга, с 50 % перекрытием текущих блоков. Он аппроксимируется идеальным фильтром 10-го порядка, M(w), с использованием критерия наименьших квадратов. ПСП фильтруется с применением фильтра M(w), чтобы обеспечить то, что спектральная плотность мощности ЦВЗ была ниже порога маскирования.
ЦВЗ, находящийся ниже порога маскирования в частотной области, распространяется на все окно 512 отсчетов. Если внутри блока имеются пиковые изменения амплитуды, то области сигнала высокой мощности распространяются на области сигнала низкой мощности, создавая ощутимые искажения. Слышимым эффектом будет шум, предшествующий пиковому изменению амплитуды. Поэтому ЦВЗ взвешивается во временной области с взятой в квадрат и нормированной огибающей сигнала,
. (7.9)
Для облегчения обнаружения ЦВЗ нужно увеличить его мощность, но при этом необходимо, чтобы спектральная плотность мощности ЦВЗ оставалась ниже порога маскирования. Если «вычисленный ЦВЗ» меньше шага квантования его нужно увеличить во столько раз, чтобы ЦВЗ в процессе квантования не был потерян.
Если во всех отрезках времени ЦВЗ ниже порога маскирования, то можно утверждать, что ЦВЗ неслышим.
Рис. 7.17. Блок-схема генератора ЦВЗ
На рис. 7.17 изображена блок-схема устройства встраивания ЦВЗ в аудиосигнал. В базовой схеме внедрения ЦВЗ кодовое слово фильтруется при помощи фильтра, приближенного по характеристикам к системе слуха человека. Полученный результат сравнивается во времени с исходным аудиосигналом, для исключения временных эффектов, таких, как пре-эхо. Затем результат добавляется к оригинальному аудиосигналу, давая в результате
(7.10)
где под w понимается отфильтрованная ПСП.
Исследования А. К. Хамди и др. [3] показывают, что ЦВЗ лучше размещать в высокочастотной области сигнала.
Незарегистрированный пользователь будет пытаться сделать невозможным распознавание ЦВЗ, добавляя к нему окрашенный шум, фильтруя его, кодируя, осуществляя над ним цифро-аналоговое и аналогово-цифровое преобразование, сжатие и т. д. При рассмотрении проблемы распознавания предполагается, что оригинальный сигнал доступен, как распознавателю, так и автору ПСП.
Необходимо различить пиратский аудиосигнал и подлинный аудиосигнал , на который наложились помехи и ЦВЗ. При этом подлежат проверке следующие гипотезы:
(7.11)
Отметим, что ЦВЗ неслышим, и нас интересуют случаи, когда искажения, вносимые незарегистрированным пользователем также неслышны. Можно использовать взаимную корреляцию между x и w, чтобы обнаружить наличие ЦВЗ с помехами, сравнивая его с порогом. Исследования А.Хамди и др. [3] показывают, что возможно надежно определять наличие ЦВЗ при использовании 50 или более блоков по 512 отсчетов для порога приблизительно равного 0,7. Необходимо отметить, что это определено для 0,8 секунды аудиосигнала (при частоте дискретизации 32 к Гц).
Тогда можно вычислить вероятность определения и вероятность ложного определения для каждого сегмента из 50 блоков по 512 отсчетов. При этом, даже если ЦВЗ произведены при помощи одинаковых псевдослучайных последовательностей для всего аудиосигнала, то в течение сигнала они будут изменяться в зависимости от порога маскирования и мощности сигнала для каждого блока из 512 отсчетов.
Автор должен выбирать различные ПСП для каждого аудиосигнала, чтобы его подписи невозможно было найти сравнением или изучением зависимости между несколькими аудиосигналами.
В работе [3] была проверена возможность удаления ЦВЗ при помощи аддитивных шумов. Был исследован наихудший случай аддитивного искажения ЦВЗ: шум, который «придерживается» порога маскирования сигнала с ЦВЗ. Опыты по обнаружению ЦВЗ были произведены на сегментах аудио сигнала длиной 50 участков по 512 отсчетов с присутствием или без ЦВЗ, при воздействии наихудшего варианта шума. Вероятность обнаружения ЦВЗ и вероятность ложного обнаружения были соответственно равны 1 и 3.1285 * 10-4, для порога 0,7.
Проведенные в [3] исследования показали, что данная система является также стойкой к аналого-цифровым и цифро-аналоговым преобразованиям.
Несмотря на то, что в рассмотренном методе используются свойства, присущие аудиосигналам, он может быть после некоторой модификации успешно применен и для внедрения информации в видео.
8. СКРЫТИЕ ДАННЫХ В ВИДЕОПОСЛЕДОВАТЕЛЬНОСТЯХ
Наиболее популярными стандартами кодирования видео являются MPEG-2 и MPEG-4. В настоящей главе приведены методы внедрения информации в видео, сжимаемое по стандарту MPEG-2.
Стеганографические методы, применяемые для встраивания информации в видео, сжатое по стандарту MPEG-2 (далее — MPEG), должны работать в реальном времени. Способы встраивания ЦВЗ, работающие в реальном времени, должны отвечать нескольким требованиям и, в первую очередь они должны быть слепыми и обладать малой вычислительной сложностью. Таким образом, единственно приемлемыми являются методы, встраивающие данные непосредственно в поток сжатых данных, чтобы избежать лишних вычислений, как это показано на рис. 8.1.
Рис. 8.1. Встраивание / извлечение ЦВЗ в развернутые данные и осуществление этой же операции со сжатыми данными.
Кроме того, операция по внедрению ЦВЗ не должна увеличивать размер сжатых видео данных. Если размер данных увеличивается, то могут возникнуть проблемы при передаче потока видео данных по каналу фиксированной скорости.
Перед тем, как перейти непосредственно к обсуждению способов встраивания ЦВЗ низкой вычислительной сложности, необходимо кратко описать собственно стандарт сжатия видеоданных MPEG [8].
8.1. Краткое описание стандарта MPEG и возможности внедрения данных
Основная идея сжатия по MPEG состоит в том, что из всего потока данных полностью передаются только некоторые кадры, для остальных же передается их отличие от других кадров.
Поток видеоданных в MPEG имеет иерархическую синтаксическую структуру. Каждый уровень содержит один или более подчиненных уровней, как это показано на рис. 8.2. Последовательность видеоданных разделяется на множество групп кадров (ГК), представляющих собой множество видеокадров, непосредственно следующих друг за другом в порядке показа. Далее, кадры подразделяются на слои и макроблоки. Низший уровень, блоковый, состоит из блоков яркости и цветности макроблока.
Рис. 8.2. Многоуровневая синтаксическая структура MPEG.
Рис. 8.3. Гибридная схема кодирования с компенсацией движения.
Алгоритм сжатия MPEG основан на гибридной схеме кодирования [12]. Как показано на рисунке 8.3, эта схема объединяет межкадровое (ДИКМ) и внутрикадровое кодирование последовательности видеоданных.
В пределах ГК временная избыточность среди видеокадров уменьшается за счет применения ДИКМ с временным предсказанием. Это означает, что одни кадры предсказываются по другим. Затем результирующая ошибка предсказания кодируется. В стандарте MPEG используются три типа кадров:
— I-кадры — intra-кадры, кодируются без ссылок на другие кадры, содержат неподвижное изображение и вдобавок используются для построения других типов кадров;