Повышение эффективности стеганоанализа в области ДВП изображения посредством анализа параметров частотной области изображения
Сивачев Алексей Вячеславович
аспирант, кафедра Проектирования и безопасности компьютерных систем, федеральное государственное автономное образовательное учреждение высшего образования «Санкт-Петербургский национальный исследовательский университет информационных технологий, механики
и оптики»
Статья из рубрики "Кодирование и защита информации"
Аннотация.
Объектом исследования являются методы стеганоанализа в области дискретного вейвлет преобразования (ДВП) изображения. В статье проведено исследование влияния факта встраивания в область ДВП на значения коэффициентов областей дискретно косинусного преобразования (ДКП) и дискретно синусного преобразования (ДСП) изображения с целью улучшения эффективности обнаружения факта встраивания в область ДВП. Показано влияние факта встраивания в область ДВП на определенные коэффициенты областей ДКП и ДСП изображения. В статье предлагается использовать определенные коэффициенты для повышения качества обучения машины опорных векторов. Метод исследования. Для оценки эффективности предлагаемого в статье метода стеганоанализа с использованием предложенных коэффициентов проводится сравнение эффективности классификации изображений с другими популярными методами стеганоанализа для области вейвлет разложения. В качестве стеганографического воздействия используется изменение значений младших значащих бит коэффициентов ДВП. Основные результаты. Показана возможность использования определенных коэффициентов ДКП и ДСП области с целью стеганоанализа в области ДВП. По результатам исследования проведенного предлагается оригинальный метод стеганоанализа, позволяющий добиться повышения эффективности стеганоанализа для областей LH и HL ДВП изображения. Полученные результаты могут быть использованы при разработке систем стеганоанализа для обеспечения эффективного обнаружения факта встраивания в область ДВП изображения.
Дата направления в редакцию:
Дата рецензирования:
Дата публикации:
Введение
Сегодня применение стеганография становится все более широко распространена, имеется информация об использовании стеганографии спецслужбами, а также
криминальными и террористическими организациями [1,2]. Для противодействия противоправному использованию стеганографии служит стеганоанализ. Задачей стеганоанализа является определить имеется ли в анализируемом контейнера скрытая инфо рма ция или не т.
Одним из наиболее популярных вариантов скрытия информации является ее встраивание в неподвижные цифровые изображения, на данный момент существует широкий спектр различных методов, позволяющих произвести встраивание информации в цифровые изображения ^^ в том числе методов для встраивания информации в область ДВП разложения изображения, популярность которых обусловленное распространением формата JPEG2000 в котором используется ДВП преобразование для сжатия изображения. Для встраивания информации в область ДВП разложения изображения в зависимости от алгоритма могут быть использованы различные области
коэффициентов (LL, LH, HL и НН) как по отдельности, так и несколько областей сразу 171
Для противодействия им разработано большое число методов стеганоанализа141, однако на данный момент не существует алгоритмов стеганоанализа позволяющих в любых условиях безошибочно определить содержит изображение встроенную информацию или нет, как правило имеет место определенная погрешность, приводящая к тому, что часть изображений может быть классифицирована неправильно, т.е. оригинальное изображение классифицировано как содержащее в себе встроенную информацию, а стегано изображение классифицировано как оригинальное151. Однако существующие на данный момент методы стеганоанализа, которые можно использовать для обнаружения встраивания в область ДВП изображения несовершенны1111 и сильно зависят от
алгоритма встраивания. Например, эффективность метода 181 варьируется от 50 до 80% в зависимости от используемого алгоритма (при 20% объеме встроенной информации от максимальной вместимости контейнера), что очевидно является недостаточным. В связи с этим исследования в части повышения эффективности методов стеганоанализа предназначенных для обнаружения факта встраивания в область ДВП изображения являются актуальными.
В работе приводится описание набора параметров частотной области изображения, на которые оказывает заметное влияние встраивание в область вейвлет разложения изображения, особенно встраивание в LH область, что позволяет предложить метод стеганоанализа на основе использования данного набора параметров. В конце статьи приводится сравнение эффективности метода стеганоанализа, основанного на использование предлагаемого набора параметров, с другими методами стеганоанализа.
Также в конце статье сделаны выводы о применимости метода, основанного на использовании предлагаемого набора параметров, для целей стеганонализа.
Исследование предметной области
В общем случае встраивание информации в область вейвлет разложения изображения представляет собой модификацию определенным образом выбранных вейвлет коэффициентов для передачи требуемой информации. По характеру воздействия на ДВП область, встраивание в общем случае можно рассматривать как добавление некоторого шума, например, шума Гаусса.
Изображение как таковое может быть представлено как набор гармонических колебаний с разными частотами, которые могут быть разделены на низкочастотные, среднечастотные и высокочастотные. Т.к. встраивание в изображение можно представить, как добавление некоторого шума к набору гармонических колебаний, составляющих изображения, то, следовательно, встраивание должно оказывать определенное влияние на параметры гармонических колебаний, особенно средней и высокой частоты.
Для разложения изображения на набор гармонических колебаний можно использовать различные ортогональные преобразования. В частности, дискретно косинусное преобразование (ДКП), которое широко известно из-за его использования в формате JPEG, или дискретно синусное преобразование (ДСП).
Двумерное дискретно косинусное и двумерное дискретно синусное преобразование может быть описано следующими формулами:
при этом
где А™ - значение пикселя изображения с координатами т и п, N и М - размерность изображения.
Встраивании информации в область ДВП происходит изменении значений коэффициентов области ДКП (ДСП). Для более наглядной иллюстрации разницы между коэффициентами области ДКП для оригинального и стегано изображения построим гистограмму разности коэффициентов области ДКП между оригинальным и стегано изображением - смотри рисунок 1а и 1б.
Рисунок 1а. Гистограмма разности коэффициентов области ДКП между оригинальным и стего (20% измененных коэффициентов области LH ДВП изображения)изображением.
} .. I ! . * _
Значение коэффициента области ДКП Рисунок 1б. Укрупненный фрагмент гистограммы с рисунка 2а для значения коэффициента от 2 до 8.
Гистограммы разности коэффициентов ДКП показывают, что значительное количество коэффициентов ДКП подверглось изменению вследствие встраивания. При этом для абсолютного большинства коэффициентов изменение значения лежит в пределах от -2 до +2. В тоже время некоторые коэффициенты выбиваются из этой закономерности. На рисунке 1б показан один коэффициент для которого разница между оригинальным и стегано изображением составила более 7.
Данный коэффициент является одним из «угловых» коэффициентов, которые располагается в углах матрицы коэффициентов, получаемой при ДКП изображения. На данные коэффициенты, при встраивании в область ДВП, оказывается наиболее сильное влияние. Аналогично для коэффициентов области ДСП. При этом коэффициент области ДКП (ДСП) и «угловой» высокочастотный могут выступать в роли некоторой системы координат, относительно которой изменяются среднечастотные коэффициенты.
Данная закономерность, при которой значения «угловых» коэффициентов подвергаются заметно большему изменению по сравнению с другими коэффициентами области ДКП (ДСП), была проверена для изображений из коллекции BOWS2.
Значительное изменение «угловых» коэффициентов области ДКП (ДСП) при встраивании
в область ДВП изображения может быть использовано для повышения эффективности стеганоанализа. Для наглядной оценки возможности классификации изображений с использованием «угловых» коэффициентов на рисунках 2(а, в, д) приведены гистограммы значений «углового» коэффициента области ДКП изображения, а на рисунках 2(б, г, е) приведены гистограммы значений «углового» коэффициента области ДСП изображения, для массива оригинальных изображений и для массива стегано изображений при встраивании в различные области ДВП изображения.
Значат« коэффициент (Лпсгн
Рисунок 2а. Гистограмма значений «углового» коэффициента К (end,1) ДКП для оригинальных
из обра ж е ний (с иний) и д л я с те г а но изображений (оранжевый) при встраивании в HL область.
Оэффшшектэ обюпн I
Рисунок 2б. Гистограмма значений «углового» коэффициента К (end,1) ДСП для оригинальных
из обра ж е ний (с иний) и д л я с те г а но изображений (оранжевый) при встраивании в HL область.
Рисунок 2в. Гистограмма значений «углового» коэффициента К (1,end) ДКП для оригинальных
из обра ж е ний (с иний) и д л я с те г а но изображений (оранжевый) при встраивании в LH область.
ЗШПШЮ ко*фф]эинснтп с
Рисунок 2г. Гистограмма значений «углового» коэффициента К (end,1) ДСП для оригинальных
из обра ж е ний (с иний) и д л я с те г а но изображений (оранжевый) при встраивании в LH область.
Рисунок 2д. Гистограмма значений
Значение коэффициента овласга ДКП Рисунок 2е. Гистограмма значений
«углового» коэффициента K (end,1) «углового» коэффициента K ДСП для оригинальных (end,end) ДСП для оригинальных
изображений (синий) и для стегано изображений (синий) и для стегано изображений (оранжевый) при изображений (оранжевый) при встраивании в HH область. встраивании в HH область.
Представленные на рисунке 2(а-е) гистограммы показывают, что между массивами значений «угловых» коэффициентов для оригинальных и стегано изображений имеется заметная разница, которую можно использовать для классификации изображений. Таким образом добавление данных «угловых» коэффициентов в набор параметров для методов машинного обучения должно положительно сказываться на качестве обучения машины опорных векторов.
Описание предлагаемого метода
Выше показано влияние встраивания в область ДВП на значения определенных коэффициентов области ДКП (ДСП). В данной статье предлагается использовать значения данных «угловых» коэффициентов для улучшения эффективности методов стеганоанализа на основе машинного обучения при встраивании информации в область ДВП изображения. Таким образом для классификации изображений при использовании методов машинного обучения предлагается использовать следующий набор параметров:
■ 1, 2, 3 и 4 статистические моменты для областей LL, LH, HL, HH, получаемые при двумерном ДВП изображения, которые также используются в других методах стеганоанализа [6, 8& 9 10];
■ «Угловые» коэффициенты (K (end,1), K (1,end), K (end,end)) матрицы коэффициентов, получаемые при двумерном ДКП изображения;
■ «Угловые» коэффициенты (K (end,1), K (1,end), K (end,end)) матрицы коэффициентов, получаемые при двумерном ДСП изображения.
Таким образом общее количество параметров в наборе параметров, подаваемом на вход методу машинного обучения, составляет 20 штук.
Для классификации изображений на оригинальные и стегано изображения на основе данного набора параметров применяются методы машинного обучения, а именно машина опорных векторов для обучения которой используется обучающее множество, содержащее как оригинальные, так и стегано изображения. На вход машине опорных векторов поступает описанный выше набор параметров, а результатом работы машины опорных векторов является бинарная классификация изображения.
Условия проведения эксперимента и оценка эффективности предлагаемого метода
сте ганоанализа
Для оценки эффективности методов стеганоанализа была выбрана коллекция BOWS2 насчитывающая 10000 изображений с разрешением 512х512.
Для сравнения были выбраны следующие методы стеганоанализа:
■ алгоритм, предложенный Gireesh Kumar и другими
■ алгоритм, предложенный Hany Farid [9];
■ алгоритм, предложенный Changxin Liu и другими -U0!;
■ алгоритм, предложенный Yun Q Shi и другими -t6!.
Для встраивания информации в область ДВП разложения изображения применялось одноуровневое двумерное дискретное вейвлетное преобразование, при применении которого мы получаем одну низкочастотную область вейвлет коэффициентов (LL область), две среднечастотные области вейвлет коэффициентов (LH и HL области) и одну высокочастотную область (HH область). Встраивание информации проводилось в каждую из них по отдельности путем модификации предпоследних бит коэффициентов области. Объем искаженных бит в области вейвлет разложения при встраивании составлял 15% от максимального объема данной области.
Из имеющегося множества изображений 20% изображений использовалось для обучения машины опорных векторов, а 80% изображений использовалось для оценки эффективности обучения.
Результатом работы метода стеганоанализа, основанного на методах машинного обучения, как правило, является бинарная классификация изображения: содержит изображение встроенную информацию или нет. Соответственно эффективность метода стеганоанализа можно оценить соответственно с корректностью его классификации: какой процент из проанализированных оригинальных изображений был классифицирован как оригинальные изображения, а также какой процент стегано изображений был классифицирован как стегано изображения. Идеальный алгоритм должен безошибочно классифицировать все оригинальные изображения как оригинальные изображения, а все стегано изображения как стегано изображения.
Экспериментальные результаты
Для оценки эффективности предлагаемого метода был проведен эксперимент по классификации изображений с помощью предложенного метода, а также других методов, взятых для сравнения. Результаты эксперимента представлены в виде графиков TN, FN, TP, FP, T и F, показывающих соотношение количества истинно отрицательных, ложноотрицательных, истинно положительных и ложноположительных для каждого метода стеганоанализа на рисунке 3(а-в).
График 3а. График соотношения Т^ ТР, FN, FP, Т, N для LH области с объемом полезной нагрузки 15%.
ТМ ТР FM FP Т F
График 3б. График соотношения TN, TP, FN, FP, T, N для HL области c объемом полезной нагрузки 15%.
so 70 60 И ЛО 30 20 10 О
• ■■■а I.. 1 lili
i GiifWíhKumar i ; la^yfand I Liu
i YunOShi
i Предлагаемый метод
График 3в. График соотношения Т^ ТР, FN, FP, Т, N для НН области с объемом полезной нагрузки 15%.
Выводы
Графики, представленные на рисунках 4(а-в), показывают, что предложенный метод дает высокую эффективность для областей HL и LH.
Для области HL предложенный метод дает улучшение эффективности в 3,5%: предлагаемый метод дает 76,5% верно классифицированных изображений против
Для области LH предложенный метод дает небольшое улучшение эффективности в 0,18%, предлагаемый метод дает 67,03% верно классифицированных изображений
против 66,85% метода
Для области НН предложенный метод не дает улучшения эффективности и напротив уступает существующим методам стеганоанализа: 92,46% предлагаемого метода против 94,24% у метода [9]. Это может быть объяснено тем, что предлагаемый метод не использует полный набор параметров, который использует метод [9]
Заключение
Использование «угловых» коэффициентов областей ДКП и ДСП в дополнение к статистическим моментам, используемым методами [6,8-10], позволяет повысить эффективность стеганоанализа для областей LH и HL. Улучшение эффективности
стеганоанализа для областей LH и HL объясняется тем, что значения дополнительных параметров изменяются в следствии встраивания в области LH и HL и позволяют машине опорных векторов более четко разграничить между собой оригинальные и стегоно изображения.
Библиография
https ://www.fbi.gov/about-us/lab/forensic-sciencecommunications/fsc/july2004/research /2004_03_research01.htm (Дата обращения 14.07.2016)