Цифровой водяной знак

Цифровой водяной знак (ЦВЗ) — технология, созданная для защиты авторских прав мультимедийных файлов. Обычно цифровые водяные знаки невидимы. Однако ЦВЗ могут быть видимыми на изображении или видео. Обычно это информация представляет собой текст или логотип, который идентифицирует автора.

Пример цифрового водяного знака (слева нормальное изображение, справа помеченное, в центре разница между изображениями с увеличенной яркостью)

Невидимые ЦВЗ внедряются в цифровые данные таким образом, что пользователю трудно выявить добавленную метку, если он не знаком с её форматом. Например, если водяной знак нужно нанести на графическое изображение, то данная процедура может быть сделана с помощью изменения яркости определённых точек. Если модификация яркости незначительна, то при просмотре рисунка человек, скорее всего, не заметит следов искусственного преобразования. Особенно хорошо данная техника работает в случае, когда водяной знак наносится на неоднородные области — например, на участок фотографии, где изображена трава.

Важнейшее применение цифровые водяные знаки нашли в системах защиты от копирования, которые стремятся предотвратить или удержать от несанкционированного копирования цифровых данных. Стеганография применяет ЦВЗ, когда стороны обмениваются секретными сообщениями, внедрёнными в цифровой сигнал. Используется как средство защиты документов с фотографиями — паспортов, водительских удостоверений, кредитных карт с фотографиями. Комментарии к цифровым фотографиям с описательной информацией — ещё один пример невидимых ЦВЗ. Хотя некоторые форматы цифровых данных могут также нести в себе дополнительную информацию, называемую метаданные, ЦВЗ отличаются тем, что информация «зашита» прямо в сигнал. Объекты мультимедиа в этом случае будут представлять собой контейнеры (носители) данных. Основное преимущество состоит в наличии условной зависимости между событием подмены объекта идентификации и наличии элемента защиты — скрытого водяного знака. Подмена объекта идентификации приведёт к выводу о подделке всего документа. Цифровые водяные знаки получили своё название от старого понятия водяных знаков на бумаге (деньгах, документах).

Жизненный цикл цифровых водяных знаковПравить

Фазы жизненного цикла ЦВЗ

Так называемый, жизненный цикл ЦВЗ может быть описан следующим образом. Сначала в сигнал-источник $\text{[math]}$ $\text{[math]}$ $S$ в доверенной среде внедряются водяные знаки при помощи функции $\text{[math]}$ $\text{[math]}$ $E$ . В результате получается сигнал $\text{[math]}$ $\text{[math]}$ $S_{E}$ . Следующий этап — распространение $\text{[math]}$ $\text{[math]}$ $S_{E}$ через сеть или любым другим способом. Во время распространения на сигнал может быть совершена атака. У получившегося сигнала $\text{[math]}$ $\text{[math]}$ $S_{EA}$ водяные знаки могут быть потенциально уничтожены или изменены. На следующем этапе функция обнаружения $\text{[math]}$ $\text{[math]}$ $D$ пытается обнаружить водяные знаки $\text{[math]}$ $\text{[math]}$ $w$ , а функция $\text{[math]}$ $\text{[math]}$ $R$ вытащить из сигнала внедрённое сообщение. Этот процесс потенциально может совершать злоумышленник.

Свойства цифровых водяных знаковПравить

Обычно ЦВЗ классифицируются по 7 основным параметрам: объём, сложность, обратимость, прозрачность, надёжность, безопасность и верификация.

Объём информацииПравить

Различают внедряемый и извлекаемый объём.

Внедряемый объёмПравить

Внедряемый объём — это просто размер сообщения $\text{[math]}$ $\text{[math]}$ $m$ , которое внедряется в сигнал. Её можно определить как: $\text{[math]}$ $\text{[math]}$ ${\text{cap}}_{E}(S)={\text{size(M)}}=|M|$ Рассматривается также относительный внедряемый объём: $\text{[math]}$ $\text{[math]}$ ${{\text{cap}}_{E}}_{\text{rel}}(S)={\frac {{\text{cap}}_{E}}{{\text{size}}(S)}}.$

Извлекаемый объёмПравить

Извлекаемый объём — это количество информации $\text{[math]}$ $\text{[math]}$ $m^{'}$ извлечённое из сообщения. В случае, если целью ЦВЗ не является передача информации, то извлекаемая информация равна нулю. Для не пустых сообщений извлекаемый объём считается после извлечения. Она считается по следующей формуле: $\text{[math]}$ $\text{[math]}$ ${{\text{cap}}_{R}}_{\text{rel}}(S_{EA})=|m|-\sum _{i=1}^{|m|}m_{i}\oplus m'_{i}$ , где $\text{[math]}$ $\text{[math]}$ $m=m_{1}m_{2}\dots m_{|m|}$ , $\text{[math]}$ $\text{[math]}$ $m'=m'_{1}m'_{2}\dots m'_{|m|}$ и $\text{[math]}$ $\text{[math]}$ $\oplus$ обозначает исключающее или. Это функция количества корректно переданных бит, она предполагает, что оба сообщения имеют одну длину. Иногда, сообщение повторяют в сигнале несколько раз. В этом случае извлекаемое сообщение в несколько раз длиннее исходного. Следующее выражение учитывает это $\text{[math]}$ $\text{[math]}$ $p_{\max }$ повторений: $\text{[math]}$ $\text{[math]}$ ${{\text{cap}}_{R}^{*}}_{\text{rel}}(S_{EA})=\sum _{j=1}^{p_{\max }}\left[|m|-\sum _{i=1}^{|m|}m_{i}\oplus m'_{ji}\right].$ Объём обычно нормируется на длину сообщения. Рассматриваются иногда такие параметры как ёмкость в секунду и ёмкость, отнесённая к $\text{[math]}$ $\text{[math]}$ $p_{\max }$ : $\text{[math]}$ $\text{[math]}$ ${{\text{cap}}_{R}^{\$}}_{\text{rel}}(S_{EA})={\frac {{{\text{cap}}_{R}^{*}}_{\text{rel}}(S_{EA})}{|m|p_{\max }}}.$

СложностьПравить

Сложность заданной функции $\text{[math]}$ $\text{[math]}$ $F$ всегда может быть измерена. Любые затраченные усилия на внедрение, атаку, детектирование или расшифровку измеряются сложностью. Пусть $\text{[math]}$ $\text{[math]}$ $C(F)$ to измеряет сложность $\text{[math]}$ $\text{[math]}$ $F$ . За $\text{[math]}$ $\text{[math]}$ $C(E,S)$ обозначим сложность процесса внедрения информации в сигнал $\text{[math]}$ $\text{[math]}$ $S$ . В зависимости от реализации функция $\text{[math]}$ $\text{[math]}$ $C$ измеряет затрачиваемое время количество операций ввода-вывода, количество строк кода и т. д. Сложность зависит от сигнала $\text{[math]}$ $\text{[math]}$ $S$ . Поэтому часто рассматривается нормированная функция независящая от $\text{[math]}$ $\text{[math]}$ $S$ . Нормализация может проводиться как по длине $\text{[math]}$ $\text{[math]}$ $\mathrm {size} (S)$ (измеряемой например, в секундах, или битах) сигнала так и по внедряемому объёму:

 $\text{[math]}$  ${\text{com}}_{\text{rel}}^{S}(S)={\frac {{\text{com}}_{\text{rel}}^{*}}{\mathrm {size} (S)}}={\frac {C(E,S)}{\mathrm {size} (S)}}$

Заметим, что здесь предполагается линейная зависимость $\text{[math]}$ $\text{[math]}$ $C(E,S)$ от $\text{[math]}$ $\text{[math]}$ $S$ . В нелинейном случае можно нормировать на внедрённый объём:

 $\text{[math]}$  ${\text{com}}_{\text{rel}}^{C}(S)={\frac {{\text{com}}_{\text{rel}}^{*}}{{\text{cap}}_{E}^{*}}}={\frac {C(E,S)}{{\text{cap}}_{E}^{*}}}$

Оба определения рассматривают конкретный сигнал $\text{[math]}$ $\text{[math]}$ $S$ . Рассматриваются также следующие параметры ЦВЗ:

Средняя сложность, нормированная на длину сигнала или объём: $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{av}}^{S}={\frac {1}{|\mathbb {S} |}}{\sum _{S\in \mathbb {S} }{\text{com}}_{\text{rel}}^{S}(S)}$ ; $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{av}}^{C}={\frac {1}{|\mathbb {S} |}}{\sum _{S\in \mathbb {S} }{\text{com}}_{\text{rel}}^{C}(S)}$
Максимальная сложность, нормированная на длину сигнала или объём: $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{mx}}^{S}=\max _{S\in \mathbb {S} }\left\{{\text{com}}_{\text{rel}}^{S}(S)\right\}$ ; $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{mx}}^{C}=\max _{S\in \mathbb {S} }\left\{{\text{com}}_{\text{rel}}^{C}(S)\right\}$
Минимальная сложность, нормированная на длину сигнала или объём: $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{mn}}^{S}=\min _{S\in \mathbb {S} }\left\{{\text{com}}_{\text{rel}}^{S}(S)\right\}$ ; $\text{[math]}$ $\text{[math]}$ ${\text{com}}_{\text{mn}}^{C}=\min _{S\in \mathbb {S} }\left\{{\text{com}}_{\text{rel}}^{C}(S)\right\}$

ОбратимостьПравить

Технология предполагает возможность удалить ЦВЗ $\text{[math]}$ $\text{[math]}$ $w$ из помеченного сигнала $\text{[math]}$ $\text{[math]}$ $S_{E}$ . Если полученный сигнал $\text{[math]}$ $\text{[math]}$ $S^{'}$ совпадает с исходным $\text{[math]}$ $\text{[math]}$ $S=S'$ , то говорят об обратимости. Возможность обратить предоставляется специальными алгоритмами. Эти алгоритмы используют секретные ключи для защиты от несанкционированного доступа к контенту.

ПрозрачностьПравить

По данным эталонному $\text{[math]}$ $\text{[math]}$ $S_{\text{ref}}$ и тестовому $\text{[math]}$ $\text{[math]}$ $S_{\text{test}}$ сигналам, функция прозрачности Т измеряет расхождение между этими сигналами $\text{[math]}$ $\text{[math]}$ $T(S_{\text{ref}},S_{\text{test}})$ . Результат вычисления заключён в интервале [0,1], где 0 соответствует случаю, когда система не может распознать в $\text{[math]}$ $\text{[math]}$ $S_{\text{test}}$ версию $\text{[math]}$ $\text{[math]}$ $S_{\text{ref}}$ , и 1, если наблюдатель не может отличить эти два сигнала.

НадёжностьПравить

В этом разделе описывается надёжность ЦВЗ. Сначала надо ввести понятие «успешного обнаружения».

Успешное обнаружениеПравить

Для измерения успеха функций обнаружения и дешифровки вводится функция «успешного обнаружения». Для ЦВЗ без закодированного сообщения $\text{[math]}$ $\text{[math]}$ ${\text{det}}_{D}$ D возвращает 0, если водяные знаки не могут быть обнаружены и $\text{[math]}$ $\text{[math]}$ $1$ иначе, как в следующей формализации: $\text{[math]}$ $\text{[math]}$ ${\text{det}}_{D}(S_{EA})={\begin{cases}0,{\text{negative}},\\1,{\text{positive.}}\end{cases}}$ Для того чтобы измерить количество успешных внедрений по нескольким тестам $\text{[math]}$ $\text{[math]}$ $\mathbb {S}$ , средняя $\text{[math]}$ $\text{[math]}$ ${\text{det}}_{D}$ может быть вычислена следующем образом: $\text{[math]}$ $\text{[math]}$ ${{\text{det}}_{D}}_{\text{av}}={\frac {1}{|{\mathbb {S} }|}}\sum _{S\in \mathbb {S} }{\text{det}}_{D}$ . Для схем с ненулевым внедрённым сообщением важно знать, что хотя бы одно (в случае множественного внедрения) сообщение расшифровалось успешно. Если, к примеру, сообщение $\text{[math]}$ $\text{[math]}$ $m$ внедряется $\text{[math]}$ $\text{[math]}$ $\left(p_{\max }\right)$ раз, и извлечённый объём $\text{[math]}$ $\text{[math]}$ ${{\text{cap}}_{R}^{*}}_{\text{rel}}$ returns, на 10 % восстановима, то непонятно, какие именно из $\text{[math]}$ $\text{[math]}$ $m_{i}$ сообщений повреждены. Тем не менее, такое определение бывает полезным, если знать, что хотя бы одно из сообщений не повредилось, что отражено в следующем выражении: $\text{[math]}$ $\text{[math]}$ ${\text{det}}_{R}(S_{EA})={\begin{cases}1,\exists j\in \displaystyle \left\{1,\dots ,p_{\max }\right\}:\sum _{i=1}^{|m|}m'_{ji}\oplus m_{ji}=0,\\0,{\text{otherwise}}.\end{cases}}$ Отметим, что это не единственное возможное определение. Например, определение может быть следующем: $\text{[math]}$ $\text{[math]}$ ${\text{det}}_{R\tau }(S_{EA})={\begin{cases}1,{\text{if }}{{\text{cap}}_{R}^{\$}}_{\text{rel}}({\tilde {S}})\geq \tau ,\\0,{\text{otherwise}}.\end{cases}}$ то есть детекция успешна тогда, когда количество успешно извлечённых бит выше некоторого предела $\text{[math]}$ $\text{[math]}$ $\tau$ (который равен или близок к 1).

Надёжность ЦВЗПравить

Мера надёжности $\text{[math]}$ $\text{[math]}$ ${\text{rob}}_{\text{rel}}$ ЦВЗ — это число, заключённое в интервале $\text{[math]}$ $\text{[math]}$ $[0,1]$ , где 0 наихудшее возможное значение и 1 наилучшее. Для измерения надёжности используются понятия числа ошибочных байтов и частоты ошибочных битов. Измеряется расстояние между строками извлечённого и внедрённого сообщений или процент совпадений для побитового сравнения. Если строки совпадают, то метод надёжен. ЦВЗ схема считается ненадёжной, если более чем $\text{[math]}$ $\text{[math]}$ $\nu$ бит повреждены и прозрачность атак выше чем $\text{[math]}$ $\text{[math]}$ $\tau$ . Например, для ЦВЗ, подверженный атакам $\text{[math]}$ $\text{[math]}$ $S_{EA}=A_{i,j}(S_{E})$ , с сообщением может быть вычислена следующем образом: $\text{[math]}$ $\text{[math]}$ ${\text{rob}}_{\text{rel}}^{byte}(S_{E})=1-\max _{A_{i,j}\in {\mathcal {A}}}\left\{T\left(S_{E},S_{EA}\right):{\text{det}}_{R}\left(S_{EA},[S,m]\right)=0\right\}$ Индекс $\text{[math]}$ $\text{[math]}$ $b y t e$ указывает на то, что вычисляется количество ошибочных байт. Для ЦВЗ без сообщения нет извлекающей функции, поэтому методы вычисления ошибочных бит и байт не применимы. Функция надёжности оценивает худший случай. При оценке надёжности любой системы, за меру надёжности принимают надёжность самого ненадёжного звена системы, в случае самой сильной атаки. В данном случае под худшей атакой понимается атака, при которой ЦВЗ удаляется без потери качества сигнала.

БезопасностьПравить

Описывает устойчивость ЦВЗ по отношению к определённым атакам.

ВерификацияПравить

Определяет тип дополнительной информации необходимой функции обнаружения/извлечения для работы.

Необходим исходный сигнал S.
Необходимо внедряемое сообщение m и некоторая дополнительная информация, кроме исходного сигнала.
Нет необходимости в дополнительной информации.

КлассификацияПравить

ЦВЗ называют надёжным по отношению к классу преобразований Т, если информации из помеченного сигнала можно доверять даже после воздействия на него ухудшения из Т. Типичные преобразования изображения: JPEG компрессия, поворот, обрезание, добавление шума и т. д. Для видео контента к этому списку добавляется MPEG компрессия и временные преобразования. ЦВЗ называют незаметным, если исходный и помеченный сигналы по определённым критериям восприятия неотличимы. Обычно легко сделать надёжный или незаметный ЦВЗ. Но, как правило, тяжело сделать ЦВЗ незаметный и надёжный одновременно.

Технологии ЦВЗ могут быть классифицированы различными способами.

НадёжностьПравить

ЦВЗ называется хрупким, если при малейшей модификации его уже нельзя обнаружить. Такие ЦВЗ обычно используют для проверки целостности.

ЦВЗ называется полухрупким, если он выдерживает незначительные модификации сигнала, но вредоносные преобразования не выдерживает. Полухрупкие ЦВЗ используются обычно для обнаружения атаки на сигнал.

ЦВЗ называется надёжным, если он противостоит всем известным видам атак. Такие ЦВЗ обычно используются в системах защиты от копирования и идентификации.

ОбъёмПравить

Длина внедряемого сообщения $\text{[math]}$ $\text{[math]}$ $|m|$ определяет две различные схемы ЦВЗ:

$\text{[math]}$ $\text{[math]}$ $|m|=0$ : Сообщение $\text{[math]}$ $\text{[math]}$ $m$ концептуально нулевое. Задача системы лишь зафиксировать присутствие водяного знака $\text{[math]}$ $\text{[math]}$ $w$ в помеченном объекте $\text{[math]}$ $\text{[math]}$ $S_{E}$ . Иногда, такой тип ЦВЗ называют 1-битным водяным знаком, так как 1 отвечает за присутствие знака, а 0 за отсутствие.
$\text{[math]}$ $\text{[math]}$ $|m|=n>0$ : Сообщение $\text{[math]}$ $\text{[math]}$ $m$ в виде n-битного числа ( $\text{[math]}$ $\text{[math]}$ $m=m_{1}\ldots m_{n},\;n\in \mathbb {N}$ , with $\text{[math]}$ $\text{[math]}$ $n=|m|$ ) или $\text{[math]}$ $\text{[math]}$ $M=\{0,1\}^{n}$ зашито в $\text{[math]}$ $\text{[math]}$ $w$ . Это обычная схема ЦВЗ с ненулевым сообщением.

Метод нанесения ЦВЗПравить

Методы нанесения ЦВЗ делятся на пространственные и частотные. К пространственным методам относится метод LSB. К частотным - методом расширения спектра. Помеченный сигнал получается аддитивной модификацией. Такие ЦВЗ отличаются средней надёжностью, но очень маленьким информационной ёмкостью. Метод амплитудной модуляции, схожий с методом расширения спектра, также применяется для внедрения. Метод квантования не очень надёжен, но позволяет внедрить большой объём информации.

ПрименениеПравить

Отслеживание распространения копий данных^[1].
- Борьба с видеопиратством и «ранний» доступ к новинкам кино. При сотрудничестве с киностудиями Голливуда операторы телевизионных сетей могут предоставлять своим зрителям платный доступ к премиум-контенту — фильмам, только что появившимся в кинотеатрах и ещё не вышедшим на DVD^[2]. Обязательным условием студий при этом является встраивание водяного знака, позволяющего обнаружить источник утечки — конкретного зрителя — при попадании фильма в нелегальный оборот^[3].
- Отслеживание трансляций (телевизионные новости часто содержат водяные знаки, оставленные международными информационными агентствами^[4]; рекламные агентства используют водяные знаки для контроля выхода своей рекламы в эфир в оговоренном объёме).
Метаданные, электронная цифровая подпись
Сокрытие факта обмена информации (Стеганография).

См. такжеПравить

ПримечанияПравить

↑ Польский киноархив защищает своё наследие (неопр.). Дата обращения: 11 ноября 2011. Архивировано из оригинала 9 августа 2011 года.
↑ Warner Brothers, Sony, Universal and Fox cue premium VOD (неопр.). Дата обращения: 11 ноября 2011. Архивировано 5 декабря 2012 года.
↑ Home Premiere just the start for forensic watermarking (неопр.). Дата обращения: 31 декабря 2019. Архивировано из оригинала 30 июня 2011 года.
↑ Associated Press extends TV monitoring agreement with Civolution (неопр.). Дата обращения: 11 ноября 2011. Архивировано 5 декабря 2012 года.

[1] Польский киноархив защищает своё наследие (неопр.). Дата обращения: 11 ноября 2011. Архивировано из оригинала 9 августа 2011 года.

[2] Warner Brothers, Sony, Universal and Fox cue premium VOD (неопр.). Дата обращения: 11 ноября 2011. Архивировано 5 декабря 2012 года.

[3] Home Premiere just the start for forensic watermarking (неопр.). Дата обращения: 31 декабря 2019. Архивировано из оригинала 30 июня 2011 года.

[4] Associated Press extends TV monitoring agreement with Civolution (неопр.). Дата обращения: 11 ноября 2011. Архивировано 5 декабря 2012 года.

[1]

[2]

[3]

[4]