Нечеткий экстрактор

Нечеткие экстракторы - это метод, который позволяет использовать биометрические данные в качестве входных данных для стандартных криптографических методов для обеспечения безопасности. «Нечеткий» в этом контексте относится к тому факту, что фиксированные значения, необходимые для криптографии, будут извлекаться из значений, близких к исходному ключу, но не идентичных ему, без ущерба для требуемой безопасности. Одно из приложений - шифрование и аутентификация записей пользователей с использованием биометрических данных пользователя в качестве ключа.

Нечеткие экстракторы - это биометрический инструмент, который позволяет аутентифицировать пользователя, используя в качестве ключа биометрический шаблон, созданный на основе биометрических данных пользователя. Они извлекают однородную и случайную строку ${\ displaystyle R}$ с входа ${\ displaystyle w}$ с толерантностью к шуму. Если вход изменится на ${\ displaystyle w '}$ но все еще близок к ${\ displaystyle w}$ , та же строка ${\ displaystyle R}$ будет реконструирован. Для этого при первоначальном вычислении ${\ displaystyle R}$ процесс также выводит вспомогательную строку ${\ displaystyle P}$ который будет сохранен для восстановления ${\ displaystyle R}$ позже и могут быть обнародованы без ущерба для безопасности ${\ displaystyle R}$ . Безопасность процесса обеспечивается также, когда злоумышленник изменяет ${\ displaystyle P}$ . Как только фиксированная строка ${\ displaystyle R}$ был рассчитан, его можно использовать, например, для ключевого соглашения между пользователем и сервером на основе только биометрических данных.

Исторически первая биометрическая система такого типа была разработана Джуэлсом и Ваттенбергом и называлась «Нечеткое обязательство», в которой криптографический ключ извлекается с использованием биометрических данных. Позже Джулс и Судан придумали схемы нечетких хранилищ , которые инвариантны по порядку для схемы нечетких обязательств, но используют код Рида – Соломона . Кодовое слово оценивается полиномом, и секретное сообщение вставляется как коэффициенты полинома. Полином оценивается для различных значений набора характеристик биометрических данных. Итак, Fuzzy Commitment и Fuzzy Vault были предшественниками нечетких экстракторов.

Это описание основано на статьях Евгения Додиса, Рафаила Островского, Леонида Рейзина « Нечеткие экстракторы: краткий обзор результатов с 2004 по 2006 год » и «Нечеткие экстракторы: как создать надежные ключи из биометрических и других зашумленных данных» ^[1] и Адам Смит

Мотивация

Чтобы нечеткие экстракторы могли генерировать надежные ключи из биометрических и других зашумленных данных, к этим биометрическим данным будут применяться парадигмы криптографии . Это означает, что им нужно разрешить

(1) Ограничьте количество предположений о содержании биометрических данных (эти данные поступают из различных источников, поэтому, чтобы избежать использования злоумышленником, лучше предполагать, что ввод непредсказуем)

(2) Примените к входу обычные криптографические методы. (Нечеткие экстракторы преобразуют биометрические данные в секретные, равномерно случайные и надежно воспроизводимые случайные строки).

Эти методы также могут иметь другие более широкие применения для других типов шумных входов, таких как приблизительные данные из человеческой памяти , изображения, используемые в качестве паролей, ключи из квантового канала. ^[1] Согласно статье Синтии Дворк (ICALP, 2006) « Дифференциальная конфиденциальность» , нечеткие экстракторы также используются для доказательства невозможности строгих представлений о конфиденциальности для статистических баз данных.

Основные определения

Предсказуемость

Предсказуемость указывает на вероятность того, что злоумышленник сможет угадать секретный ключ. С математической точки зрения предсказуемость случайной величины ${\ displaystyle A}$ является ${\ Displaystyle \ макс _ {\ mathrm {а}} Р [А = а]}$ .

Например, учитывая пару случайных величин ${\ displaystyle A}$ а также ${\ displaystyle B}$ , если противник знает ${\ displaystyle b}$ из ${\ displaystyle B}$ , то предсказуемость ${\ displaystyle A}$ будет ${\ Displaystyle \ макс _ {\ mathrm {a}} P [A = a | B = b]}$ . Итак, противник может предсказать ${\ displaystyle A}$ с участием ${\ displaystyle E_ {b \ leftarrow B} [\ max _ {\ mathrm {a}} P [A = a | B = b]]}$ . Мы используем среднее значение по ${\ displaystyle B}$ поскольку он не находится под контролем противника, но поскольку зная ${\ displaystyle b}$ делает предсказание ${\ displaystyle A}$ состязательный, мы берем наихудший случай ${\ displaystyle A}$ .

Мин-энтропия

Мин-энтропия указывает на наихудший случай энтропии. С математической точки зрения это определяется как ${\ Displaystyle H _ {\ infty} (A) = - \ log (\ max _ {\ mathrm {a}} P [A = a])}$ .

Случайная величина с минимальной энтропией не менее ${\ displaystyle m}$ называется ${\ displaystyle m}$ -источник.

Статистическое расстояние

Статистическое расстояние - это мера различимости. С математической точки зрения, это выражается для двух распределений вероятностей ${\ displaystyle A}$ а также ${\ displaystyle B}$ в виде ${\ displaystyle SD [A, B]}$ знак равно ${\ displaystyle {\ frac {1} {2}} \ sum _ {\ mathrm {v}} | P [A = v] -P [B = v] |}$ . В любой системе, если ${\ displaystyle A}$ заменяется на ${\ displaystyle B}$ , она будет вести себя как исходная система с вероятностью не менее ${\ displaystyle 1-SD [A, B]}$ .

Определение 1 (сильный экстрактор)

Параметр ${\ displaystyle M}$ как сильный экстрактор случайности . Рандомизированная функция Ext: ${\ Displaystyle M \ rightarrow \ {0,1 \} ^ {l}}$ со случайностью длины ${\ displaystyle r}$ это ${\ Displaystyle (м, л, \ эпсилон)}$ сильный экстрактор, если для всех ${\ displaystyle m}$ -источники ${\ displaystyle W}$ на ${\ displaystyle M (\ operatorname {Ext} (W; I), I) \ приблизительно _ {\ epsilon} (U_ {l}, U_ {r}),}$ где ${\ displaystyle I = U_ {r}}$ не зависит от ${\ displaystyle W}$ .

Вывод экстрактора - это ключ, сгенерированный из ${\ displaystyle w \ leftarrow W}$ с семенем ${\ displaystyle i \ leftarrow I}$ . Он ведет себя независимо от других частей системы с вероятностью ${\ displaystyle 1- \ epsilon}$ . Сильные экстракторы могут извлечь максимум ${\ displaystyle l = m-2 \ log {\ frac {1} {\ epsilon}} + O (1)}$ биты из произвольного ${\ displaystyle m}$ -источник.

Безопасный эскиз

Безопасный эскиз позволяет восстановить шумный вход, так что если вход ${\ displaystyle w}$ и эскиз ${\ displaystyle s}$ , дано ${\ displaystyle s}$ и ценность ${\ displaystyle w '}$ рядом с ${\ displaystyle w}$ , ${\ displaystyle w}$ можно восстановить. Но эскиз ${\ displaystyle s}$ не должен раскрывать информацию о ${\ displaystyle w}$ , чтобы сохранить его в безопасности.

Если ${\ Displaystyle \ mathbb {M}}$ - метрическое пространство с функцией расстояния dis, Secure Sketch восстанавливает строку ${\ Displaystyle ш \ в \ mathbb {M}}$ из любой близкой строки ${\ Displaystyle ш '\ в \ mathbb {M}}$ без раскрытия ${\ displaystyle w}$ .

Определение 2 (безопасный эскиз)

An ${\ Displaystyle (м, {\ тильда {м}}, т)}$ Secure Sketch - это пара эффективных рандомизированных процедур (в Sketch отмечен SS, в Recover отмечен Rec), таких что:

(1) Процедура создания эскиза SS, примененная к входу ${\ Displaystyle ш \ в \ mathbb {M}}$ возвращает строку ${\ displaystyle s \ in {\ {0,1 \} ^ {*}}}$ .

Процедура восстановления Rec использует в качестве входных данных два элемента ${\ Displaystyle ш '\ в \ mathbb {M}}$ а также ${\ displaystyle s \ in {\ {0,1 \} ^ {*}}}$ .

(2) Правильность: если ${\ Displaystyle дис (ш, ш ') \ leq т}$ тогда ${\ Displaystyle Rec (ш ', SS (ш)) = ш}$ .

(3) Безопасность: для любого ${\ displaystyle m}$ -источник более ${\ displaystyle M}$ , мин-энтропия ${\ displaystyle W}$ дано ${\ displaystyle s}$ в приоритете:

для любой ${\ displaystyle (W, E)}$ , если ${\ Displaystyle {\ тильда {H}} _ {\ mathrm {\ infty}} (W | E) \ geq m}$ , тогда ${\ Displaystyle {\ тильда {H}} _ {\ mathrm {\ infty}} (W | SS (W), E) \ geq {\ tilde {m}}}$ .

Нечеткий экстрактор

Нечеткие экстракторы не восстанавливают исходный ввод, а генерируют строку ${\ displaystyle R}$ (что близко к равномерному) от ${\ displaystyle w}$ и разрешить его последующее воспроизведение (используя вспомогательную строку ${\ displaystyle P}$ ) с учетом любых ${\ displaystyle w '}$ рядом с ${\ displaystyle w}$ . Сильные экстракторы - это особый случай нечетких экстракторов, когда ${\ displaystyle t}$ = 0 и ${\ Displaystyle P = I}$ .

Определение 3 (нечеткий экстрактор)

An ${\ Displaystyle (м, л, т, \ эпсилон)}$ нечеткий экстрактор - это пара эффективных рандомизированных процедур (Gen - Generate и Rep - Reproduce), таких что:

(1) Gen, учитывая ${\ Displaystyle ш \ в \ mathbb {M}}$ , выводит извлеченную строку ${\ Displaystyle R \ in {\ mathbb {\ {} 0,1 \} ^ {l}}}$ и вспомогательная строка ${\ Displaystyle П \ ин {\ mathbb {\ {} 0,1 \} ^ {*}}}$ .

(2) Правильность: если ${\ Displaystyle дис (ш, ш ') \ leq т}$ а также ${\ Displaystyle (R, P) \ leftarrow Gen (ш)}$ , тогда ${\ Displaystyle Rep (ш ', P) = R}$ .

(3) Безопасность: для всех m-источников ${\ displaystyle W}$ над ${\ displaystyle M}$ , строка ${\ displaystyle R}$ почти однороден даже с учетом ${\ displaystyle P}$ , Так ${\ Displaystyle {\ тильда {H}} _ {\ mathrm {\ infty}} (W | E) \ geq m}$ , тогда ${\ Displaystyle (R, P, E) \ приблизительно (U _ {\ mathrm {l}}, P, E)}$ .

Таким образом, нечеткие экстракторы выводят почти однородные случайные последовательности битов, которые являются предпосылкой для использования криптографических приложений (в качестве секретных ключей). Поскольку выходные биты немного неоднородны, существует риск снижения безопасности, но расстояние от равномерного распределения не превышает ${\ displaystyle \ epsilon}$ и пока это расстояние достаточно мало, безопасность будет оставаться адекватной.

Надежные эскизы и нечеткие экстракторы

Надежные эскизы можно использовать для создания нечетких экстракторов. Как применение SS к ${\ displaystyle w}$ чтобы получить ${\ displaystyle s}$ и сильный экстрактор Ext со случайностью ${\ displaystyle x}$ к ${\ displaystyle w}$ получить ${\ displaystyle R}$ . ${\ displaystyle (s, x)}$ может храниться как вспомогательная строка ${\ displaystyle P}$ . ${\ displaystyle R}$ может быть воспроизведен ${\ displaystyle w '}$ а также ${\ Displaystyle P = (s, x)}$ . ${\ displaystyle Rec (ш ', s)}$ может восстановиться ${\ displaystyle w}$ а также ${\ Displaystyle Ext (ш, х)}$ может воспроизвести ${\ displaystyle R}$ . Следующая лемма формализует это.

Лемма 1 (нечеткие экстракторы из эскизов)

Предположим, что (SS, Rec) - ${\ Displaystyle (М, м, {\ тильда {м}}, т)}$ безопасный эскиз и пусть Ext будет средним случаем ${\ Displaystyle (п, {\ тильда {м}}, л, \ эпсилон)}$ сильный экстрактор. Тогда следующий (Gen, Rep) является ${\ Displaystyle (М, м, л, т, \ эпсилон)}$ нечеткий экстрактор: (1) Gen ${\ Displaystyle (ш, г, х)}$ : набор ${\ Displaystyle P = (SS (ш; г), х), R = Ext (ш; х),}$ и вывод ${\ displaystyle (R, P)}$ . (2) Представитель ${\ Displaystyle (ш ', (с, х))}$ : восстанавливаться ${\ Displaystyle ш = Rec (ш ', s)}$ и вывод ${\ Displaystyle R = Ext (ш; х)}$ .

Доказательство: из определения безопасного скетча (определение 2), ${\ Displaystyle Н _ {\ infty} (W | SS (W)) \ geq {\ тильда {м}}}$ . А поскольку Ext - это средний случай ${\ Displaystyle (п, м, л, \ эпсилон)}$ -сильный экстрактор. ${\ Displaystyle SD ((Ext (W; X), SS (W), X), (U_ {l}, SS (W), X)) = SD ((R, P), (U_ {l}, P)) \ leq \ epsilon.}$

Следствие 1.

Если (SS, Rec) является ${\ Displaystyle (М, м, {\ тильда {м}}, т)}$ безопасный эскиз, а Ext - ${\ displaystyle (п, {\ тильда {m}} - журнал ({\ гидроразрыва {1} {\ delta}}), l, \ epsilon)}$ сильный экстрактор, то приведенная выше конструкция (Gen, Rep) является ${\ Displaystyle (М, м, л, т, \ эпсилон + \ дельта)}$ нечеткий экстрактор.

Справочный документ включает множество общих комбинаторных оценок безопасных эскизов и нечетких экстракторов. ^[1]

Основные конструкции

Благодаря своим свойствам устойчивости к ошибкам безопасные эскизы можно обрабатывать, анализировать и строить как ${\ Displaystyle (п, к, d) _ {\ mathcal {F}}}$ общий код исправления ошибок или ${\ Displaystyle [п, к, d] _ {\ mathcal {F}}}$ для линейных кодов, где ${\ displaystyle n}$ - длина кодовых слов, ${\ displaystyle k}$ длина кодируемого сообщения, ${\ displaystyle d}$ расстояние между кодовыми словами, а ${\ Displaystyle {\ mathcal {F}}}$ это алфавит. Если ${\ Displaystyle {\ mathcal {F}} ^ {п}}$ это вселенная возможных слов, тогда можно будет найти код исправления ошибок ${\ Displaystyle С \ подмножество {\ mathcal {F}} ^ {п}}$ такое, что существует уникальное кодовое слово ${\ displaystyle c \ in C}$ для каждого ${\ Displaystyle ш \ ин {\ mathcal {F}} ^ {п}}$ с расстоянием Хемминг из ${\ displaystyle dis_ {Ham} (с, ш) \ leq (d-1) / 2}$ . Первым шагом для создания надежного эскиза является определение типа ошибок, которые могут произойти, а затем выбор расстояния для измерения.

Красный - это конструкция с кодовым смещением, синий - это синдромная конструкция, зеленый - расстояние редактирования и другие сложные конструкции.

Дистанционные конструкции Хэмминга

Когда нет риска удаления данных и только их повреждения, лучшим измерением для исправления ошибок является расстояние Хэмминга. Есть две общие конструкции для исправления ошибок Хэмминга в зависимости от того, является ли код линейным или нет. Обе конструкции начинаются с кода исправления ошибок, который имеет расстояние ${\ displaystyle 2t + 1}$ где ${\ displaystyle {t}}$ количество допустимых ошибок.

Конструкция с кодовым смещением

При использовании ${\ Displaystyle (п, к, 2t + 1) _ {\ mathcal {F}}}$ общий код, назначьте равномерно случайное кодовое слово ${\ displaystyle c \ in C}$ для каждого ${\ displaystyle w}$ , тогда пусть ${\ Displaystyle SS (ш) = s = туалет}$ какой сдвиг необходим, чтобы изменить ${\ displaystyle c}$ в ${\ displaystyle w}$ . Чтобы исправить ошибки в ${\ displaystyle w '}$ вычесть ${\ displaystyle s}$ из ${\ displaystyle w '}$ затем исправьте ошибки в полученном некорректном кодовом слове, чтобы получить ${\ displaystyle c}$ и, наконец, добавить ${\ displaystyle s}$ к ${\ displaystyle c}$ получить ${\ displaystyle w}$ . Это означает ${\ displaystyle Rec (w ', s) = s + dec (w'-s) = w}$ . Эта конструкция может достичь наилучшего возможного компромисса между устойчивостью к ошибкам и потерей энтропии, когда ${\ displaystyle {\ mathcal {F}} \ geq n}$ и используется код Рида – Соломона, приводящий к потере энтропии в размере ${\ Displaystyle 2t \ журнал ({\ mathcal {F}})}$ . Единственный способ улучшить это - найти код лучше, чем код Рида – Соломона.

Синдром конструирования

При использовании ${\ Displaystyle [п, к, 2t + 1] _ {\ mathcal {F}}}$ линейный код позволяет ${\ Displaystyle SS (ш) = s}$ быть синдром из ${\ displaystyle w}$ . Исправлять ${\ displaystyle w '}$ найти вектор ${\ displaystyle e}$ такой, что ${\ Displaystyle син (е) = син (ш ') - с}$ , тогда ${\ Displaystyle ш = ш'-е}$ .

Установить разностные конструкции

При работе с очень большим алфавитом или очень длинными строками, в результате получается очень большая вселенная. ${\ displaystyle {\ mathcal {U}}}$ , может быть более эффективным лечить ${\ displaystyle w}$ а также ${\ displaystyle w '}$ как наборы и посмотрите на различия наборов, чтобы исправить ошибки. Для работы с большим набором ${\ displaystyle w}$ полезно посмотреть на его характеристический вектор ${\ displaystyle x_ {w}}$ , который является двоичным вектором длины ${\ displaystyle n}$ который имеет значение 1, когда элемент ${\ displaystyle a \ in {\ mathcal {U}}}$ а также ${\ Displaystyle а \ в ш}$ , или 0, когда ${\ Displaystyle а \ notin ш}$ . Лучший способ уменьшить размер защищенного эскиза, когда ${\ displaystyle n}$ большой. ${\ displaystyle k}$ большой, так как размер определяется ${\ displaystyle nk}$ . Хороший код, на котором основывается эта конструкция, - это ${\ Displaystyle [п, нт \ альфа, 2т + 1] _ {2}}$ Код BCH, где ${\ Displaystyle п = 2 ^ {\ альфа} -1}$ а также ${\ displaystyle t \ ll n}$ так ${\ Displaystyle к \ Leq п-журнал {п \ выбрать {т}}}$ , также полезно, чтобы коды BCH можно было декодировать за сублинейное время.

Построение эскиза булавкой

Позволять ${\ displaystyle SS (w) = s = syn (x_ {w})}$ . Исправлять ${\ displaystyle w '}$ первая находка ${\ displaystyle SS (w ') = s' = syn (x_ {w} ')}$ , затем найти множество v, где ${\ displaystyle syn (x_ {v}) = s'-s}$ , наконец, вычислите симметричную разность, чтобы получить ${\ Displaystyle Rec (w ', s) = w' \ треугольник v = w}$ . Хотя это не единственная конструкция, с помощью которой можно установить разницу, она самая простая.

Редактировать дистанционные конструкции

Когда данные могут быть повреждены или удалены, лучшим способом измерения является расстояние редактирования . Чтобы создать конструкцию, основанную на расстоянии редактирования, проще всего начать с построения для заданной разницы или расстояния Хэмминга в качестве промежуточного шага коррекции, а затем построить вокруг него построение расстояния редактирования.

Прочие конструкции для измерения расстояния

Есть много других типов ошибок и расстояний, которые можно использовать для моделирования других ситуаций. Большинство этих других возможных конструкций построено на более простых конструкциях, таких как конструкции расстояния редактирования.

Повышение устойчивости к ошибкам за счет смягчения представлений о правильности

Можно показать, что устойчивость к ошибкам безопасного эскиза можно улучшить, применяя вероятностный метод к исправлению ошибок и запрашивая только ошибки, которые можно исправить с высокой вероятностью. Это позволяет выйти за пределы Плоткина, которые ограничивают исправление ${\ displaystyle n / 4}$ ошибок и приблизиться к оценке Шеннона с учетом почти ${\ displaystyle n / 2}$ исправления. Для достижения этой улучшенной коррекции ошибок необходимо использовать менее ограничительную модель распределения ошибок.

Случайные ошибки

Для этой наиболее жесткой модели используйте BSC. ${\ displaystyle _ {p}}$ создать ${\ displaystyle w '}$ что вероятность ${\ displaystyle p}$ на каждой позиции в ${\ displaystyle w '}$ что полученный бит неправильный. Эта модель может показать, что потеря энтропии ограничивается ${\ displaystyle nH (p) -o (n)}$ , где ${\ displaystyle H}$ - бинарная функция энтропии , а если min-энтропия ${\ Displaystyle м \ GEQ N (ЧАС ({\ гидроразрыва {1} {2}} - \ gamma)) + \ varepsilon}$ тогда ${\ Displaystyle п ({\ гидроразрыва {1} {2}} - \ gamma)}$ ошибки можно терпеть, для некоторых постоянных ${\ displaystyle \ gamma> 0}$ .

Ошибки, зависящие от ввода

Для этой модели ошибки не имеют известного распределения и могут исходить от злоумышленника, единственными ограничениями являются ${\ displaystyle dis _ {\ text {err}} \ leq t}$ и что искаженное слово зависит только от ввода ${\ displaystyle w}$ а не на безопасном эскизе. Для этой модели ошибок можно показать, что никогда не будет больше, чем ${\ displaystyle t}$ ошибок, поскольку эта модель может учитывать все сложные шумовые процессы, а это означает, что может быть достигнута граница Шеннона, для этого к защищенному эскизу добавляется случайная перестановка, которая уменьшит потерю энтропии.

Вычислительно ограниченные ошибки

Это отличается от модели, зависящей от входных данных, наличием ошибок, которые зависят как от входных данных. ${\ displaystyle w}$ и безопасный эскиз, и злоумышленник ограничен алгоритмами с полиномиальным временем для внесения ошибок. Поскольку алгоритмы, которые могут работать за время, превышающее полиномиальное, в настоящее время невозможны в реальном мире, положительный результат с использованием этой модели ошибок будет гарантировать, что любые ошибки могут быть исправлены. Это наименее ограничительная модель, единственный известный способ приблизиться к границе Шеннона - использовать коды, декодируемые списком, хотя на практике это не всегда может быть полезно, поскольку возврат списка вместо одного кодового слова не всегда может быть приемлемым.

Гарантии конфиденциальности

В целом шифрованная попытка системы просачиваться как мало информация , как это возможно в качестве противника . В случае биометрии в случае утечки информации о считывании биометрических данных злоумышленник может получить личную информацию о пользователе. Например, злоумышленник замечает, что во вспомогательных строках есть определенный шаблон, который подразумевает этническую принадлежность пользователя. Мы можем рассматривать эту дополнительную информацию как функцию ${\ displaystyle f (W)}$ . Если злоумышленник узнает вспомогательную строку, необходимо убедиться, что из этих данных он не сможет вывести какие-либо данные о человеке, у которого были сняты биометрические данные.

Корреляция между вспомогательной строкой и биометрическим вводом

В идеале вспомогательная строка ${\ displaystyle P}$ не будет раскрывать информацию о биометрическом вводе ${\ displaystyle w}$ . Это возможно только тогда, когда каждое последующее биометрическое считывание ${\ displaystyle w '}$ идентичен оригиналу ${\ displaystyle w}$ . В этом случае на самом деле нет необходимости во вспомогательной строке, поэтому легко сгенерировать строку, которая никоим образом не коррелирует с ${\ displaystyle w}$ .

Поскольку желательно принимать биометрические данные ${\ displaystyle w '}$ похожий на ${\ displaystyle w}$ вспомогательная строка ${\ displaystyle P}$ должно быть как-то коррелировано. Более разные ${\ displaystyle w}$ а также ${\ displaystyle w '}$ разрешены, тем больше будет корреляция между ${\ displaystyle P}$ а также ${\ displaystyle w}$ , чем больше они взаимосвязаны, тем больше информации ${\ displaystyle P}$ показывает о ${\ displaystyle w}$ . Мы можем рассматривать эту информацию как функцию ${\ displaystyle f (W)}$ . Лучшее возможное решение - убедиться, что злоумышленник не сможет узнать что-либо полезное из вспомогательной строки.

Gen ( W ) как вероятностная карта

Вероятностная карта ${\ Displaystyle Y ()}$ скрывает результаты функций с небольшой утечкой ${\ displaystyle \ epsilon}$ . Утечка - это разница в вероятности угадывания двумя противниками некоторой функции, когда один знает вероятностную карту, а другой нет. Формально:

{\ Displaystyle | \ Pr [A_ {1} (Y (W)) = f (W)] - \ Pr [A_ {2} () = f (W)] | \ leq \ epsilon}

Если функция ${\ displaystyle \ operatorname {Gen} (W)}$ является вероятностной картой, то даже если противник знает как вспомогательную строку ${\ displaystyle P}$ и секретная строка ${\ displaystyle R}$ они лишь незначительно более вероятно поймут что-то о предмете, как если бы они ничего не знали. Строка ${\ displaystyle R}$ предполагается, что он хранится в секрете, поэтому даже в случае утечки информации (что маловероятно) злоумышленник все равно не сможет выяснить ничего полезного о предмете, если ${\ displaystyle \ epsilon}$ маленький. Мы можем рассмотреть ${\ displaystyle f (W)}$ быть какой-либо корреляцией между биометрическими данными и некоторыми физическими характеристиками человека. Параметр ${\ Displaystyle Y = \ OperatorName {Gen} (W) = R, P}$ в приведенном выше уравнении меняет его на:

{\ Displaystyle | \ Pr [A_ {1} (R, P) = f (W)] - \ Pr [A_ {2} () = f (W)] | \ leq \ epsilon}

Это означает, что если один противник ${\ displaystyle A_ {1}}$ имеет ${\ displaystyle (R, P)}$ и второй противник ${\ displaystyle A_ {2}}$ ничего не знает, их лучшие догадки на ${\ displaystyle f (W)}$ только ${\ displaystyle \ epsilon}$ отдельно.

Однородные нечеткие экстракторы

Унифицированные нечеткие экстракторы - это частный случай нечетких экстракторов, где выходные ${\ displaystyle (R, P)}$ из ${\ displaystyle Gen (W)}$ незначительно отличаются от строк, выбранных из равномерного распределения, т. е. ${\ displaystyle (R, P) \ приблизительно _ {\ epsilon} (U _ {\ ell}, U_ {| P |})}$

Единые безопасные эскизы

Поскольку безопасные эскизы подразумевают нечеткие экстракторы, создание единого безопасного эскиза позволяет легко построить однородный нечеткий экстрактор. В едином безопасном эскизе процедура эскиза ${\ Displaystyle SS (ш)}$ это случайность экстрактор ${\ Displaystyle Ext (ш; я)}$ . Где ${\ displaystyle w}$ биометрический ввод и ${\ displaystyle i}$ - случайное семя . Поскольку экстракторы случайности выводят строку, которая выглядит как однородное распределение, они скрывают всю информацию о своем вводе.

Приложения

Эскизы экстрактора можно использовать для построения ${\ Displaystyle (м, т, \ эпсилон)}$ -нечеткие идеально односторонние хеш-функции. При использовании в качестве хеш-функции вход ${\ displaystyle w}$ это объект, который вы хотите хешировать. В ${\ Displaystyle P, R}$ что ${\ Displaystyle Gen (ш)}$ output - это хеш-значение. Если бы кто-то хотел убедиться, что ${\ displaystyle w '}$ в ${\ displaystyle t}$ из оригинала ${\ displaystyle w}$ , они подтвердят, что ${\ Displaystyle Rep (ш ', P) = R}$ . ${\ Displaystyle (м, т, \ эпсилон)}$ -нечеткие идеально односторонние хэш-функции - это специальные хеш-функции, в которых они принимают любой ввод не более чем ${\ displaystyle t}$ ошибок, по сравнению с традиционными хэш-функциями, которые принимают только тогда, когда ввод точно соответствует оригиналу. Традиционные криптографические хеш-функции пытаются гарантировать, что с вычислительной точки зрения невозможно найти два разных входа, которые хешируют одно и то же значение. Нечеткие идеально односторонние хеш-функции делают аналогичное утверждение. Они делают невозможным с точки зрения вычислений два нахождения двух входов, которые больше, чем ${\ displaystyle t}$ Расстояние Хэмминга друг от друга и хеширование с одинаковым значением.

Защита от активных атак

Активная атака может быть такой, при которой злоумышленник может изменить вспомогательную строку. ${\ displaystyle P}$ . Если противник может изменить ${\ displaystyle P}$ в другую строку, которая также приемлема для функции воспроизведения ${\ Displaystyle Rep (W, P)}$ , это приводит ${\ Displaystyle Rep (W, P)}$ выводить неверную секретную строку ${\ displaystyle {\ tilde {R}}}$ . Надежные нечеткие экстракторы решают эту проблему, допуская сбой функции воспроизведения, если в качестве входных данных предоставляется измененная вспомогательная строка.

Надежные нечеткие экстракторы

Один из методов создания надежных нечетких экстракторов - использование хеш-функций . Эта конструкция требует двух хэш-функций ${\ displaystyle H_ {1}}$ а также ${\ displaystyle H_ {2}}$ . В ${\ displaystyle Gen (W)}$ functions производит вспомогательную строку ${\ displaystyle P}$ путем добавления вывода безопасного эскиза ${\ Displaystyle s = SS (ш)}$ к хешу обоих чтений ${\ displaystyle w}$ и безопасный эскиз ${\ displaystyle s}$ . Он генерирует секретную строку ${\ displaystyle R}$ применяя вторую хеш-функцию к ${\ displaystyle w}$ а также ${\ displaystyle s}$ . Формально: ${\ displaystyle Gen (w): s = SS (w), return: P = (s, H_ {1} (w, s)), R = H_ {2} (w, s)}$

Функция воспроизведения ${\ Displaystyle Rep (W, P)}$ также использует хэш-функции ${\ displaystyle H_ {1}}$ а также ${\ displaystyle H_ {2}}$ . В дополнение к проверке биометрических данных ввод достаточно похож на тот, который был восстановлен с помощью ${\ Displaystyle Rec (W, S)}$ функция, он также проверяет этот хеш во второй части ${\ displaystyle P}$ был фактически получен из ${\ displaystyle w}$ а также ${\ displaystyle s}$ . Если оба этих условия соблюдены, возвращается ${\ displaystyle R}$ что само по себе является второй хеш-функцией, применяемой к ${\ displaystyle w}$ а также ${\ displaystyle s}$ . Формально:

${\ displaystyle Rep (ш ', {\ тильда {P}}):}$ Получать ${\ Displaystyle {\ тильда {s}}}$ а также ${\ displaystyle {\ tilde {h}}}$ из ${\ displaystyle {\ tilde {P}}; {\ tilde {w}} = Rec (w ', {\ tilde {s}}).}$ Если ${\ displaystyle \ Delta ({\ тильда {w}}, w ') \ leq t}$ а также ${\ displaystyle {\ tilde {h}} = H_ {1} ({\ tilde {w}}, {\ tilde {s}})}$ тогда ${\ displaystyle return: H_ {2} ({\ тильда {w}}, {\ тильда {s}})}$ еще ${\ displaystyle return: fail}$

Если ${\ displaystyle P}$ было изменено, это будет очевидно, потому что, ${\ displaystyle Rep}$ выдаст ошибку с очень высокой вероятностью. Чтобы алгоритм принял другой ${\ displaystyle P}$ противнику придется найти ${\ displaystyle {\ tilde {w}}}$ такой, что ${\ displaystyle H_ {1} (ш, s) = H_ {1} ({\ тильда {w}}, {\ тильда {s}})}$ . Поскольку хэш-функция считается односторонней , с вычислительной точки зрения найти такую ${\ displaystyle {\ tilde {w}}}$ . Видя ${\ displaystyle P}$ не предоставит противнику никакой полезной информации. Поскольку, опять же, хеш-функция является односторонней, злоумышленник с вычислительной точки зрения не может отменить хеш-функцию и вычислить ${\ displaystyle w}$ . Часть ${\ displaystyle P}$ является безопасным скетчем, но по определению скетч раскрывает незначительную информацию о своем вводе. Аналогично видя ${\ displaystyle R}$ (даже если он никогда не должен этого видеть) не предоставит противнику никакой полезной информации, поскольку злоумышленник не сможет отменить хэш-функцию и увидеть биометрические данные.

Внешние ссылки

«Minisketch: оптимизированная библиотека C ++ для согласования наборов на основе BCH (Pin Sketch)» . github.com . 31 мая 2021 г.

[how_to_generate-1] Евгений Додис, Рафаил Островский, Леонид Рейзин и Адам Смит. «Нечеткие экстракторы: как создать надежные ключи из биометрии и других зашумленных данных» . 2008 г.

[1]

Нечеткий экстрактор

Мотивация

Основные определения

Предсказуемость

Мин-энтропия

Статистическое расстояние

Определение 1 (сильный экстрактор)

Безопасный эскиз

Определение 2 (безопасный эскиз)

Нечеткий экстрактор

Определение 3 (нечеткий экстрактор)

Надежные эскизы и нечеткие экстракторы

Лемма 1 (нечеткие экстракторы из эскизов)

Следствие 1.

Основные конструкции

Дистанционные конструкции Хэмминга

Конструкция с кодовым смещением

Синдром конструирования

Установить разностные конструкции

Построение эскиза булавкой

Редактировать дистанционные конструкции

Прочие конструкции для измерения расстояния

Повышение устойчивости к ошибкам за счет смягчения представлений о правильности

Случайные ошибки

Ошибки, зависящие от ввода

Вычислительно ограниченные ошибки

Гарантии конфиденциальности

Корреляция между вспомогательной строкой и биометрическим вводом

Gen ( W ) как вероятностная карта

Однородные нечеткие экстракторы

Единые безопасные эскизы

Приложения

Защита от активных атак

Надежные нечеткие экстракторы

Рекомендации

Внешние ссылки