Анонимизация MAC-адреса


Анонимизация MAC-адреса выполняет одностороннюю функцию для MAC-адреса , так что результат может использоваться в системах отслеживания для отчетности и широкой публики, в то же время делая практически невозможным получение исходного MAC-адреса из результата. Идея состоит в том, что этот процесс позволяет таким компаниям , как Google [1] , Apple [2] и CrowdVision [3] , которые отслеживают перемещения пользователей с помощью компьютерного оборудования, одновременно сохранять личность людей, которых они отслеживают, а также само оборудование.

Примером анонимизации MAC-адреса может быть использование простого алгоритма хеширования. Учитывая адрес 11:22:33:44:55:66, алгоритм хеширования MD5 производит eb341820cd3a3485461a61b1e97d31b1(32 шестнадцатеричных цифры). [4] Адрес, отличающийся только одним символом ( ) , 11:22:33:44:55:67дает [5] совершенно другой хэш из-за лавинного эффекта .391907146439938c9821856fa181052e

Проблема заключается в том, что возможных MAC-адресов всего 2 48 (281 474 976 710 656). Учитывая алгоритм кодирования, можно легко создать индекс для каждого возможного адреса. Используя сжатие радужной таблицы , индекс можно сделать достаточно маленьким, чтобы его можно было переносить. Построение индекса представляет собой удручающе параллельную задачу, поэтому работу можно значительно ускорить, например, временно арендовав большое количество ресурсов облачных вычислений.

Например, если один ЦП может вычислить 1 000 000 зашифрованных MAC-адресов в секунду, то создание полной таблицы займет 8,9 ЦП-лет. С парком из 1000 ЦП это займет всего около 78 часов. Используя радужную таблицу с «глубиной» 1 000 000 хэшей на запись, результирующая таблица будет содержать всего несколько сотен миллионов записей (несколько ГБ) и потребует 0,5 секунды (в среднем, без учета времени ввода-вывода) для реверсирования любого зашифрованного MAC-адреса. в свой первоначальный вид.

В 2018 году ученые обнаружили, что с помощью современного вычислительного оборудования с возможностью расчета 6 гига хэшей MD5 и 844 хэшей Mega SHA-256 в секунду авторы могут восстановить 100% из 1 миллиона хэшей в: [6]

Другой подход, который был протестирован, заключается в усечении MAC-адреса путем удаления организационно уникального идентификатора (первые 24 бита 48-битного MAC-адреса). [7] Однако, поскольку было выделено только 0,1% от общего пространства уникальных идентификаторов Организации , и не все производители полностью используют выделенное им пространство MAC-адресов, это не дает каких-либо существенных преимуществ в отношении конфиденциальности. [8] Кроме того, производители часто назначают непрерывные блоки адресов определенным устройствам, что позволяет точно отображать используемые устройства, позволяя идентифицировать тип устройства только с небольшой частью MAC-адреса. [9]