Анонимизация данных - это вид очистки информации , целью которого является защита конфиденциальности . Это процесс удаления информации , позволяющей установить личность, из наборов данных , чтобы люди, которых описывают данные, оставались анонимными .
Обзор
Анонимизация данных была определена как «процесс, посредством которого личные данные необратимо изменяются таким образом, что субъект данных больше не может быть идентифицирован прямо или косвенно, ни одним оператором данных, ни в сотрудничестве с любой другой стороной». [1] Анонимизация данных может позволить передачу информации через границу, например, между двумя отделами внутри агентства или между двумя агентствами, при одновременном снижении риска непреднамеренного раскрытия информации и в определенных средах таким образом, чтобы можно было проводить оценку и анализ после анонимизация.
В контексте медицинских данных под анонимными данными понимаются данные, по которым получатель информации не может идентифицировать пациента. Имя, адрес и полный почтовый индекс должны быть удалены вместе с любой другой информацией, которая в сочетании с другими данными, хранящимися у получателя или раскрытыми для них, могла бы идентифицировать пациента. [2]
Всегда существует риск того, что анонимные данные не останутся анонимными с течением времени. Соединение анонимного набора данных с другими данными, умные методы и грубая мощь - вот некоторые из способов деанонимизации ранее анонимных наборов данных; Субъекты данных больше не анонимны.
Деанонимизация - это обратный процесс, при котором анонимные данные сопоставляются с другими источниками данных для повторной идентификации источника анонимных данных. [3] Обобщение и возмущение - два популярных подхода к анонимизации реляционных данных. [4] Процесс сокрытия данных с возможностью их повторной идентификации позже также называется псевдонимизацией, и это односторонние компании, которые могут хранить данные в соответствии с требованиями HIPAA . [5]
Существует пять типов операций анонимизации данных: обобщение, подавление, анатомизация, перестановка и возмущение. [6]
Требования GDPR
Европейский Союз «с новым Положением защиты Общие данные (GDPR) требует , чтобы сохраненные данные на людей в ЕС испытывают либо анонимную или pseudonymization процесс. [7] GDPR Recital (26) устанавливает очень высокую планку того, что представляют собой анонимные данные, тем самым освобождая данные от требований GDPR, а именно: «… информация, которая не относится к идентифицированному или идентифицируемому физическому лицу или к предоставленным личным данным. анонимным таким образом, что субъект данных не может быть или больше не может быть идентифицирован ». Европейский надзорный орган по защите данных (EDPS) и испанское агентство Agencia Española de Protección de Datos (AEPD) выпустили совместное руководство по требованиям к анонимности и освобождению от требований GDPR. Согласно EDPS и AEPD, никто, включая контролера данных, не должен иметь возможность повторно идентифицировать субъекты данных в должным образом анонимизированном наборе данных. [8] Исследования специалистов [9] из Имперского колледжа в Лондоне и Калифорнийского университета в Бельгии, а также решение судьи Михала Агмон-Гонена из окружного суда Тель-Авива [10] подчеркивают недостатки «анонимизации» в сегодняшнем мире. мир больших данных. Анонимизация отражает устаревший подход к защите данных [11], который был разработан, когда обработка данных была ограничена изолированными (разрозненными) приложениями до того, как стала популярной обработка «больших данных», предполагающая широкое распространение и объединение данных.
Смотрите также
Рекомендации
- ^ ISO 25237: 2017 Информатика здравоохранения - Псевдонимизация . ISO. 2017. с. 7.
- ^ «Анонимизация данных» . Бесплатный медицинский словарь . Проверено 17 января 2014 года .
- ^ «Деанонимизация» . Whatis.com . Проверено 17 января 2014 года .
- ^ Бинь Чжоу; Цзянь Пей; WoShun Luk (декабрь 2008 г.). «Краткий обзор методов анонимизации для публикации данных социальных сетей с сохранением конфиденциальности» (PDF) . Информационный бюллетень ACM SIGKDD Explorations Newsletter . 10 (2): 12–22. DOI : 10.1145 / 1540276.1540279 . S2CID 609178 .
- ^ «Деидентификация данных - более простой способ соответствия HIPAA» . Труво . TrueVault.
- ^ Эйюпоглу, Джан; Айдын, Мухаммед; Заим, Абдул; Сертбас, Ахмет (17 мая 2018 г.). «Эффективный алгоритм анонимизации больших данных, основанный на методах хаоса и возмущений» . Энтропия . 20 (5): 373. DOI : 10,3390 / e20050373 . ISSN 1099-4300 . PMC 7512893 . PMID 33265463 . Текст был скопирован из этого источника, доступного по международной лицензии Creative Commons Attribution 4.0 .
- ^ Наука о данных в соответствии с GDPR с псевдонимизацией в конвейере данных Опубликовано Dativa, 17 апреля 2018 г.
- ^ «ВВЕДЕНИЕ В ХЕШ-ФУНКЦИЮ КАК МЕТОД ПСЕВДОНИМИЗАЦИИ ПЕРСОНАЛЬНЫХ ДАННЫХ» (PDF) .
- ^ «Ваши данные были« анонимными »? Эти ученые все еще могут идентифицировать вас» .
- ^ "Attm (TA) 28857-06-17 Ассоциация медицинских сестер против Министерства обороны" .
- ^ «Данные могут быть получены из-за устаревшего израильского закона о конфиденциальности, - заявляет аналитический центр» .
дальнейшее чтение
- Рагхунатан, Баладжи (июнь 2013 г.). Полная книга по анонимизации данных: от планирования до реализации . CRC Press. ISBN 9781482218565.
- Халед Эль-Эмам , Лук Арбакл (август 2014 г.). Анонимизация данных о здоровье: примеры из практики и методы для начала работы . O'Reilly Media. ISBN 978-1-4493-6307-9.
- Рольф Х. Вебер, Ульрике И. Генрих (2012). Анонимизация: SpringerBriefs по кибербезопасности . Springer. ISBN 9781447140665.
- Арис Гкулалас-Диванис, Григориос Лукидес (2012). Анонимизация электронных медицинских записей для поддержки клинического анализа (SpringerBriefs в области электротехники и вычислительной техники) . Springer. ISBN 9781461456674.
- Пит Уорден. «Почему вы не можете анонимизировать свои данные» . O'Reilly Media, Inc. Архивировано из оригинала 9 января 2014 года . Проверено 17 января 2014 года .
Внешние ссылки
- об анонимизации интернет-трафика: список чтения для обмена данными и анонимизации