Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Данные исчерпания или исчерпания данных - это след данных, оставленных действиями пользователей Интернета или других компьютерных систем во время их онлайн-активности, поведения и транзакций. Это часть более широкой категории нетрадиционных данных [1], которая включает геопространственные, сетевые данные и данные временных рядов и может быть полезна для прогнозной аналитики . Каждый посещенный веб-сайт, нажатие ссылки и даже наведение курсора мыши собираются, оставляя за собой след данных. [2] Создается огромное количество часто сырых данных, которые могут быть в форме файлов cookie , временных файлов, файлов журнала , сохраняемых вариантов и т. Д. [3]Эта информация может помочь улучшить работу в сети, например, с помощью настраиваемого контента. Его можно использовать для улучшения отслеживания тенденций, а изучение исчерпания данных также улучшает пользовательский интерфейс и дизайн макета. С другой стороны, они также могут поставить под угрозу конфиденциальность, поскольку предлагают ценную информацию о привычках пользователя. Например, самый популярный в мире веб-сайт Google использует эти данные для уточнения прогнозной ценности своих продуктов. [4]

Данные, которые собирают компании, часто представляют собой информацию, которая сразу не кажется полезной. Хотя информация не используется компанией сразу, она может быть сохранена для использования в будущем или продана кому-то другому, кто может использовать эту информацию. Эти данные могут помочь в контроле качества, производительности и доходов. [5]

В отличие от основного контента, эти данные не создаются целенаправленно пользователем, который часто не подозревает о самом их существовании. Банк, например, будет рассматривать в качестве первичных данных информацию о суммах и сторонах транзакции, в то время как вторичные данные могут включать процент транзакций, выполненных в банкомате, а не в реальном банке. [6]

Медицинские выхлопные данные [ править ]

Большинство медицинских устройств излучают данные о выхлопе в той или иной форме, например, многие кардиостимуляторы, диализные аппараты и камеры, используемые во время хирургических операций. [7] Большая часть этих данных никогда не фиксируется и в основном удаляется после завершения операции или выполнения следующей плановой проверки устройством. Некоторые проблемы возникли в связи с использованием данных, полученных с помощью таких устройств, как кардиостимуляторы. Это может привести к большим проблемам, связанным с использованием данных выхлопных газов. [8] Использование электронных медицинских карт (ЭМИ) для исследований создает большое количество проблем, наиболее распространенной из которых является объем имеющихся данных. Этот избыток данных слишком велик для того, чтобы люди могли сортировать и анализировать, что создает потребность в алгоритмах . [9]

Решения [ править ]

Хотя вытяжка данных не является новой концепцией, в современном мире она играет гораздо большую роль. Развитие технологий привело к увеличению объема данных. Сбор и распространение этих данных не является незаконным, но необходимо предпринять определенные шаги для обеспечения этичного использования этих данных. Чтобы обеспечить безопасность пользователей, при продаже информация может оставаться анонимной. Кроме того, пользователям может быть предоставлена ​​возможность отказаться от продажи своей информации, если они захотят. Наконец, чтобы избежать каких-либо негативных коннотаций, веб-сайты могут обновлять свои политики конфиденциальности, чтобы они включали все данные, которые они будут собирать о пользователе. [10]

Ссылки [ править ]

  1. ^ «Что такое нетрадиционные данные? - Определение из глоссария ЕС» . Проверено 28 апреля 2019 .
  2. ^ Kosciejew, M. (2013). Индивидуальные и большие данные. Фелиситер , 59 (6), 47
  3. ^ «Что такое Data Exhaust? - Определение из Техопедии» . Techopedia.com . Проверено 1 ноября 2018 .
  4. ^ Zuboff, Shoshana (2015). «Большой другой: капитализм слежки и перспективы информационной цивилизации». Журнал информационных технологий . 30 : 75–89. DOI : 10.1057 / jit.2015.5 . S2CID 15329793 . 
  5. ^ «Что такое исчерпание данных и что с этим делать?» . www.datasciencecentral.com . Проверено 1 ноября 2018 .
  6. ^ «5 вещей, которые вам нужно знать об утечке данных» .
  7. ^ Роб, Китчин (2014-08-26). Революция данных: большие данные, открытые данные, инфраструктуры данных и их последствия . Лос-Анджелес, Калифорния. ISBN 978-1446287484. OCLC  871211376 .
  8. ^ «Наши медицинские данные должны стать бесплатными» . ПРОВОДНОЙ . Проверено 12 октября 2017 .
  9. ^ «Медицинские данные повсюду: проблема отходов - AI Med» . AI Med . 2018-05-09 . Проверено 1 ноября 2018 .
  10. ^ «Работа с исчерпанием данных. - Бесплатная онлайн-библиотека» . www.thefreelibrary.com . Проверено 1 ноября 2018 .