Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

В ориентированного на соединение , A поток данных представляет собой последовательность кодированных в цифровом виде когерентных сигналов ( пакетов из данных или пакетов данных ) , используемых для передачи или получать информацию , которая находится в процессе передачи. [1] Поток данных - это набор информации, извлеченной от поставщика данных. [2] Он содержит необработанные данные, которые были собраны из поведения пользователей в браузере на веб-сайтах, где размещен специальный пиксель. Потоки данных полезны для специалистов по обработке данных для больших данных и искусственного интеллекта.поставка алгоритмов. Основными поставщиками потоков данных являются компании, занимающиеся информационными технологиями .

Формальное определение [ править ]

Формально поток данных - это любая упорядоченная пара, в которой:

  1. представляет собой последовательность из кортежей и
  2. представляет собой последовательность положительных интервалов реального времени .

Содержание [ править ]

Поток данных содержит разные наборы данных, которые зависят от выбранного формата данных.

  • Атрибуты - каждый атрибут [3] потока данных представляет определенный тип данных, например идентификатор сегмента / точки данных, отметку времени, геоданные.
  • Атрибут отметки времени помогает определить, когда произошло событие.
  • Идентификатор субъекта - это кодированный алгоритмом идентификатор, извлеченный из файла cookie.
  • Необработанные данные включают информацию прямо от поставщика данных без обработки ни алгоритмом, ни человеком.
  • Обработанные данные - это данные, которые были подготовлены [4] (каким-то образом изменены, проверены или очищены) для использования в будущих действиях.

Использование [ править ]

Существуют различные области, в которых используются потоки данных:

  • Обнаружение и оценка мошенничества - необработанные данные используются в качестве исходных данных для алгоритма борьбы с мошенничеством ( методы анализа данных для обнаружения мошенничества ). Например, временная метка или количество появлений файлов cookie или анализ точек данных используются в системе оценки для обнаружения мошенничества или для того, чтобы убедиться, что получатель сообщения не является ботом (так называемый трафик, не связанный с людьми [5] ).
  • Искусственный интеллект - необработанные данные обрабатываются как набор поездов и набор тестов присоздании алгоритмов искусственного интеллекта и машинного обучения .
  • Необработанные данные используются для профилирования и персонализации, чтобы настроить профили пользователей [6] и разделить их для сегментации, например, по полу или местоположению (на основе точки данных ).
  • Бизнес-аналитика - необработанные данные - это источник информации для систем бизнес-аналитики , используемый для обогащения профилей пользователей подробной информацией о них, например, путем покупки или геоданными. Эта информация используется для бизнес-анализа и прогнозных исследований.
  • Таргетинг - данные, обработанные специалистами по данным, улучшают онлайн-кампании и используются для охвата целевой аудитории. [7]
  • CRM Enrichment - необработанные данные интегрированы с системой управления взаимоотношениями с клиентами . Интеграция CRM позволяет заполнить пробелы в профилях пользователей демографическими данными, интересами или покупательскими намерениями.

Интеграция [ править ]

Основные интеграции с потоками данных:

  • Потоки данных интегрированы с такими системами, как платформа данных о клиентах (CDP), управление взаимоотношениями с клиентами (CRM) или платформа управления данными (DMP) для обогащения профилей пользователей внешними данными. Можно расширить знания о существующих пользователях, используя внешние источники. [8]
  • Потоки данных используются, чтобы обогатить системы бизнес-аналитики и сделать анализ более точным, а выводы - более точными.
  • В случае интеграции системы управления контентом (CMS) поток данных используется для идентификации пользователей и персонализации их посещения, даже если это их первый визит. Благодаря анализу данных фактическое содержание веб-сайта адаптируется к пользователю.
  • Потоки данных интегрированы с платформой спроса (DSP) в экосистеме программной рекламы. Стороны (например, рекламодатели) могут обмениваться идентификаторами пользователей и объединять с ними существующие профили.
  • Потоки данных используются для выбора соответствующих сегментов пользователей (например, людей, интересующихся автомобильной промышленностью) и использования их в онлайн-кампании. Сегменты обогащаются дополнительными пользовательскими характеристиками из потока данных и затем отправляются в DSP.

Источники данных видны [ править ]

В потоке данных видно, какое устройство использовалось на стороне пользователя - это видно в пользовательском агенте :

  • мобильный - когда пользователь использует мобильный браузер для исследования, у него узкое разрешение экрана и версия мобильного приложения соответственно;
  • рабочий стол - когда пользователь использует настольный браузер или версию приложения.

Следующая информация передается об используемом устройстве:

  • Фактический URL-адрес посещенного веб-сайта, на котором произошло событие
  • Пользовательский агент
  • Геолокация
  • Интернет-протокол (IP)

Форматы [ править ]

Точка данных - это тег, который собирает информацию об определенном действии, выполняемом пользователем на веб-сайте. Точки данных существуют двух типов, значения которых используются для создания соответствующих аудиторий. Это:

  • "событие" с информацией о наступлении определенного события (например, нажатие на ссылку или показ рекламы)
  • "атрибут" с числовыми или буквенно-цифровыми значениями.

Сегмент - это логический оператор, построенный на определенных точках данных с использованием операторов AND, OR или NOT. [9]
Гибридные данные - необработанные данные из форматов данных точки и сегмента. [10]
URL-адреса - это набор информации о конкретном URL-адресе , который был посещен.

GDPR [ править ]

Информация, собираемая с веб-сайтов, основана на поведении пользователей. Поставщики данных предоставляют как личную, так и неличную информацию. В потоке данных доступны два типа пользовательских данных:

  • Персональные данные (PII) , - информация , которая позволяет четко или путем комбинирования с методами идентификации данных идентификации личности. Примеры PII: страховой идентификатор, адрес электронной почты, номер телефона, IP-адрес , геолокация, биометрические данные . [11]
  • Non-личная информация (не PII) является информацией , которая не может быть использована для идентификации личности или для отслеживания местоположения. Файл cookie или идентификатор устройства - это пример не-PII.

Заметки [ править ]

  1. ^ "Поток данных Федерального стандарта 1037C " . Архивировано 13 апреля 2007 года . Проверено 4 апреля 2007 года .
  2. ^ «Поток данных» . techopedia.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  3. ^ «Атрибут» . businessdictionary.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  4. ^ "Что представляет собой обработка данных?" . ec.europa.eu . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  5. ^ "Нечеловеческое движение [NHT]" . theonlineadvertisingguide.com . Архивировано 13 августа 2017 года . Проверено 24 апреля 2019 года .
  6. ^ «ПОВЕДЕНЧЕСКОЕ ПРОФИЛИРОВАНИЕ И ПЕРСОНАЛИЗАЦИЯ: ПЕРВЫЙ ОПЫТ КЛИЕНТА» . selligent.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  7. ^ «Что такое таргетинг - значение» . selligent.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  8. ^ «Что такое поток данных и как его использовать» . OnAudience.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  9. ^ «6 типов сегментации пользователей и их значение для вашего продукта» . uxdesign.cc .
  10. ^ «Что такое гибридное управление данными» . ibm.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .
  11. ^ «Что такое личная информация (PII)? Как защитить ее в соответствии с GDPR» . csoonline.com . Архивировано 24 апреля 2019 года . Проверено 24 апреля 2019 года .

Ссылки [ править ]

  • Ха, Энтони. «Lotame предлагает« разложенный »подход к продаже инструментов обработки данных» . techcrunch.com .
  • «Необработанные данные (исходные данные или атомарные данные)» . searchdatamanagement.techtarget.com .
  • Аллея, Гаррет. "Что такое потоковая передача данных?" . alooma.com .
  • «КАК ИСПОЛЬЗОВАТЬ ПЕРЕДАЧУ ДАННЫХ ДЛЯ БОЛЬШИХ ДАННЫХ» . dummies.com .
  • «Лотаме запускает поток данных» . destinationcrm.com .
  • Перера, Шринатх. «Нежное введение в потоковую обработку» . medium.com .