Слияние данных - это процесс интеграции нескольких источников данных для получения более согласованной, точной и полезной информации, чем та, которая предоставляется любым отдельным источником данных.
Процессы слияния данных часто делятся на низкие, промежуточные или высокие, в зависимости от стадии обработки, на которой происходит слияние. [1] Низкоуровневое слияние данных объединяет несколько источников необработанных данных для создания новых необработанных данных. Ожидается, что объединенные данные будут более информативными и синтетическими, чем исходные входные данные.
Например, объединение датчиков также известно как объединение данных (нескольких датчиков) и является подмножеством объединения данных .
Концепция слияния данных проистекает из развитой способности людей и животных вбирать информацию от различных органов чувств для улучшения их способности к выживанию. Например, сочетание зрения, осязания, запаха и вкуса может указывать на то, съедобно ли вещество. [2]
Модель JDL / DFIG [ править ]
В середине 1980-х годов совместные директора лабораторий сформировали субпанель Data Fusion (которая позже стала известна как Data Fusion Group). С появлением всемирной паутины слияние данных, таким образом, включало слияние данных, датчиков и информации. JDL / DFIG представил модель слияния данных, которая разделяет различные процессы. В настоящее время шесть уровней модели Data Fusion Information Group (DFIG):
Уровень 0: предварительная обработка источника (или оценка данных )
Уровень 1: Оценка объекта
Уровень 2: Оценка ситуации
Уровень 3: Оценка воздействия (или уточнение угрозы )
Уровень 4: Уточнение процесса (или управление ресурсами )
Уровень 5: Уточнение пользователя (или когнитивное уточнение )
Уровень 6: уточнение миссии (или управление миссией )
Хотя модель JDL (уровни 1–4) все еще используется сегодня, ее часто критикуют за то, что уровни обязательно происходят по порядку, а также за отсутствие адекватного представления о потенциале человека в цикле. . Модель DFIG (уровень 0–5) исследовала последствия осведомленности о ситуации, уточнения пользователя и управления миссией. [3] Несмотря на эти недостатки, модели JDL / DFIG полезны для визуализации процесса объединения данных, облегчения обсуждения и общего понимания [4] и важны для проектирования объединения информации на системном уровне. [3] [5]
Геопространственные приложения [ править ]
В геопространственной ( ГИС ) области слияние данных часто является синонимом интеграции данных . В этих приложениях часто возникает необходимость объединить различные наборы данных в единый (объединенный) набор данных, который включает все точки данных и временные шаги из входных наборов данных. Объединенный набор данных отличается от простого комбинированного расширенного набора тем, что точки в объединенном наборе данных содержат атрибуты и метаданные, которые, возможно, не были включены для этих точек в исходный набор данных.
Упрощенный пример этого процесса показан ниже, где набор данных «α» объединен с набором данных β, чтобы сформировать объединенный набор данных δ. Точки данных в наборе «α» имеют пространственные координаты X и Y и атрибуты A1 и A2. Точки данных в наборе β имеют пространственные координаты X и Y и атрибуты B1 и B2. Объединенный набор данных содержит все точки и атрибуты.
Набор входных данных α | Набор входных данных β | Объединенный набор данных δ | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
|
|
|
В простом случае, когда все атрибуты единообразны во всей области анализа, атрибуты могут быть просто назначены: M ?, N ?, Q ?, R? на M, N, Q, R. В реальном приложении атрибуты не являются единообразными, и обычно требуется некоторый тип интерполяции, чтобы правильно назначить атрибуты точкам данных в объединенном наборе.
В гораздо более сложном приложении, исследователи морские животных используют синтез данных для объединения данных отслеживания животных с батиметрическом , метеорологическое , температурой поверхности моря(SST) и данные о среде обитания животных для изучения и понимания использования среды обитания и поведения животных в ответ на внешние факторы, такие как погода или температура воды. Каждый из этих наборов данных демонстрирует разную пространственную сетку и частоту дискретизации, поэтому простая комбинация, вероятно, создаст ошибочные предположения и испортит результаты анализа. Но с помощью объединения данных все данные и атрибуты объединяются в единое представление, в котором создается более полная картина среды. Это позволяет ученым определять ключевые места и время и формировать новые представления о взаимодействиях между окружающей средой и поведением животных.
На рисунке справа изучаются скальные омары у побережья Тасмании. Хью Педерсон из Университета Тасмании использовал программное обеспечение для объединения данных, чтобы объединить данные отслеживания южных скальных омаров (окрашенные желтым и черным цветом для дня и ночи соответственно) с данными батиметрии и среды обитания, чтобы создать уникальную четырехмерную картину поведения скального омара.
Интеграция данных [ править ]
В приложениях за пределами геопространственной области применяются различия в использовании терминов « Интеграция данных» и «Объединение данных». В таких областях, как бизнес-аналитика, например, интеграция данных используется для описания объединения данных, тогда как объединение данных - это интеграция с последующим сокращением или заменой. Интеграцию данных можно рассматривать как комбинацию наборов, в которой сохраняется более крупный набор, тогда как слияние - это метод сокращения набора с повышенной достоверностью.
Области применения [ править ]
- Биоинформатика
- Биометрия
- Бизнес-аналитика
- Управление эффективностью бизнеса
- Хеминформатика
- Количественная взаимосвязь структура-активность
- Наука открытия
- Системы геопространственной информации
- Разведывательные службы
- Интеллектуальные транспортные системы
- Дисконтная карта
- Океанография
- Картографирование почвы
- Беспроводные сенсорные сети
Из нескольких способов определения трафика [ править ]
Данные от различных сенсорных технологий могут быть объединены интеллектуальными способами для точного определения состояния трафика. Подход, основанный на слиянии данных, который использует собранные на обочине дороги акустические данные, изображения и данные датчиков, показал, что объединяет преимущества различных индивидуальных методов. [6]
Слияние решений [ править ]
Во многих случаях географически рассредоточенные датчики сильно ограничены по энергии и полосе пропускания. Поэтому необработанные данные, относящиеся к определенному явлению, часто суммируются в нескольких битах от каждого датчика. При выводе на основе двоичного события (т. Е. Или ) в крайнем случае только двоичные решения отправляются от датчиков в Центр объединения решений (DFC) и объединяются, чтобы получить улучшенные характеристики классификации. [7] [8] [9]
Для лучшего понимания контекста [ править ]
Благодаря множеству встроенных датчиков, включая датчик движения, датчик окружающей среды, датчик положения, современное мобильное устройство обычно предоставляет мобильным приложениям доступ к ряду сенсорных данных, которые можно использовать для повышения контекстной осведомленности. Использование методов обработки сигналов и объединения данных, таких как создание функций, технико-экономическое обоснование и анализ главных компонентов (PCA), такие сенсорные данные значительно улучшат положительную скорость классификации движения и контекстуально релевантного состояния устройства. [10] Многие методы контекстной информации предоставлены Snidaro, et al. [11] [12]
См. Также [ править ]
- Ассимиляция данных
- Изменение данных
- Слияние изображений
- Информационная интеграция
- Интегративный уровень
- Мета-анализ
- Слияние датчиков
Ссылки [ править ]
- Перейти ↑ Klein, Lawrence A. (2004). Слияние датчиков и данных: инструмент для оценки информации и принятия решений . SPIE Press. п. 51. ISBN 978-0-8194-5435-5.
- ^ Холл, Дэвид L .; Ллинас, Джеймс (1997). «Введение в слияние мультисенсорных данных» . Труды IEEE . 85 (1): 6–23. DOI : 10.1109 / 5.554205 . ISSN 0018-9219 .
- ^ a b Blasch, Эрик П .; Bossé, Éloi; Ламберт, Дейл А. (2012). Управление объединением информации высокого уровня и проектирование систем . Норвуд, Массачусетс: Издательство Artech House. ISBN 978-1-6080-7151-7.
- ^ Лиггинс, Мартин Э .; Холл, Дэвид Л .; Ллинас, Джеймс (2008). Слияние мультисенсорных данных, второе издание: теория и практика (слияние мультисенсорных данных) . CRC. ISBN 978-1-4200-5308-1.
- ^ Blasch, E., Steinberg, A., Das, S., Llinas, J., Chong, C.-Y., Kessler, O., Waltz, E., White, F. "(2013). Возвращаясь к Модель JDL для эксплуатации информации // Международная конференция по слиянию информации.CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Джоши, В., Rajamani, Н., Такаюки, К., Prathapaneni, Субраманьям, Л. В. (2013). Обучение, основанное на синтезе информации, для определения состояния экономичного трафика . Материалы двадцать третьей международной совместной конференции по искусственному интеллекту.CS1 maint: несколько имен: список авторов ( ссылка )
- ^ Ciuonzo, D .; Папа, G .; Romano, G .; Salvo Rossi, P .; Уиллетт, П. (1 сентября 2013 г.). «Однобитовое децентрализованное обнаружение с помощью теста Рао для мультисенсорного слияния». Письма об обработке сигналов IEEE . 20 (9): 861–864. arXiv : 1306.6141 . Bibcode : 2013ISPL ... 20..861C . DOI : 10,1109 / LSP.2013.2271847 . ISSN 1070-9908 . S2CID 6315906 .
- ^ Ciuonzo, D .; Сальво Росси, П. (2014-02-01). «Слияние решений с неизвестной вероятностью обнаружения датчика». Письма об обработке сигналов IEEE . 21 (2): 208–212. arXiv : 1312.2227 . Bibcode : 2014ISPL ... 21..208C . DOI : 10,1109 / LSP.2013.2295054 . ISSN 1070-9908 . S2CID 8761982 .
- ^ Ciuonzo, D .; De Maio, A .; Сальво Росси, П. (01.09.2015). «Систематическая основа для комплексной проверки гипотез независимых испытаний Бернулли». Письма об обработке сигналов IEEE . 22 (9): 1249–1253. Bibcode : 2015ISPL ... 22.1249C . DOI : 10,1109 / LSP.2015.2395811 . ISSN 1070-9908 . S2CID 15503268 .
- ^ Guiry, Джон Дж .; ван де Вен, Пепейн; Нельсон, Джон (21 марта 2014 г.). «Слияние нескольких датчиков для повышения контекстной осведомленности о повседневных действиях с повсеместными устройствами» . Датчики . 14 (3): 5687–5701. DOI : 10.3390 / s140305687 . PMC 4004015 . PMID 24662406 .
- ^ Снидаро, Лаурао; и другие. (2016). Слияние информации с расширенным контекстом: повышение производительности в реальном мире с помощью знаний предметной области . Швейцария, AG: Springer. ISBN 978-3-319-28971-7.
- ^ Haghighat, Мохаммед; Абдель-Мотталеб, Мохамед; Алхалаби, Уэди (2016). «Дискриминантный корреляционный анализ: слияние уровней функций в реальном времени для мультимодального биометрического распознавания» . IEEE Transactions по информационной криминалистике и безопасности . 11 (9): 1984–1996. DOI : 10.1109 / TIFS.2016.2569061 . S2CID 15624506 .
Источники [ править ]
- Общие ссылки
- Холл, Дэйв Л .; Ллинас, Джеймс (1997). «Введение в слияние мультисенсорных данных». Труды IEEE . 85 (1): 6–23. DOI : 10.1109 / 5.554205 .
- Блаш, Эрик; Кадар, Иван; Салерно, Джон; Kokar, Mieczyslaw M .; Дас, Субрата; Пауэлл, Джеральд М .; Corkill, Daniel D .; Руспини, Энрике Х. (2006). «Проблемы и трудности в оценке ситуации (уровень 2 слияние)» (PDF) . Журнал достижений в области слияния информации . 1 (2). Архивировано из оригинального (PDF) 27 мая 2015 года.
Библиография [ править ]
- Холл, Дэвид Л .; Макмаллен, Соня А.Х. (2004). Математические методы в слиянии мультисенсорных данных, второе издание . Норвуд, Массачусетс: ISBN Artech House, Inc. 978-1-5805-3335-5.
- Митчелл, HB (2007). Объединение данных с несколькими датчиками - Введение . Берлин: Springer-Verlag. ISBN 978-3-540-71463-7.
- Дас, С. (2008). Слияние данных высокого уровня . Норвуд, Массачусетс: Издательство Artech House. ISBN 978-1-59693-281-4.
Внешние ссылки [ править ]
Найдите объединение данных в Викисловаре, бесплатном словаре. |
- Дискриминантный корреляционный анализ (DCA)
- Sensordata Fusion, Введение
- Международное общество слияния информации
- Sensor Fusion для нанопозиционирования