Многосторонний анализ данных - это метод анализа больших наборов данных путем представления данных в виде многомерного массива . Правильный выбор размеров массива и методов анализа может выявить закономерности в базовых данных, не обнаруженные другими методами. [1]
История
Исследование многостороннего анализа данных было впервые формализовано в результате конференции, состоявшейся в 1988 году. Результатом этой конференции стал первый текст, специально адресованный этой области, - Многосторонний анализ данных Коппи и Боласко . [2] В то время области применения многостороннего анализа включали статистику , эконометрику и психометрию . В последние годы приложения расширились и стали включать хемометрию , сельское хозяйство , анализ социальных сетей и пищевую промышленность . [3]
Состав многостороннего анализа данных
Многосторонние данные
Аналитики данных Multiway используют термин « способ» для обозначения измерения данных, оставляя слово « режим» для методов или моделей, используемых для анализа данных. [2] : xviii
В этом смысле мы можем определить различные способы анализа данных:
- Односторонние данные - это вектор с одним значением данных для каждого дискретного или непрерывного значения одного измерения.
- Двусторонние данные - это матрица с одним значением данных для каждого дискретного или непрерывного значения двух отдельных измерений; таблицы могут быть использованы для визуализации таких данных в случае дискретных размеров.
- Трехсторонние данные можно рассматривать как стек матриц (или, аналогично, как книгу из нескольких электронных таблиц ), добавляя третье измерение. Такие данные могут представлять температуру в разных местах (двусторонние данные), взятые за разное время (третье измерение, приводящее к трехсторонним данным).
- Четырехсторонние данные , используя ту же аналогию с электронными таблицами, могут быть представлены как файловая папка, заполненная отдельными книгами.
- Пятисторонние и шестисторонние данные могут быть представлены аналогичным образом более высокими уровнями агрегирования данных.
В общем, несколько измерений, представленных в наборе данных, могут быть измерены в разное время или в разных местах с использованием разных методологий и могут содержать несоответствия, такие как отсутствующие данные или расхождения в представлении данных.
Многосторонняя модель
Многостороннее приложение
Многосторонний анализ данных может использоваться в различных многосторонних приложениях для решения проблемы обнаружения скрытой полилинейной структуры в многосторонних наборах данных. Ниже приведены примеры приложений в различных областях: [4]
- Компьютерное зрение
- Электроаналитическая химия
- Неврология
- Анализ процесса
- Анализ социальных сетей / веб-майнинг
Многосторонняя обработка
Многосторонняя обработка - это выполнение спроектированной и определенной многосторонней модели (моделей), преобразующей многосторонние данные до желаемого уровня путем удовлетворения конкретных потребностей конкретного многостороннего приложения. Типичный пример данных, созданных с помощью потенциометрического электронного языка, иллюстрирует соответствующую многостороннюю обработку. [5]
Смотрите также
Рекомендации
- ^ Coppi, R .; Боласко, С., ред. (1989). Многосторонний анализ данных . Амстердам: Северная Голландия. ISBN 9780444874108.
- ^ а б Крооненберг, Питер М. (2008). Прикладной многосторонний анализ данных . Серия Уайли по вероятности и статистике. 702 . Джон Вили и сыновья. п. XV. ISBN 9780470237991.
- ^ Бро, Расмус (20 ноября 1998 г.). Многосторонний анализ в пищевой промышленности: модели, алгоритмы и приложения (PDF) (кандидатская диссертация). Амстердамский университет .
- ^ Акар, Эврим; Йенер, Бюлент. Неконтролируемый многосторонний анализ данных: обзор литературы (PDF) (Диссертация). Политехнический институт Ренсселера .
- ^ Cartas, Рауль; Мимендия, Айтор; Легин, Андрей; дель Валле, Манель (2011). «Многосторонняя обработка данных, генерируемых с помощью потенциометрического электронного языка в системе SIA». Электроанализ . 23 (4): 953–961. DOI : 10.1002 / elan.201000642 .