Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В прикладной математике , топологический анализ данных ( ТД ) представляет собой подход к анализу наборов данных с использованием методов из топологии . Извлечение информации из многомерных, неполных и зашумленных наборов данных, как правило, является сложной задачей. TDA обеспечивает общую основу для анализа таких данных способом, который нечувствителен к конкретной выбранной метрике, и обеспечивает снижение размерности и устойчивость к шуму. Помимо этого, он наследует функториальность , фундаментальную концепцию современной математики, от ее топологической природы, что позволяет ей адаптироваться к новым математическим инструментам.

Первоначальная мотивация - изучить форму данных. TDA объединила алгебраическую топологию и другие инструменты чистой математики, чтобы обеспечить математически строгое изучение «формы». Главный инструмент - постоянная гомология , адаптация гомологии к данным облака точек . Устойчивая гомология применяется ко многим типам данных во многих областях. Более того, ее математическая основа имеет еще и теоретическое значение. Уникальные особенности TDA делают его многообещающим мостом между топологией и геометрией.

Основная теория [ править ]

Интуиция [ править ]

Предпосылка, лежащая в основе TDA, заключается в том, что форма имеет значение. Реальные данные в больших размерах почти всегда разрежены и, как правило, имеют релевантные особенности малых размеров. Одна из задач TDA - дать точную характеристику этого факта. Наглядным примером является простая система хищник-жертва, управляемая уравнениями Лотки – Вольтерра . [1] Легко заметить, что траектория системы образует замкнутый круг в пространстве состояний. TDA предоставляет инструменты для обнаружения и количественной оценки такого повторяющегося движения. [2]

Многие алгоритмы анализа данных, в том числе используемые в TDA, требуют выбора различных параметров. Без предварительного знания предметной области трудно выбрать правильный набор параметров для набора данных. Основная идея стойкой гомологиив том, что мы можем использовать информацию, полученную из всех значений параметра. Конечно, одно только это понимание сделать легко; сложная часть - это кодирование этого огромного количества информации в понятной и простой для представления форме. С TDA есть математическая интерпретация, когда информация является группой гомологии. В общем, предполагается, что функции, которые сохраняются для широкого диапазона параметров, являются «истинными» функциями. Предполагается, что особенности, сохраняющиеся только для узкого диапазона параметров, являются шумом, хотя теоретическое обоснование этого неясно. [3]

Ранняя история [ править ]

Предшественники полной концепции стойкой гомологии со временем появлялись постепенно. [4] В 1990 году Патрицио Фрозини ввел функцию размера, которая эквивалентна 0-й постоянной гомологии. [5] Спустя почти десять лет Ванесса Робинс изучала образы гомоморфизмов, индуцированных включением. [6] Наконец, вскоре после этого Edelsbrunner et al. представил концепцию устойчивой гомологии вместе с эффективным алгоритмом и его визуализацией в виде диаграммы устойчивости. [7] Карлссон и др. переформулировал первоначальное определение и дал эквивалентный метод визуализации, называемый штрих-кодами персистентности [8], интерпретирующий персистентность на языке коммутативной алгебры. [9]Инвариант штрих-кода эквивалентен канонической форме, введенной Баранниковым в 1996 году для изучения теории Морса. [10]

Концепции [ править ]

Ниже представлены некоторые широко используемые концепции. Обратите внимание, что некоторые определения могут отличаться от автора к автору.

Точка помутнения часто определяется как конечное множество точек в некотором евклидовом пространстве, но можно принять любое конечное метрическое пространство.

Комплекс Чех точечного облака является нервом из крышки шаров фиксированного радиуса вокруг каждой точки в облаке.

Модуль персистентности, индексированный с помощью, является векторным пространством для каждого и линейной картой всякий раз , так что для всех и всякий раз [11] Эквивалентное определение - это функтор, рассматриваемый как частично упорядоченное множество, в категорию векторных пространств.

Постоянная группа гомологии точечного облака модуль устойчивости определяется как , где это Чех комплекс радиуса облака точек и является группой гомологии.

Сохранение штрих - кода является мультимножеством интервалов в , а диаграмма , устойчивость является мультимножеством точек ( ).

Вассерстин расстояние между двумя персистенции диаграмм и определяется как

где и колеблется в пределах биекций между и . Пожалуйста, обратитесь к рисунку 3.1 у Мунка [12] для иллюстрации.

Расстояние узкого места между и является

Это частный случай дистанции Вассерштейна .

Базовое свойство [ править ]

Структурная теорема [ править ]

Первая классификационная теорема для стойких гомологий появилась в 1994 г. [10] через канонические формы Баранникова. Классификационная теорема, интерпретирующая настойчивость на языке коммутативной алгебры, появилась в 2005 г .: [9] для конечно порожденного модуля персистентности с полевыми коэффициентами,

Интуитивно, свободные части соответствуют генераторам гомологии, которые появляются на уровне фильтрации и никогда не исчезают, в то время как торсионные части соответствуют тем, которые появляются на уровне фильтрации и сохраняются на этапах фильтрации (или, что то же самое, исчезают на уровне фильтрации ). [10]

Устойчивая гомология визуализируется с помощью штрих-кода или диаграммы устойчивости. Штрих-код уходит корнями в абстрактную математику. А именно, категория конечных фильтрованных комплексов над полем полупроста. Любой фильтрованный комплекс изоморфен своей канонической форме, прямой сумме одномерных и двумерных простых фильтрованных комплексов.

Стабильность [ править ]

Стабильность желательна, поскольку она обеспечивает устойчивость к шуму. Если - любое пространство, гомеоморфное симплициальному комплексу и являющееся непрерывными ручными [13] функциями, то векторные пространства персистентности и конечно представлены, и , где относится к расстоянию узкого места [14] и является отображением, принимающим непрерывное ручное к диаграмме персистентности ее -й гомологии.

Рабочий процесс [ править ]

Основной рабочий процесс в TDA: [15]

  1. Если это облако точек, замените его вложенным семейством симплициальных комплексов (например, комплекс Чеха или Виеториса-Рипса). Этот процесс превращает облако точек в фильтрацию симплициальных комплексов. Взятие гомологии каждого комплекса в этой фильтрации дает модуль персистентности
  2. Примените теорему о структуре, чтобы получить параметризованную версию числа Бетти , диаграммы устойчивости или, что эквивалентно, штрих-кода.

Графически говоря,

Обычное использование настойчивости в TDA [16]

Вычисление [ править ]

Первый алгоритм по всем полям для устойчивых гомологий в алгебраической топологии был описан Баранниковым [10] путем приведения к канонической форме верхнетреугольными матрицами. Первый алгоритм устойчивой гомологии был предложен Edelsbrunner et al. [7] Зомородиан и Карлссон дали первый практический алгоритм для вычисления устойчивых гомологий по всем полям. [9] Книга Эдельсбруннера и Харера дает общее руководство по вычислительной топологии. [17]

Одна из проблем, возникающих при вычислениях, - это выбор комплекса. Чех комплекс и Виторис-рипы комплекс являются наиболее естественным на первый взгляд; однако их размер быстро растет с увеличением количества точек данных. Комплекс Виеториса – Рипса предпочтительнее комплекса Чеха, потому что его определение проще, а комплекс Чеха требует дополнительных усилий для определения в общем конечном метрическом пространстве. Были изучены эффективные способы снизить вычислительные затраты на гомологию. Например, α-комплекс и комплекс-свидетель используются для уменьшения размера и размера комплексов. [18]

Недавно дискретная теория Морса показала многообещающие возможности для вычислительной гомологии, поскольку она может свести данный симплициальный комплекс к гораздо меньшему клеточному комплексу, который гомотопен исходному. [19] Это сокращение фактически может быть выполнено, поскольку комплекс построен с использованием теории матроидов , что приведет к дальнейшему увеличению производительности. [20] Другой недавний алгоритм экономит время, игнорируя классы гомологии с низкой персистентностью. [21]

Доступны различные программные пакеты, такие как javaPlex , Dionysus , Perseus , PHAT , DIPHA , GUDHI , Ripser и TDAstats . Сравнение этих инструментов выполнено Otter et al. [22] Giotto-tda - это пакет Python, предназначенный для интеграции TDA в рабочий процесс машинного обучения с помощью API scikit-learn . TDA пакета R может рассчитывать недавно изобретенные концепции, такие как ландшафт и оценка расстояния между ядрами. [23] Набор инструментов топологииспециализируется на непрерывных данных, определенных на множествах низкой размерности (1, 2 или 3), что обычно встречается в научной визуализации . Другой пакет R, TDAstats , реализует быструю библиотеку C ++ Ripser для вычисления постоянной гомологии. [24] Он также использует вездесущий пакет ggplot2 для создания воспроизводимых, настраиваемых, качественных для публикации визуализаций постоянной гомологии, в частности топологических штрих-кодов и диаграмм устойчивости. В приведенном ниже примере кода дается пример того, как можно использовать язык программирования R для вычисления постоянной гомологии.

# установить пакет из CRAN и загрузить наборы данных install.packages ( "TDAstats" ) library ( "TDAstats" ) data ( "unif2d" ) data ( "circle2d" )# вычислить постоянную гомологию для обоих наборов данных unif.phom  <-  calculate_homology ( unif2d ) circ.phom  <-  calculate_homology ( circle2d )# построить равномерно распределенное облако точек как диаграмму устойчивости plot_persist ( unif.phom )# построить облако точек круга как топологический штрих-код # мы видим одну постоянную полосу, как и ожидалось для круга (один цикл / цикл) plot_barcode ( circ.phom )
Диаграмма устойчивости, созданная с помощью образца кода (unif.2d dataset) для набора из 100 точек, равномерно распределенных в двумерном единичном квадрате. Ни один из 0-циклов или 1-циклов не считается истинным сигналом (в действительности ни один из них не существует в пределах облака единичных квадратных точек). Хотя некоторые функции, кажется, сохраняются, отметки на оси показывают, что наиболее стойкая функция сохраняется менее чем на 0,20 единиц, что относительно мало для облака точек на единичном квадрате.
Топологический штрих-код, созданный с помощью образца кода (набор данных circ.2d) для набора из 100 точек, равномерно распределенных по окружности круга. Одиночный длинный одномерный элемент в верхней части штрих-кода представляет собой единственный 1-цикл, присутствующий в круге.

Визуализация [ править ]

Данные большого размера невозможно визуализировать напрямую. Было изобретено множество методов для извлечения низкоразмерной структуры из набора данных, таких как анализ главных компонентов и многомерное масштабирование . [25] Однако важно отметить, что сама проблема некорректна, поскольку в одном и том же наборе данных можно найти множество различных топологических характеристик. Таким образом, изучение визуализации многомерных пространств имеет центральное значение для TDA, хотя оно не обязательно предполагает использование устойчивых гомологий. Однако в последнее время были предприняты попытки использовать постоянную гомологию при визуализации данных. [26]

Карлссон и др. предложили общий метод под названием MAPPER . [27] Он наследует идею Серра о том, что покрытие сохраняет гомотопию. [28] Обобщенная формулировка MAPPER выглядит следующим образом:

Позвольте и быть топологическими пространствами и позвольте быть непрерывным отображением. Позвольте быть конечным открытым покрытием . Выход MAPPER - это нерв откатной крышки , где каждый прообраз разделяется на связанные компоненты. [26] Это очень общая концепция, частными случаями которой являются граф Риба [29] и деревья слияния.

Это не совсем исходное определение. [27] Карлссон и др. выберите быть или и накройте его открытыми множествами, пересекающимися не более чем двумя. [3] Это ограничение означает, что выходные данные имеют форму сложной сети . Поскольку топология конечного облака точек тривиальна, методы кластеризации (например, одиночная связь ) используются для создания аналога связанных наборов в прообразе, когда MAPPER применяется к фактическим данным.

С математической точки зрения MAPPER - это разновидность графа Риба . Если самое большее одномерно, то для каждого ,

[30] Дополнительная гибкость также имеет недостатки. Одной из проблем является нестабильность, поскольку некоторое изменение выбора покрытия может привести к значительному изменению вывода алгоритма. [31] Была проделана работа по преодолению этой проблемы. [26]

Три успешных применения MAPPER можно найти в Carlsson et al. [32] Комментарий Дж. Карри к приложениям в этой статье состоит в том, что «общая черта, представляющая интерес в приложениях, - это наличие бликов или усиков». [33]

Бесплатная реализация MAPPER доступна в Интернете, написанная Даниэлем Мюлнером и Аравиндакшаном Бабу. MAPPER также составляет основу платформы AI Ayasdi .

Многомерная настойчивость [ править ]

Для TDA важна многомерная настойчивость. Эта концепция возникает как в теории, так и на практике. Первое исследование многомерной устойчивости было проведено на ранней стадии разработки TDA [34] и является одной из основополагающих документов TDA. [9] Первое приложение, появившееся в литературе, - это метод сравнения форм, аналогичный изобретению TDA. [35]

Определение п - мерного модуля сохранения состояния в это [33]

  • векторное пространство назначается каждой точке в
  • карта присваивается, если (
  • карты удовлетворяют для всех

Возможно, стоит отметить, что существуют разногласия по поводу определения многомерной устойчивости. [33]

Одним из преимуществ одномерного постоянства является его представление в виде диаграммы или штрих-кода. Однако дискретных полных инвариантов многомерных модулей персистентности не существует. [36] Основная причина этого заключается в том, что структура набора неразложимых чрезвычайно усложняется теоремой Габриэля в теории колчановых представлений [37], хотя конечно n-мерный модуль сохранения может быть однозначно разложен в прямую сумму неразложимы по теореме Крулля-Шмидта. [38]

Тем не менее, многие результаты были получены. Карлссон и Зомородиан ввели ранговый инвариант , определенный как , в котором есть конечно порожденный n-градуированный модуль. В одном измерении он эквивалентен штрих-коду. В литературе ранговый инвариант часто называют постоянными числами Бетти (PBN). [17] Во многих теоретических работах авторы использовали более ограниченное определение, аналог персистентности подуровневого множества. В частности, сохранение числа Бетти функции задаются с помощью функции , принимая каждый к , где и .

Некоторые основные свойства включают монотонность и диагональный скачок. [39] Стойкие числа Бетти будут конечными, если является компактным и локально стягиваемым подпространством . [40]

Используя метод слоения, k-тусклые PBN можно разложить на семейство одномерных PBN с помощью вывода размерности. [41] Этот метод также привел к доказательству устойчивости многомерных PBN. [42] Разрывы PBN возникают только в точках, где либо является точкой разрыва, либо точкой разрыва в предположении, что и является компактным триангулируемым топологическим пространством. [43]

Постоянное пространство, обобщение устойчивой диаграммы, определяется как мультимножество всех точек с кратностью больше 0 и диагональю. [44] Он обеспечивает стабильное и полное представление PBN. Текущая работа Carlsson et al. пытается дать геометрическую интерпретацию устойчивой гомологии, которая может дать представление о том, как объединить теорию машинного обучения с топологическим анализом данных. [45]

Первый практический алгоритм вычисления многомерной персистентности был изобретен очень рано. [46] После этого было предложено множество других алгоритмов, основанных на таких концепциях, как дискретная теория Морса [47] и оценка по конечной выборке. [48]

Прочие настойчивости [ править ]

Стандартная парадигма в TDA часто называется настойчивостью на подуровне . Помимо многомерной персистентности, было сделано много работ, чтобы расширить этот частный случай.

Зигзагообразное упорство [ править ]

Ненулевые отображения в модуле сохраняемости ограничиваются отношением предварительного порядка в категории. Однако математики пришли к выводу, что единодушие направления не является существенным для многих результатов. «Философский момент состоит в том, что теория декомпозиции представлений графов в некоторой степени не зависит от ориентации ребер графа». [49] Настойчивость зигзага важна с теоретической стороны. Все примеры, приведенные в обзорной статье Карлссона, чтобы проиллюстрировать важность функциональности, имеют некоторые общие черты. [3]

Расширенная настойчивость и настойчивость уровней [ править ]

Некоторые попытки - это потерять более строгое ограничение функции. [50] Дополнительную информацию см. В разделах « Категоризация, связки и влияние на математику» .

Естественно распространить гомологию персистентности на другие базовые понятия алгебраической топологии, такие как когомологии и относительные гомологии / когомологии. [51] Интересным приложением является вычисление круговых координат для набора данных через первую постоянную группу когомологий. [52]

Круговая настойчивость [ править ]

Гомология нормальной персистентности изучает функции с действительными значениями. Кругозначная карта может быть полезной, «теория постоянства для кругозначных карт обещает сыграть роль для некоторых векторных полей, как и стандартная теория стойкости для скалярных полей», как прокомментировали D. Burghelea et al. [53] Основное отличие состоит в том, что жордановы клетки (очень похожие по формату на жордановы блоки в линейной алгебре) нетривиальны для кругозначных функций, которые были бы равны нулю в вещественном случае, а комбинация со штрих-кодами дает инварианты ручная карта в умеренных условиях. [53]

Они используют два метода: теория Морса-Новикова [54] и теория представлений графов. [55] Более свежие результаты можно найти у D. Burghelea et al. [56] Например, требование приручения может быть заменено более слабым условием - непрерывным.

Стойкость при кручении [ править ]

Доказательство структурной теоремы основывается на том, что базовая область является полем, поэтому было сделано не так много попыток гомологии персистентности с кручением. Фрозини определил псевдометрию на этом конкретном модуле и доказал ее устойчивость. [57] Одно из новшеств в том, что определение метрики не зависит от какой-либо теории классификации. [58]

Категоризация и связки [ править ]

Одним из преимуществ теории категорий является ее способность поднимать конкретные результаты на более высокий уровень, показывая отношения между кажущимися несвязанными объектами. Бубеник и др. [59] предлагает краткое введение в теорию категорий, подходящую для TDA.

Теория категорий - это язык современной алгебры, который широко используется при изучении алгебраической геометрии и топологии. Было отмечено, что «ключевое наблюдение [9] состоит в том, что диаграмма устойчивости, созданная в [7], зависит только от алгебраической структуры, которую несет эта диаграмма». [60] Использование теории категорий в TDA оказалось плодотворным. [59] [60]

После обозначения , сделанное в Bubenik и др., [60] категория индексации является любым предупорядоченным множеством (не обязательно или ), целевая категорией является любой категорией (вместо обычно используется ), и функторы называются обобщены устойчивостью модулей в , над .

Одним из преимуществ использования теории категорий в TDA является более четкое понимание концепций и открытие новых отношений между доказательствами. Для иллюстрации возьмем два примера. Понимание соответствия между перемежением и сопоставлением имеет огромное значение, поскольку сопоставление было методом, используемым вначале (измененным из теории Морса). Краткое изложение работ можно найти в Vin de Silva et al. [61] Многие теоремы гораздо легче доказать в более интуитивной обстановке. [58] Другой пример - взаимосвязь между построением различных комплексов из облаков точек. Давно замечено родство комплексов Чеха и Виеториса-Рипса. В частности, . [62]Существенную взаимосвязь между комплексами Чеха и Рипса можно гораздо яснее увидеть на категориальном языке. [61]

Язык теории категорий также помогает формулировать результаты в терминах, понятных более широкому математическому сообществу. Расстояние до узкого места широко используется в TDA из-за результатов стабильности по отношению к расстоянию до узкого места. [11] [14] Фактически, расстояние перемежения - это конечный объект в ч.у. категории стабильных метрик на многомерных модулях персистентности в простом поле . [58] [63]

Пучки , центральное понятие в современной алгебраической геометрии , неразрывно связаны с теорией категорий. Грубо говоря, связки - это математический инструмент для понимания того, как локальная информация определяет глобальную информацию. Джастин Карри рассматривает постоянство набора уровней как исследование волокон непрерывных функций. Объекты, которые он изучает, очень похожи на объекты MAPPER, но с теорией пучков в качестве теоретической основы. [33] Хотя в теории пучков еще не было прорыва в теории TDA, это многообещающе, поскольку в алгебраической геометрии есть много красивых теорем, относящихся к теории пучков. Например, естественный теоретический вопрос заключается в том, приводят ли разные методы фильтрации к одному и тому же результату.[64]

Стабильность [ править ]

Стабильность имеет решающее значение для анализа данных, поскольку реальные данные содержат шумы. Используя теорию категорий, Бубеник и др. различали теоремы о мягкой и жесткой устойчивости и доказали, что мягкие случаи формальны. [60] В частности, общий рабочий процесс TDA

Теорема о мягкой устойчивости утверждает, что это липшицево , а теорема о жесткой устойчивости утверждает, что это липшицево.

Расстояние узкого места широко используется в TDA. Теорема изометрии утверждает, что расстояние чередования равно расстоянию до узкого места. [58] Бубеник и др. абстрагировали определение до определения между функторами, когда оно оснащено сублинейной проекцией, или надлинейным семейством, в котором все еще остается псевдометрическим. [60] Рассматривая великолепные символы расстояния перемежения, [65] здесь мы вводим общее определение расстояния перемежения (вместо первого введенного): [11] Пусть (функция от до, которая является монотонной и удовлетворяет всем ). А-перемежение между F и G состоит из естественных преобразований и , таких что и .

Два основных результата: [60]

  • Позвольте быть предварительно упорядоченным набором с сублинейной проекцией или суперлинейным семейством. Позвольте быть функтором между произвольными категориями . Тогда для любых двух функторов имеем .
  • Позвольте быть ч.у. метрического пространства , быть топологическим пространством. И пусть (не обязательно непрерывными) будут функции, и будет соответствующая диаграмма устойчивости. Тогда .

Эти два результата суммируют многие результаты по стабильности различных моделей персистентности.

Для получения информации о теореме устойчивости многомерной персистентности обратитесь к подразделу о настойчивости.

Структурная теорема [ править ]

Структурная теорема имеет центральное значение для TDA; как прокомментировал Дж. Карлссон, «то, что делает гомологии полезными в качестве дискриминатора между топологическими пространствами, - это факт наличия классификационной теоремы для конечно порожденных абелевых групп». [3] (см. Основную теорему о конечно порожденных абелевых группах ).

Основным аргументом, используемым при доказательстве исходной структурной теоремы, является стандартная структурная теорема для конечно порожденных модулей над областью главных идеалов . [9] Однако этот аргумент не работает, если установлен индексный набор . [3]

В общем, не каждый модуль сохраняемости можно разложить на интервалы. [66] Было сделано много попыток ослабить ограничения исходной структурной теоремы. [ требуется пояснение ] Случай для поточечных конечномерных модулей персистентности, индексированных локально конечным подмножеством, решен на основе работы Уэбба. [67] Наиболее заметный результат получен Кроули-Бови, который решил случай . Теорема Кроули-Бови утверждает, что любой поточечно конечномерный модуль персистентности является прямой суммой интервальных модулей. [68]

Чтобы понять определение его теоремы, необходимо ввести некоторые понятия. Интервал в определяется как подмножество , обладающего свойством , что если и , если есть такие , что , то , как хорошо. Модуль интервалов назначает каждому элементу векторное пространство и присваивает нулевое векторное пространство элементам в нем . Все карты являются нулевыми, если только и , в этом случае, не являются тождественными. [33] Интервальные модули неразложимы. [69]

Хотя результат Кроули-Бови является очень сильной теоремой, он все же не распространяется на случай q-tame. [66] Модуль персистентности q-ручной, если ранг модуля конечен для всех . Есть примеры q-ручных модулей персистентности, которые не могут быть поточечно конечными. [70] Однако оказывается, что аналогичная структурная теорема все еще остается в силе, если признаки, существующие только для одного значения индекса, удалены. [69] Это верно, потому что бесконечномерные части при каждом значении индекса не сохраняются из-за условия конечного ранга. [71] Формально наблюдаемая категория определяется как , в котором обозначает полную подкатегориючьи объекты являются эфемерными модулями ( когда бы то ни было ). [69]

Обратите внимание, что расширенные результаты, перечисленные здесь, не применимы к зигзагообразной персистентности, поскольку аналог модуля зигзагообразной стойкости не сразу очевиден.

Статистика [ править ]

Реальные данные всегда конечны, поэтому их изучение требует от нас учета стохастичности. Статистический анализ дает нам возможность отделить истинные характеристики данных от артефактов, вызванных случайным шумом. Стойкая гомология не имеет внутреннего механизма, позволяющего различать признаки с низкой вероятностью и признаки с высокой вероятностью.

Один из способов применения статистики к анализу топологических данных - изучение статистических свойств топологических характеристик облаков точек. Изучение случайных симплициальных комплексов дает некоторое представление о статистической топологии. K. Turner et al. [72] предлагает резюме работы в этом ключе.

Второй способ - изучить распределения вероятностей в постоянном пространстве. Пространство сохранения есть , где - пространство всех штрих-кодов, содержащих ровно интервалы, а эквивалентности - если . [73] Это пространство довольно сложно; например, он не является полным по метрике «узкое место». Первая попытка его изучения сделана Ю. Милейко и соавт. [74] Пространство диаграмм устойчивости в их статье определяется как

где - диагональная линия в . Приятным свойством является то, что в метрике Вассерштейна она полна и отделима . Ожидание, дисперсия и условная вероятность могут быть определены в смысле Фреше . Это позволяет перенести на TDA многие статистические инструменты. Работы по испытанию значимости нулевой гипотезы , [75] доверительные интервалы , [76] и надежные оценки [77] заметные шаги.

Третий способ - это непосредственно рассматривать когомологии вероятностного пространства или статистических систем, которые называются информационными структурами и в основном состоят из тройки ( ), пространства выборки, случайных величин и вероятностных законов. [78] [79] Случайные величины рассматриваются как разбиения n атомных вероятностей (рассматриваемых как вероятностный (n-1) -симплекс ) на решетке разбиений (). Случайные величины или модули измеримых функций обеспечивают коцепные комплексы, в то время как кограница рассматривается как общая гомологическая алгебра, впервые обнаруженная Хохшильдом с левым действием, реализующим действие обусловливания. Первое условие коцикла соответствует цепному правилу энтропии, позволяющему однозначно с точностью до мультипликативной константы получить энтропию Шеннона как первый класс когомологий. Рассмотрение деформированного левого действия обобщает структуру энтропии Тсаллиса. Информационные когомологии - это пример окольцованных топосов. Многомерный k - Взаимная информация появляется в выражениях кограниц, и их обращение в нуль, связанное с условием коцикла, дает эквивалентные условия для статистической независимости. [80]Минимумы взаимной информации, также называемые синергизмом, порождают интересные конфигурации независимости, аналогичные гомотопическим связям. Из-за его комбинаторной сложности на данных был исследован только симплициальный подслучай когомологий и информационной структуры. Применительно к данным эти когомологические инструменты количественно определяют статистические зависимости и независимость, включая цепи Маркова и условную независимость , в многомерном случае. [81] Примечательно, что взаимная информация обобщает коэффициент корреляции и ковариациюнелинейным статистическим зависимостям. Эти подходы были разработаны независимо и лишь косвенно связаны с методами персистентности, но могут быть примерно поняты в симплициальном случае с помощью теоремы Ху Куо Тина, которая устанавливает взаимно однозначное соответствие между функциями взаимной информации и конечной измеримой функцией множества с оператором пересечения. , чтобы построить сложный каркас Чеха . Информационная когомология предлагает некоторую прямую интерпретацию и применение с точки зрения нейробиологии (теория нейронной сборки и качественное познание [82] ), статистической физики и глубокой нейронной сети, для которых структура и алгоритм обучения определяются комплексом случайных величин и информационной цепочкой. правило. [83]

Пейзажи персистентности, представленные Питером Бубеником, представляют собой другой способ представления штрих-кодов, более поддающийся статистическому анализу. [84] сохранение ландшафта из стойкого модуля определяется как функция , , где обозначает расширенную реальную линию и . Пространство ландшафтов персистентности очень хорошее: оно наследует все хорошие свойства представления штрих-кода (стабильность, простота представления и т. Д.), Но статистические величины могут быть легко определены, и некоторые проблемы в работе Ю. Милейко и др., Такие как как неединственность ожиданий, [74] можно преодолеть. Доступны эффективные алгоритмы вычислений с персистентными ландшафтами. [85]Другой подход заключается в использовании измененной персистентности, то есть сохраняемости образа, ядра и коядра. [86]

Приложения [ править ]

Классификация приложений [ править ]

Существует несколько способов классификации приложений TDA. Пожалуй, самый естественный способ - по полю. Очень неполный список успешных приложений включает [87] скелетирование данных, [88] изучение формы, [89] реконструкцию графа, [90] [91] [92] [93] [94] анализ изображений, [95] [96] материал, [97] анализ развития болезни, [98] [99] сенсорная сеть, [62] анализ сигналов, [100] космическая паутина, [101] сложная сеть, [102] [103] [104] [105]фрактальная геометрия, [106] вирусная эволюция, [107] распространение инфекций в сетях, [108] классификация бактерий с использованием молекулярной спектроскопии, [109] гиперспектральная визуализация в физической химии [110] и дистанционное зондирование. [111]

Другой способ - выделить методы Дж. Карлссона [73]

один из них - изучение гомологических инвариантов данных, отдельных наборов данных, а другой - использование гомологических инвариантов при изучении баз данных, где сами точки данных имеют геометрическую структуру.

Характеристики ТДА в приложениях [ править ]

В последних приложениях TDA есть несколько примечательных интересных особенностей:

  1. Объединение инструментов из нескольких разделов математики . Помимо очевидной потребности в алгебре и топологии, в TDA нашли применение уравнения в частных производных, [112] алгебраическая геометрия, [36] теория представлений, [49] статистика, комбинаторика и риманова геометрия [71] .
  2. Количественный анализ . Топология считается очень мягкой, поскольку многие понятия инвариантны относительно гомотопии. Тем не менее, постоянная топология способна регистрировать рождение (появление) и смерть (исчезновение) топологических объектов, поэтому в нее встраивается дополнительная геометрическая информация. Одним из теоретических доказательств является частично положительный результат об уникальности восстановления кривых; [113] два из них касаются количественного анализа стабильности фуллерена и количественного анализа самоподобия отдельно. [106] [114]
  3. Роль непродолжительной настойчивости . Кратковременная настойчивость также оказалась полезной, несмотря на распространенное мнение, что причиной этого явления является шум. [115] Это интересно с математической теорией.

Одна из основных областей анализа данных сегодня - машинное обучение . Некоторые примеры машинного обучения в TDA можно найти в Adcock et al. [116] конференция посвящена связи между TDA и машинного обучения. Чтобы применить инструменты машинного обучения, информация, полученная из TDA, должна быть представлена ​​в векторной форме. Постоянная и многообещающая попытка - это описанный выше ландшафт настойчивости. Другая попытка использует концепцию постоянства изображений. [117] Однако одной из проблем этого метода является потеря устойчивости, поскольку теорема о жесткой устойчивости зависит от представления штрих-кода.

Влияние на математику [ править ]

Топологический анализ данных и стойкая гомология оказали влияние на теорию Морса . Теория Морса сыграла очень важную роль в теории ТДА, в том числе в области вычислений. Некоторые работы в области устойчивых гомологий расширили результаты о функциях Морса для приручения функций или даже для непрерывных функций. Забытый результат Р. Деёвеля задолго до изобретения стойких гомологий распространяет теорию Морса на все непрерывные функции. [118]

Один из недавних результатов состоит в том, что категория графов Риба эквивалентна определенному классу пучков. [119] Это мотивировано теоретической работой в TDA, поскольку граф Риба связан с теорией Морса, а MAPPER является производным от нее. Доказательство этой теоремы опирается на расстояние перемежения.

Стойкая гомология тесно связана со спектральными последовательностями . [120] [121] В частности, алгоритм, приводящий отфильтрованный комплекс к его канонической форме [10], позволяет гораздо быстрее вычислять спектральные последовательности, чем стандартная процедура вычисления групп постранично. Сохранение зигзага может иметь теоретическое значение для спектральных последовательностей.

См. Также [ править ]

  • Снижение размерности
  • Сбор данных
  • Компьютерное зрение
  • Вычислительная топология
  • Дискретная теория Морса
  • Анализ формы (цифровая геометрия)
  • Теория размеров
  • Алгебраическая топология

Ссылки [ править ]

  1. ^ Эпштейн, Чарльз ; Карлссон, Гуннар ; Эдельсбруннер, Герберт (01.12.2011). «Топологический анализ данных». Обратные задачи . 27 (12): 120201. arXiv : 1609.08227 . Bibcode : 2011InvPr..27a0101E . DOI : 10.1088 / 0266-5611 / 27/12/120201 .
  2. ^ "diva-portal.org/smash/record.jsf?pid=diva2%253A575329&dswid=4297" . www.diva-portal.org . Архивировано из оригинального 19 ноября 2015 года . Проверено 5 ноября 2015 .
  3. ^ a b c d e Карлссон, Гуннар (01.01.2009). «Топология и данные» . Бюллетень Американского математического общества . 46 (2): 255–308. DOI : 10.1090 / S0273-0979-09-01249-X . ISSN 0273-0979 . 
  4. ^ Эдельсбруннер Х. Устойчивая гомология: теория и практика [J]. 2014 г.
  5. ^ Frosini, Патрицио (1990-12-01). «Расстояние для классов подобия подмногообразий евклидова пространства» . Бюллетень Австралийского математического общества . 42 (3): 407–415. DOI : 10.1017 / S0004972700028574 . ISSN 1755-1633 . 
  6. ^ Робинс V . К вычислению гомологий по конечным приближениям [C] // Материалы топологии. 1999, 24 (1): 503-532.
  7. ^ a b c Эдельсбруннер; Летчер; Зомородян (01.11.2002). «Топологическая устойчивость и упрощение» . Дискретная и вычислительная геометрия . 28 (4): 511–533. DOI : 10.1007 / s00454-002-2885-2 . ISSN 0179-5376 . 
  8. ^ Карлссон, Гуннар; Зомородян, Афра; Коллинз, Энн; Гибас, Леонидас Дж. (01.12.2005). «Штрих-коды стойкости для фигур». Международный журнал моделирования форм . 11 (2): 149–187. CiteSeerX 10.1.1.5.2718 . DOI : 10.1142 / S0218654305000761 . ISSN 0218-6543 .  
  9. ^ a b c d e f Зомородян, Афра; Карлссон, Гуннар (19 ноября 2004 г.). «Вычисление стойких гомологий» . Дискретная и вычислительная геометрия . 33 (2): 249–274. DOI : 10.1007 / s00454-004-1146-у . ISSN 0179-5376 . 
  10. ^ a b c d e Баранников, Сергей (1994). «Обрамленный комплекс Морса и его инварианты» . Успехи советской математики . 21 : 93–115.
  11. ^ a b c Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Глисс, Марк; Guibas, Leonidas J .; Удот, Стив Ю. (1 января 2009 г.). Близость модулей персистентности и их диаграммы . Материалы двадцать пятого ежегодного симпозиума по вычислительной геометрии . SCG '09. Нью-Йорк, Нью-Йорк, США: ACM. С. 237–246. CiteSeerX 10.1.1.473.2112 . DOI : 10.1145 / 1542362.1542407 . ISBN  978-1-60558-501-7. S2CID  840484 .
  12. ^ Мунк Э. Приложения устойчивой гомологии к системам, меняющимся во времени [D]. Университет Дьюка, 2013.
  13. ^ Шихман, Владимир (2011). Топологические аспекты негладкой оптимизации . Springer Science & Business Media. С. 169–170. ISBN 9781461418979. Проверено 22 ноября 2017 года .
  14. ^ а б Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (12 декабря 2006 г.). «Диаграммы устойчивости» . Дискретная и вычислительная геометрия . 37 (1): 103–120. DOI : 10.1007 / s00454-006-1276-5 . ISSN 0179-5376 . 
  15. ^ Ghrist, Роберт (2008-01-01). «Штрих-коды: постоянная топология данных» . Бюллетень Американского математического общества . 45 (1): 61–75. DOI : 10.1090 / S0273-0979-07-01191-3 . ISSN 0273-0979 . 
  16. ^ Шазаль, Фредерик; Глисс, Марк; Лабрюер, Катрин; Мишель, Бертран (27 мая 2013 г.). «Оптимальные скорости сходимости для диаграмм устойчивости в топологическом анализе данных». arXiv : 1305.6239 [ math.ST ].
  17. ^ a b Эдельсбруннер, Герберт; Харер, Джон (01.01.2010). Вычислительная топология: введение . American Mathematical Soc. ISBN 9780821849255.
  18. ^ Де Сильва, Вин; Карлссон, Гуннар (01.01.2004). Топологическое оценивание с использованием комплексов свидетелей . Труды Первой конференции Eurographics по точечной графике . СПБГ'04. Эр-ла-Виль, Швейцария, Швейцария: Еврографическая ассоциация. С. 157–166. DOI : 10.2312 / SPBG / SPBG04 / 157-166 . ISBN 978-3-905673-09-8.
  19. ^ Мишайков, Константин; Нанда, Видит (27 июля 2013 г.). "Теория Морса для фильтрации и эффективного вычисления стойких гомологий" . Дискретная и вычислительная геометрия . 50 (2): 330–353. DOI : 10.1007 / s00454-013-9529-6 . ISSN 0179-5376 . 
  20. ^ Хенсельман, Грегори; Грист, Роберт (1 июня 2016 г.). "Матроидные фильтрации и вычислительные стойкие гомологии". arXiv : 1606.00199 . Bibcode : 2016arXiv160600199H . Cite journal requires |journal= (help)
  21. ^ Чен, Чао; Кербер, Майкл (01.05.2013). «Чувствительный к выходу алгоритм для постоянной гомологии» . Вычислительная геометрия . 27-й ежегодный симпозиум по вычислительной геометрии (SoCG 2011). 46 (4): 435–447. DOI : 10.1016 / j.comgeo.2012.02.010 .
  22. Выдра, Нина; Портер, Мейсон А .; Тилльманн, Ульрике; Гриндрод, Питер; Харрингтон, Хизер А. (2015-06-29). «Дорожная карта для вычисления устойчивой гомологии» . EPJ Data Science . 6 (1): 17. arXiv : 1506.08903 . Bibcode : 2015arXiv150608903O . DOI : 10,1140 / epjds / s13688-017-0109-5 . PMC 6979512 . PMID 32025466 .  
  23. ^ Fasy, Бретань Terese; Ким, Джису; Леччи, Фабрицио; Мария, Клеман (07.11.2014). «Введение в пакет R TDA». arXiv : 1411.1830 [ cs.MS ].
  24. ^ Вадхва, Рауль; Уильямсон, Дрю; Дхаван, Эндрю; Скотт, Джейкоб (2018). «TDAstats: R конвейер для вычисления устойчивой гомологии в топологическом анализе данных» . Журнал открытого программного обеспечения . 3 (28): 860. Полномочный код : 2018JOSS .... 3..860R . DOI : 10,21105 / joss.00860 .
  25. ^ Лю S, Maljovec D, Wang B и др. Визуализация многомерных данных: достижения за последнее десятилетие [J].
  26. ^ a b c Дей, Тамал К .; Мемоли, Факундо; Ван, Юсу (2015-04-14). «Mutiscale Mapper: основа для топологического обобщения данных и карт». arXiv : 1504.03763 [ cs.CG ].
  27. ^ a b «Превышен предел загрузки». CiteSeerX 10.1.1.161.8956 .  Cite journal requires |journal= (help)
  28. ^ Ботт, Рауль; Ту, Лоринг В. (2013-04-17). Дифференциальные формы в алгебраической топологии . Springer Science & Business Media. ISBN 978-1-4757-3951-0.
  29. ^ Паскуччи, Valerio; Скорцелли, Джорджио; Бремер, Пер-Тимо; Маскареньяс, Аджит (2007). «Надежное онлайн-вычисление графиков Риба: простота и скорость» . Транзакции ACM на графике . 33 : 58.1–58.9. DOI : 10.1145 / 1275808.1276449 .
  30. ^ Карри, Джастин (2013-03-13). «Пучки, пучки и аппликации». arXiv : 1303,3255 [ math.AT ].
  31. ^ Лю, Сюй; Се, Чжэн; Йи, Донъюнь (01.01.2012). «Быстрый алгоритм построения топологической структуры больших данных» . Гомологии, гомотопии и приложения . 14 (1): 221–238. DOI : 10.4310 / hha.2012.v14.n1.a11 . ISSN 1532-0073 . 
  32. ^ Lum, PY; Singh, G .; Lehman, A .; Ишканов, Т .; Vejdemo-Johansson, M .; Alagappan, M .; Carlsson, J .; Карлссон, Г. (07.02.2013). «Извлечение информации из формы сложных данных с использованием топологии» . Научные отчеты . 3 : 1236. Bibcode : 2013NatSR ... 3E1236L . DOI : 10.1038 / srep01236 . PMC 3566620 . PMID 23393618 .  
  33. ^ a b c d e Карри, Джастин (2014-11-03). «Топологический анализ данных и косчевы». arXiv : 1411.0613 [ math.AT ].
  34. ^ Frosini P, Mulazzani M. Гомотопические группы размера для вычисления расстояний естественного размера [J]. Бюллетень Бельгийского математического общества Саймон Стевин, 1999, 6 (3): 455-464.
  35. ^ Biasotti, S .; Cerri, A .; Frosini, P .; Георгий, Д .; Ланди, К. (17 мая 2008 г.). «Функции многомерного размера для сравнения форм». Журнал математической визуализации и зрения . 32 (2): 161–179. DOI : 10.1007 / s10851-008-0096-Z . ISSN 0924-9907 . S2CID 13372132 .  
  36. ^ a b Карлссон, Гуннар; Зомородян, Афра (24.04.2009). «Теория многомерной персистентности» . Дискретная и вычислительная геометрия . 42 (1): 71–93. DOI : 10.1007 / s00454-009-9176-0 . ISSN 0179-5376 . 
  37. ^ Дерксен Х., Вейман Дж. Представления колчана [J]. Уведомления AMS, 2005, 52 (2): 200-206.
  38. ^ Atiyah M F. О теореме Крулля-Шмидта в применении к пучкам [J]. Бюллетень математического общества Франции, 1956, 84: 307-317.
  39. ^ Cerri A, Di Fabio B, Ferri M и др. Многомерные стойкие гомологии стабильны [J]. arXiv : 0908.0064 , 2009.
  40. ^ Кальяри, Франческа; Ланди, Клаудия (2011-04-01). «Конечность ранговых инвариантов многомерных стойких групп гомологий». Письма по прикладной математике . 24 (4): 516–518. arXiv : 1001.0358 . DOI : 10.1016 / j.aml.2010.11.004 . S2CID 14337220 . 
  41. ^ Кальяри, Франческа; Ди Фабио, Барбара; Ферри, Массимо (01.01.2010). «Одномерная редукция многомерных стойких гомологий». Труды Американского математического общества . 138 (8): 3003–3017. arXiv : math / 0702713 . DOI : 10.1090 / S0002-9939-10-10312-8 . ISSN 0002-9939 . S2CID 18284958 .  
  42. ^ Cerri, Андреа; Фабио, Барбара Ди; Ферри, Массимо; Фрозини, Патрицио; Ланди, Клаудия (1 августа 2013 г.). «Числа Бетти в многомерных стойких гомологиях являются стабильными функциями» . Математические методы в прикладных науках . 36 (12): 1543–1557. Bibcode : 2013MMAS ... 36.1543C . DOI : 10.1002 / mma.2704 . ISSN 1099-1476 . 
  43. ^ Cerri, Андреа; Фрозини, Патрицио (2015-03-15). «Необходимые условия разрывов многомерных персистентных чисел Бетти». Математические методы в прикладных науках . 38 (4): 617–629. Bibcode : 2015MMAS ... 38..617C . DOI : 10.1002 / mma.3093 . ISSN 1099-1476 . 
  44. ^ Cerri, Андреа; Ланди, Клаудия (2013-03-20). Гонсалес-Диас, Росио; Хименес, Мария-Хосе; Медрано, Белен (ред.). Пространство персистентности в многомерных персистентных гомологиях . Конспект лекций по информатике. Springer Berlin Heidelberg. С. 180–191. DOI : 10.1007 / 978-3-642-37067-0_16 . ISBN 978-3-642-37066-3.
  45. ^ Skryzalin, Яцек; Карлссон, Гуннар (14 ноября 2014 г.). «Числовые инварианты из многомерной персистентности». arXiv : 1411.4022 [ cs.CG ].
  46. ^ Карлссон, Гуннар; Сингх, Гурджит; Зомородян, Афра (16.12.2009). Дун, Инфэй; Ду, Дин-Чжу; Ибарра, Оскар (ред.). Вычисление многомерной персистентности . Конспект лекций по информатике. Springer Berlin Heidelberg. С. 730–739. CiteSeerX 10.1.1.313.7004 . DOI : 10.1007 / 978-3-642-10631-6_74 . ISBN  978-3-642-10630-9. S2CID  15529723 .
  47. ^ Аллили, Маджид; Качиньский, Томаш; Ланди, Клаудия (30 октября 2013 г.). «Редукционные комплексы в теории многомерных устойчивых гомологий». arXiv : 1310.8089 [ cs.CG ].
  48. ^ Cavazza N, Ferri M, Landi C. Оценка многомерных устойчивых гомологий с помощью конечной выборки [J]. 2010 г.
  49. ^ a b Карлссон, Гуннар; Сильва, Вин де (2010-04-21). «Зигзагообразное упорство» . Основы вычислительной математики . 10 (4): 367–405. DOI : 10.1007 / s10208-010-9066-0 . ISSN 1615-3375 . 
  50. ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон (2008-04-04). «Расширение настойчивости с помощью двойственности Пуанкаре и Лефшеца». Основы вычислительной математики . 9 (1): 79–103. DOI : 10.1007 / s10208-008-9027-Z . ISSN 1615-3375 . S2CID 33297537 .  
  51. ^ де Сильва, Вин; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (2011). «Двойственности в стойких (ко) гомологиях». Обратные задачи . 27 (12): 124003. arXiv : 1107.5665 . Bibcode : 2011InvPr..27l4003D . DOI : 10.1088 / 0266-5611 / 27/12/124003 . S2CID 5706682 . 
  52. ^ Сильва, Вин де; Морозов Дмитрий; Вейдемо-Йоханссон, Микаэль (30 марта 2011 г.). «Постоянные когомологии и круговые координаты». Дискретная и вычислительная геометрия . 45 (4): 737–759. arXiv : 0905.4887 . DOI : 10.1007 / s00454-011-9344-х . ISSN 0179-5376 . S2CID 31480083 .  
  53. ^ a b Burghelea, Дэн; Дей, Тамал К. (2013-04-09). «Топологическая стойкость для кругозначных карт». Дискретная и вычислительная геометрия . 50 (1): 69–98. arXiv : 1104,5646 . DOI : 10.1007 / s00454-013-9497-х . ISSN 0179-5376 . S2CID 17407953 .  
  54. ^ Новиков С. П. Квазипериодические структуры в топологии [C] // Топологические методы в современной математике, Труды симпозиума в честь шестидесятилетия Джона Милнора, проходившего в Государственном университете Нью-Йорка, Стоуни-Брук, Нью-Йорк. 1991: 223-233.
  55. ^ Гросс, Джонатан Л .; Йеллен, Джей (2004-06-02). Справочник по теории графов . CRC Press. ISBN 978-0-203-49020-4.
  56. ^ Burghelea, Дэн; Халлер, Стефан (4 июня 2015 г.). «Топология угловых отображений, штрих-кодов и жордановых блоков». arXiv : 1303.4328 [ math.AT ].
  57. ^ Фрозини, Патрицио (2012-06-23). «Устойчивое сравнение многомерных персистентных групп гомологий с кручением». Acta Applicandae Mathematicae . 124 (1): 43–54. arXiv : 1012.4169 . DOI : 10.1007 / s10440-012-9769-0 . ISSN 0167-8019 . S2CID 4809929 .  
  58. ^ a b c d Лесник, Майкл (2015-03-24). "Теория расстояния перемежения на модулях многомерного постоянства". Основы вычислительной математики . 15 (3): 613–650. arXiv : 1106,5305 . DOI : 10.1007 / s10208-015-9255-у . ISSN 1615-3375 . S2CID 17184609 .  
  59. ^ a b Бубеник, Петр; Скотт, Джонатан А. (28 января 2014 г.). «Категоризация стойких гомологий». Дискретная и вычислительная геометрия . 51 (3): 600–627. arXiv : 1205,3669 . DOI : 10.1007 / s00454-014-9573-х . ISSN 0179-5376 . S2CID 11056619 .  
  60. ^ a b c d e f Бубеник, Питер; Сильва, Вин де; Скотт, Джонатан (09.10.2014). «Метрики для модулей обобщенного постоянства». Основы вычислительной математики . 15 (6): 1501–1531. CiteSeerX 10.1.1.748.3101 . DOI : 10.1007 / s10208-014-9229-5 . ISSN 1615-3375 . S2CID 16351674 .   
  61. ^ а б де Сильва, Вин; Нанда, Видит (01.01.2013). Геометрия в пространстве модулей персистентности . Труды двадцать девятого ежегодного симпозиума по вычислительной геометрии . SoCG '13. Нью-Йорк, Нью-Йорк, США: ACM. С. 397–404. DOI : 10.1145 / 2462356.2462402 . ISBN 978-1-4503-2031-3. S2CID  16326608 .
  62. ^ а б Де Сильва В., Грист Р. Покрытие сенсорных сетей через постоянную гомологию [J]. Алгебраическая и геометрическая топология, 2007, 7 (1): 339-358.
  63. ^ д'Амико, Микеле; Фрозини, Патрицио; Ланди, Клаудия (14 октября 2008 г.). «Естественное псевдо-расстояние и оптимальное соответствие между функциями уменьшенного размера». Acta Applicandae Mathematicae . 109 (2): 527–554. arXiv : 0804.3500 . Bibcode : 2008arXiv0804.3500D . DOI : 10.1007 / s10440-008-9332-1 . ISSN 0167-8019 . S2CID 1704971 .  
  64. ^ Ди Фабио, B .; Фрозини, П. (1 августа 2013 г.). «Фильтрации, индуцированные непрерывными функциями». Топология и ее приложения . 160 (12): 1413–1422. arXiv : 1304.1268 . Bibcode : 2013arXiv1304.1268D . DOI : 10.1016 / j.topol.2013.05.013 . S2CID 13971804 . 
  65. ^ Лесник, Майкл (2012-06-06). «Многомерные перемежения и приложения к топологическому выводу». arXiv : 1206.1365 [ math.AT ].
  66. ^ а б Чазаль, Фредерик; де Сильва, Вин; Глисс, Марк; Удот, Стив (16.07.2012). «Структура и устойчивость модулей персистентности». arXiv : 1207.3674 [ math.AT ].
  67. ^ Уэбб, Кэри (1985-01-01). «Декомпозиция градуированных модулей» . Труды Американского математического общества . 94 (4): 565–571. DOI : 10.1090 / S0002-9939-1985-0792261-6 . ISSN 0002-9939 . 
  68. ^ Кроли-Boevey, Уильям (2015). «Разложение поточечно конечномерных модулей персистентности». Журнал алгебры и ее приложений . 14 (5): 1550066. arXiv : 1210.0819 . DOI : 10.1142 / s0219498815500668 . S2CID 119635797 . 
  69. ^ a b c Чазаль, Фредерик; Кроули-Боеви, Уильям; де Сильва, Вин (2014-05-22). «Наблюдаемая структура модулей персистентности». arXiv : 1405.5644 [ math.RT ].
  70. ^ Дро, Жан-Мари (2012-10-15). «Подмножество евклидова пространства с большими гомологиями Вьеториса-Рипса». arXiv : 1210.4097 [ math.GT ].
  71. ^ a b Вайнбергер С. Что такое ... стойкие гомологии? [J]. Уведомления AMS, 2011, 58 (1): 36-39.
  72. ^ Тернер, Кэтрин; Милейко, Юрий; Мукерджи, Саян; Харер, Джон (12.07.2014). "Средство Фреше для распределений диаграмм постоянства". Дискретная и вычислительная геометрия . 52 (1): 44–70. arXiv : 1206,2790 . DOI : 10.1007 / s00454-014-9604-7 . ISSN 0179-5376 . S2CID 14293062 .  
  73. ^ a b Карлссон, Гуннар (01.05.2014). «Распознавание топологических образов для данных облака точек» . Acta Numerica . 23 : 289–368. DOI : 10.1017 / S0962492914000051 . ISSN 1474-0508 . 
  74. ^ a b Милейко, Юрий; Мукерджи, Саян; Харер, Джон (2011-11-10). «Вероятностные меры на пространстве диаграмм устойчивости» . Обратные задачи . 27 (12): 124007. Bibcode : 2011InvPr..27l4007M . DOI : 10.1088 / 0266-5611 / 27/12/124007 . ISSN 0266-5611 . S2CID 250676 .  
  75. ^ Робинсон, Эндрю; Тернер, Кэтрин (2013-10-28). «Проверка гипотез для анализа топологических данных». arXiv : 1310.7467 [ stat.AP ].
  76. ^ Fasy, Бретань Terese; Леччи, Фабрицио; Ринальдо, Алессандро; Вассерман, Ларри; Балакришнан, Шивараман; Сингх, Арти (01.12.2014). «Наборы уверенности для диаграмм настойчивости» . Летопись статистики . 42 (6): 2301–2339. DOI : 10.1214 / 14-AOS1252 . ISSN 0090-5364 . 
  77. ^ Блумберг, Эндрю Дж .; Гал, Итамар; Mandell, Michael A .; Пансия, Мэтью (15 мая 2014 г.). «Надежная статистика, проверка гипотез и доверительные интервалы для устойчивых гомологий на пространствах метрических мер». Основы вычислительной математики . 14 (4): 745–789. arXiv : 1206.4581 . DOI : 10.1007 / s10208-014-9201-4 . ISSN 1615-3375 . S2CID 17150103 .  
  78. ^ Бодо, Пьер; Беннекен, Даниэль (2015). «Гомологическая природа энтропии» . Энтропия . 17 (5): 3253–3318. Bibcode : 2015Entrp..17.3253B . DOI : 10.3390 / e17053253 .
  79. ^ Виньо, Хуан-Пабло (2019). "Топология статистических систем: когомологический подход к теории информации" (PDF) . Рукопись PHD : 0–226.
  80. ^ Бодо, Пьер; Тапиа, Моника; Беннекен, Даниэль; Гоайяр, Жан-Марк (2019). «Анализ топологической информации» . Энтропия . 21 (9): 881. Bibcode : 2019Entrp..21..881B . DOI : 10.3390 / e21090881 .
  81. ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга» . Научные отчеты . 8 (1): 13637. Bibcode : 2018NatSR ... 813637T . DOI : 10.1038 / s41598-018-31765-Z . PMC 6134142 . PMID 30206240 .  
  82. ^ Бодо, Пьер (2019). «Элементы качественного познания: перспектива информационной топологии». Обзоры физики жизни . 31 : 263–275. arXiv : 1807.04520 . Bibcode : 2019PhLRv..31..263B . DOI : 10.1016 / j.plrev.2019.10.003 . PMID 31679788 . 
  83. ^ Бодо, Пьер (2019). "Машина Пуанкаре-Шеннона: статистическая физика и аспекты машинного обучения информационных когомологий" . Энтропия . 21 (9): 881. Bibcode : 2019Entrp..21..881B . DOI : 10.3390 / e21090881 .
  84. ^ Bubenik, Питер (2012-07-26). «Статистический анализ топологических данных с использованием постоянных ландшафтов». arXiv : 1207.6437 [ math.AT ].
  85. ^ Бубеник, Питер; Длотко, Павел (31.12.2014). «Набор инструментов для топологической статистики». Журнал символических вычислений . 78 : 91–114. arXiv : 1501.00179 . Bibcode : 2015arXiv150100179B . DOI : 10.1016 / j.jsc.2016.03.009 . S2CID 9789489 . 
  86. ^ Коэн-Штайнер, Дэвид; Эдельсбруннер, Герберт; Харер, Джон; Морозов, Дмитрий (2009). Материалы двадцатого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам . С. 1011–1020. CiteSeerX 10.1.1.179.3236 . DOI : 10.1137 / 1.9781611973068.110 . ISBN  978-0-89871-680-1.
  87. ^ Курлин, В. (2015). «Одномерный гомологически стойкий каркас неструктурированного облака точек в любом метрическом пространстве» (PDF) . Форум компьютерной графики (CGF) . 34 (5): 253–262. DOI : 10.1111 / cgf.12713 . S2CID 10610111 .  
  88. ^ Курлин, В. (2014). «Быстрый и надежный алгоритм для подсчета топологически стойких дыр в зашумленных облаках». Конференция IEEE 2014 года по компьютерному зрению и распознаванию образов (PDF) . Конференция IEEE по компьютерному зрению и распознаванию образов . С. 1458–1463. arXiv : 1312.1492 . DOI : 10.1109 / CVPR.2014.189 . ISBN  978-1-4799-5118-5. S2CID  10118087 .
  89. ^ Курлин, В. (2015). «Гомологически стойкий скелет - это быстрый и надежный дескриптор точек интереса в 2D-изображениях». Компьютерный анализ изображений и паттернов (PDF) . Конспект лекций по информатике (Труды CAIP: Computer Analysis of Images and Patterns) . Конспект лекций по информатике. 9256 . С. 606–617. DOI : 10.1007 / 978-3-319-23192-1_51 . ISBN  978-3-319-23191-4.
  90. ^ Cerri, A .; Ferri, M .; Георгий, Д. (01.09.2006). «Получение изображений товарных знаков с помощью функций размера». Графические модели . Специальный выпуск конференции Vision, Video and Graphics 2005. 68 (5–6): 451–471. DOI : 10.1016 / j.gmod.2006.07.001 .
  91. ^ Шазаль, Фредерик; Коэн-Штайнер, Дэвид; Guibas, Leonidas J .; Мемоли, Факундо; Удот, Стив Ю. (1 июля 2009 г.). "Стабильные сигнатуры Громова-Хаусдорфа для форм с использованием персистентности". Форум компьютерной графики . 28 (5): 1393–1403. CiteSeerX 10.1.1.161.9103 . DOI : 10.1111 / j.1467-8659.2009.01516.x . ISSN 1467-8659 . S2CID 8173320 .   
  92. ^ Biasotti, S .; Георгий, Д .; Spagnuolo, M .; Фальцидиено, Б. (01.09.2008). «Размерные функции для сравнения 3D-моделей». Распознавание образов . 41 (9): 2855–2873. DOI : 10.1016 / j.patcog.2008.02.003 .
  93. ^ Li, C .; Овсяников, М .; Чазал, Ф. (2014). «Структурное распознавание на основе постоянства» (PDF) . Конференция IEEE по компьютерному зрению и распознаванию образов .
  94. ^ Тапиа, Моника; др. и др. (2018). «Идентичность нейротрансмиттера и электрофизиологический фенотип генетически связаны в дофаминергических нейронах среднего мозга» . Научные отчеты . 8 (1): 13637. Bibcode : 2018NatSR ... 813637T . DOI : 10.1038 / s41598-018-31765-Z . PMC 6134142 . PMID 30206240 .  
  95. ^ Bendich, P .; Edelsbrunner, H .; Кербер, М. (01.11.2010). «Вычислительная надежность и стойкость изображений». IEEE Transactions по визуализации и компьютерной графике . 16 (6): 1251–1260. CiteSeerX 10.1.1.185.523 . DOI : 10.1109 / TVCG.2010.139 . ISSN 1077-2626 . PMID 20975165 . S2CID 8589124 .    
  96. ^ Карлссон, Гуннар; Ишханов, Тигран; Сильва, Вин де; Зомородян, Афра (30.06.2007). «О локальном поведении пространств природных образов». Международный журнал компьютерного зрения . 76 (1): 1–12. CiteSeerX 10.1.1.463.7101 . DOI : 10.1007 / s11263-007-0056-х . ISSN 0920-5691 . S2CID 207252002 .   
  97. ^ Накамура, Такенобу; Хираока, Ясуаки; Хирата, Акихико; Escolar, Emerson G .; Нисиура, Ясумаса (26 февраля 2015 г.). «Стойкие гомологии и многочастичная атомная структура для среднего порядка в стекле». Нанотехнологии . 26 (30): 304001. arXiv : 1502.07445 . Bibcode : 2015Nanot..26D4001N . DOI : 10.1088 / 0957-4484 / 26/30/304001 . PMID 26150288 . S2CID 7298655 .  
  98. ^ Николау, Моника; Левин, Арнольд Дж .; Карлссон, Гуннар (26 апреля 2011 г.). «Анализ данных на основе топологии определяет подгруппу рака груди с уникальным мутационным профилем и отличной выживаемостью» . Труды Национальной академии наук . 108 (17): 7265–7270. Bibcode : 2011PNAS..108.7265N . DOI : 10.1073 / pnas.1102826108 . ISSN 0027-8424 . PMC 3084136 . PMID 21482760 .   
  99. ^ Шмидт, Стефан; Post, Teun M .; Boroujerdi, Massoud A .; Кестерен, Шарлотта Ван; Ploeger, Bart A .; Паскуа, Оскар Э. Делла; Данхоф, Мейндерт (01.01.2011). Кимко, Холли ХК; Пек, Карл С. (ред.). Анализ прогрессирования заболевания: к моделям, основанным на механизмах . Успехи AAPS в серии фармацевтических наук. Springer Нью-Йорк. С. 433–455. DOI : 10.1007 / 978-1-4419-7415-0_19 . ISBN 978-1-4419-7414-3.
  100. ^ Переа, Хосе А .; Харер, Джон (29 мая 2014 г.). «Раздвижные окна и постоянство: применение топологических методов для анализа сигналов». Основы вычислительной математики . 15 (3): 799–838. CiteSeerX 10.1.1.357.6648 . DOI : 10.1007 / s10208-014-9206-Z . ISSN 1615-3375 . S2CID 592832 .   
  101. ^ ван де Вейгаерт, Риен; Вегтер, Герт; Эдельсбруннер, Герберт; Джонс, Бернард Дж. Т.; Пранав, Пратюш; Парк, Чангбом; Hellwing, Wojciech A .; Элдеринг, Боб; Круитхоф, Нико (01.01.2011). Гаврилова, Марина Л .; Тан, К. Кеннет; Мостафави, Мир Абольфазл (ред.). Труды по вычислительной науке XIV . Берлин, Гейдельберг: Springer-Verlag. С. 60–101. ISBN 978-3-642-25248-8.
  102. Горак, Даниела; Малетич, Слободан; Райкович, Милан (01.03.2009). «Стойкая гомология сложных сетей - IOPscience». Журнал статистической механики: теория и эксперимент . 2009 (3): P03034. arXiv : 0811.2203 . Bibcode : 2009JSMTE..03..034H . DOI : 10.1088 / 1742-5468 / 2009/03 / p03034 . S2CID 15592802 . 
  103. ^ Карстенс, CJ; Хорадам, KJ ( 4 июня 2013 г. ). «Постоянные гомологии сетей сотрудничества» . Математические проблемы инженерии . 2013 : 1–7. DOI : 10.1155 / 2013/815035 .
  104. ^ Ли, Hyekyoung; Кан, Хеджин; Чанг, МК; Ким, Бунг-Ньюн; Ли, Дон Су (2012-12-01). "Постоянная гомология сети мозга с точки зрения дендрограммы". IEEE Transactions по медицинской визуализации . 31 (12): 2267–2277. CiteSeerX 10.1.1.259.2692 . DOI : 10,1109 / TMI.2012.2219590 . ISSN 0278-0062 . PMID 23008247 . S2CID 858022 .    
  105. ^ Петри, G .; Эксперт, П .; Turkheimer, F .; Carhart-Harris, R .; Nutt, D .; Hellyer, PJ; Ваккарино, Ф. (06.12.2014). «Гомологические каркасы функциональных сетей мозга» . Журнал Интерфейса Королевского общества . 11 (101): 20140873. DOI : 10.1098 / rsif.2014.0873 . ISSN 1742-5689 . PMC 4223908 . PMID 25401177 .   
  106. ^ а б Макферсон, Роберт; Швайнхарт, Бенджамин (01.07.2012). «Измерение формы с топологией». Журнал математической физики . 53 (7): 073516. arXiv : 1011.2258 . Bibcode : 2012JMP .... 53g3516M . DOI : 10.1063 / 1.4737391 . ISSN 0022-2488 . S2CID 17423075 .  
  107. ^ Чен, Джозеф Minhow; Карлссон, Гуннар; Рабадан, Рауль (12 ноября 2013 г.). «Топология вирусной эволюции» . Труды Национальной академии наук . 110 (46): 18566–18571. Bibcode : 2013PNAS..11018566C . DOI : 10.1073 / pnas.1313480110 . ISSN 0027-8424 . PMC 3831954 . PMID 24170857 .   
  108. ^ Тейлор, Д .; др., др. (2015-08-21). «Анализ топологических данных карт заражения для изучения процессов распространения в сетях» . Nature Communications . 6 (6): 7723. arXiv : 1408.1168 . Bibcode : 2015NatCo ... 6E7723T . DOI : 10.1038 / ncomms8723 . ISSN 2041-1723 . PMC 4566922 . PMID 26194875 .   
  109. ^ Offroy, М. (2016). «Анализ топологических данных: многообещающий инструмент исследования больших данных в биологии, аналитической химии и физической химии». Analytica Chimica Acta . 910 : 1–11. DOI : 10.1016 / j.aca.2015.12.037 . PMID 26873463 . 
  110. ^ Duponchel, Л. (2018). «Изучение наборов данных гиперспектральных изображений с помощью анализа топологических данных». Analytica Chimica Acta . 1000 : 123–131. DOI : 10.1016 / j.aca.2017.11.029 . PMID 29289301 . 
  111. ^ Duponchel, Л. (2018). «Когда дистанционное зондирование встречается с анализом топологических данных» . Журнал спектральной визуализации . 7 : а1. DOI : 10.1255 / jsi.2018.a1 .
  112. ^ Ван, Бао; Вэй, Го-Вэй (07.12.2014). «Объективно-ориентированные стойкие гомологии». arXiv : 1412.2368 [ q-bio.BM ].
  113. ^ Фрозини, Патрицио; Ланди, Клаудия (2011). «Единственность моделей в стойких гомологиях: случай кривых». Обратные задачи . 27 (12): 124005. arXiv : 1012.5783 . Bibcode : 2011InvPr..27l4005F . DOI : 10.1088 / 0266-5611 / 27/12/124005 . S2CID 16636182 . 
  114. ^ Ся, Келин; Фэн, Синь; Тонг, Иин; Вэй, Го Вэй (2015-03-05). «Постоянная гомология для количественного предсказания стабильности фуллерена» . Журнал вычислительной химии . 36 (6): 408–422. DOI : 10.1002 / jcc.23816 . ISSN 1096-987X . PMC 4324100 . PMID 25523342 .   
  115. ^ Ся, Келин; Вэй, Го-Вэй (2014-08-01). «Постоянный гомологический анализ белковой структуры, гибкости и складчатости» . Международный журнал численных методов в биомедицинской инженерии . 30 (8): 814–844. arXiv : 1412.2779 . Bibcode : 2014arXiv1412.2779X . DOI : 10.1002 / cnm.2655 . ISSN 2040-7947 . PMC 4131872 . PMID 24902720 .   
  116. ^ Адкок, Аарон; Карлссон, Эрик; Карлссон, Гуннар (31 мая 2016 г.). «Кольцо алгебраических функций на штрих-кодах с постоянством» (PDF) . Гомологии, гомотопии и приложения . 18 (1): 381–402. DOI : 10.4310 / hha.2016.v18.n1.a21 . S2CID 2964961 .  
  117. ^ Чепуштанова, Софья; Эмерсон, Теган; Хэнсон, Эрик; Кирби, Майкл; Мотта, Фрэнсис; Невилл, Рэйчел; Петерсон, Крис; Шипман, Патрик; Зигельмайер, Лори (22 июля 2015 г.). «Постоянные образы: альтернативное постоянное представление гомологии». arXiv : 1507.06217 [ cs.CG ].
  118. ^ Деевеля, Рене (1955-01-01). "Topologie D'Une Fonctionnelle". Анналы математики . Вторая серия. 61 (1): 13–72. DOI : 10.2307 / 1969619 . JSTOR 1969619 . 
  119. ^ де Сильва, Вин; Мунк, Элизабет; Патель, Амит (13 апреля 2016 г.). «Категоризованные графы Риба». Дискретная и вычислительная геометрия . 55 (4): 854–906. arXiv : 1501.04147 . DOI : 10.1007 / s00454-016-9763-9 . S2CID 7111141 . 
  120. Перейти ↑ Goodman, Jacob E. (2008-01-01). Обзоры по дискретной и вычислительной геометрии: двадцать лет спустя: совместная летняя исследовательская конференция AMS-IMS-SIAM, 18-22 июня 2006 г., Snowbird, Юта . American Mathematical Soc. ISBN 9780821842393.
  121. ^ Эдельсбруннер, Герберт; Харер, Джон (2008). Стойкая гомология - обзор . Современная математика. 453 . AMS. С. 15–18. CiteSeerX 10.1.1.87.7764 . DOI : 10.1090 / conm / 453/08802 . ISBN  9780821842393. Раздел 5

Дальнейшее чтение [ править ]

Краткое введение

  • Изучение формы данных с помощью топологии , Майкл Лесник
  • Исходный материал для анализа топологических данных Микаэля Вейдемо-Йоханссона

Монография

  • Теория постоянства: от представлений колчана к анализу данных , Стив Удо

Видео-лекция

  • Введение в стойкую гомологию и топологию для анализа данных , Мэтью Райт
  • Форма данных , Гуннар Карлссон

Учебник по топологии

  • Алгебраическая топология , Аллен Хэтчер
  • Вычислительная топология: введение , Герберт Эдельсбруннер и Джон Л. Харер
  • Элементарная прикладная топология , Роберт Грист

Другие ресурсы TDA

  • Прикладная топология , Стэнфорд
  • Сеть исследований прикладной алгебраической топологии , Институт математики и ее приложений
  • Топологическое обучение ядра: дискретная теория Морса используется для соединения машинного обучения ядра с анализом топологических данных. https://www.researchgate.net/publication/327427685_Topological_Kernel_Learning