Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Внутреннее измерение для набора данных можно рассматривать как число переменных , необходимых в минимальном представлении данных. Точно так же при обработке многомерных сигналов внутренняя размерность сигнала описывает, сколько переменных необходимо для генерации хорошего приближения сигнала.

Однако при оценке внутренней размерности часто используется несколько более широкое определение, основанное на размерности многообразия, когда представление во внутренней размерности действительно должно существовать только локально. Таким образом, такие методы оценки внутренних измерений могут обрабатывать наборы данных с различными внутренними измерениями в разных частях набора данных. Это часто называют локальной внутренней размерностью .

Внутреннее измерение можно использовать как нижнюю границу того, в какое измерение можно сжать набор данных посредством уменьшения размерности, но его также можно использовать как меру сложности набора данных или сигнала. Для набора данных или сигнала N переменных его внутренняя размерность M удовлетворяет 0 ≤ M ≤ N , хотя оценки могут давать более высокие значения.

Пример [ править ]

Позвольте быть функцией двух переменных (или сигналом ), которая имеет форму для некоторой функции одной переменной g, которая не является постоянной . Это означает, что f изменяется в соответствии с g с первой переменной или по первой координате . С другой стороны, f постоянна по отношению ко второй переменной или по второй координате. Необходимо знать только значение одной, а именно первой переменной, чтобы определить значение f . Следовательно, это функция с двумя переменными, но ее внутренняя размерность равна единице.

Чуть более сложный пример .f по-прежнему является внутренне одномерным, что можно увидеть, выполнив преобразование переменной и которое дает . Поскольку изменение f можно описать одной переменной y 1, его внутренняя размерность равна единице.

В случае, когда f является постоянным, его внутренняя размерность равна нулю, поскольку для описания вариации не требуется никакой переменной. В общем случае, когда внутренняя размерность функции двух переменных f не равна ни нулю, ни единице, она равна двум.

В литературе функции, имеющие внутреннюю размерность ноль, один или два, иногда называют i0D , i1D или i2D соответственно.

Формальное определение сигналов [ править ]

Для N -переменных функций F , множество переменных может быть представлено как N - мерный вектор х : .

Если для некоторой M -переменной функции g и матрицы A размера M × N верно, что

  • для всех x ;
  • M - наименьшее число, для которого может быть найдено указанное выше соотношение между f и g ,

то внутренняя размерность F является М .

Внутреннее измерение является характеристикой F , это не является однозначной характеристика г , ни А . То есть, если указанное выше соотношение выполняется для некоторых f , g и A , оно также должно выполняться для тех же f и g ' и A', заданных формулами и где B - невырожденная матрица размера M × M , поскольку .

Преобразование Фурье сигналов низкой внутренней размерности [ править ]

Н функция переменной , которая имеет внутреннюю размерность M <N имеет характеристику преобразования Фурье . Интуитивно, поскольку этот тип функции является постоянным в одном или нескольких измерениях, его преобразование Фурье должно выглядеть как импульс (преобразование Фурье константы) в том же измерении в частотной области .

Простой пример [ править ]

Пусть f - функция с двумя переменными, которая является i1D. Это означает, что существует нормализованный вектор и функция одной переменной g такие, что для всех . Если F является преобразованием Фурье функции f (обе функции с двумя переменными), это должно быть так .

Здесь G - преобразование Фурье функции g (оба являются функциями одной переменной), δ - импульсная функция Дирака, а m - нормализованный вектор, перпендикулярный n . Это означает, что F исчезает везде, кроме линии, проходящей через начало частотной области и параллельной m . Вдоль этой линии F варьируется в зависимости от G .

Общий случай [ править ]

Пусть f - функция N -переменной, имеющая внутреннюю размерность M , то есть существует M -переменная функция g и матрица A размера M × N такие, что .

Тогда его преобразование Фурье F можно описать следующим образом:

  • F обращается в нуль всюду, кроме подпространства размерности M
  • Подпространство M натянуто на строки матрицы A
  • В подпространстве F изменяется согласно G преобразованию Фурье g

Обобщения [ править ]

Тип внутреннего измерения, описанный выше, предполагает, что линейное преобразование применяется к координатам N -переменной функции f, чтобы получить M переменных, которые необходимы для представления каждого значения f . Это означает , что F постоянна вдоль линий, плоскостей, или гиперплоскостях, в зависимости от N и M .

В общем случае f имеет внутреннюю размерность M, если существуют M функций a 1 , a 2 , ..., a M и M -переменной функции g такие, что

  • для всех x
  • M - наименьшее количество функций, которое допускает вышеуказанное преобразование

Простой пример - преобразование функции f с двумя переменными в полярные координаты:

  • , f является i1D и постоянным вдоль любой окружности с центром в начале координат.
  • , f равно i1D и постоянна на всех лучах из начала координат.

В общем случае простое описание либо точечных множеств, для которых f является постоянным, либо их преобразования Фурье, обычно невозможно.

Локальная внутренняя размерность [ править ]

Локальная внутренняя размерность (LID) относится к наблюдению, что часто данные распределяются на многообразии более низкой размерности при рассмотрении только ближайшего подмножества данных. Например, функция может считаться одномерной, когда y близко к 0, и двумерной, когда y намного больше 1.

В отношении данных часто используется локальная внутренняя размерность. Затем он обычно оценивается на основе k ближайших соседей точки данных [1], часто на основе концепции, связанной с удвоением размерности в математике. Поскольку объем d- сферы растет экспоненциально по d , скорость, с которой находятся новые соседи по мере увеличения радиуса поиска, может использоваться для оценки локальной внутренней размерности (например, оценка GED [2] ). Однако были предложены альтернативные подходы к оценке, например оценка на основе угла. [3]

История [ править ]

В течение 1950-х годов в социальных науках были разработаны методы так называемого «масштабирования» для исследования и обобщения многомерных наборов данных. [4] После того, как Шепард представил неметрическое многомерное масштабирование в 1962 году [5], одной из основных областей исследований в области многомерного масштабирования (MDS) была оценка внутренней размерности. [6] Эта тема также изучалась в теории информации , впервые предложенной Беннетом в 1965 году, который ввел термин «внутреннее измерение» и написал компьютерную программу для его оценки. [7] [8] [9]

В течение 1970-х годов были построены методы оценки внутренней размерности, которые не зависели от уменьшения размерности, такие как MDS: на основе локальных собственных значений, [10], на основе распределений расстояний, [11] и на основе других геометрических свойств, зависящих от размерности [12]

Оценка внутренней размерности множеств и вероятностных мер также широко изучается примерно с 1980 года в области динамических систем, где размерности (странных) аттракторов были предметом интереса. [13] [14] [15] [16] Для странных аттракторов нет предположения о многообразии, и измеряемая размерность является некоторой версией фрактальной размерности, которая также может быть нецелой. Однако определения фрактальной размерности дают многомерное измерение многообразий.

В 2000-х годах «проклятие размерности» было использовано для оценки внутренней размерности. [17] [18]

Приложения [ править ]

Случай с двумя переменными сигналами, которым является i1D, часто встречается в компьютерном зрении и обработке изображений и отражает идею локальных областей изображения, которые содержат линии или края. Анализ таких регионов имеет долгую историю, но только после того, как началось более формальное и теоретическое рассмотрение таких операций, была установлена ​​концепция внутреннего измерения, хотя название менялось.

Так , например, что здесь понятие упоминается как изображения окрестности внутренней размерности 1 или i1D окрестности называется 1-мерное по Кнутссон (1982), [19] линейной симметричной по Бигун & Гранлундом (1987) [20] и простой окрестности в Granlund & Knutsson (1995). [21]

См. Также [ править ]

  • Измерение
  • Фрактальное измерение
  • Хаусдорфово измерение
  • Топологическое измерение

Ссылки [ править ]

  1. ^ Амсалег, Лоран; Челли, Усама; Фурон, Тедди; Жирар, Стефан; Houle, Michael E .; Каварабаяси, Кен-ичи; Нетт, Майкл (10.08.2015). «Оценка локальной внутренней размерности» . Материалы 21-й Международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных . КДД '15. Сидней, Новый Южный Уэльс, Австралия: Ассоциация вычислительной техники: 29–38. DOI : 10.1145 / 2783258.2783405 . ISBN 978-1-4503-3664-2.
  2. ^ Houle, ME; Kashima, H .; Нетт, М. (2012). «Обобщенное измерение расширения» . 2012 IEEE 12-я Международная конференция по интеллектуальному анализу данных, семинары : 587–594. DOI : 10.1109 / ICDMW.2012.94 .
  3. ^ Тордсен, Эрик; Шуберт, Эрих (2020). Сато, Синьити; Вадикамо, Лючия; Зимек, Артур; Каррара, Фабио; Бартолини, Илария; Аумюллер, Мартин; Йонссон, Бьорн Тор; Паг, Расмус (ред.). «ABID: внутренняя размерность на основе углов» . Поиск сходства и приложения . Конспект лекций по информатике. Чам: Издательство Springer International: 218–232. arXiv : 2006.12880 . DOI : 10.1007 / 978-3-030-60936-8_17 . ISBN 978-3-030-60936-8.
  4. ^ Торгерсон, Уоррен С. (1978) [1958]. Теория и методы масштабирования . Вайли. ISBN 0471879452. OCLC  256008416 .
  5. ^ Шепард, Роджер Н. (1962). «Анализ близости: многомерное масштабирование с неизвестной функцией расстояния. I.». Психометрика . 27 (2): 125–140. DOI : 10.1007 / BF02289630 .
  6. ^ Шепард, Роджер Н. (1974). «Представление структуры в данных подобия: проблемы и перспективы». Психометрика . 39 (4): 373–421. DOI : 10.1007 / BF02291665 .
  7. ^ Беннет, Роберт С. (июнь 1965 г.). «Представление и анализ сигналов - Часть XXI: Внутренняя размерность коллекций сигналов» . Реп.163 . Балтимор, Мэриленд: Университет Джона Хопкинса.
  8. ^ Роберт С. Беннетт (1965). Представление и анализ сигналов Часть XXI. Внутренняя размерность коллекций сигналов (PDF) (PhD). Анн-Арбор, Мичиган: Университет Джона Хопкинса.
  9. ^ Беннет, Роберт С. (сентябрь 1969). «Внутренняя размерность коллекций сигналов». IEEE Transactions по теории информации . 15 (5): 517–525. DOI : 10.1109 / TIT.1969.1054365 .
  10. ^ Фукунага, К .; Olsen, DR (1971). «Алгоритм определения внутренней размерности данных». Транзакции IEEE на компьютерах . 20 (2): 176–183. DOI : 10.1109 / TC.1971.223208 .
  11. ^ Петтис, KW; Бейли, Томас А .; Джайн, Анил К .; Дубс, Ричард С. (1979). «Оценка внутренней размерности на основе информации о ближайшем соседе». IEEE Transactions по анализу шаблонов и машинному анализу . 1 (1): 25–37. DOI : 10.1109 / TPAMI.1979.4766873 . PMID 21868828 . 
  12. Перейти ↑ Trunk, GV (1976). «Статистическая оценка внутренней размерности зашумленного набора сигналов». Транзакции IEEE на компьютерах . 100 (2): 165–171. DOI : 10.1109 / TC.1976.5009231 .
  13. ^ Grassberger, P .; Прокачча, И. (1983). «Измерение странностей странных аттракторов». Physica D: нелинейные явления . 9 (1–2): 189–208. Bibcode : 1983PhyD .... 9..189G . DOI : 10.1016 / 0167-2789 (83) 90298-1 .
  14. ^ Такенс, Ф. (1984). «О численном определении размерности аттрактора». В Тонге, Хауэлл (ред.). Динамические системы и бифуркации, Труды семинара , проходившего в Гронингене, Нидерланды, 16-20 апреля 1984 года . Конспект лекций по математике. 1125 . Springer-Verlag. С. 99–106. DOI : 10.1007 / BFb0075637 . ISBN 3540394117.
  15. ^ Катлер, CD (1993). «Обзор теории и оценки фрактальной размерности» . Оценка размеров и модели . Нелинейные временные ряды и хаос. 1 . World Scientific. С. 1–107. ISBN 9810213530.
  16. ^ Гарт, D. (2001). Мультифракталы - теория и приложения . Чепмен и Холл / CRC. ISBN 9781584881544.
  17. ^ Чавес, Э. (2001). «Поиск в метрических пространствах». ACM Computing Surveys . 33 (3): 273–321. DOI : 10.1145 / 502807.502808 . hdl : 10533/172863 .
  18. Пестов, В. (2008). «Аксиоматический подход к внутреннему измерению набора данных». Нейронные сети . 21 (2–3): 204–213. arXiv : 0712.2063 . DOI : 10.1016 / j.neunet.2007.12.030 . PMID 18234471 . 
  19. Перейти ↑ Knutsson, Hans (1982). Фильтрация и реконструкция при обработке изображений (PDF) . Линчёпинг изучает науку и технологии. 88 . Линчёпингский университет. ISBN  91-7372-595-1. oai: DiVA.org: liu-54890.
  20. ^ Бигюн, Йозеф; Гранлунд, Гёста Х. (1987). «Обнаружение оптимальной ориентации линейной симметрии» (PDF) . Материалы международной конференции по компьютерному зрению . С. 433–438.
  21. ^ Granlund, Gösta H .; Кнутссон, Ханс (1995). Обработка сигналов в компьютерном зрении . Kluwer Academic. ISBN 978-1-4757-2377-9.
  • Майкл Фельсберг; Синан Калкан; Норберт Крюгер (2009). «Непрерывная характеристика размерности структур изображений» . Вычисления изображений и зрения . 27 (6): 628–636. DOI : 10.1016 / j.imavis.2008.06.018 . hdl : 11511/36631 .