Из Википедии, свободной энциклопедии
Перейти к навигации Перейти к поиску

Наименьших квадратов спектральный анализ ( LSSA ) представляет собой способ оценки частотного спектра , на основе наименьших квадратов приступе синусоид до выборок данных, аналогично анализу Фурье . [1] [2] Анализ Фурье , наиболее часто используемый спектральный метод в науке, обычно усиливает длиннопериодический шум в записях с длинными интервалами; LSSA смягчает такие проблемы. [3]

LSSA также известен как метод Ваничека [4] в честь Петра Ваничека , а также как метод Ломба [3] (или периодограмма Ломба [5] ) и метод Ломба – Скаргла [6] (или периодограмма Ломба – Скаргла [2]). [7] ), основанный на вкладе Николаса Р. Ломба [8] и, независимо, Джеффри Д. Скаргла. [9] Тесно связанные методы были разработаны Майклом Коренбергом, Скоттом Ченом и Дэвидом Донохо .

Историческая справка [ править ]

Тесная связь между анализом Фурье , периодограммой и аппроксимацией синусоид методом наименьших квадратов известна давно. [10] Большинство разработок, однако, ограничиваются полными наборами данных с одинаковыми интервалами между выборками. В 1963 году Фрик Дж. М. Барнинг из Mathematisch Centrum , Амстердам, обработал неравномерно разнесенные данные с помощью аналогичных методов [11], включая как анализ периодограммы, эквивалентный тому, что сейчас называется методом Ломба, так и аппроксимацию методом наименьших квадратов выбранных частот синусоид. из таких периодограмм, связанных процедурой, которая теперь известна как поиск совпадения с последующей фиксацией [12]или поиск ортогонального совпадения. [13]

Петр Ваничек , канадский геодезист из Университета Нью-Брансуика , в 1969 году также предложил подход согласованного преследования, который он назвал «последовательным спектральным анализом», результатом которого стала «периодограмма наименьших квадратов» с одинаковыми и неравномерно разнесенными данными. [14] Он обобщил этот метод для учета систематических компонентов, выходящих за рамки простого среднего, таких как «предсказанный линейный (квадратичный, экспоненциальный, ...) вековой тренд неизвестной величины», и применил его к множеству выборок в 1971 году. . [15]

Затем в 1976 году метод Ваничека был упрощен Николасом Р. Ломбом из Сиднейского университета , указавшим на его тесную связь с анализом периодограмм . [8] Определение периодограммы неодинаково распределенных данных был впоследствии дополнительно модифицирована и анализировали с помощью Джеффри Д. Scargle из исследовательского центра NASA Ames , [9] , которые показали , что с незначительными изменениями она может быть идентична формуле наименьших квадратов Lomb для подгонка индивидуальных синусоидальных частот.

Скаргл заявляет, что его статья «не вводит новую технику обнаружения, а вместо этого изучает надежность и эффективность обнаружения с помощью наиболее часто используемого метода, периодограммы, в случае, когда время наблюдения неравномерно », и далее указывает в ссылка на подгонку синусоид методом наименьших квадратов по сравнению с анализом периодограмм, что его статья «по-видимому, впервые устанавливает, что (с предложенными модификациями) эти два метода в точности эквивалентны». [9]

Press [3] резюмирует развитие следующим образом:

Совершенно другой метод спектрального анализа для неравномерно отобранных данных, который смягчает эти трудности и имеет некоторые другие очень желательные свойства, был разработан Ломбом, частично на основе более ранних работ Барнинга и Ваничека, и дополнительно разработан Скаргл.

Майкл Коренберг из Королевского университета в 1989 году разработал метод «быстрого ортогонального поиска» для более быстрого нахождения почти оптимального разложения спектров или других задач [16], аналогичный методике, которая позже стала известна как поиск ортогонального сопоставления. В 1994 году Скотт Чен и Дэвид Донохо из Стэнфордского университета разработали метод «базового поиска», использующий минимизацию нормы коэффициентов L1, чтобы преобразовать задачу в задачу линейного программирования , для которой доступны эффективные решения. [17]

Метод Ваничека [ править ]

В методе Ваничека дискретный набор данных аппроксимируется взвешенной суммой синусоид постепенно определяемых частот с использованием стандартной линейной регрессии или аппроксимации методом наименьших квадратов . [18] Частоты выбираются с использованием метода, аналогичного методу Барнинга, но идущего дальше в оптимизации выбора каждой последующей новой частоты, выбирая частоту, которая минимизирует невязку после аппроксимации методом наименьших квадратов (эквивалентно методу подгонки, теперь известному как поиск соответствия с дооборудованием [12] ). Количество синусоид должно быть меньше или равно количеству выборок данных (считая синусы и косинусы той же частоты, что и отдельные синусоиды).

Вектор данных Φ представлен как взвешенная сумма синусоидальных базисных функций, занесенных в таблицу в матрице A путем оценки каждой функции во время выборки с вектором весов x :

где весовой вектор x выбран так, чтобы минимизировать сумму квадратов ошибок аппроксимации Φ . Решение для x представляет собой замкнутую форму с использованием стандартной линейной регрессии : [19]

Здесь матрица A может быть основана на любом наборе функций, которые являются взаимно независимыми (не обязательно ортогональными) при оценке во время выборки; для спектрального анализа обычно используются функции синусов и косинусов, равномерно распределенных по интересующему диапазону частот. Если слишком много частот выбрано в слишком узком частотном диапазоне, функции не будут достаточно независимыми, матрица будет плохо обусловлена, и результирующий спектр не будет иметь смысла. [19]

Когда базисные функции в A ортогональны (то есть не коррелированы, что означает, что столбцы имеют нулевые попарные скалярные произведения ), матрица A T A является диагональной матрицей; когда все столбцы имеют одинаковую мощность (сумму квадратов элементов), тогда эта матрица представляет собой единичную матрицу, умноженную на константу, поэтому инверсия тривиальна. Последний случай имеет место, когда времена выборки равномерно разнесены, а синусоиды выбраны в виде синусов и косинусов, равномерно распределенных попарно в частотном интервале от 0 до полупериода на выборку (с интервалом 1 / N цикла на выборку, опуская синус фазы на 0 и максимальной частоте, где они идентичны нулю). Этот частный случай известен как дискретное преобразование Фурье., немного переписанный с точки зрения реальных данных и коэффициентов. [19]

    (Случай ДПФ для N равноотстоящих отсчетов и частот в пределах скалярного фактора)

Ломб предложил использовать это упрощение в целом, за исключением парных корреляций между синусоидальными и косинусными основаниями одной и той же частоты, поскольку корреляции между парами синусоид часто малы, по крайней мере, когда они не слишком близко расположены. По сути, это традиционная формулировка периодограммы , но теперь она принята для использования с неравномерно расположенными образцами. Вектор x является хорошей оценкой лежащего в основе спектра, но поскольку корреляции игнорируются, A x больше не является хорошим приближением к сигналу, и метод больше не является методом наименьших квадратов - тем не менее, на него по-прежнему ссылаются как таковой.

Периодограмма Ломба – Скаргла [ править ]

Вместо того, чтобы напрямую брать скалярные произведения данных с синусоидальными и косинусоидальными сигналами, Скаргл модифицировал стандартную формулу периодограммы, чтобы сначала найти временную задержку τ, так что эта пара синусоид была бы взаимно ортогональной во время выборки t j , а также скорректирована с учетом потенциально неравные мощности этих двух базисных функций, чтобы получить лучшую оценку мощности на частоте, [3] [9], что сделало его модифицированный метод периодограммы точно эквивалентным методу наименьших квадратов Ломба. Задержка τ определяется формулой

Периодограмма на частоте ω затем оценивается как:

отчеты Scargle имеют такое же статистическое распределение, что и периодограмма в случае с равномерной выборкой. [9]

На любой индивидуальной частоте ω этот метод дает ту же мощность, что и метод наименьших квадратов для синусоид этой частоты в форме

[20]

Обобщенная периодограмма Ломба – Скаргла [ править ]

Стандартная периодограмма Ломба – Скаргла действительна для модели с нулевым средним. Обычно это приближается путем вычитания среднего значения данных перед вычислением периодограммы. Однако это неверное предположение, когда среднее значение модели (подогнанные синусоиды) не равно нулю. Обобщен Lomb-Scargle Периодограмма снимает это предположение, и явно решает для среднего. В этом случае установленная функция

[21]

Обобщенную периодограмму Ломба – Скаргла также называют периодограммой с плавающим средним . [22]

Метод "быстрого ортогонального поиска" Коренберга [ править ]

Майкл Коренберг из Королевского университета в Кингстоне, Онтарио , разработал метод выбора разреженного набора компонентов из чрезмерно полного набора, такого как синусоидальные компоненты для спектрального анализа, который называется быстрым ортогональным поиском (FOS). Математически FOS использует слегка модифицированное разложение Холецкого в процессе уменьшения среднеквадратичной ошибки (MSER), реализованное как инверсия разреженной матрицы . [16] [23] Как и другие методы LSSA, FOS позволяет избежать основного недостатка дискретного анализа Фурье и может обеспечить высокоточную идентификацию встроенных периодичностей и превосходит данные с неравномерными интервалами; Метод быстрого ортогонального поиска также применялся для решения других задач, таких как идентификация нелинейных систем.

Метод "основного преследования" Чена и Донохо [ править ]

Чен и Донохо разработали процедуру, называемую поиском базиса, для подбора разреженного набора синусоид или других функций из чрезмерно полного набора. Метод определяет оптимальное решение как решение, которое минимизирует L1 норму коэффициентов, так что задача может быть представлена ​​как задача линейного программирования , для которой доступны эффективные методы решения. [17]

Метод Хи-квадрат Палмера [ править ]

Палмер разработал метод поиска наиболее подходящей функции для любого выбранного количества гармоник, что дает больше свободы при поиске несинусоидальных гармонических функций. [24] Этот метод представляет собой быстрый метод (на основе БПФ ) для выполнения взвешенного анализа методом наименьших квадратов для произвольно разнесенных данных с неоднородными стандартными ошибками. Доступен исходный код, реализующий эту технику. [25] Поскольку данные часто не дискретизируются в равномерно распределенные дискретные моменты времени, этот метод "объединяет" данные в сетку, разреженно заполняя массив временных рядов во время выборки. Все промежуточные точки сетки получают нулевой статистический вес, что эквивалентно бесконечным полосам погрешностей между выборками.

Приложения [ править ]

Самая полезная функция метода LSSA - это возможность спектрального анализа неполных записей без необходимости манипулировать записью или придумывать несуществующие иным образом данные.

Величины в LSSA спектра изображают вклад в частоту или период к дисперсии от временных рядов . [14] Как правило, спектральные величины, определенные вышеописанным способом, обеспечивают прямой режим уровня значимости выходных данных . [26] В качестве альтернативы, величины в спектре Ваничека также могут быть выражены в дБ . [27] Обратите внимание, что звездные величины в спектре Ваничека подчиняются β-распределению . [28]

Обратное преобразование LSSA Ваничека возможно, в чем проще всего убедиться, записав прямое преобразование в виде матрицы; матрица, обратная (когда матрица не является сингулярной) или псевдообратная, тогда будет обратным преобразованием; обратное будет точно соответствовать исходным данным, если выбранные синусоиды взаимно независимы в точках выборки и их количество равно количеству точек данных. [19] Подобная обратная процедура для метода периодограммы неизвестна.

Реализация [ править ]

LSSA может быть реализован менее чем на странице кода MATLAB . [29] По существу: [18]

«чтобы вычислить спектр наименьших квадратов, мы должны вычислить m спектральных значений ... что включает в себя выполнение аппроксимации наименьших квадратов m раз, каждый раз, чтобы получить [спектральную мощность] для другой частоты»

Т.е. для каждой частоты в желаемом наборе частот функции синуса и косинуса оцениваются в моменты времени, соответствующие выборкам данных, и скалярные произведения вектора данных с векторами синусоиды берутся и соответствующим образом нормализуются; следуя методу, известному как периодограмма Ломба / Скаргла, временной сдвиг вычисляется для каждой частоты, чтобы ортогонализировать компоненты синуса и косинуса перед скалярным произведением, как описано Креймером; [19] наконец, мощность вычисляется из этих двух составляющих амплитуды . Этот же процесс реализует дискретное преобразование Фурье. когда данные равномерно распределены во времени, а выбранные частоты соответствуют целому числу циклов в конечной записи данных.

Этот метод обрабатывает каждый синусоидальный компонент независимо или вне контекста, даже если они могут быть не ортогональными в точках данных; это оригинальный метод Ваничека. Напротив, как объясняет Креймер, также возможно выполнить полную одновременную или контекстную аппроксимацию методом наименьших квадратов, решив матричное уравнение, разделив общую дисперсию данных между указанными частотами синусоиды. [19] Такое матричное решение методом наименьших квадратов изначально доступно в MATLAB как оператор обратной косой черты . [30]

Креймер объясняет, что одновременный или контекстный метод, в отличие от независимой или внеконтекстной версии (а также версии периодограммы из-за Ломба), не может вместить больше компонентов (синусов и косинусов), чем имеется выборок данных, и далее, что: [19]

«... серьезные последствия могут также возникнуть, если выбранные частоты приводят к тому, что некоторые из компонентов Фурье (триггерные функции) становятся почти линейно зависимыми друг от друга, тем самым создавая плохо обусловленную или почти сингулярную N. Чтобы избежать такой плохой обусловленности, становится необходимо либо выбрать другой набор частот для оценки (например, равноотстоящие частоты), либо просто пренебречь корреляциями в N (то есть недиагональными блоками) и оценить обратное преобразование методом наименьших квадратов отдельно для отдельных частот ... "

С другой стороны, метод периодограммы Ломба может использовать произвольно большое количество или плотность частотных компонентов, как в стандартной периодограмме ; то есть частотная область может быть передискретизирована произвольным фактором. [3]

В анализе Фурье, таком как преобразование Фурье или дискретное преобразование Фурье , все синусоиды, подгоняемые к данным, являются взаимно ортогональными, поэтому нет различий между простой проекцией на основе скалярного произведения вне контекста на базисные функции и одновременный подбор методом наименьших квадратов в контексте; то есть не требуется инверсия матрицы для разделения дисперсии по методу наименьших квадратов между ортогональными синусоидами разных частот. [31] Этот метод обычно предпочтительнее из-за его эффективной реализации быстрого преобразования Фурье , когда доступны полные записи данных с равноотстоящими выборками.

См. Также [ править ]

  • Ортогональные функции
  • SigSpec
  • Синусоидальная модель
  • Спектральная плотность
  • Оценка спектральной плотности для конкурирующих альтернатив

Ссылки [ править ]

  1. ^ Cafer Ibanoglu (2000). Переменные звезды как важный астрофизический инструмент . Springer. ISBN 0-7923-6084-2.
  2. ^ а б Д. Скотт Бирни; Дэвид Опер; Гильермо Гонсалес (2006). Наблюдательная астрономия . Издательство Кембриджского университета. ISBN 0-521-85370-2.
  3. ^ a b c d e Press (2007). Числовые рецепты (3-е изд.). Издательство Кембриджского университета. ISBN 978-0-521-88068-8.
  4. ^ Дж. Тейлор; С. Гамильтон (1972-03-20). «Некоторые испытания метода спектрального анализа Ваничека». Астрофизика и космическая наука . 17 (2): 357–367. Bibcode : 1972Ap & SS..17..357T . DOI : 10.1007 / BF00642907 .
  5. Алистер И. Мис (2001). Нелинейная динамика и статистика . Springer. ISBN 0-8176-4163-7.
  6. ^ Фрэнк Чемберс (2002). Изменение климата: важнейшие концепции окружающей среды . Рутледж. ISBN 0-415-27858-9.
  7. Перейти ↑ Hans PA Van Dongen (1999). «Поиск биологических ритмов: обнаружение пика в периодограмме неравномерно разнесенных данных». Журнал биологических ритмов . 14 (6): 617–620. DOI : 10.1177 / 074873099129000984 . PMID 10643760 . 
  8. ^ a b Lomb, NR (1976). «Частотный анализ методом наименьших квадратов неравномерно разнесенных данных». Астрофизика и космическая наука . 39 (2): 447–462. Bibcode : 1976Ap & SS..39..447L . DOI : 10.1007 / BF00648343 .
  9. ^ а б в г д Скаргл, JD (1982). «Исследования по анализу астрономических временных рядов. II - Статистические аспекты спектрального анализа неравномерно распределенных данных». Астрофизический журнал . 263 : 835. Bibcode : 1982ApJ ... 263..835S . DOI : 10.1086 / 160554 .
  10. ^ Дэвид Брант (1931). Комбинация наблюдений (2-е изд.). Издательство Кембриджского университета.
  11. ^ Барнинг, FJM (1963). "Численный анализ кривой блеска 12 Лакертов". Бюллетень астрономических институтов Нидерландов . 17 : 22. Bibcode : 1963BAN .... 17 ... 22B .
  12. ^ a b Паскаль Винсент; Йошуа Бенжио (2002). «Погоня за соответствием ядра» (PDF) . Машинное обучение . 48 : 165–187. DOI : 10,1023 / A: 1013955821559 .
  13. ^ YC Пати, Р. Rezaiifar и PS Krishnaprasad, «Ортогональныесовпадения: Рекурсивная функция приближения с приложениями вейвлетразложения,» в Proc. 27-я конференция Asilomar по сигналам, системам и компьютерам, изд. А. Сингх, Лос-Аламитос, Калифорния, США, IEEE Computer Society Press, 1993.
  14. ^ a b Ваничек, П. (1969). «Приблизительный спектральный анализ методом наименьших квадратов». Астрофизика и космическая наука . 4 (4): 387–391. Bibcode : 1969Ap & SS ... 4..387V . DOI : 10.1007 / BF00651344 .
  15. ^ Ваничек, П. (1971). «Дальнейшее развитие и свойства спектрального анализа методом наименьших квадратов». Астрофизика и космическая наука . 12 (1): 10–33. Bibcode : 1971Ap & SS..12 ... 10V . DOI : 10.1007 / BF00656134 .
  16. ^ Б Коренберг, MJ (1989). «Надежный ортогональный алгоритм для идентификации системы и анализа временных рядов». Биологическая кибернетика . 60 (4): 267–276. DOI : 10.1007 / BF00204124 . PMID 2706281 . 
  17. ^ a b С. Чен и Д.Л. Донохо (1994), «Основное преследование». Технический отчет, Департамент статистики, Стэнфордский университет, доступен по адресу [1]. Архивировано 5 июля 2017 г. на Wayback Machine.
  18. ^ a b Уэллс, Д.Е., П. Ваничек, С. Пагиатакис, 1985. Возвращение к спектральному анализу методом наименьших квадратов. Технический отчет 84 Департамента геодезии, Университет Нью-Брансуика, Фредериктон, 68 страниц, доступен на [2] .
  19. ^ a b c d e f g Креймер, М. Р., Спектр наименьших квадратов, его обратное преобразование и функция автокорреляции: теория и некоторые приложения в геодезии [ постоянная мертвая ссылка ] , доктор философии. Диссертация, Университет Торонто, Канада (1998 г.).
  20. ^ Уильям Дж. Эмери; Ричард Э. Томсон (2001). Методы анализа данных в физической океанографии . Эльзевир. ISBN 0-444-50756-6.
  21. ^ М. Зехмайстер; М. Кюрстер (март 2009 г.). «Обобщенная периодограмма Ломба – Скаргла. Новый формализм для периодограмм с плавающим средним и кеплеровским». Астрономия и астрофизика . 496 (2): 577–584. arXiv : 0901.2573 . Bibcode : 2009A&A ... 496..577Z . DOI : 10.1051 / 0004-6361: 200811296 .
  22. ^ Эндрю Камминг; Джеффри В. Марси; Р. Пол Батлер (декабрь 1999 г.). "The Lick Planet Search: обнаруживаемость и пороги массы". Астрофизический журнал . 526 (2): 890–915. arXiv : astro-ph / 9906466 . Bibcode : 1999ApJ ... 526..890C . DOI : 10.1086 / 308020 .
  23. ^ Коренберг, Майкл Дж .; Бренан, Колин Дж. Х .; Хантер, Ян В. (1997). "Рамановская спектральная оценка с помощью быстрого ортогонального поиска". Аналитик . 122 (9): 879–882. Bibcode : 1997Ana ... 122..879K . DOI : 10.1039 / a700902j .
  24. ^ Палмер, Дэвид М. (2009). «Быстрый метод хи-квадрат для периодического поиска данных с нерегулярной выборкой». Астрофизический журнал . 695 (1): 496–502. arXiv : 0901.1913 . Bibcode : 2009ApJ ... 695..496P . DOI : 10.1088 / 0004-637X / 695/1/496 .
  25. ^ "Дэвид Палмер: Быстрый поиск периода хи-квадрат" .
  26. Beard, AG, Williams, PJS, Mitchell, NJ & Muller, HG Специальная климатология планетарных волн и приливной изменчивости, Дж Атм. Solar-Ter. Phys. 63 (09), стр. 801–811 (2001).
  27. ^ Пагиатакис, С. Стохастическая значимость пиков в спектре наименьших квадратов, J of Geodesy 73, p.67-78 (1999).
  28. ^ Стивс, Р. Р. Статистический тест на значимость пиков в спектре наименьших квадратов, Сборник документов геодезической службы, Министерство энергетики, горнодобывающей промышленности и ресурсов, исследований и картирования, Оттава, Канада, стр.149-166 (1981)
  29. ^ Ричард А. Мюллер; Гордон Дж. Макдональд (2000). Ледниковые периоды и астрономические причины: данные, спектральный анализ и механизмы . Springer. ISBN 3-540-43779-7.
  30. ^ Тимоти А. Дэвис; Кермит Сигмон (2005). MATLAB Primer . CRC Press. ISBN 1-58488-523-8.
  31. ^ Даррелл Уильямсон (1999). Обработка сигналов в дискретном времени: алгебраический подход . Springer. ISBN 1-85233-161-5.

Внешние ссылки [ править ]

  • Бесплатная загрузка пакета LSSA , FORTRAN, метода спектрального анализа методом наименьших квадратов Ваничека, из Университета Нью-Брансуика .
  • Бесплатная загрузка пакета LSWAVE , MATLAB, включает метод спектрального анализа наименьших квадратов Ваничека, разработанный Национальной геодезической службой США .
  • Бесплатная загрузка программного обеспечения LSSA [ постоянная мертвая ссылка ] (через ftp), FORTRAN, метод Ваничека, из Министерства природных ресурсов Канады .