Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Сглаживание шлицев являются оценки функции, , полученными из множества зашумленных наблюдений мишени для того, чтобы сбалансировать меру добра прилегания к с производной на основе измерения гладкости . Они предоставляют средства для сглаживания зашумленных данных. Самый известный пример - это кубический сглаживающий сплайн, но есть много других возможностей, в том числе для случая, когда - векторная величина.

Определение кубического сплайна [ править ]

Позвольте быть набором наблюдений, смоделированных соотношением, где являются независимыми случайными величинами с нулевым средним (обычно предполагается, что они имеют постоянную дисперсию). Кубический сплайн оценка сглаживания функции определяются как минимизатор (по классу дважды дифференцируемых функций) из [1] [2]

Примечания:

  • - параметр сглаживания, контролирующий компромисс между точностью данных и грубостью оценки функции. Это часто оценивается с помощью обобщенной перекрестной проверки [3] или с помощью метода ограниченного предельного правдоподобия (REML), который использует связь между сплайн-сглаживанием и байесовской оценкой (штраф за сглаживание можно рассматривать как вызванный априорной функцией ). [4]
  • Интеграл часто оценивается по всей действительной линии, хотя также можно ограничить диапазон диапазоном .
  • As (без сглаживания) сглаживающий сплайн сходится к интерполирующему сплайну .
  • При (бесконечное сглаживание) штраф за шероховатость становится первостепенным, и оценка сходится к линейной оценке наименьших квадратов .
  • Штраф за грубость, основанный на второй производной, является наиболее распространенным в современной статистической литературе, хотя этот метод можно легко адаптировать к штрафам, основанным на других производных.
  • В ранней литературе для штрафа использовались разности второго или третьего порядка с одинаковым интервалом , а не производные. [5]
  • Штрафная цель сглаживания суммы квадратов может быть заменена штрафной целью вероятности, в которой сумма квадратов заменяется другой мерой точности данных, основанной на логарифмическом правдоподобии. [1] Член суммы квадратов соответствует штрафной вероятности с предположением Гаусса для .

Вывод кубического сглаживающего сплайна [ править ]

Полезно подумать о настройке сглаживающего сплайна в два этапа:

  1. Во-первых, получите значения .
  2. Из этих значений извлеките для всех x .

Теперь сначала обработайте второй шаг.

Учитывая вектор подобранных значений, часть критерия сплайна, относящаяся к сумме квадратов, является фиксированной. Осталось только минимизировать , и минимизатор представляет собой естественный кубический сплайн , интерполирующий точки . Этот интерполирующий сплайн является линейным оператором и может быть записан в виде

где - набор базисных функций сплайна. В результате штраф за шероховатость имеет вид

где элементы А являются . Базисные функции и, следовательно, матрица A зависят от конфигурации переменных-предикторов , но не от ответов или .

A - это матрица размера n × n, заданная формулой .

Δ представляет собой (n-2) × n матрицу вторых разностей с элементами:

, ,

W - (n-2) × (n-2) симметричная трехдиагональная матрица с элементами:

, и расстояния между последовательными узлами (или значения x).

А теперь вернемся к первому шагу. Штрафная сумма квадратов может быть записана как

где .

Сведение к минимуму , дифференцируя против . Это приводит к: [6] и

Подход Де Бура [ править ]

Подход Де Бура использует ту же идею поиска баланса между плавной кривой и близостью к заданным данным. [7]

где параметр, называемый коэффициентом сглаживания, принадлежит интервалу , а - величины, контролирующие степень сглаживания (они представляют собой вес каждой точки ). На практике, поскольку в основном используются кубические шлицы , обычно . Решение для было предложено Райншем в 1967 году. [8] For , когда приближается , сходится к «естественному» сплайну, интерполянту к заданным данным. [7] В подходах , сходится к прямой линии (гладкая кривая). Поскольку поиск подходящего значения - это задача проб и ошибок, избыточная константабыл введен для удобства. [8] используется для численного определения значения, чтобы функция удовлетворяла следующему условию:

Алгоритм, описанный де Боором, начинается с и увеличивается до тех пор, пока не будет выполнено условие. [7] Если это оценка стандартного отклонения для , рекомендуется выбирать константу в интервале . Имея средства, решение - "естественный" сплайн-интерполянт. [8] Увеличение означает, что мы получаем более плавную кривую, удаляясь от заданных данных.

Многомерные сплайны [ править ]

Существует два основных класса методов обобщения - от сглаживания по скаляру до сглаживания по вектору . Первый подход просто обобщает штраф за сглаживание сплайна на многомерную настройку. Например, при попытке оценить, мы могли бы использовать штраф сплайна тонкой пластины и найти минимизирующий

Подход тонких пластинчатых сплайнов можно обобщить на сглаживание по более чем двум измерениям и на другие порядки дифференцирования штрафа. [1] По мере увеличения размерности существуют некоторые ограничения на наименьший порядок дифференциала, который можно использовать, [1] но на самом деле в оригинальной статье Дюшона [9] даются несколько более сложные штрафы, позволяющие избежать этого ограничения.

Тонкие пластинчатые шлицы изотропны, что означает, что если мы повернем систему координат, оценка не изменится, но мы также предполагаем, что одинаковый уровень сглаживания подходит для всех направлений. Это часто считается разумным при сглаживании относительно пространственного положения, но во многих других случаях изотропия не является подходящим допущением и может привести к чувствительности к явно произвольному выбору единиц измерения. Например, при сглаживании по расстоянию и времени изотропный сглаживатель даст разные результаты, если расстояние измеряется в метрах, а время в секундах, от того, что произойдет, если мы изменим единицы измерения на сантиметры и часы.

Второй класс обобщений для многомерного сглаживания напрямую связан с этой проблемой масштабной инвариантности с использованием построений сплайнов тензорного произведения. [10] [11] [12] Такие сплайны имеют недостатки сглаживания с несколькими параметрами сглаживания, что является ценой, которую нужно заплатить за то, что не предполагается, что одинаковая степень сглаживания подходит для всех направлений.

Связанные методы [ править ]

Сглаживающие сплайны связаны с:

  • Сплайны регрессии. В этом методе данные подгоняются к набору базисных функций сплайна с сокращенным набором узлов, обычно методом наименьших квадратов. Штраф за шероховатость не применяется. (См. Также многомерные сплайны адаптивной регрессии .)
  • Штрафные сплайны. Это объединяет уменьшенные узлы регрессионных шлицев со снижением шероховатости сглаживающих шлицев. [13] [14]
  • Метод упругих карт для обучения многообразию . Этот метод сочетает штраф по методу наименьших квадратов за ошибку аппроксимации со штрафом за изгиб и растяжение аппроксимирующего многообразия и использует грубую дискретизацию задачи оптимизации; см. шлицы тонкой пластины .

Исходный код [ править ]

Исходный код для сглаживания сплайнов можно найти в примерах из книги Карла де Бура Практическое руководство по сплайнам . Примеры приведены на языке программирования Fortran . Обновленные источники доступны также на официальном сайте Карла де Бура [1] .

Ссылки [ править ]

  1. ^ а б в г Грин, ПДж; Сильверман, Б.В. (1994). Непараметрическая регрессия и обобщенные линейные модели: подход со штрафом за грубость . Чепмен и Холл.
  2. ^ Хасти, TJ; Тибширани, Р.Дж. (1990). Обобщенные аддитивные модели . Чепмен и Холл. ISBN 978-0-412-34390-2.
  3. ^ Craven, P .; Вахба, Г. (1979). «Сглаживание зашумленных данных с помощью сплайн-функций». Numerische Mathematik . 31 (4): 377–403. DOI : 10.1007 / bf01404567 .
  4. ^ Кимелдорф, GS; Вахба, Г. (1970). «Соответствие байесовского оценивания случайных процессов и сглаживания сплайнами» . Летопись математической статистики . 41 (2): 495–502. DOI : 10.1214 / АОМ / 1177697089 .
  5. Перейти ↑ Whittaker, ET (1922). «О новой методике градуировки». Труды Эдинбургского математического общества . 41 : 63–75.
  6. Перейти ↑ Rodriguez, German (Spring 2001). «Сглаживание и непараметрическая регрессия» (PDF) . 2.3.1 Расчет. п. 12 . Проверено 28 августа 2017 года . CS1 maint: location (link)
  7. ^ а б в Де Бур, К. (2001). Практическое руководство по сплайнам (исправленное издание) . Springer. С. 207–214. ISBN 978-0-387-90356-9.
  8. ^ a b c Райнш, Кристиан Х (1967). «Сглаживание сплайновыми функциями». Numerische Mathematik . 10 (3): 177–183. DOI : 10.1007 / BF02162161 .
  9. ^ Дж. Дюшон, 1976, Сплайны, минимизирующие инвариантные вращения полунормы в пространствах Соболева. С. 85–100, В: Конструктивная теория функций нескольких переменных, Обервольфах, 1976, У. Шемпп и К. Целлер , ред., Конспект лекций по математике, том. 571, Шпрингер, Берлин, 1977 г.
  10. ^ Вахба, Грейс. Сплайновые модели для данных наблюдений . СИАМ.
  11. ^ Гу, Чонг (2013). Сглаживающие сплайновые модели дисперсионного анализа (2-е изд.) . Springer.
  12. Перейти ↑ Wood, SN (2017). Обобщенные аддитивные модели: введение с R (2-е изд.) . Чепмен и Холл / CRC. ISBN 978-1-58488-474-3.
  13. ^ Эйлерс, PHC и Маркс Б. (1996). «Гибкое сглаживание с B-шлицами и штрафами». Статистическая наука . 11 (2): 89–121.
  14. ^ Рупперт, Дэвид; Жезл, МП; Кэрролл, RJ (2003). Полупараметрическая регрессия . Издательство Кембриджского университета. ISBN 978-0-521-78050-6.

Дальнейшее чтение [ править ]

  • Вахба, Г. (1990). Сплайновые модели для данных наблюдений . СИАМ, Филадельфия.
  • Грин, П.Дж. и Сильверман, Б.В. (1994). Непараметрическая регрессия и обобщенные линейные модели . CRC Press.
  • Де Бур, К. (2001). Практическое руководство по сплайнам (исправленное издание) . Springer.