Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску
Подбор зашумленной кривой с помощью модели асимметричного пика с итерационным процессом ( алгоритм Гаусса – Ньютона с переменным коэффициентом затухания α).
Вверху: исходные данные и модель.
Внизу: эволюция нормированной суммы квадратов ошибок.

Кривая фитинг [1] [2] представляет собой процесс построения кривой , или математическую функцию , которая имеет наилучшее соответствие серии точек данных , [3] , возможно , с учетом ограничений. [4] [5] Аппроксимация кривой может включать либо интерполяцию , [6] [7], где требуется точное соответствие данным, либо сглаживание , [8] [9], при котором строится «гладкая» функция, которая приблизительно соответствует данные. Родственная тема регрессионный анализ , [10] [11] , который больше фокусируется на вопросахстатистический вывод, например, сколько неопределенности присутствует в кривой, которая соответствует данным, наблюдаемым со случайными ошибками. Подгонянные кривые можно использовать в качестве вспомогательных средств для визуализации данных [12] [13], чтобы вывести значения функции при отсутствии данных [14] и суммировать отношения между двумя или более переменными. [15] Экстраполяция относится к использованию подобранной кривой за пределами диапазона наблюдаемых данных [16] и подвержена определенной степени неопределенности [17], поскольку она может отражать метод, использованный для построения кривой, в той же степени, в которой он отражает наблюдаемые данные.

Типы [ править ]

Подгонка функций к точкам данных[ редактировать ]

Чаще всего подходит функция вида y = f ( x ) .

Подгонка линий и полиномиальных функций к точкам данных[ редактировать ]

Точки аппроксимации полиномиальных кривых, созданные с помощью синусоидальной функции. Черная пунктирная линия - «истинные» данные, красная линия - полином первой степени , зеленая линия - вторая степень , оранжевая линия - третья степень, а синяя линия - четвертая степень.

Полиномиальное уравнение первой степени

линия с наклоном a . Линия соединит любые две точки, поэтому полиномиальное уравнение первой степени точно соответствует любым двум точкам с различными координатами x.

Если порядок уравнения увеличить до полинома второй степени, получатся следующие результаты:

Это точно соответствует простой кривой по трем точкам.

Если порядок уравнения увеличить до полинома третьей степени, получится следующее:

Этого точно хватит на четыре точки.

Более общим утверждением было бы сказать, что он точно соответствует четырем ограничениям . Каждое ограничение может быть точкой, углом или кривизной (которая является обратной величиной радиуса соприкасающегося круга ). Ограничения по углу и кривизне чаще всего добавляются к концам кривой и в таких случаях называются конечными условиями . Идентичные конечные условия часто используются для обеспечения плавного перехода между полиномиальными кривыми, содержащимися в одном сплайне . Также могут быть добавлены ограничения более высокого порядка, такие как «изменение скорости кривизны». Это, например, может быть полезно на клеверном листе шоссе.дизайн, чтобы понять скорость изменения сил, прилагаемых к автомобилю (см. рывок ), когда он следует за клеверным листом, и, соответственно, установить разумные ограничения скорости.

Полиномиальное уравнение первой степени также может точно соответствовать одной точке и углу, в то время как полиномиальное уравнение третьей степени также может точно соответствовать двум точкам, угловому ограничению и ограничению кривизны. Для них и для полиномиальных уравнений более высокого порядка возможны многие другие комбинации ограничений.

Если имеется более n  + 1 ограничений ( n - степень полинома), кривая полинома все равно может проходить через эти ограничения. Точное соответствие всем ограничениям не определено (но может произойти, например, в случае полинома первой степени, точно подходящего к трем коллинеарным точкам ). В общем, однако, для оценки каждого приближения необходим некоторый метод. Метод наименьших квадратов - это один из способов сравнения отклонений.

Есть несколько причин получить приблизительное соответствие, когда можно просто увеличить степень полиномиального уравнения и получить точное соответствие:

  • Даже если существует точное совпадение, это не обязательно означает, что его можно легко обнаружить. В зависимости от используемого алгоритма могут быть разные случаи, когда невозможно вычислить точное соответствие, или для поиска решения может потребоваться слишком много компьютерного времени. Эта ситуация может потребовать приблизительного решения.
  • Может быть желательным эффект усреднения сомнительных точек данных в выборке, а не искажения кривой, чтобы она точно соответствовала им.
  • Феномен Рунге : многочлены высокого порядка могут сильно колебаться. Если кривая проходит через две точки А и В , можно было бы ожидать , что кривая будет работать несколько рядом с серединой A и B , а также. Этого может не случиться с полиномиальными кривыми высокого порядка; они могут даже иметь очень большие положительные или отрицательные значения . С полиномами низкого порядка кривая с большей вероятностью упадет около средней точки (она даже гарантированно точно пройдет через среднюю точку на полиноме первой степени).
  • Полиномы низкого порядка имеют тенденцию быть гладкими, а полиномиальные кривые высокого порядка имеют тенденцию быть "неровными". Чтобы определить это более точно, максимальное количество точек перегиба, возможное в полиномиальной кривой, равно n-2 , где n - порядок полиномиального уравнения. Точка перегиба - это место на кривой, где он переключается с положительного радиуса на отрицательный. Мы также можем сказать, что здесь он переходит от «удерживания воды» к «проливанию воды». Обратите внимание, что полиномы высокого порядка могут быть неуклюжими только «возможно»; они также могут быть гладкими, но это не гарантирует этого, в отличие от полиномиальных кривых низкого порядка. Многочлен пятнадцатой степени может иметь не более тринадцати точек перегиба, но также может иметь двенадцать, одиннадцать,или любое число до нуля.

Степень полиномиальной кривой выше, чем требуется для точной подгонки, нежелательна по всем причинам, перечисленным ранее для полиномов высокого порядка, но также приводит к случаю, когда существует бесконечное количество решений. Например, полином первой степени (линия), ограниченный только одной точкой вместо обычных двух, даст бесконечное количество решений. Это поднимает проблему, как сравнить и выбрать только одно решение, что может быть проблемой как для программного обеспечения, так и для людей. По этой причине обычно лучше выбирать как можно более низкую степень для точного соответствия по всем ограничениям и, возможно, даже более низкую степень, если приблизительное соответствие приемлемо.

Связь между урожаем пшеницы и засолением почвы [18]

Подгонка других функций к точкам данных [ править ]

В некоторых случаях также могут использоваться другие типы кривых, такие как тригонометрические функции (например, синус и косинус).

В спектроскопии данные могут быть подогнаны с помощью функций Гаусса , Лоренца , Фойгта и других подобных функций.

В сельском хозяйстве перевернутая логистическая сигмовидная функция (S-кривая) используется для описания связи между урожайностью сельскохозяйственных культур и факторами роста. Синяя фигура была получена сигмовидной регрессией данных, измеренных на сельскохозяйственных угодьях. Видно, что изначально, то есть при низкой засоленности почвы, урожайность сельскохозяйственных культур медленно снижается при увеличении засоления почвы, а после этого снижение прогрессирует быстрее.

Алгебраическая подгонка против геометрической подгонки для кривых [ править ]

Для алгебраического анализа данных «подгонка» обычно означает попытку найти кривую, которая минимизирует вертикальное ( ось Y ) смещение точки от кривой (например, обычный метод наименьших квадратов ). Однако для графических приложений и приложений с изображениями геометрическая аппроксимация стремится обеспечить наилучшее визуальное соответствие; что обычно означает попытку минимизировать ортогональное расстояние до кривой (например, полное наименьших квадратов ) или иным образом включить обе оси смещения точки от кривой. Геометрическая посадка не пользуется популярностью, поскольку обычно требует нелинейных и / или итерационных вычислений, хотя их преимущество заключается в более эстетичном и геометрически точном результате. [19] [20] [21]

Подгонка плоских кривых к точкам данных[ редактировать ]

Если функция формы не может быть постулирована, можно попытаться описать плоскую кривую .

В некоторых случаях также могут использоваться другие типы кривых, такие как конические сечения (круговые, эллиптические, параболические и гиперболические дуги) или тригонометрические функции (такие как синус и косинус). Например, траектории объектов под действием силы тяжести следуют параболическому пути, когда сопротивление воздуха не учитывается. Следовательно, сопоставление точек данных траектории с параболической кривой имело бы смысл. Приливы следуют синусоидальным моделям, поэтому точки данных приливов должны быть сопоставлены с синусоидальной волной или суммой двух синусоидальных волн разных периодов, если учитываются эффекты Луны и Солнца.

Для параметрической кривой эффективно подбирать каждую из ее координат как отдельную функцию от длины дуги ; предполагая, что точки данных можно упорядочить, можно использовать хордовое расстояние . [22]

Подгонка круга геометрической подгонкой[ редактировать ]

Подгонка окружности по методу Купа, точки, описывающие дугу окружности, центр (1; 1), радиус 4.
различные модели эллиптических фитингов
Подгонка эллипса к минимуму алгебраического расстояния (метод Фитцгиббона).

Куп [23] подходит к проблеме поиска наилучшего визуального соответствия круга набору двумерных точек данных. Этот метод элегантно преобразует обычно нелинейную задачу в линейную, которая может быть решена без использования итерационных численных методов, и, следовательно, намного быстрее, чем предыдущие методы.

Подгонка эллипса геометрической подгонкой[ редактировать ]

Вышеупомянутый метод расширен на общие эллипсы [24] путем добавления нелинейного шага, в результате чего метод является быстрым, но при этом находит визуально приятные эллипсы произвольной ориентации и смещения.

Применение к поверхностям [ править ]

Обратите внимание, что хотя это обсуждение касалось 2D-кривых, большая часть этой логики также распространяется на 3D-поверхности, каждый участок которых определяется сеткой кривых в двух параметрических направлениях, обычно называемых u и v . Поверхность может состоять из одного или нескольких участков поверхности в каждом направлении.

Программное обеспечение [ править ]

Многие статистические пакеты, такие как R, и числовое программное обеспечение, такое как gnuplot , GNU Scientific Library , MLAB , Maple , MATLAB , Mathematica , GNU Octave и SciPy, включают команды для подбора кривой в различных сценариях. Также существуют программы, специально написанные для подбора кривой; их можно найти в списках программ статистического и численного анализа, а также в Категории: Программное обеспечение для регрессии и построения кривых .

См. Также [ править ]

  • Корректировка наблюдений
  • Уплотнение по кривой
  • Теория оценок
  • Аппроксимация функции
  • Доброту соответствия
  • Алгоритм Левенберга – Марквардта
  • Линия фитинга
  • Нелинейная регрессия
  • Переоснащение
  • Плоская кривая
  • Подгонка распределения вероятностей
  • Сглаживание
  • Сплайны ( интерполяция , сглаживание )
  • Временные ряды
  • Всего наименьших квадратов
  • Оценка тренда

Ссылки [ править ]

  1. ^ Сандра Лах Арлингхаус, Практическое руководство PHB по аппроксимации кривой. CRC Press, 1994.
  2. ^ Уильям М. Колб. Подгонка кривой для программируемых калькуляторов . Syntec, Incorporated, 1984 г.
  3. ^ С. Халли, К. Рао. 1992. Передовые методы анализа населения. ISBN  0306439972 Страница 165 ( ср . ... функции выполняются, если у нас есть хорошее или умеренное соответствие наблюдаемым данным.)
  4. ^ Сигнал и шум : почему так много прогнозов терпят неудачу, а некоторые - нет. Автор Нейт Сильвер
  5. ^ Подготовка данных для интеллектуального анализа данных : текст. Автор Дориан Пайл.
  6. ^ Численные методы в разработке с MATLAB®. Автор Яан Киусалаас. Стр.24.
  7. ^ Численные методы в разработке с Python 3 . Автор Яан Киусалаас. Стр.21.
  8. ^ Численные методы аппроксимации кривой . Автор: PG Guest, Филип Джордж Гест. Стр. 349.
  9. ^ См. Также: Mollifier
  10. ^ Подбор моделей к биологическим данным с помощью линейной и нелинейной регрессии . Харви Мотульски, Артур Христопулос.
  11. ^ Регрессионный анализ Рудольф Дж. Фройнд, Уильям Дж. Уилсон, Ping Sa. Стр. 269.
  12. ^ Визуальная информатика. Под редакцией Халимы Бадиозе Заман, Питера Робинсона, Марии Петру, Патрика Оливье, Хайко Шредера. Стр.689.
  13. ^ Численные методы для нелинейных инженерных моделей . Джон Р. Хаузер. Стр. 227.
  14. ^ Методы экспериментальной физики: спектроскопия, том 13, часть 1. Клэр Мартон. Стр.150.
  15. ^ Энциклопедия дизайна исследования, том 1. Под редакцией Нила Дж. Салкинда. Стр. 266.
  16. ^ Методы анализа и планирования сообщества . Ричард Э. Клостерман. Страница 1.
  17. ^ Введение в риск и неопределенность в оценке экологических инвестиций. Издательство ДИАНА. Стр. 69
  18. ^ Калькулятор сигмовидной регрессии
  19. ^ Ahn, Sung-Joon (декабрь 2008), "Геометрическая Подгонка параметрических кривых и поверхностей" (PDF) , журнал систем обработки информации , 4 (4): 153-158, DOI : 10,3745 / JIPS.2008.4.4.153 , архивируется из оригинала (PDF) от 13.03.2014
  20. ^ Чернов, Н .; Ма, Х. (2011), «Аппроксимация квадратичных кривых и поверхностей методом наименьших квадратов», в Yoshida, Sota R. (ed.), Computer Vision , Nova Science Publishers, стр. 285–302, ISBN. 9781612093994
  21. ^ Лю, Ян; Ван, Вэньпин (2008), «Повторное рассмотрение ортогональной аппроксимации методом наименьших квадратов параметрических кривых и поверхностей», в Chen, F .; Juttler, В. (ред.), Достижения в области геометрического моделирования и обработки , Lecture Notes в области компьютерных наук, 4975 , стр 384-397,. CiteSeerX 10.1.1.306.6085 , DOI : 10.1007 / 978-3-540-79246-8_29 , ISBN  978-3-540-79245-1
  22. ^ стр.51 в Ahlberg & Nilson (1967) Теория сплайнов и их приложения , Academic Press, 1967 [1]
  23. ^ Coope, идентификатор (1993). «Аппроксимация окружности методом линейных и нелинейных наименьших квадратов». Журнал теории оптимизации и приложений . 76 (2): 381–388. DOI : 10.1007 / BF00939613 . ЛВП : 10092/11104 .
  24. Paul Sheer, помощник по программному обеспечению для ручной стереофотометрологии , M.Sc. дипломная работа, 1997 г.

Дальнейшее чтение [ править ]

  • Н. Чернов (2010), Круговая и линейная регрессия: подгонка окружностей и линий методом наименьших квадратов , Chapman & Hall / CRC, Монографии по статистике и прикладной вероятности, том 117 (256 стр.). [2]