Кривая фитинг [1] [2] представляет собой процесс построения кривой , или математическую функцию , которая имеет наилучшее соответствие серии точек данных , [3] , возможно , с учетом ограничений. [4] [5] Аппроксимация кривой может включать либо интерполяцию , [6] [7], где требуется точное соответствие данным, либо сглаживание , [8] [9], в котором строится «гладкая» функция, которая приблизительно соответствует данные. Родственная тема регрессионный анализ , [10] [11] , который больше фокусируется на вопросахстатистический вывод, например, сколько неопределенности присутствует в кривой, которая соответствует данным, наблюдаемым со случайными ошибками. Подгонянные кривые можно использовать в качестве вспомогательных средств для визуализации данных [12] [13], чтобы вывести значения функции, когда данные недоступны, [14] и суммировать отношения между двумя или более переменными. [15] Экстраполяция относится к использованию подобранной кривой за пределами диапазона наблюдаемых данных [16] и подвержена определенной степени неопределенности [17], поскольку она может отражать метод, использованный для построения кривой, в той же степени, в которой он отражает наблюдаемые данные.
Подгонка функций к точкам данных
Чаще всего подходит функция вида y = f ( x ) .
Подгонка линий и полиномиальных функций к точкам данных
Полиномиальное уравнение первой степени
это линия с наклоном a . Линия соединит любые две точки, поэтому полиномиальное уравнение первой степени точно соответствует любым двум точкам с разными координатами x.
Если порядок уравнения увеличить до полинома второй степени, будут получены следующие результаты:
Это точно соответствует простой кривой по трем точкам.
Если порядок уравнения увеличить до полинома третьей степени, получится следующее:
Этого точно хватит на четыре точки.
Более общим утверждением было бы сказать, что он точно соответствует четырем ограничениям . Каждое ограничение может быть точкой, углом или кривизной (которая является обратной величиной радиуса соприкасающегося круга ). Ограничения по углу и кривизне чаще всего добавляются к концам кривой и в таких случаях называются конечными условиями . Идентичные конечные условия часто используются для обеспечения плавного перехода между полиномиальными кривыми, содержащимися в одном сплайне . Также могут быть добавлены ограничения более высокого порядка, такие как «изменение скорости кривизны». Это, например, было бы полезно при проектировании клеверного листа для шоссе, чтобы понять скорость изменения сил, приложенных к автомобилю (см. Рывок ), когда он следует за клеверным листом, и, соответственно, установить разумные ограничения скорости.
Полиномиальное уравнение первой степени также может точно соответствовать одной точке и углу, в то время как полиномиальное уравнение третьей степени также может точно соответствовать двум точкам, угловому ограничению и ограничению кривизны. Для них и для полиномиальных уравнений более высокого порядка возможны многие другие комбинации ограничений.
Если имеется более чем n + 1 ограничений ( n - степень полинома), полиномиальная кривая все равно может проходить через эти ограничения. Точное соответствие всем ограничениям не определено (но может произойти, например, в случае полинома первой степени, точно подходящего к трем коллинеарным точкам ). Однако в общем случае для оценки каждого приближения требуется какой-то метод. Метод наименьших квадратов - один из способов сравнить отклонения.
Есть несколько причин получить приблизительное соответствие, когда можно просто увеличить степень полиномиального уравнения и получить точное совпадение:
- Даже если существует точное совпадение, это не обязательно означает, что его можно легко обнаружить. В зависимости от используемого алгоритма может иметь место расходящийся случай, когда невозможно рассчитать точное соответствие, или для поиска решения может потребоваться слишком много компьютерного времени. Эта ситуация может потребовать приблизительного решения.
- Может быть желательным эффект усреднения сомнительных точек данных в выборке, а не искажения кривой, чтобы она точно соответствовала им.
- Феномен Рунге : полиномы высокого порядка могут сильно колебаться. Если кривая проходит через две точки А и В , можно было бы ожидать , что кривая будет работать несколько рядом с серединой A и B , а также. Этого может не случиться с полиномиальными кривыми высокого порядка; они могут даже иметь очень большие положительные или отрицательные значения . С полиномами низкого порядка кривая с большей вероятностью упадет около средней точки (она даже гарантированно точно пройдет через среднюю точку на полиноме первой степени).
- Полиномы низкого порядка имеют тенденцию быть гладкими, а полиномиальные кривые высокого порядка - «неровными». Чтобы определить это более точно, максимальное количество точек перегиба, возможное в полиномиальной кривой, равно n-2 , где n - порядок полиномиального уравнения. Точка перегиба - это место на кривой, где она переключается с положительного радиуса на отрицательный. Мы также можем сказать, что здесь происходит переход от «удержания воды» к «проливанию воды». Обратите внимание, что полиномы высокого порядка могут быть неуклюжими только «возможно»; они также могут быть гладкими, но это не гарантирует этого, в отличие от полиномиальных кривых низкого порядка. Многочлен пятнадцатой степени может иметь не более тринадцати точек перегиба, но также может иметь одиннадцать, девять или любое нечетное число до единицы. (Многочлены с четной степенью могут иметь любое четное количество точек перегиба от n - 2 до нуля.)
Степень полиномиальной кривой выше, чем требуется для точной подгонки, нежелательна по всем причинам, перечисленным ранее для полиномов высокого порядка, но также приводит к случаю, когда существует бесконечное количество решений. Например, полином первой степени (линия), ограниченный только одной точкой вместо обычных двух, даст бесконечное количество решений. Это поднимает проблему, как сравнить и выбрать только одно решение, что может быть проблемой как для программного обеспечения, так и для людей. По этой причине обычно лучше выбирать как можно более низкую степень для точного соответствия по всем ограничениям и, возможно, даже более низкую степень, если приблизительное соответствие приемлемо.
Подгонка других функций к точкам данных
В некоторых случаях также могут использоваться другие типы кривых, такие как тригонометрические функции (например, синус и косинус).
В спектроскопии данные могут быть подогнаны с помощью функций Гаусса , Лоренца , Фойгта и других родственных функций.
В сельском хозяйстве перевернутая логистическая сигмовидная функция (S-кривая) используется для описания взаимосвязи между урожайностью сельскохозяйственных культур и факторами роста. Синяя фигура получена сигмовидной регрессией данных, измеренных на сельскохозяйственных угодьях. Видно, что изначально, то есть при низкой засоленности почвы, урожайность сельскохозяйственных культур медленно снижается при увеличении засоления почвы, а после этого снижение прогрессирует быстрее.
Алгебраическая подгонка против геометрической подгонки для кривых
Для алгебраического анализа данных «подгонка» обычно означает попытку найти кривую, которая минимизирует вертикальное ( ось Y ) смещение точки от кривой (например, обычный метод наименьших квадратов ). Однако для графических приложений и приложений с изображениями геометрическая подгонка стремится обеспечить наилучшее визуальное соответствие; что обычно означает попытку минимизировать ортогональное расстояние до кривой (например, метод наименьших квадратов ) или иным образом включить обе оси смещения точки от кривой. Геометрическая посадка не пользуется популярностью, поскольку обычно требует нелинейных и / или итерационных расчетов, хотя их преимущество заключается в более эстетичном и геометрически точном результате. [19] [20] [21]
Подгонка плоских кривых к точкам данных
Если функция вида невозможно постулировать, можно попытаться описать плоскую кривую .
В некоторых случаях также могут использоваться другие типы кривых, такие как конические сечения (круговые, эллиптические, параболические и гиперболические дуги) или тригонометрические функции (например, синус и косинус). Например, траектории объектов под действием силы тяжести следуют параболическому пути, когда сопротивление воздуха игнорируется. Следовательно, сопоставление точек данных траектории с параболической кривой имело бы смысл. Приливы следуют синусоидальным паттернам, поэтому точки данных приливов должны соответствовать синусоидальной волне или сумме двух синусоидальных волн разных периодов, если учитываются эффекты Луны и Солнца.
Для параметрической кривой эффективно подбирать каждую из ее координат как отдельную функцию от длины дуги ; предполагая, что точки данных можно упорядочить, можно использовать хордовое расстояние . [22]
Подгонка круга геометрической подгонкой
Купе [23] подходит к проблеме поиска наилучшего визуального соответствия круга набору двумерных точек данных. Этот метод элегантно преобразует обычно нелинейную задачу в линейную, которую можно решить без использования итерационных численных методов, и, следовательно, он намного быстрее, чем предыдущие методы.
Подгонка эллипса геометрической подгонкой
Вышеупомянутый метод расширен на общие эллипсы [24] путем добавления нелинейного шага, в результате чего метод является быстрым, но при этом находит визуально приятные эллипсы произвольной ориентации и смещения.
Посадочные поверхности
Обратите внимание, что хотя это обсуждение касалось 2D-кривых, большая часть этой логики также распространяется на 3D-поверхности, каждый участок которых определяется сеткой кривых в двух параметрических направлениях, обычно называемых u и v . Поверхность может состоять из одного или нескольких участков поверхности в каждом направлении.
Программное обеспечение
Многие статистические пакеты, такие как R, и числовое программное обеспечение, такое как gnuplot , GNU Scientific Library , MLAB , Maple , MATLAB , Scilab , Mathematica , GNU Octave и SciPy, включают команды для подбора кривой в различных сценариях. Есть также программы, специально написанные для подбора кривой; их можно найти в списках программ статистического и численного анализа, а также в Категории: Программное обеспечение для регрессии и построения кривых .
Смотрите также
- Корректировка наблюдений
- Уплотнение по кривой
- Теория оценок
- Аппроксимация функции
- Доброта подгонки
- Алгоритм Левенберга – Марквардта
- Линия фитинга
- Нелинейная регрессия
- Переоснащение
- Плоская кривая
- Подгонка распределения вероятностей
- Сглаживание
- Сплайны ( интерполяция , сглаживание )
- Временная последовательность
- Всего наименьших квадратов
- Оценка тренда
Рекомендации
- ^ Сандра Лах Арлингхаус, Практическое руководство PHB по подгонке кривой. CRC Press, 1994.
- ^ Уильям М. Колб. Подгонка кривой для программируемых калькуляторов . Syntec, Incorporated, 1984 г.
- ^ С. Халли, К. Рао. 1992. Передовые методы анализа населения. ISBN 0306439972 Страница 165 ( ср . ... функции выполняются, если у нас есть хорошее или умеренное соответствие наблюдаемым данным.)
- ^ Сигнал и шум : почему так много прогнозов терпят неудачу, а некоторые - нет. Автор Нейт Сильвер
- ^ Подготовка данных для интеллектуального анализа данных : Текст. Автор Дориан Пайл.
- ^ Численные методы в разработке с MATLAB®. Автор Яан Киусалаас. Стр.24.
- ^ Численные методы в разработке с Python 3 . Автор Яан Киусалаас. Стр.21.
- ^ Численные методы аппроксимации кривой . Автор PG Guest, Филип Джордж Гест. Стр. 349.
- ^ См. Также: Mollifier
- ^ Подбор моделей к биологическим данным с использованием линейной и нелинейной регрессии . Харви Мотульски, Артур Христопулос.
- ^ Регрессионный анализ Рудольф Дж. Фройнд, Уильям Дж. Уилсон, Ping Sa. Стр. 269.
- ^ Визуальная информатика. Под редакцией Халимы Бадиоз Заман, Питера Робинсона, Марии Петру, Патрика Оливье, Хайко Шредера. Стр. 689.
- ^ Численные методы для нелинейных инженерных моделей . Джон Р. Хаузер. Стр. 227.
- ^ Методы экспериментальной физики: спектроскопия, том 13, часть 1. Клэр Мартон. Стр.150.
- ^ Энциклопедия дизайна исследования, том 1. Под редакцией Нила Дж. Салкинда. Стр. 266.
- ^ Методы анализа и планирования сообщества . Ричард Э. Клостерман. Страница 1.
- ^ Введение в риск и неопределенность в оценке экологических инвестиций. Издательство ДИАНА. Стр. 69
- ^ Калькулятор сигмовидной регрессии
- ^ Ahn, Sung-Joon (декабрь 2008), "Геометрическая Подгонка параметрических кривых и поверхностей" (PDF) , журнал систем обработки информации , 4 (4): 153-158, DOI : 10,3745 / JIPS.2008.4.4.153 , архивируется из оригинал (PDF) от 13.03.2014
- ^ Чернов, Н .; Ма, Х. (2011), «Аппроксимация квадратичных кривых и поверхностей по методу наименьших квадратов», в Yoshida, Sota R. (ed.), Computer Vision , Nova Science Publishers, стр. 285–302, ISBN. 9781612093994
- ^ Лю, Ян; Ван, Вэньпин (2008), «Повторное рассмотрение ортогональной аппроксимации методом наименьших квадратов параметрических кривых и поверхностей», в Chen, F .; Juttler, В. (ред.), Достижения в области геометрического моделирования и обработки , Lecture Notes в области компьютерных наук, 4975 , стр 384-397,. CiteSeerX 10.1.1.306.6085 , DOI : 10.1007 / 978-3-540-79246-8_29 , ISBN 978-3-540-79245-1
- ^ стр.51 в Ahlberg & Nilson (1967) Теория сплайнов и их приложения , Academic Press, 1967 [1]
- ^ Купе, И.Д. (1993). «Аппроксимация окружности методом линейных и нелинейных наименьших квадратов». Журнал теории оптимизации и приложений . 76 (2): 381–388. DOI : 10.1007 / BF00939613 . ЛВП : 10092/11104 .
- ↑ Paul Sheer, помощник по программному обеспечению для ручной стереофотометрологии , M.Sc. дипломная работа, 1997 г.
дальнейшее чтение
- Н. Чернов (2010), Круговая и линейная регрессия: подгонка окружностей и линий методом наименьших квадратов , Chapman & Hall / CRC, Монографии по статистике и прикладной вероятности, том 117 (256 стр.). [2]