Алгоритм Гаусса – Ньютона

Алгоритм Гаусса-Ньютона используется для решения нелинейных наименьших квадратов проблем. Это модификация метода Ньютона для нахождения минимума в виде функции . В отличие от метода Ньютона, алгоритм Гаусса – Ньютона может использоваться только для минимизации суммы квадратов значений функции, но он имеет то преимущество, что вторые производные, которые может быть сложно вычислить, не требуются. ^[1]

Аппроксимация зашумленной кривой с помощью модели асимметричного пика с использованием алгоритма Гаусса – Ньютона с переменным коэффициентом затухания α.
Вверху: исходные данные и модель.
Внизу: эволюция нормализованной суммы квадратов ошибок.

Проблемы нелинейных наименьших квадратов возникают, например, в нелинейной регрессии , когда параметры в модели ищутся так, чтобы модель хорошо согласовывалась с имеющимися наблюдениями.

Метод назван в честь математиков Карла Фридриха Гаусса и Исаака Ньютона и впервые появился в работе Гаусса 1809 года Theoria motus corporum coelestium in sectionibus conicis solem ambientum . ^[2]

Описание

Для m функций r = ( r ₁ ,…, r _m ) (часто называемых остатками) от n переменных β = ( β ₁ ,…, β _n ) при m ≥ n алгоритм Гаусса – Ньютона итеративно находит значение переменные, минимизирующие сумму квадратов ^[3]

{\ displaystyle S ({\ boldsymbol {\ beta}}) = \ sum _ {i = 1} ^ {m} r_ {i} ({\ boldsymbol {\ beta}}) ^ {2}.}

Начиная с первоначального предположения ${\ displaystyle {\ boldsymbol {\ beta}} ^ {(0)}}$ для минимума метод продолжается итерациями

{\ displaystyle {\ boldsymbol {\ beta}} ^ {(s + 1)} = {\ boldsymbol {\ beta}} ^ {(s)} - \ left (\ mathbf {J_ {r}} ^ {\ mathsf {T}} \ mathbf {J_ {r}} \ right) ^ {- 1} \ mathbf {J_ {r}} ^ {\ mathsf {T}} \ mathbf {r} \ left ({\ boldsymbol {\ beta }} ^ {(s)} \ right),}

где, если r и β - векторы-столбцы , элементы матрицы Якоби равны

{\ displaystyle \ left (\ mathbf {J_ {r}} \ right) _ {ij} = {\ frac {\ partial r_ {i} \ left ({\ boldsymbol {\ beta}} ^ {(s)} \ справа)} {\ partial \ beta _ {j}}},}

и символ ${\ Displaystyle ^ {\ mathsf {T}}}$ обозначает транспонирование матрицы .

Если m = n , итерация упрощается до

{\ displaystyle {\ boldsymbol {\ beta}} ^ {(s + 1)} = {\ boldsymbol {\ beta}} ^ {(s)} - \ left (\ mathbf {J_ {r}} \ right) ^ {-1} \ mathbf {r} \ left ({\ boldsymbol {\ beta}} ^ {(s)} \ right),}

что является прямым обобщением метода Ньютона в одном измерении.

При подборе данных, где цель состоит в том, чтобы найти такие параметры β , чтобы данная модельная функция y = f ( x , β ) наилучшим образом соответствовала некоторым точкам данных ( x _i , y _i ), функции r _i являются остатками :

{\ displaystyle r_ {i} ({\ boldsymbol {\ beta}}) = y_ {i} -f \ left (x_ {i}, {\ boldsymbol {\ beta}} \ right).}

Тогда метод Гаусса – Ньютона можно выразить через якобиан J _f функции f как

{\ displaystyle {\ boldsymbol {\ beta}} ^ {(s + 1)} = {\ boldsymbol {\ beta}} ^ {(s)} + \ left (\ mathbf {J_ {f}} ^ {\ mathsf {T}} \ mathbf {J_ {f}} \ right) ^ {- 1} \ mathbf {J_ {f}} ^ {\ mathsf {T}} \ mathbf {r} \ left ({\ boldsymbol {\ beta }} ^ {(s)} \ right).}

Обратите внимание, что ${\ displaystyle \ left (\ mathbf {J_ {f}} ^ {\ mathsf {T}} \ mathbf {J_ {f}} \ right) ^ {- 1} \ mathbf {J_ {f}} ^ {\ mathsf {T}}}$ является левой Псевдообратный из ${\ displaystyle \ mathbf {J_ {f}}}$ .

Заметки

Предположение m ≥ n в формулировке алгоритма необходимо, поскольку в противном случае матрица J _r^TJ _r не обратима и нормальные уравнения не могут быть решены (по крайней мере, однозначно).

Алгоритм Гаусса – Ньютона может быть получен путем линейной аппроксимации вектора функций r _i . Используя теорему Тейлора , мы можем писать на каждой итерации:

{\ displaystyle \ mathbf {r} ({\ boldsymbol {\ beta}}) \ приблизительно \ mathbf {r} \ left ({\ boldsymbol {\ beta}} ^ {(s)} \ right) + \ mathbf {J_ {r}} \ left ({\ boldsymbol {\ beta}} ^ {(s)} \ right) \ Delta}

с участием ${\ displaystyle \ Delta = {\ boldsymbol {\ beta}} - {\ boldsymbol {\ beta}} ^ {(s)}}$ . Задача найти Δ, минимизирующую сумму квадратов правой части; т.е.

{\ displaystyle \ min \ left \ | \ mathbf {r} \ left ({\ boldsymbol {\ beta}} ^ {(s)} \ right) + \ mathbf {J_ {r}} \ left ({\ boldsymbol { \ beta}} ^ {(s)} \ right) \ Delta \ right \ | _ {2} ^ {2},}

является линейной задачей наименьших квадратов , которая может быть решена явно, давая нормальные уравнения в алгоритме.

Нормальные уравнения - это n одновременных линейных уравнений с неизвестными приращениями Δ. Они могут быть решены за один шаг, используя разложение Холецкого , или, лучше, с QR - разложение на J _г . Для больших систем итерационный метод , такой как метод сопряженных градиентов , может быть более эффективным. Если существует линейная зависимость между столбцами J _r , итерации не удастся, поскольку J _r^TJ _r становится сингулярным.

Когда ${\ displaystyle \ mathbf {r}}$ сложный ${\ displaystyle \ mathbf {r}}$ : C ⁿ ${\ displaystyle \ rightarrow}$ C следует использовать конъюгированную форму: ${\ displaystyle \ left ({\ overline {\ mathbf {J_ {f}}}} ^ {\ mathsf {T}} \ mathbf {J_ {f}} \ right) ^ {- 1} {\ overline {\ mathbf {J_ {f}}}} ^ {\ mathsf {T}}}$ .

Пример

Расчетная кривая, полученная с

{\ displaystyle {\ hat {\ beta}} _ {1} = 0,362}

а также

{\ displaystyle {\ hat {\ beta}} _ {2} = 0,556}

(синим цветом) по сравнению с наблюдаемыми данными (красным)

В этом примере алгоритм Гаусса – Ньютона будет использоваться для подгонки модели к некоторым данным путем минимизации суммы квадратов ошибок между данными и прогнозами модели.

В биологическом эксперименте, изучающем связь между концентрацией субстрата $[S]$ и скоростью реакции в ферментно-опосредованной реакции, были получены данные в следующей таблице.

$я$	1	2	3	4	5	6	7
$[S]$	0,038	0,194	0,425	0,626	1,253	2,500	3,740
Показатель	0,050	0,127	0,094	0,2122	0,2729	0,2665	0,3317

Требуется найти кривую (модельную функцию) вида

{\ displaystyle {\ text {rate}} = {\ frac {V _ {\ text {max}} [S]} {K_ {M} + [S]}}}

который наилучшим образом соответствует данным методом наименьших квадратов, с параметрами ${\ displaystyle V _ {\ text {max}}}$ а также ${\ displaystyle K_ {M}}$ быть определенным.

Обозначим через ${\ displaystyle x_ {i}}$ а также ${\ displaystyle y_ {i}}$ значение $[S]$ и ставка из таблицы, ${\ Displaystyle я = 1, \ точки, 7}$ . Позволять ${\ displaystyle \ beta _ {1} = V _ {\ text {max}}}$ а также ${\ displaystyle \ beta _ {2} = K_ {M}}$ . Мы найдем ${\ displaystyle \ beta _ {1}}$ а также ${\ displaystyle \ beta _ {2}}$ такая, что сумма квадратов остатков

{\ displaystyle r_ {i} = y_ {i} - {\ frac {\ beta _ {1} x_ {i}} {\ beta _ {2} + x_ {i}}} \ quad (i = 1, \ точки, 7)}

сводится к минимуму.

Якобиан ${\ displaystyle \ mathbf {J_ {r}}}$ вектора невязок ${\ displaystyle r_ {i}}$ в отношении неизвестных ${\ displaystyle \ beta _ {j}}$ это ${\ displaystyle 7 \ times 2}$ матрица с ${\ displaystyle i}$ -я строка с записями

{\ displaystyle {\ frac {\ partial r_ {i}} {\ partial \ beta _ {1}}} = - {\ frac {x_ {i}} {\ beta _ {2} + x_ {i}}} ; {\ frac {\ partial r_ {i}} {\ partial \ beta _ {2}}} = {\ frac {\ beta _ {1} x_ {i}} {\ left (\ beta _ {2} + x_ {i} \ right) ^ {2}}}.}

Начиная с первоначальных оценок ${\ displaystyle \ beta _ {1} = 0,9}$ а также ${\ displaystyle \ beta _ {2} = 0,2}$ , после пяти итераций алгоритма Гаусса – Ньютона оптимальные значения ${\ displaystyle {\ hat {\ beta}} _ {1} = 0,362}$ а также ${\ displaystyle {\ hat {\ beta}} _ {2} = 0,556}$ получены. Сумма квадратов остатков уменьшилась с начального значения 1,445 до 0,00784 после пятой итерации. График на рисунке справа показывает кривую, определенную моделью для оптимальных параметров с наблюдаемыми данными.

Свойства сходимости

Можно показать ^[4] , что приращение Δ является направлением спуска для S , и, если алгоритм сходится, то предел является стационарной точкой из S . Однако не гарантируется сходимость, даже локальная сходимость, как в методе Ньютона , или сходимость при обычных условиях Вульфа. ^[5]

Скорость сходимости алгоритма Гаусса – Ньютона может приближаться к квадратичной . ^[6] Алгоритм может сходиться медленно или не сходиться вообще, если первоначальное предположение далеко от минимума или матрица ${\ Displaystyle \ mathbf {J_ {r} ^ {\ mathsf {T}} J_ {r}}}$ в плохом состоянии . Например, рассмотрим проблему с ${\ displaystyle m = 2}$ уравнения и ${\ Displaystyle п = 1}$ переменная, заданная

{\ displaystyle {\ begin {align} r_ {1} (\ beta) & = \ beta +1, \\ r_ {2} (\ beta) & = \ lambda \ beta ^ {2} + \ beta -1. \ конец {выровнено}}}

Оптимум на ${\ displaystyle \ beta = 0}$ . (На самом деле оптимум при ${\ displaystyle \ beta = -1}$ для ${\ displaystyle \ lambda = 2}$ , так как ${\ Displaystyle S (0) = 1 ^ {2} + (- 1) ^ {2} = 2}$ , но ${\ Displaystyle S (-1) = 0}$ .) Если ${\ displaystyle \ lambda = 0}$ , то фактически задача является линейной, и метод находит оптимум за одну итерацию. Если | λ | <1, то метод линейно сходится и погрешность уменьшается асимптотически с коэффициентом | λ | на каждой итерации. Однако если | λ | > 1, то метод даже не сходится локально. ^[7]

Вывод из метода Ньютона

В дальнейшем алгоритм Гаусса – Ньютона будет выведен из метода Ньютона для оптимизации функций с помощью аппроксимации. Как следствие, скорость сходимости алгоритма Гаусса – Ньютона может быть квадратичной при определенных условиях регулярности. В целом (при более слабых условиях) скорость сходимости линейна. ^[8]

Рекуррентное соотношение для метода Ньютона минимизации функции S параметров ${\ displaystyle {\ boldsymbol {\ beta}}}$ является

{\ displaystyle {\ boldsymbol {\ beta}} ^ {(s + 1)} = {\ boldsymbol {\ beta}} ^ {(s)} - \ mathbf {H} ^ {- 1} \ mathbf {g} ,}

где г обозначает вектор градиента в S , а Н обозначает матрицу Гессе из S .

С ${\ Displaystyle S = \ сумма _ {я = 1} ^ {m} r_ {я} ^ {2}}$ , градиент определяется выражением

{\ displaystyle g_ {j} = 2 \ sum _ {i = 1} ^ {m} r_ {i} {\ frac {\ partial r_ {i}} {\ partial \ beta _ {j}}}.}

Элементы гессиана вычисляются путем дифференцирования элементов градиента, ${\ displaystyle g_ {j}}$ , относительно ${\ displaystyle \ beta _ {k}}$ :

{\ displaystyle H_ {jk} = 2 \ sum _ {i = 1} ^ {m} \ left ({\ frac {\ partial r_ {i}} {\ partial \ beta _ {j}}} {\ frac { \ partial r_ {i}} {\ partial \ beta _ {k}}} + r_ {i} {\ frac {\ partial ^ {2} r_ {i}} {\ partial \ beta _ {j} \ partial \ beta _ {k}}} \ right).}

Метод Гаусса – Ньютона получается путем игнорирования членов второй производной (второй член в этом выражении). То есть гессиан аппроксимируется

{\ displaystyle H_ {jk} \ приблизительно 2 \ sum _ {i = 1} ^ {m} J_ {ij} J_ {ik},}

где ${\ displaystyle J_ {ij} = {\ frac {\ partial r_ {i}} {\ partial \ beta _ {j}}}}$ являются элементами якобиана J _r . Градиент и приближенный гессиан можно записать в матричных обозначениях как

{\ displaystyle \ mathbf {g} = 2 {\ mathbf {J} _ {\ mathbf {r}}} ^ {\ mathsf {T}} \ mathbf {r}, \ quad \ mathbf {H} \ приблизительно 2 { \ mathbf {J} _ {\ mathbf {r}}} ^ {\ mathsf {T}} \ mathbf {J_ {r}}.}

Эти выражения подставляются в приведенное выше рекуррентное соотношение, чтобы получить операционные уравнения

{\ displaystyle {\ boldsymbol {\ beta}} ^ {(s + 1)} = {\ boldsymbol {\ beta}} ^ {(s)} + \ Delta; \ quad \ Delta = - \ left (\ mathbf { J_ {r}} ^ {\ mathsf {T}} \ mathbf {J_ {r}} \ right) ^ {- 1} \ mathbf {J_ {r}} ^ {\ mathsf {T}} \ mathbf {r} .}

Сходимость метода Гаусса – Ньютона не гарантируется во всех случаях. Приближение

{\ displaystyle \ left | r_ {i} {\ frac {\ partial ^ {2} r_ {i}} {\ partial \ beta _ {j} \ partial \ beta _ {k}}} \ right | \ ll \ left | {\ frac {\ partial r_ {i}} {\ partial \ beta _ {j}}} {\ frac {\ partial r_ {i}} {\ partial \ beta _ {k}}} \ right |}

условие, которое необходимо соблюдать, чтобы иметь возможность игнорировать члены производной второго порядка, может быть справедливым в двух случаях, для которых следует ожидать сходимости: ^[9]

Значения функции ${\ displaystyle r_ {i}}$ по величине невелики, по крайней мере, около минимума.
Функции только "умеренно" нелинейны, так что ${\ displaystyle {\ frac {\ partial ^ {2} r_ {i}} {\ partial \ beta _ {j} \ partial \ beta _ {k}}}}$ относительно невелика по величине.

Улучшенные версии

В методе Гаусса – Ньютона сумма квадратов невязок S может не уменьшаться на каждой итерации. Однако, поскольку Δ - направление спуска, если только ${\ displaystyle S \ left ({\ boldsymbol {\ beta}} ^ {s} \ right)}$ является стационарной точкой, справедливо ${\ displaystyle S \ left ({\ boldsymbol {\ beta}} ^ {s} + \ alpha \ Delta \ right)$ для всех достаточно малых ${\ displaystyle \ alpha> 0}$ . Таким образом, если происходит расхождение, одним из решений является использование дроби ${\ displaystyle \ alpha}$ вектора приращения Δ в формуле обновления:

{\ displaystyle {\ boldsymbol {\ beta}} ^ {s + 1} = {\ boldsymbol {\ beta}} ^ {s} + \ alpha \ Delta.}

.

Другими словами, вектор приращения слишком длинный, но он по- прежнему указывает на «гору», так происходит только часть пути будет уменьшать целевую функцию S . Оптимальное значение для ${\ displaystyle \ alpha}$ можно найти с помощью алгоритма линейного поиска , то есть по величине ${\ displaystyle \ alpha}$ определяется путем нахождения значения, которое минимизирует S , обычно с использованием метода прямого поиска в интервале ${\ Displaystyle 0 <\ альфа <1}$ или поиск строки с возвратом, такой как поиск Armijo-line . Обычно ${\ displaystyle \ alpha}$ следует выбирать так, чтобы он удовлетворял условиям Вульфа или Гольдштейна . ^[10]

В случаях, когда направление вектора сдвига таково, что оптимальная доля α близка к нулю, альтернативным методом обработки расхождения является использование алгоритма Левенберга – Марквардта , метода доверительной области . ^[3] Нормальные уравнения изменены таким образом, что вектор приращения поворачивается в направлении наискорейшего спуска ,

{\ displaystyle \ left (\ mathbf {J ^ {\ mathsf {T}} J + \ lambda D} \ right) \ Delta = - \ mathbf {J} ^ {\ mathsf {T}} \ mathbf {r},}

где D - положительная диагональная матрица. Обратите внимание, что когда D является единичной матрицей I и ${\ displaystyle \ lambda \ to + \ infty}$ , тогда ${\ displaystyle \ lambda \ Delta = \ lambda \ left (\ mathbf {J ^ {\ mathsf {T}} J} + \ lambda \ mathbf {I} \ right) ^ {- 1} \ left (- \ mathbf { J} ^ {\ mathsf {T}} \ mathbf {r} \ right) = \ left (\ mathbf {I} - \ mathbf {J ^ {\ mathsf {T}} J} / \ lambda + \ cdots \ right ) \ left (- \ mathbf {J} ^ {\ mathsf {T}} \ mathbf {r} \ right) \ to - \ mathbf {J} ^ {\ mathsf {T}} \ mathbf {r}}$ , поэтому направление Δ приближается к направлению отрицательного градиента ${\ displaystyle - \ mathbf {J} ^ {\ mathsf {T}} \ mathbf {r}}$ .

Так называемый параметр Марквардта ${\ displaystyle \ lambda}$ также может быть оптимизирован линейным поиском, но это неэффективно, так как вектор сдвига необходимо пересчитывать каждый раз ${\ displaystyle \ lambda}$ изменено. Более эффективная стратегия заключается в следующем: Когда происходит дивергенция, увеличивают параметр Марквардта до тех пор , пока не будет уменьшение S . Затем сохраняйте значение от одной итерации к следующей, но уменьшайте его, если возможно, до достижения порогового значения, когда параметр Marquardt может быть установлен на ноль; минимизация S тогда становится стандартной минимизацией Гаусса – Ньютона.

Масштабная оптимизация

Для крупномасштабной оптимизации метод Гаусса – Ньютона представляет особый интерес, поскольку часто (хотя, конечно, не всегда) верно, что матрица ${\ displaystyle \ mathbf {J} _ {\ mathbf {r}}}$ более разреженный, чем приблизительный гессен ${\ Displaystyle \ mathbf {J} _ {\ mathbf {r}} ^ {\ mathsf {T}} \ mathbf {J_ {r}}}$ . В таких случаях само пошаговое вычисление обычно необходимо выполнять с помощью приближенного итерационного метода, подходящего для больших и разреженных задач, такого как метод сопряженных градиентов .

Чтобы такой подход работал, нужен как минимум эффективный метод вычисления продукта.

{\ Displaystyle {\ mathbf {J} _ {\ mathbf {r}}} ^ {\ mathsf {T}} \ mathbf {J_ {r}} \ mathbf {p}}

для некоторого вектора p . При разреженном хранении матриц , как правило, практично хранить строки ${\ displaystyle \ mathbf {J} _ {\ mathbf {r}}}$ в сжатом виде (например, без нулевых записей), что затрудняет прямое вычисление вышеуказанного продукта из-за транспонирования. Однако, если определить c _i как строку i матрицы ${\ displaystyle \ mathbf {J} _ {\ mathbf {r}}}$ , выполняется следующее простое соотношение:

{\ displaystyle {\ mathbf {J} _ {\ mathbf {r}}} ^ {\ mathsf {T}} \ mathbf {J_ {r}} \ mathbf {p} = \ sum _ {i} \ mathbf {c } _ {i} \ left (\ mathbf {c} _ {i} \ cdot \ mathbf {p} \ right),}

так что каждая строка вносит дополнительный и независимый вклад в продукт. Помимо соблюдения практической структуры разреженной памяти, это выражение хорошо подходит для параллельных вычислений . Обратите внимание, что каждая строка c _i является градиентом соответствующей невязки r _i ; Имея это в виду, приведенная выше формула подчеркивает тот факт, что остатки вносят вклад в проблему независимо друг от друга.

Связанные алгоритмы

В квазиньютоновском методе , таком как метод Дэвидона, Флетчера и Пауэлла или Бройдена – Флетчера – Гольдфарба – Шанно ( метод BFGS ), оценка полного гессиана ${\ displaystyle {\ frac {\ partial ^ {2} S} {\ partial \ beta _ {j} \ partial \ beta _ {k}}}}$ строится численно с использованием первых производных ${\ displaystyle {\ frac {\ partial r_ {i}} {\ partial \ beta _ {j}}}}$ только так, чтобы после n циклов уточнения метод по своим характеристикам приближался к методу Ньютона. Обратите внимание, что квазиньютоновские методы могут минимизировать общие вещественные функции, тогда как методы Гаусса – Ньютона, Левенберга – Марквардта и т. Д. Подходят только для нелинейных задач наименьших квадратов.

Другой метод решения задач минимизации с использованием только первых производных - это градиентный спуск . Однако этот метод даже приближенно не учитывает вторые производные. Следовательно, это очень неэффективно для многих функций, особенно если параметры сильно взаимодействуют.

Заметки

^ Mittelhammer, Ron C .; Миллер, Дуглас Дж .; Судья Джордж Г. (2000). Эконометрические основы . Кембридж: Издательство Кембриджского университета. С. 197–198. ISBN 0-521-62394-4.
^ Floudas, Christodoulos A .; Пардалос, Панос М. (2008). Энциклопедия оптимизации . Springer. п. 1130. ISBN 9780387747583. CS1 maint: обескураженный параметр ( ссылка )
^ а б Бьорк (1996)
^ Бьорк (1996), стр. 260.
^ Маскаренхас (2013), "Расходимость BFGS и Гаусса методов Ньютона", математического программирования , 147 (1): 253-276, Arxiv : 1309.7922 , DOI : 10.1007 / s10107-013-0720-6
^ Бьорк (1996), стр. 341, 342.
^ Флетчер (1987), стр. 113.
^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 04.08.2016 . Проверено 25 апреля 2014 .CS1 maint: заархивированная копия как заголовок ( ссылка )
^ Nocedal (1999), стр. 259.
^ Нокедаль, Хорхе. (1999). Численная оптимизация . Райт, Стивен Дж., 1960-. Нью-Йорк: Спрингер. ISBN 0387227423. OCLC 54849297 .

Внешние ссылки

Вероятность, статистика и оценка . Алгоритм подробно описан и применяется к биологическому эксперименту, обсуждаемому в качестве примера в этой статье (стр. 84 с неопределенностями в расчетных значениях).

Реализации

Artelys Knitro - это нелинейный решатель с реализацией метода Гаусса – Ньютона. Он написан на C и имеет интерфейсы с C ++ / C # / Java / Python / MATLAB / R.

[1] Mittelhammer, Ron C .; Миллер, Дуглас Дж .; Судья Джордж Г. (2000). Эконометрические основы . Кембридж: Издательство Кембриджского университета. С. 197–198. ISBN 0-521-62394-4.

[optimizationEncyc-2] Floudas, Christodoulos A .; Пардалос, Панос М. (2008). Энциклопедия оптимизации . Springer. п. 1130. ISBN 9780387747583. CS1 maint: обескураженный параметр ( ссылка )

[ab-3] а б Бьорк (1996)

[4] Бьорк (1996), стр. 260.

[5] Маскаренхас (2013), "Расходимость BFGS и Гаусса методов Ньютона", математического программирования , 147 (1): 253-276, Arxiv : 1309.7922 , DOI : 10.1007 / s10107-013-0720-6

[6] Бьорк (1996), стр. 341, 342.

[7] Флетчер (1987), стр. 113.

[8] «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 04.08.2016 . Проверено 25 апреля 2014 .CS1 maint: заархивированная копия как заголовок ( ссылка )

[9] Nocedal (1999), стр. 259.

[10] Нокедаль, Хорхе. (1999). Численная оптимизация . Райт, Стивен Дж., 1960-. Нью-Йорк: Спрингер. ISBN 0387227423. OCLC 54849297 .

[1]

Алгоритм Гаусса – Ньютона

Описание

Заметки

Пример

Свойства сходимости

Вывод из метода Ньютона

Улучшенные версии

Масштабная оптимизация

Связанные алгоритмы

Заметки

Рекомендации

Внешние ссылки

Реализации