Рекурсия Левинсона

Рекурсия Левинсона или рекурсия Левинсона – Дурбина - это процедура в линейной алгебре для рекурсивного вычисления решения уравнения, содержащего матрицу Теплица . В алгоритме работает в & $thetas; (п 2)$ время, что является сильным улучшением по сравнению с Гаусс-Жордан , который работает в Q ( п ³ ).

Алгоритм Левинсона – Дарбина был впервые предложен Норманом Левинсоном в 1947 году, усовершенствован Джеймсом Дурбином в 1960 году, а затем улучшен до умножений $4 n 2,$ а затем $3 n 2$ У. Ф. Тренчем и С. Зохаром, соответственно.

Другие методы обработки данных включают разложение Шура и разложение Холецкого . По сравнению с ними рекурсия Левинсона (особенно разделенная рекурсия Левинсона) имеет тенденцию быть более быстрой в вычислительном отношении, но более чувствительна к неточностям вычислений, таким как ошибки округления .

Алгоритм Барейса для матриц Теплица (не путать с общим алгоритмом Барейса ) работает примерно так же быстро, как рекурсия Левинсона, но он использует пространство $O (n 2)$ , тогда как рекурсия Левинсона использует только пространство O ( n ). Алгоритм Bareiss, однако, является численно стабильным , ^[1]^[2] , тогда как Левинсон рекурсия в лучшем случае лишь слабо устойчивая (т.е. он обладает числовой стабильностью для хорошо кондиционированных линейных систем). ^[3]

Новые алгоритмы, называемые асимптотически быстрыми или иногда сверхбыстрыми алгоритмами Теплица, могут решать за $Θ (n log p n)$ для различных p (например, p = 2, ^[4]^[5] p = 3 ^[6] ). Рекурсия Левинсона остается популярной по нескольким причинам; во-первых, это относительно легко понять в сравнении; с другой стороны, он может быть быстрее сверхбыстрого алгоритма для малых n (обычно n <256). ^[7]

Вывод

Задний план

Матричные уравнения имеют вид:

{\ displaystyle \ mathbf {M} \ {\ vec {x}} = {\ vec {y}}.}

Алгоритм Левинсона – Дарбина может использоваться для любого такого уравнения, если M - известная матрица Теплица с ненулевой главной диагональю. Здесь ${\ displaystyle {\ vec {y}}}$ - известный вектор , и ${\ displaystyle {\ vec {x}}}$ - неизвестный вектор чисел x _{i, который} еще предстоит определить.

В данной статье ê _i - это вектор, полностью состоящий из нулей, за исключением его i- го места, которое содержит значение один. Его длина будет неявно определяться окружающим контекстом. Термин N относится к ширине указанной выше матрицы - M - это матрица N × N. Наконец, в этой статье верхние индексы относятся к индуктивному индексу , тогда как нижние индексы обозначают индексы. Например (и определение), в этой статье матрица T ⁿ - это матрица размера n × n, которая копирует верхний левый блок размером n × n из M, то есть T ⁿ_ij = M _ij .

T ⁿ также является матрицей Теплица; это означает, что это можно записать как:

{\ displaystyle \ mathbf {T} ^ {n} = {\ begin {bmatrix} t_ {0} & t _ {- 1} & t _ {- 2} & \ dots & t _ {- n + 1} \\ t_ {1} & t_ {0} & t _ {- 1} & \ dots & t _ {- n + 2} \\ t_ {2} & t_ {1} & t_ {0} & \ dots & t _ {- n + 3} \\\ vdots & \ vdots & \ vdots & \ ddots & \ vdots \\ t_ {n-1} & t_ {n-2} & t_ {n-3} & \ dots & t_ {0} \ end {bmatrix}}.}

Вступительные шаги

Алгоритм состоит из двух шагов. На первом этапе устанавливаются два набора векторов, называемых прямым и обратным векторами. Прямые векторы используются, чтобы помочь получить набор обратных векторов; тогда их можно сразу выбросить. Обратные векторы необходимы для второго шага, где они используются для построения желаемого решения.

Рекурсия Левинсона – Дурбина определяет n- ^й «прямой вектор», обозначенный ${\ displaystyle {\ vec {f}} ^ {n}}$ , как вектор длины n, который удовлетворяет:

{\ displaystyle \ mathbf {T} ^ {n} {\ vec {f}} ^ {n} = {\ hat {e}} _ {1}.}

П ^е «вектора обратного» ${\ displaystyle {\ vec {b}} ^ {n}}$ определяется аналогично; это вектор длины n, который удовлетворяет:

{\ displaystyle \ mathbf {T} ^ {n} {\ vec {b}} ^ {n} = {\ hat {e}} _ {n}.}

Важное упрощение может произойти, когда M - симметричная матрица ; тогда два вектора связаны соотношением b ⁿ_i = f ⁿ_{n + 1− i} - то есть они переворачивают строки друг друга. Это может сэкономить дополнительные вычисления в этом особом случае.

Получение обратных векторов

Даже если матрица не является симметричной, то n- ^й прямой и обратный вектор можно найти из векторов длины n - 1 следующим образом. Во-первых, прямой вектор может быть расширен нулем, чтобы получить:

{\ displaystyle \ mathbf {T} ^ {n} {\ begin {bmatrix} {\ vec {f}} ^ {n-1} \\ 0 \\\ end {bmatrix}} = {\ begin {bmatrix} \ & \ & \ & t _ {- n + 1} \\\ & \ mathbf {T} ^ {n-1} & \ & t _ {- n + 2} \\\ & \ & \ & \ vdots \\ t_ {n -1} & t_ {n-2} & \ dots & t_ {0} \\\ end {bmatrix}} {\ begin {bmatrix} \ \\ {\ vec {f}} ^ {n-1} \\\ \ \ 0 \\\ \\\ end {bmatrix}} = {\ begin {bmatrix} 1 \\ 0 \\\ vdots \\ 0 \\\ epsilon _ {f} ^ {n} \ end {bmatrix}}. }

При переходе от T ^{n −1} к T ⁿ дополнительный столбец, добавленный к матрице, не нарушает решение, когда ноль используется для расширения прямого вектора. Однако дополнительная строка, добавленная к матрице , нарушила решение; и это создало нежелательный член ошибки ε _f, который встречается на последнем месте. Вышеприведенное уравнение дает ему значение:

{\ displaystyle \ epsilon _ {f} ^ {n} \ = \ \ sum _ {i = 1} ^ {n-1} \ M_ {ni} \ f_ {i} ^ {n-1} \ = \ \ sum _ {i = 1} ^ {n-1} \ t_ {ni} \ f_ {i} ^ {n-1}.}

Эта ошибка будет вскоре возвращена и устранена из нового прямого вектора; но сначала обратный вектор должен быть расширен аналогичным образом (хотя и в обратном направлении). Для обратного вектора

{\ displaystyle \ mathbf {T} ^ {n} {\ begin {bmatrix} 0 \\ {\ vec {b}} ^ {n-1} \\\ end {bmatrix}} = {\ begin {bmatrix} t_ {0} & \ dots & t _ {- n + 2} & t _ {- n + 1} \\\ vdots & \ & \ & \ \\ t_ {n-2} & \ & \ mathbf {T} ^ {n- 1} & \ \\ t_ {n-1} & \ & \ & \ end {bmatrix}} {\ begin {bmatrix} \ \\ 0 \\\ \\ {\ vec {b}} ^ {n-1 } \\\ \\\ end {bmatrix}} = {\ begin {bmatrix} \ epsilon _ {b} ^ {n} \\ 0 \\\ vdots \\ 0 \\ 1 \ end {bmatrix}}.}

Как и раньше, дополнительный столбец, добавленный к матрице, не нарушает этот новый обратный вектор; но дополнительная строка делает. Здесь у нас есть еще одна нежелательная ошибка ε _b со значением:

{\ displaystyle \ epsilon _ {b} ^ {n} \ = \ \ sum _ {i = 2} ^ {n} \ M_ {1i} \ b_ {i-1} ^ {n-1} \ = \ \ sum _ {i = 1} ^ {n-1} \ t _ {- i} \ b_ {i} ^ {n-1}. \}

Эти два члена ошибки могут быть использованы для формирования прямого и обратного векторов более высокого порядка, описанных ниже. Учитывая линейность матриц, для всех ${\ Displaystyle (\ альфа, \ бета)}$ :

{\ displaystyle \ mathbf {T} \ left (\ alpha {\ begin {bmatrix} {\ vec {f}} \\\ \\ 0 \\\ end {bmatrix}} + \ beta {\ begin {bmatrix} 0 \\\ \\ {\ vec {b}} \ end {bmatrix}} \ right) = \ alpha {\ begin {bmatrix} 1 \\ 0 \\\ vdots \\ 0 \\\ epsilon _ {f} \ \\ end {bmatrix}} + \ beta {\ begin {bmatrix} \ epsilon _ {b} \\ 0 \\\ vdots \\ 0 \\ 1 \ end {bmatrix}}.}

Если α и β выбраны так, что правая часть дает ê ₁ или ê _n , то величина в скобках будет соответствовать определению n- ^го прямого или обратного вектора, соответственно. Если выбраны альфа и бета, векторная сумма в скобках проста и дает желаемый результат.

Чтобы найти эти коэффициенты, ${\ displaystyle \ alpha _ {f} ^ {n}}$ , ${\ displaystyle \ beta _ {f} ^ {n}}$ таковы, что:

{\ displaystyle {\ vec {f}} ^ {n} = \ alpha _ {f} ^ {n} {\ begin {bmatrix} {\ vec {f}} ^ {n-1} \\ 0 \ end { bmatrix}} + \ beta _ {f} ^ {n} {\ begin {bmatrix} 0 \\ {\ vec {b}} ^ {n-1} \ end {bmatrix}}}

и соответственно ${\ displaystyle \ alpha _ {b} ^ {n}}$ , ${\ displaystyle \ beta _ {b} ^ {n}}$ таковы, что:

{\ displaystyle {\ vec {b}} ^ {n} = \ alpha _ {b} ^ {n} {\ begin {bmatrix} {\ vec {f}} ^ {n-1} \\ 0 \ end { bmatrix}} + \ beta _ {b} ^ {n} {\ begin {bmatrix} 0 \\ {\ vec {b}} ^ {n-1} \ end {bmatrix}}.}

Умножив оба предыдущих уравнения на ${\ displaystyle {\ mathbf {T}} ^ {n}}$ получается следующее уравнение:

{\ displaystyle {\ begin {bmatrix} 1 & \ epsilon _ {b} ^ {n} \\ 0 & 0 \\\ vdots & \ vdots \\ 0 & 0 \\\ epsilon _ {f} ^ {n} & 1 \ end {bmatrix }} {\ begin {bmatrix} \ alpha _ {f} ^ {n} & \ alpha _ {b} ^ {n} \\\ beta _ {f} ^ {n} & \ beta _ {b} ^ { n} \ end {bmatrix}} = {\ begin {bmatrix} 1 & 0 \\ 0 & 0 \\\ vdots & \ vdots \\ 0 & 0 \\ 0 & 1 \ end {bmatrix}}.}

Теперь, когда все нули в середине двух векторов выше игнорируются и сворачиваются, остается только следующее уравнение:

{\ displaystyle {\ begin {bmatrix} 1 & \ epsilon _ {b} ^ {n} \\\ epsilon _ {f} ^ {n} & 1 \ end {bmatrix}} {\ begin {bmatrix} \ alpha _ {f } ^ {n} & \ alpha _ {b} ^ {n} \\\ beta _ {f} ^ {n} & \ beta _ {b} ^ {n} \ end {bmatrix}} = {\ begin { bmatrix} 1 & 0 \\ 0 & 1 \ end {bmatrix}}.}

После решения этих задач (с использованием обратной формулы матрицы Крамера 2 × 2) новые прямые и обратные векторы:

{\ displaystyle {\ vec {f}} ^ {n} = {1 \ over {1- \ epsilon _ {b} ^ {n} \ epsilon _ {f} ^ {n}}} {\ begin {bmatrix} {\ vec {f}} ^ {n-1} \\ 0 \ end {bmatrix}} - {\ epsilon _ {f} ^ {n} \ over {1- \ epsilon _ {b} ^ {n} \ epsilon _ {f} ^ {n}}} {\ begin {bmatrix} 0 \\ {\ vec {b}} ^ {n-1} \ end {bmatrix}}}

{\ displaystyle {\ vec {b}} ^ {n} = {1 \ over {1- \ epsilon _ {b} ^ {n} \ epsilon _ {f} ^ {n}}} {\ begin {bmatrix} 0 \\ {\ vec {b}} ^ {n-1} \ end {bmatrix}} - {\ epsilon _ {b} ^ {n} \ over {1- \ epsilon _ {b} ^ {n} \ epsilon _ {f} ^ {n}}} {\ begin {bmatrix} {\ vec {f}} ^ {n-1} \\ 0 \ end {bmatrix}}.}

Выполнение этих векторных суммирований дает n- ^й прямой и обратный векторы из предыдущих. Остается только найти первый из этих векторов, а затем несколько быстрых сумм и умножений дают оставшиеся. Первые прямые и обратные векторы просто:

{\ displaystyle {\ vec {f}} ^ {1} = {\ vec {b}} ^ {1} = \ left [{1 \ over M_ {11}} \ right] = \ left [{1 \ over t_ {0}} \ right].}

Использование обратных векторов

Вышеуказанные шаги дают N обратные векторы для М . Отсюда более произвольное уравнение:

{\ displaystyle {\ vec {y}} = \ mathbf {M} \ {\ vec {x}}.}

Решение может быть построено тем же рекурсивным способом, что и обратные векторы. Соответственно, ${\ displaystyle {\ vec {x}}}$ должен быть обобщен на последовательность промежуточных продуктов ${\ displaystyle {\ vec {x}} ^ {n}}$ , так что ${\ displaystyle {\ vec {x}} ^ {N} = {\ vec {x}}}$ .

Затем решение строится рекурсивно с учетом того, что если

{\ displaystyle \ mathbf {T} ^ {n-1} {\ begin {bmatrix} x_ {1} ^ {n-1} \\ x_ {2} ^ {n-1} \\\ vdots \\ x_ { n-1} ^ {n-1} \\\ end {bmatrix}} = {\ begin {bmatrix} y_ {1} \\ y_ {2} \\\ vdots \\ y_ {n-1} \ end { bmatrix}}.}

Затем снова добавив ноль и определив при необходимости константу ошибки:

{\ Displaystyle \ mathbf {T} ^ {n} {\ begin {bmatrix} x_ {1} ^ {n-1} \\ x_ {2} ^ {n-1} \\\ vdots \\ x_ {n- 1} ^ {n-1} \\ 0 \ end {bmatrix}} = {\ begin {bmatrix} y_ {1} \\ y_ {2} \\\ vdots \\ y_ {n-1} \\\ epsilon _ {x} ^ {n-1} \ end {bmatrix}}.}

Затем мы можем использовать n- ^й обратный вектор, чтобы исключить член ошибки и заменить его желаемой формулой следующим образом:

{\ Displaystyle \ mathbf {T} ^ {n} \ left ({\ begin {bmatrix} x_ {1} ^ {n-1} \\ x_ {2} ^ {n-1} \\\ vdots \\ x_ {n-1} ^ {n-1} \\ 0 \\\ end {bmatrix}} + (y_ {n} - \ epsilon _ {x} ^ {n-1}) \ {\ vec {b}} ^ {n} \ right) = {\ begin {bmatrix} y_ {1} \\ y_ {2} \\\ vdots \\ y_ {n-1} \\ y_ {n} \ end {bmatrix}}.}

Продолжение этого метода до n = N дает решение ${\ displaystyle {\ vec {x}}}$ .

На практике эти шаги часто выполняются одновременно с остальной частью процедуры, но они образуют единое целое и заслуживают того, чтобы их рассматривали как отдельный шаг.

Блокировать алгоритм Левинсона

Если M не является строго теплицевым, но блочным теплицем, рекурсия Левинсона может быть получена почти таким же образом, если рассматривать блочную матрицу Теплица как матрицу Теплица с матричными элементами (Musicus 1988). Блочные матрицы Теплица возникают естественным образом в алгоритмах обработки сигналов при работе с множественными потоками сигналов (например, в системах MIMO ) или циклостационарными сигналами.

Смотрите также

Расщепленная рекурсия Левинсона
Линейное предсказание
Авторегрессионная модель

Заметки

^ Боянчик и др. (1995).
^ Брент (1999).
^ Кришна и Ван (1993).
^ http://www.maths.anu.edu.au/~brent/pd/rpb143tr.pdf
^ «Архивная копия» (PDF) . Архивировано из оригинального (PDF) 15 ноября 2009 года . Проверено 28 апреля 2009 .CS1 maint: заархивированная копия как заголовок ( ссылка )
^ https://web.archive.org/web/20070418074240/http://saaz.cs.gsu.edu/papers/sfast.pdf
^ http://www.math.niu.edu/~ammar/papers/amgr88.pdf