Доверительный регион

В статистике , доверительная область является многомерным обобщением доверительного интервала . Это набор точек в n- мерном пространстве, часто представляемый в виде эллипсоида вокруг точки, которая является предполагаемым решением проблемы, хотя могут встречаться и другие формы.

Интерпретация

Доверительный интервал вычисляется таким образом, что если бы набор измерений повторялся много раз и доверительный интервал вычислялся бы одинаково для каждого набора измерений, то в определенном процентном соотношении (например, 95%) доверительный интервал был бы включить точку, представляющую «истинные» значения набора оцениваемых переменных. Однако, если не сделаны определенные предположения относительно априорных вероятностей , это не означает, что после расчета одной доверительной области существует 95% -ная вероятность того, что «истинные» значения лежат внутри этой области, поскольку мы не предполагаем какой-либо конкретной вероятности. распространение «истинных» ценностей, и мы можем иметь или не располагать другой информацией о том, где они могут находиться.

Случай независимых, одинаково нормально распределенных ошибок

Предположим, мы нашли решение ${\ displaystyle {\ boldsymbol {\ beta}}}$ к следующей переопределенной проблеме:

{\ displaystyle \ mathbf {Y} = \ mathbf {X} {\ boldsymbol {\ beta}} + {\ boldsymbol {\ varepsilon}}}

где Y представляет собой п - мерный вектор - столбец , содержащий наблюдаемые значения зависимой переменной , Х представляет собой N матрицу с размерностью р матрица наблюдаемых значений независимых переменных (которые могут представлять собой физическую модель) , которая , как предполагается, будет точно известно, ${\ displaystyle {\ boldsymbol {\ beta}}}$ вектор-столбец, содержащий p параметров, которые необходимо оценить, и ${\ displaystyle {\ boldsymbol {\ varepsilon}}}$ представляет собой n- мерный вектор-столбец ошибок, которые, как предполагается, распределены независимо с нормальными распределениями с нулевым средним и каждая из которых имеет одинаковую неизвестную дисперсию ${\ displaystyle \ sigma ^ {2}}$ .

Совместная 100 (1 - α )% доверительная область для элементов ${\ displaystyle {\ boldsymbol {\ beta}}}$ представлен набором значений вектора b, которые удовлетворяют следующему неравенству: ^[1]

{\ displaystyle ({\ boldsymbol {\ hat {\ beta}}} - \ mathbf {b}) ^ {\ prime} \ mathbf {X} ^ {\ prime} \ mathbf {X} ({\ boldsymbol {\ hat {\ beta}}} - \ mathbf {b}) \ leq ps ^ {2} F_ {1- \ alpha} (p, \ nu),}

где переменная b представляет любую точку в доверительной области, p - количество параметров, т.е. количество элементов вектора. ${\ displaystyle {\ boldsymbol {\ beta}},}$ ${\ displaystyle {\ boldsymbol {\ hat {\ beta}}}}$ вектор оцениваемых параметров, и ев ² является уменьшенной хи-квадрат , несмещенной оценкой из ${\ displaystyle \ sigma ^ {2}}$ равно

{\ displaystyle s ^ {2} = {\ frac {\ varepsilon ^ {\ prime} \ varepsilon} {np}}.}

Кроме того, Р является функцией квантиля из F-распределения , с р и ${\ displaystyle \ nu = np}$ степени свободы , ${\ displaystyle \ alpha}$ - уровень статистической значимости , а символ ${\ Displaystyle X ^ {\ prime}}$ означает транспонирование из ${\ displaystyle X}$ .

Выражение можно переписать как:

{\ displaystyle ({\ boldsymbol {\ hat {\ beta}}} - \ mathbf {b}) ^ {\ prime} \ mathbf {C} _ {\ mathbf {\ beta}} ^ {- 1} ({\ полужирный символ {\ hat {\ beta}}} - \ mathbf {b}) \ leq pF_ {1- \ alpha} (p, \ nu),}

где ${\ displaystyle \ mathbf {C} _ {\ mathbf {\ beta}} = s ^ {2} \ left (\ mathbf {X} ^ {\ prime} \ mathbf {X} \ right) ^ {- 1}}$ - ковариационная матрица, масштабированная методом наименьших квадратов. ${\ displaystyle {\ boldsymbol {\ hat {\ beta}}}}$ .

Вышеприведенное неравенство определяет эллипсоидальную область в p -мерном декартовом пространстве параметров R ^p . Центр эллипсоида находится по оценке ${\ displaystyle {\ boldsymbol {\ hat {\ beta}}}}$ . По словам Пресса и др., Построить эллипсоид проще после разложения по сингулярным числам . Длины осей эллипсоида пропорциональны обратным величинам на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.

Взвешенные и обобщенные методы наименьших квадратов

Теперь рассмотрим более общий случай, когда некоторые отдельные элементы ${\ displaystyle {\ boldsymbol {\ varepsilon}}}$ имеют известную ненулевую ковариацию (другими словами, ошибки в наблюдениях не распределяются независимо), и / или стандартные отклонения ошибок не все равны. Предположим, что ковариационная матрица ${\ displaystyle {\ boldsymbol {\ varepsilon}}}$ является ${\ Displaystyle \ mathbf {V} \ sigma ^ {2}}$ , Где V представляет собой N матрицу с размерностью п невырожденная матрица , которая была равна ${\ displaystyle \ mathbf {I}}$ в более конкретном случае, рассмотренном в предыдущем разделе (где I - единичная матрица ), но здесь разрешено иметь ненулевые недиагональные элементы, представляющие ковариацию пар отдельных наблюдений, а также не обязательно иметь все диагональные элементы равный.

Можно найти ^[2] невырожденную симметричную матрицу P такую, что

{\ Displaystyle \ mathbf {P} ^ {\ prime} \ mathbf {P} = \ mathbf {P} \ mathbf {P} = \ mathbf {V}}

В сущности, Р представляет собой квадратный корень из ковариационной матрицы V .

Проблема наименьших квадратов

{\ displaystyle \ mathbf {Y} = \ mathbf {X} {\ boldsymbol {\ beta}} + {\ boldsymbol {\ varepsilon}}}

затем можно преобразовать, умножив каждый член слева на обратное к P , образуя новую формулировку задачи

{\ displaystyle \ mathbf {Z} = \ mathbf {Q} {\ boldsymbol {\ beta}} + \ mathbf {f},}

где

{\ Displaystyle \ mathbf {Z} = \ mathbf {P} ^ {- 1} \ mathbf {Y}}

{\ Displaystyle \ mathbf {Q} = \ mathbf {P} ^ {- 1} \ mathbf {X}}

а также

{\ displaystyle \ mathbf {f} = \ mathbf {P} ^ {- 1} {\ boldsymbol {\ varepsilon}}}

Совместная доверительная область для параметров, т.е. для элементов ${\ displaystyle {\ boldsymbol {\ beta}}}$ , тогда ограничено эллипсоидом, задаваемым формулой ^[3]

{\ displaystyle (\ mathbf {b} - {\ boldsymbol {\ hat {\ beta}}}) ^ {\ prime} \ mathbf {Q} ^ {\ prime} \ mathbf {Q} (\ mathbf {b} - {\ boldsymbol {\ hat {\ beta}}}) = {\ frac {p} {np}} (\ mathbf {Z} ^ {\ prime} \ mathbf {Z} - \ mathbf {b} ^ {\ prime } \ mathbf {Q} ^ {\ prime} \ mathbf {Z}) F_ {1- \ alpha} (p, np).}

Здесь F представляет собой процентную точку F -распределения, а величины p и np являются степенями свободы, которые являются параметрами этого распределения.

Нелинейные задачи

Области достоверности могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, а затем размер области определяется распределением вероятностей. Естественный выбор - использовать в качестве границы набор точек с постоянным ${\ displaystyle \ chi ^ {2}}$ ( хи-квадрат ) значения.

Один из подходов состоит в том, чтобы использовать линейное приближение к нелинейной модели, которое может быть близким приближением в окрестности решения, а затем применить анализ для линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика, а вторые производные модели также не очень велики.

Также можно использовать подходы начальной загрузки . ^[4]

См. Методологии количественной оценки неопределенности для прямого распространения неопределенности для связанных концепций.

Смотрите также

Заметки

↑ Дрейпер и Смит (1981, стр.94)
↑ Дрейпер и Смит (1981, с. 108)
↑ Дрейпер и Смит (1981, стр.109)
^ Hutton TJ, Бакстон BF, Hammond P, Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра. IEEE Transactions по медицинской визуализации , 22 (6): 747-53

Внешние ссылки

[1] Дрейпер и Смит (1981, стр.94)

[2] Дрейпер и Смит (1981, с. 108)

[3] Дрейпер и Смит (1981, стр.109)

[4] Hutton TJ, Бакстон BF, Hammond P, Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра. IEEE Transactions по медицинской визуализации , 22 (6): 747-53

[1]