В статистике , доверительная область является многомерным обобщением доверительного интервала . Это набор точек в n- мерном пространстве, часто представляемый в виде эллипсоида вокруг точки, которая является предполагаемым решением проблемы, хотя могут встречаться и другие формы.
Интерпретация
Доверительный интервал вычисляется таким образом, что если бы набор измерений повторялся много раз и доверительный интервал вычислялся бы одинаково для каждого набора измерений, то в определенном процентном соотношении (например, 95%) доверительный интервал был бы включить точку, представляющую «истинные» значения набора оцениваемых переменных. Однако, если не сделаны определенные предположения относительно априорных вероятностей , это не означает, что после расчета одной доверительной области существует 95% -ная вероятность того, что «истинные» значения лежат внутри этой области, поскольку мы не предполагаем какой-либо конкретной вероятности. распространение «истинных» ценностей, и мы можем иметь или не располагать другой информацией о том, где они могут находиться.
Случай независимых, одинаково нормально распределенных ошибок
Предположим, мы нашли решение к следующей переопределенной проблеме:
где Y представляет собой п - мерный вектор - столбец , содержащий наблюдаемые значения зависимой переменной , Х представляет собой N матрицу с размерностью р матрица наблюдаемых значений независимых переменных (которые могут представлять собой физическую модель) , которая , как предполагается, будет точно известно,вектор-столбец, содержащий p параметров, которые необходимо оценить, ипредставляет собой n- мерный вектор-столбец ошибок, которые, как предполагается, распределены независимо с нормальными распределениями с нулевым средним и каждая из которых имеет одинаковую неизвестную дисперсию.
Совместная 100 (1 - α )% доверительная область для элементовпредставлен набором значений вектора b, которые удовлетворяют следующему неравенству: [1]
где переменная b представляет любую точку в доверительной области, p - количество параметров, т.е. количество элементов вектора. вектор оцениваемых параметров, и ев 2 является уменьшенной хи-квадрат , несмещенной оценкой из равно
Кроме того, Р является функцией квантиля из F-распределения , с р и степени свободы ,- уровень статистической значимости , а символозначает транспонирование из.
Выражение можно переписать как:
где - ковариационная матрица, масштабированная методом наименьших квадратов. .
Вышеприведенное неравенство определяет эллипсоидальную область в p -мерном декартовом пространстве параметров R p . Центр эллипсоида находится по оценке. По словам Пресса и др., Построить эллипсоид проще после разложения по сингулярным числам . Длины осей эллипсоида пропорциональны обратным величинам на диагоналях диагональной матрицы, а направления этих осей задаются строками 3-й матрицы разложения.
Взвешенные и обобщенные методы наименьших квадратов
Теперь рассмотрим более общий случай, когда некоторые отдельные элементы имеют известную ненулевую ковариацию (другими словами, ошибки в наблюдениях не распределяются независимо), и / или стандартные отклонения ошибок не все равны. Предположим, что ковариационная матрица является , Где V представляет собой N матрицу с размерностью п невырожденная матрица , которая была равнав более конкретном случае, рассмотренном в предыдущем разделе (где I - единичная матрица ), но здесь разрешено иметь ненулевые недиагональные элементы, представляющие ковариацию пар отдельных наблюдений, а также не обязательно иметь все диагональные элементы равный.
Можно найти [2] невырожденную симметричную матрицу P такую, что
В сущности, Р представляет собой квадратный корень из ковариационной матрицы V .
Проблема наименьших квадратов
затем можно преобразовать, умножив каждый член слева на обратное к P , образуя новую формулировку задачи
где
- а также
Совместная доверительная область для параметров, т.е. для элементов , тогда ограничено эллипсоидом, задаваемым формулой [3]
Здесь F представляет собой процентную точку F -распределения, а величины p и np являются степенями свободы, которые являются параметрами этого распределения.
Нелинейные задачи
Области достоверности могут быть определены для любого распределения вероятностей. Экспериментатор может выбрать уровень значимости и форму области, а затем размер области определяется распределением вероятностей. Естественный выбор - использовать в качестве границы набор точек с постоянным( хи-квадрат ) значения.
Один из подходов состоит в том, чтобы использовать линейное приближение к нелинейной модели, которое может быть близким приближением в окрестности решения, а затем применить анализ для линейной задачи, чтобы найти приблизительную доверительную область. Это может быть разумным подходом, если доверительная область не очень велика, а вторые производные модели также не очень велики.
Также можно использовать подходы начальной загрузки . [4]
См. Методологии количественной оценки неопределенности для прямого распространения неопределенности для связанных концепций.
Смотрите также
Заметки
- ↑ Дрейпер и Смит (1981, стр.94)
- ↑ Дрейпер и Смит (1981, с. 108)
- ↑ Дрейпер и Смит (1981, стр.109)
- ^ Hutton TJ, Бакстон BF, Hammond P, Поттс HWW (2003). Оценка средних траекторий роста в пространстве форм с использованием сглаживания ядра. IEEE Transactions по медицинской визуализации , 22 (6): 747-53
Рекомендации
- Draper, NR; Х. Смит (1981) [1966]. Прикладной регрессионный анализ (2-е изд.). США: ISBN John Wiley and Sons Ltd. 0-471-02995-5.
- Нажмите, WH; С.А. Теукольский; В. Т. Феттерлинг; Б. П. Фланнери (1992) [1988]. Числовые рецепты в C: Искусство научных вычислений (2-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета.