В статистике , то уменьшенный хи-квадрат , широко используется в благости пригонки тестирования. Это также известно как среднеквадратичное взвешенное отклонение ( MSWD ) в изотопном датировании [1] и дисперсия удельного веса в контексте взвешенных наименьших квадратов . [2] [3]
Его квадратный корень называется стандартная ошибка регрессии , [4] стандартная ошибка регрессии , [5] [6] или стандартная ошибка уравнения [7] (см Обычный метод наименьших квадратов # Снижение хи-квадрат )
Определение
Он определяется как хи-квадрат на степень свободы : [8] [9] [10] [11] [12] [13] [14] [15]]
где хи-квадрат - это взвешенная сумма квадратов отклонений :
с входными данными: дисперсия Наблюдения О , и вычисленные данные С . [8] Степень свободы,, равно количеству наблюдений n минус количество подобранных параметров m .
В методе взвешенных наименьших квадратов определение часто записывается в матричной записи как
где r - вектор остатков, а W - весовая матрица, обратная входной (диагональной) ковариационной матрице наблюдений. Если W недиагонально, то применяется обобщенный метод наименьших квадратов .
В обычном методе наименьших квадратов определение упрощается до:
где числитель - это остаточная сумма квадратов (RSS).
Обсуждение
Как показывает практика, когда дисперсия ошибки измерения известна априори ,указывает на плохую подгонку модели. Ауказывает, что соответствие не полностью захватило данные (или что дисперсия ошибки была недооценена). В принципе, значение вокруг указывает, что степень соответствия между наблюдениями и оценками соответствует дисперсии ошибок. Ауказывает на то, что модель «переобладает» данные: либо модель неверно соответствует шуму, либо дисперсия ошибки была переоценена. [16]
Когда дисперсия ошибки измерения известна лишь частично, уменьшенное значение хи-квадрат может служить апостериорной оценкой коррекции , см. Средневзвешенное арифметическое значение # Корректировка избыточной или недостаточной дисперсии .
Приложения
Геохронология
В геохронологии MSWD - это мера согласия, которая учитывает относительную важность как внутренней, так и внешней воспроизводимости, с наиболее распространенным использованием в изотопном датировании. [17] [18] [1] [19] [20] [21]
Как правило, когда:
MSWD = 1, если данные о возрасте соответствуют одномерному нормальному распределению в пространстве t (для среднего арифметического возраста) или log ( t ) (для среднего геометрического возраста), или если композиционные данные соответствуют двумерному нормальному распределению в [log ( U / He ), log ( Th / He)] - пространство (для центральной эпохи).
СКВО <1, если наблюдаемый разброс меньше, чем предсказано аналитическими погрешностями. В этом случае данные называются «недостаточно дисперсными», что указывает на завышение аналитических неопределенностей.
СКВО> 1, если наблюдаемый разброс превышает предсказанный аналитическими погрешностями. В этом случае данные считаются «чрезмерно рассредоточенными». Эта ситуация является скорее правилом, чем исключением в геохронологии (U-Th) / He, что указывает на неполное понимание изотопной системы. Было предложено несколько причин для объяснения чрезмерной дисперсии данных (U-Th) / He, включая неравномерное распределение U-Th и радиационное повреждение.
Часто геохронолог определяет серию измерений возраста на одном образце с измеренным значением. имеющий вес и связанная с этим ошибка для каждого определения возраста. Что касается взвешивания, можно либо взвесить все измеренные возрасты одинаково, либо взвесить их в соответствии с долей выборки, которую они представляют. Например, если две трети образца использовались для первого измерения и одна треть для второго и последнего измерения, то можно было бы взвесить первое измерение вдвое, чем второе.
Среднее арифметическое определение возраста:
но это значение может вводить в заблуждение, если каждое определение возраста не имеет одинакового значения.
Когда можно предположить, что каждое измеренное значение имеет одинаковый вес или значимость, смещенные и несмещенные (или « выборка » и «совокупность» соответственно) оценки дисперсии рассчитываются следующим образом:
Стандартное отклонение - это квадратный корень из дисперсии.
Когда индивидуальные определения возраста не имеют одинакового значения, лучше использовать взвешенное среднее значение для получения «среднего» возраста следующим образом:
Можно показать, что смещенная взвешенная оценка дисперсии
который можно вычислить как
Несмещенная взвешенная оценка выборочной дисперсии может быть вычислена следующим образом:
Опять же, соответствующее стандартное отклонение - это квадратный корень из дисперсии.
Несмещенная взвешенная оценка выборочной дисперсии также может быть вычислена на лету следующим образом:
Невзвешенный средний квадрат взвешенных отклонений (невзвешенный СКВО) затем может быть вычислен следующим образом:
По аналогии средневзвешенный квадрат взвешенных отклонений (взвешенное СКВО) можно вычислить следующим образом:
Анализ Раша
При анализе данных, основанном на модели Раша , статистика приведенного хи-квадрата называется среднеквадратичной статистикой по оборудованию, а взвешенная по информации статистика приведенного хи-квадрата называется статистикой среднего квадрата бесконечности. [22]
Рекомендации
- ^ a b Вендт, И., и Карл, К., 1991, Статистическое распределение среднеквадратичного взвешенного отклонения, Химическая геология, 275–285.
- ^ Линейная алгебра, геодезия и GPS , Гилберт Стрэнг, Кай Борре
- ^ Оценка параметров и проверка гипотез в линейных моделях, Карл-Рудольф Кох [1]
- ^ Джулиан Фарауэй (2000), Практическая регрессия и Anova с использованием R
- ^ Kenney, J .; Сохраняя, ES (1963). Математика статистики . ван Ностранд. п. 187.
- ^ Цвиллинджер, Д. (1995). Стандартные математические таблицы и формулы . Чепмен и Холл / CRC. п. 626. ISBN. 0-8493-2479-3.
- ^ Хаяси, Фумио (2000). Эконометрика . Издательство Принстонского университета. ISBN 0-691-01018-8.
- ^ а б Лауб, Чарли; Куль, Тоня Л. (б. Д.), Насколько плохо - это хорошо? Критический взгляд на подгонку моделей отражательной способности с использованием статистики по приведенному хи-квадрат (PDF) , Калифорнийский университет, Дэвис, заархивировано из оригинала (PDF) 6 октября 2016 г. , получено 30 мая 2015 г.
- ^ Тейлор, Джон Роберт (1997), Введение в анализ ошибок , University Science Books, стр. 268
- ^ Киркман, TW (nd), Подбор кривой хи-квадрат , получено 30 мая 2015 г.
- ^ Бевингтон 1969 , стр. 85
- ^ Измерения и их неопределенности: Практическое руководство по современному анализу ошибок, Ифан Хьюз, Томас Хасе [2]
- ^ Работа с неопределенностями: руководство по анализу ошибок, Манфред Дросг [3]
- ^ Практическая статистика для астрономов, JV Wall, CR Jenkins
- ^ Вычислительные методы в физике и технике, Сэмюэл Шоу Мин Вонг [4]
- ^ Бевингтон, Филип Р. (1969), Обработка данных и анализ ошибок для физических наук , Нью-Йорк: McGraw-Hill, стр. 89.
Для тестов χ 2 χ ν 2 должен быть приблизительно равен единице.
- ^ Дикин, А. П. 1995. Радиогенный Изотоп геологии. Издательство Кембриджского университета, Кембридж, Великобритания, 1995 г., ISBN 0-521-43151-4 , ISBN 0-521-59891-5
- ^ Макдугалл, И. и Харрисон, Т.М. 1988. Геохронология и термохронология методом 40 Ar / 39 Ar. Издательство Оксфордского университета.
- ^ Лэнс П. Блэк, Сандра Л. Камо, Шарлотта М. Аллен, Джон Н. Алейников, Дональд В. Дэвис, Рассел Дж. Корш, Крис Фудулис 2003. ТЕМОРА 1: новый стандарт циркона для фанерозойской U – Pb геохронологии. Химическая геология 200, 155–170.
- ^ MJ Streule, RJ Phillips, MP Searle, DJ Waters и MSA Horstwood 2009. Эволюция и хронология метаморфического комплекса Пангонга, примыкающего к моделированию и геохронологии U-Pb Каракорамский разлом, Ладакх: ограничения термобарометрии, метаморфического моделирования и геохронологии U-Pb. Журнал геологического общества 166, 919-932 DOI : 10,1144 / 0016-76492008-117
- ^ Роджер Пауэлл, Джанет Хергт , Джон Вудхед 2002. Улучшение изохронных вычислений с помощью надежной статистики и бутстрапа. Химическая геология 185, 191–204.
- ^ Линакр, JM (2002). «Что означают Infit и Outfit, Mean-Square и Standardized?» . Rasch Measurement Transactions . 16 (2): 878.