Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

В статистике , то оценка (или информатор [1] ) является градиент от функции логарифмического правдоподобия относительно вектора параметров . Оценка, оцениваемая в конкретной точке вектора параметров, указывает на крутизну логарифмической функции правдоподобия и, таким образом, на чувствительность к бесконечно малым изменениям значений параметров. Если функция логарифмического правдоподобия непрерывна по пространству параметров , оценка исчезнет при локальном максимуме или минимуме ; этот факт используется при оценке максимального правдоподобия чтобы найти значения параметров, которые максимизируют функцию правдоподобия.

Поскольку оценка является функцией наблюдений , которые подвержены ошибкам выборки , она поддается статистическому анализу, известному как тест оценки, в котором параметр удерживается на определенном значении. Кроме того, отношение двух функций правдоподобия, оцененных при двух различных значениях параметра, можно понимать как определенный интеграл функции оценки. [2]

Определение [ править ]

Оценка является градиент (вектор частных производных ) из , то натуральный логарифм от функции правдоподобия , по отношению к м - мерного вектора параметров .

Таким образом, дифференцирование дает вектор-строку и указывает чувствительность вероятности (ее производная, нормализованная по ее значению).

В более ранней литературе [ необходима цитата ] «линейная оценка» может относиться к оценке относительно бесконечно малой трансляции заданной плотности. Это соглашение возникло в те времена, когда основным интересующим параметром было среднее или медианное значение распределения. В этом случае вероятность наблюдения определяется плотностью формы . "Линейная оценка" тогда определяется как

Свойства [ править ]

Среднее [ править ]

Хотя оценка является функцией от , она также зависит от наблюдений, в которых оценивается функция правдоподобия, и, принимая во внимание случайный характер выборки, можно принять ее ожидаемое значение по пространству выборки . При определенных условиях регулярности функций плотности случайных величин [3] [4] ожидаемое значение оценки, оцененное при истинном значении параметра , равно нулю. Чтобы увидеть это, перепишите функцию правдоподобия как функцию плотности вероятности и обозначьте пространство выборки . Потом:

Предполагаемые условия регулярности допускают замену производной и интеграла (см. Правило интеграла Лейбница ), поэтому приведенное выше выражение можно переписать как

Приведенный выше результат стоит перефразировать словами: математическое ожидание результата равно нулю. Таким образом, если бы кто-то многократно отбирал из некоторого распределения и многократно вычислял оценку, то среднее значение оценок было бы асимптотически стремиться к нулю .

Дисперсия [ править ]

Дисперсия бороздки, может быть получена из приведенного выше выражения для ожидаемого значения.

Следовательно, дисперсия оценки равна отрицательному ожидаемому значению матрицы Гессе логарифмической вероятности. [5]

Последняя известна как информация Фишера и написана . Обратите внимание, что информация Фишера не является функцией какого-либо конкретного наблюдения, поскольку случайная величина была усреднена. Эта концепция информации полезна при сравнении двух методов наблюдения за некоторым случайным процессом .

Примеры [ править ]

Процесс Бернулли [ править ]

Рассмотрим первые n попыток процесса Бернулли и увидим, что A из них были успешными, а оставшиеся B - неудачными, где вероятность успеха равна  θ .

Тогда вероятность того, является

поэтому оценка s является

Теперь мы можем убедиться, что ожидаемая оценка равна нулю. Отметив, что ожидание A равно nθ, а ожидание B равно n (1 -  θ ) [напомним, что A и B - случайные величины], мы можем видеть, что математическое ожидание s равно

Мы также можем проверить дисперсию . Мы знаем, что A + B = n (поэтому Bn  -  A ) и дисперсия A равна (1 -  θ ), поэтому дисперсия s равна

Модель двоичного результата [ править ]

Для моделей с бинарными исходами ( Y = 1 или 0) модель может быть оценена с помощью логарифма прогнозов.

где p - вероятность оцениваемой модели, а S - оценка. [6]

Приложения [ править ]

Алгоритм подсчета очков [ править ]

Алгоритм оценки представляет собой итерационный метод численного определения оценщика максимального правдоподобия .

Оценка теста [ править ]

Обратите внимание, что это функция и наблюдения , так что, как правило, это не статистика . Однако в некоторых приложениях, таких как тест на баллы , балл оценивается по определенному значению (например, значению нулевой гипотезы), и в этом случае результат является статистическим. Интуитивно понятно, что если ограниченная оценка близка к максимуму функции правдоподобия, оценка не должна отличаться от нуля более чем на ошибку выборки . В 1948 году CR Rao впервые доказал, что квадрат оценки, деленный на информационную матрицу, следует асимптотическому χ 2 -распределению при нулевой гипотезе. [7]

Также обратите внимание, что тест отношения правдоподобия дается формулой

это означает, что критерий отношения правдоподобия можно понимать как область под функцией оценки между и . [8]

См. Также [ править ]

  • Информация Fisher
  • Теория информации
  • Оценка теста
  • Алгоритм подсчета очков
  • Стандартный балл
  • Кривая поддержки

Заметки [ править ]

  1. ^ Информатор в энциклопедии математики
  2. ^ Пиклз, Эндрю (1985). Введение в анализ правдоподобия . Норидж: WH Hutchins & Sons. С.  24–29 . ISBN 0-86094-190-6.
  3. ^ Серфлинг, Роберт Дж. (1980). Аппроксимационные теоремы математической статистики . Нью-Йорк: Джон Вили и сыновья. п. 145 . ISBN 0-471-02403-1.
  4. ^ Гринберг, Эдвард; Вебстер, Чарльз Э. младший (1983). Продвинутая эконометрика: мост к литературе . Нью-Йорк: Джон Вили и сыновья. п. 25. ISBN 0-471-09077-8.
  5. ^ Сарган, Денис (1988). Лекции по продвинутой эконометрике . Оксфорд: Бэзил Блэквелл. С. 16–18. ISBN 0-631-14956-2.
  6. ^ Steyerberg, EW; Викерс, Эй Джей; Cook, NR; Гердс, Т .; Gonen, M .; Obuchowski, N .; Pencina, MJ; Каттан, МВ (2010). «Оценка эффективности моделей прогнозирования. Рамки для традиционных и новых мер» . Эпидемиология . 21 (1): 128–138. DOI : 10.1097 / EDE.0b013e3181c30fb2 . PMC 3575184 . PMID 20010215 .  
  7. ^ Рао, К. Радхакришна (1948). «Большая выборка тестов статистических гипотез относительно нескольких параметров с приложениями к задачам оценивания». Математические труды Кембриджского философского общества . 44 (1): 50–57. DOI : 10.1017 / S0305004100023987 .
  8. ^ Запально, A. (1982). «Отношение правдоподобия, тесты множителей Вальда и Лагранжа: пояснительная записка». Американский статистик . 36 (3a): 153–157. DOI : 10.1080 / 00031305.1982.10482817 .

Ссылки [ править ]

  • Ченцов, Н.Н. (2001) [1994], «Информатор» , Энциклопедия математики , EMS Press
  • Кокс, Д.Р .; Хинкли, Д.В. (1974). Теоретическая статистика . Чепмен и Холл. ISBN 0-412-12420-3.
  • Шервиш, Марк Дж. (1995). Теория статистики . Нью-Йорк: Спрингер. Раздел 2.3.1. ISBN 0-387-94546-6.