Каплан-Мейер оценка , [1] [2] также известными как предельный продукт оценка , является непараметрической статистика используется для оценки функции выживания от времени жизни данных. В медицинских исследованиях он часто используется для измерения доли пациентов, живущих в течение определенного времени после лечения. В других областях оценки Каплана-Мейера можно использовать для измерения продолжительности времени, в течение которого люди остаются без работы после потери работы [3], времени до отказа деталей машин или того, как долго мясистые плоды остаются на растениях до их удаления. по плодоядности . Оценщик назван в честь Эдварда Л. Каплани Пол Мейер , каждый из которых представил аналогичные рукописи в Журнал Американской статистической ассоциации . [4] Редактор журнала Джон Тьюки убедил их объединить свои работы в одну статью, которая была процитирована более 59 000 раз с момента ее публикации в 1958 году. [5] [6]
Оценщик от функции выживания (вероятность того, что жизнь длиннее, чем ) дан кем-то:
с участием время , когда по крайней мере один случай произошел, d I в числе событий (например, смерть) , которые произошли во время, а также что люди , как известно, сохранились ( до сих пор не имели события или были подвергнуты цензуре) до времени.
Основные понятия
График оценки Каплана – Мейера представляет собой серию убывающих горизонтальных шагов, которые при достаточно большом размере выборки приближаются к истинной функции выживания для этой популяции. Предполагается, что значение функции выживаемости между последовательными отдельными выборочными наблюдениями («щелчки») является постоянным.
Важным преимуществом кривой Каплана-Мейера является то, что метод может учитывать некоторые типы цензурированных данных , в частности цензуру справа , которая происходит, если пациент выходит из исследования, теряется для последующего наблюдения или живет без события. появление при последнем наблюдении. На графике маленькие вертикальные отметки обозначают отдельных пациентов, время выживания которых было подвергнуто цензуре справа. Когда не происходит усечения или цензуры, кривая Каплана – Мейера является дополнением к эмпирической функции распределения .
В медицинской статистике типичное приложение может включать группировку пациентов по категориям, например, пациентов с профилем гена A и пациентов с профилем гена B. На графике пациенты с геном B умирают намного быстрее, чем пациенты с геном A. Через два года выживают около 80% пациентов с геном A, но менее половины пациентов с геном B.
Для создания оценщика Каплана-Мейера для каждого пациента (или каждого субъекта) требуются по крайней мере две части данных: статус при последнем наблюдении (возникновение события или цензура справа) и время до события (или время до цензуры). . Если необходимо сравнить функции выживаемости между двумя или более группами, то потребуется третья часть данных: групповое распределение каждого субъекта. [7]
Определение проблемы
Позволять быть случайной величиной, которую мы рассматриваем как время до того, как произойдет интересующее событие. Как указано выше, цель состоит в том, чтобы оценить функцию выживаемости. лежащий в основе . Напомним, что эта функция определяется как
- , где самое время.
Позволять быть независимыми, одинаково распределенными случайными величинами, общее распределение которых совпадает с распределением : случайное время, когда какое-то событие получилось. Данные, доступные для оценки не является , но список пар где для , фиксированное, детерминированное целое число, время цензуры события а также . В частности, доступна информация о сроках проведения мероприятия. произошло ли событие раньше установленного времени и если да, то фактическое время события также доступно. Задача состоит в том, чтобы оценить учитывая эти данные.
Вывод оценки Каплана – Мейера.
Здесь мы показываем два вывода оценки Каплана – Мейера. Оба основаны на переписывании функции выживаемости с точки зрения того, что иногда называют опасностью или уровнем смертности . Однако перед этим стоит рассмотреть наивный оценщик.
Наивный оценщик
Чтобы понять мощь оценки Каплана – Мейера, целесообразно сначала описать наивную оценку функции выживаемости.
Исправить и разреши . Основной аргумент показывает, что справедливо следующее утверждение:
- Предложение 1: Если время цензуры события превышает ( ), тогда если и только если .
Позволять быть таким, чтобы . Из предыдущего предложения следует, что
Позволять и рассматривать только те , т. е. события, исход которых не подвергался цензуре раньше времени . Позволять быть количеством элементов в . Обратите внимание, что набор не является случайным, и поэтому тоже . Более того,представляет собой последовательность независимых, одинаково распределенных случайных величин Бернулли с общим параметром. При условии, что, это наводит на мысль оценить с использованием
где следует последнее равенство, поскольку подразумевает .
Качество этой оценки определяется размером . Это может быть проблематично, когдамала, что происходит по определению, когда многие события подвергаются цензуре. Особенно неприятное свойство этого оценщика, которое предполагает, что он, возможно, не является «лучшим» оценщиком, состоит в том, что он игнорирует все наблюдения, время цензуры которых предшествует. Интуитивно эти наблюдения все еще содержат информацию о: Например, когда для многих событий с , также верно, мы можем сделать вывод, что события часто происходят раньше, что означает, что большой, который через Значит это должен быть маленьким. Однако эта наивная оценка игнорирует эту информацию. Тогда возникает вопрос, существует ли оценщик, который лучше использует все данные. Это то, что выполняет оценщик Каплана – Мейера. Обратите внимание, что наивная оценка не может быть улучшена без цензуры; поэтому возможность улучшения во многом зависит от наличия цензуры.
Подход с плагином
По элементарным подсчетам,
где предпоследнее равенство использовало это является целочисленным, и для последней строки, которую мы ввели
Рекурсивным разложением равенства , мы получили
Обратите внимание, что здесь .
Оценщик Каплана – Мейера можно рассматривать как «вспомогательный оценщик», в котором каждый оценивается на основе данных и оценки получается как произведение этих оценок.
Осталось уточнить, как подлежит оценке. По предложению 1 для любого такой, что , а также оба держатся. Следовательно, для любого такой, что ,
По аналогичным соображениям, которые привели к построению наивной оценки выше, мы приходим к оценке
(подумайте о том, чтобы вычислить числитель и знаменатель отдельно в определении «степени опасности» ). Оценка Каплана – Мейера тогда дается выражением
Форма оценки, изложенная в начале статьи, может быть получена с помощью некоторой дальнейшей алгебры. Для этого напишите где, используя терминологию актуарной науки, это количество известных смертей за время , пока это количество тех людей, которые живы во время .
Обратите внимание, что если , . Это означает, что мы можем не включать определение продукта все те термины, где . Затем, позволяя быть временами когда , а также , мы приходим к виду оценки Каплана – Мейера, приведенному в начале статьи:
В отличие от наивного оценщика, можно увидеть, что этот оценщик более эффективно использует доступную информацию: в особом случае, упомянутом ранее, когда записано много ранних событий, оценщик умножит много членов на значение ниже единицы и, таким образом, будет принимать при этом вероятность выживания не может быть большой.
Вывод как оценка максимального правдоподобия
Каплан-Мейер оценка может быть получен из оценки максимального правдоподобия в функции риски . [8] Более конкретно как количество событий и общее количество людей, подверженных риску во время , дискретная степень опасности может быть определена как вероятность того, что у человека произойдет какое-либо событие во время . Тогда выживаемость можно определить как:
и функция правдоподобия для функции риска до времени является:
следовательно, вероятность регистрации будет:
нахождение максимума логарифмического правдоподобия относительно дает:
где шляпа используется для обозначения оценки максимального правдоподобия. Учитывая этот результат, мы можем написать:
Преимущества и ограничения
Оценка Каплана – Мейера - один из наиболее часто используемых методов анализа выживаемости. Оценка может быть полезна для изучения показателей выздоровления, вероятности смерти и эффективности лечения. Его способность оценивать выживаемость с поправкой на ковариаты ограничена ; параметрические модели выживаемости и модель пропорциональных рисков Кокса могут быть полезны для оценки выживаемости с поправкой на ковариаты.
Статистические соображения
Оценка Каплана – Мейера - это статистика , и для аппроксимации ее дисперсии используются несколько оценок . Одна из наиболее распространенных оценок - формула Гринвуда: [9]
где количество случаев и - общее количество наблюдений, для .
Формула Гринвуда выводится [10] , учитывая, что вероятность получения неудачи из случаев следует биномиальному распределению с вероятностью отказа. В результате для максимальной вероятности риска у нас есть а также . Чтобы избежать мультипликативных вероятностей, мы вычисляем дисперсию логарифмаи будет использовать дельта-метод, чтобы преобразовать его обратно к исходной дисперсии:
Используя центральную предельную теорему мартингала , можно показать, что дисперсия суммы в следующем уравнении равна сумме дисперсий: [10]
в результате мы можем написать:
еще раз используя дельта-метод:
по желанию.
В некоторых случаях может возникнуть желание сравнить разные кривые Каплана – Мейера. Это можно сделать с помощью логарифмического рангового теста и теста пропорциональных рисков Кокса .
Другие статистические данные, которые могут быть использованы с этой оценкой, - это полоса Холла-Веллнера [11] и полоса равной точности. [12]
Программное обеспечение
- Mathematica : встроенная функция
SurvivalModelFit
создает модели выживания. [13] - SAS : В
proc lifetest
процедуре реализована оценка Каплана – Мейера . [14] - R : оценщик Каплана – Мейера доступен как часть
survival
пакета. [15] [16] [17] - Stata : команда
sts
возвращает оценку Каплана – Мейера. [18] [19] - Python : в
lifelines
пакет входит оценщик Каплана – Мейера. [20] - MATLAB :
ecdf
функция с'function','survivor'
аргументами может вычислить или построить оценку Каплана-Мейера. [21] - StatsDirect : оценщик Каплана – Мейера реализован в
Survival Analysis
меню. [22] - SPSS : Оценщик Каплана-Мейера реализован в
Analyze > Survival > Kaplan-Meier...
меню. [23] - Юля : в
Survival.jl
комплект входит оценщик Каплана-Мейера. [24]
Смотрите также
- Анализ выживаемости
- Частота превышения
- Средняя смертельная доза
- Оценка Нельсона – Аалена
Рекомендации
- ^ Каплан, EL; Мейер, П. (1958). «Непараметрическая оценка по неполным наблюдениям». J. Amer. Статист. Доц. 53 (282): 457–481. DOI : 10.2307 / 2281868 . JSTOR 2281868 .
- ^ Каплан, Э.Л. в ретроспективе основополагающей статьи в «Классике цитирования на этой неделе». Текущее содержание 24 , 14 (1983). Доступно в UPenn в формате PDF.
- ^ Мейер, Брюс Д. (1990). «Страхование от безработицы и заклинания по безработице» (PDF) . Econometrica . 58 (4): 757–782. DOI : 10.2307 / 2938349 . JSTOR 2938349 .
- ^ Лукас Дж. Сталперс и Эдвард Л. Каплан, «Эдвард Л. Каплан и кривая выживания Каплана-Мейера», Журнал Британского общества истории математики , Vol. 33, No. 2 (ноябрь 2018), 109-135.
- ^ "- Google Scholar" . scholar.google.com . Проверено 4 марта 2017 .
- ^ «Пол Мейер, 1924–2011» . Чикаго Трибьюн . 18 августа 2011 г.
- ^ Rich JT, Neely JG, Paniello RC, Voelker CC, Nussenbaum B, Wang EW (2010). «Практическое руководство по пониманию кривых Каплана – Мейера» . Otolaryngol Head Neck Surg . 143 (3): 331–6. DOI : 10.1016 / j.otohns.2010.05.007 . PMC 3932959 . PMID 20723767 .
- ^ (PDF) https://web.stanford.edu/~lutian/coursepdf/STAT331unit3.pdf . Отсутствует или пусто
|title=
( справка ) - ^ Гринвуд, М. (1926). «Естественная продолжительность рака». Отчеты по общественному здравоохранению и медицине . Лондон: Канцелярия Ее Величества. 33 : 1–26.
- ^ а б (PDF) https://www.math.wustl.edu/%7Esawyer/handouts/greenwood.pdf . Отсутствует или пусто
|title=
( справка ) - ^ Холл WJ и Wellner JA (1980) Полосы уверенности для кривой выживаемости для цензурированных данных. Биометрика 69
- ^ Наир В.Н. (1984) Полосы уверенности для функций выживания с цензурированными данными: сравнительное исследование. Технометрика 26: 265–275
- ^ «Анализ выживаемости - Mathematica SurvivalModelFit» . wolfram.com . Проверено 14 августа 2017 .
- ^ Процедура САМОСТОЯТЕЛЬНОГО ЖИЗНИ
- ^ «Выживание: Анализ выживаемости» . R проект . Апрель 2019.
- ^ Виллекенс, Франс (2014). « Пакет выживания » . Multistate Анализ истории жизни с R . Springer. С. 135–153. DOI : 10.1007 / 978-3-319-08383-4_6 . ISBN 978-3-319-08383-4.
- ^ Чен, Дин-Гэн; Мир, Карл Э. (2014). Клинические испытания Анализ данных при помощи R . CRC Press. С. 99–108. ISBN 9781439840214.
- ^ «sts - создание, графическое отображение, список и тестирование функций выживших и кумулятивных опасностей» (PDF) . Руководство по Stata .
- ^ Клевес, Марио (2008). Введение в анализ выживаемости с использованием Stata (второе изд.). Колледж-Стейшн: Stata Press. С. 93–107. ISBN 978-1-59718-041-2.
- ^ lifeelines docs
- ^ «Эмпирическая кумулятивная функция распределения - MATLAB ecdf» . mathworks.com . Проверено 16 июня 2016 .
- ^ https://www.statsdirect.co.uk/help/Default.htm#survival_analysis/kaplan_meier.htm ]
- ^ [1]
- ^ https://juliastats.org/Survival.jl/latest/km/
дальнейшее чтение
- Аален, Странный; Борган, Орнульф; Gjessing, Хакон (2008). Анализ выживаемости и истории событий: точка зрения на процесс . Springer. С. 90–104. ISBN 978-0-387-68560-1.
- Грин, Уильям Х. (2012). «Непараметрический и полупараметрический подходы» . Эконометрический анализ (седьмое изд.). Прентис-Холл. С. 909–912. ISBN 978-0-273-75356-8.
- Джонс, Эндрю М .; Райс, Найджел; Д'Ува, Тереза Баго; Балия, Сильвия (2013). «Данные о продолжительности» . Прикладная экономика здравоохранения . Лондон: Рутледж. С. 139–181. ISBN 978-0-415-67682-3.
- Певица, Джудит Б .; Уиллетт, Джон Б. (2003). Прикладной лонгитюдный анализ данных: моделирование изменений и возникновения событий . Нью-Йорк: Издательство Оксфордского университета. С. 483–487. ISBN 0-19-515296-4.
Внешние ссылки
- Данн, Стив (2002). «Кривые выживаемости: начисление и оценка Каплана-Мейера» . Руководство по раку . Статистика.
- Стауб, Линда; Гекенидис, Александрос (7 марта 2011 г.). «Кривые выживания Каплана – Мейера и лог-ранговый тест» (PDF) . Анализ выживаемости (PDF) . Раздаточный материал и презентация . Семинар по статистике (SfS). Eidgenössische Technische Hochschule Zürich (ETH) [Швейцарский федеральный технологический институт в Цюрихе].
- Три меняющиеся кривые Каплана – Мейера на YouTube