Анализ выживания


Анализ выживания - это раздел статистики для анализа ожидаемой продолжительности времени до наступления одного события, такого как смерть биологических организмов и отказ механических систем. Эта тема называется теорией надежности или анализом надежности в инженерии , анализом продолжительности или моделированием продолжительности в экономике и анализом истории событий в социологии .. Анализ выживания пытается ответить на определенные вопросы, например, какова доля популяции, которая выживет после определенного времени? Из тех, кто выживает, с какой скоростью они умрут или потерпят неудачу? Можно ли учитывать несколько причин смерти или отказа? Как определенные обстоятельства или характеристики увеличивают или уменьшают вероятность выживания ?

Чтобы ответить на такие вопросы, необходимо определить «время жизни». В случае биологического выживания смерть однозначна, но для механической надежности отказ не может быть четко определен, поскольку вполне могут быть механические системы, в которых отказ является частичным, зависит от степени или иным образом не локализован во времени . Даже в биологических задачах некоторые события (например, сердечный приступ или отказ другого органа) могут иметь такую ​​же неоднозначность. Теория , изложенная ниже, предполагает четко определенные события в определенное время; другие случаи могут быть лучше обработаны моделями, которые явно учитывают неоднозначные события.

В более общем плане анализ выживания включает моделирование времени до данных о событиях; в этом контексте смерть или неудача считаются «событием» в литературе по анализу выживания - традиционно для каждого субъекта происходит только одно событие, после которого организм или механизм мертвы или сломаны. Модели повторяющихся событий или повторяющихся событий ослабляют это предположение. Изучение повторяющихся событий актуально для системной надежности , а также во многих областях социальных наук и медицинских исследований.

В этом примере используется набор данных о выживаемости при остром миелогенном лейкозе «aml» из пакета «survival» в R. Набор данных взят из Miller (1997) [1] , и вопрос заключается в том, следует ли продлить стандартный курс химиотерапии («поддерживать ') для дополнительных циклов.

Последнее наблюдение (11) в 161 неделю подвергается цензуре. Цензурирование указывает на то, что у пациента не было события (отсутствие рецидива амл-рака). Другой субъект, наблюдение 3, был подвергнут цензуре в возрасте 13 недель (обозначен статусом = 0). Этот субъект участвовал в исследовании всего 13 недель, и в течение этих 13 недель не было рецидивов рака надпочечников. Возможно, этот пациент был включен в исследование ближе к концу, так что его можно было наблюдать только в течение 13 недель. Также возможно, что пациент был включен в исследование на ранней стадии, но был потерян для последующего наблюдения или выбыл из исследования. Таблица показывает, что другие испытуемые подвергались цензуре в 16, 28 и 45 недель (наблюдения 17, 6 и 9 со статусом=0). Все остальные субъекты испытали события (рецидив рака амл) во время исследования. Представляет интерес вопрос, возникает ли рецидив позже у пациентов, находящихся на поддерживающей терапии, чем у пациентов, не получающих поддерживающую терапию.

Функция выживания S ( t ) — это вероятность того, что субъект проживет дольше, чем время t . S ( t ) теоретически представляет собой гладкую кривую, но обычно ее оценивают с помощью кривой Каплана-Мейера (КМ). График показывает график КМ для данных AML и может быть интерпретирован следующим образом:


Набор данных Aml, отсортированный по времени выживания
Таблица смертности для данных AML
График Каплана – Мейера по группам лечения в амл
Выходные данные регрессии пропорциональных рисков Кокса для данных о меланоме. Предикторной переменной является пол 1: женский, 2: мужской.
Гистограммы толщины опухоли меланомы
Выход Cox PH для набора данных меланомы с ковариантной логарифмической толщиной опухоли
Дерево выживания для набора данных о раке простаты