Из Википедии, свободной энциклопедии
Перейти к навигацииПерейти к поиску

Модели пропорциональных рисков - это класс моделей выживания в статистике . Модели выживания связывают время, которое проходит до того, как произойдет какое-либо событие, с одной или несколькими ковариатами, которые могут быть связаны с этим количеством времени. В модели пропорциональных опасностей уникальный эффект увеличения ковариаты на единицу является мультипликативным по отношению к степени опасности . Например, прием лекарства может вдвое снизить риск возникновения инсульта, или изменение материала, из которого изготовлен компонент, может удвоить его риск отказа. Другие типы моделей выживаемости, такие как модели ускоренного времени отказа , не демонстрируют пропорциональных рисков. ВМодель ускоренного времени отказа описывает ситуацию, в которой биологическая или механическая жизненная история события ускоряется (или замедляется).

Фон

Модели выживания можно рассматривать как состоящие из двух частей: базовой функции риска , часто обозначаемой, описывая, как риск события в единицу времени изменяется с течением времени на базовых уровнях ковариат; и параметры эффекта, описывающие, как опасность изменяется в ответ на объясняющие коварианты. Типичный медицинский пример может включать ковариаты, такие как назначение лечения, а также характеристики пациента, такие как возраст в начале исследования, пол и наличие других заболеваний в начале исследования, чтобы уменьшить вариабельность и / или контроль за искажением.

Пропорциональная состояние опасности [1] утверждает , что ковариаты мультипликативной связаны с опасностью. В простейшем случае стационарных коэффициентов, например, лечение лекарством может, скажем, вдвое снизить опасность для субъекта в любой момент времени., в то время как базовая опасность может варьироваться. Обратите внимание, однако, что это не удваивает продолжительность жизни субъекта; точное влияние ковариат на время жизни зависит от типа. Ковариатой не ограничивается бинарными предсказателей; в случае непрерывной ковариаты, обычно предполагается, что опасность реагирует экспоненциально; каждая единица увеличения приводит к пропорциональному масштабированию опасности.

Модель Кокса

Частичное правдоподобие Кокса, показанное ниже, получается путем использования оценки Бреслоу базовой функции риска, включения ее в полную вероятность и последующего наблюдения за тем, что результат является продуктом двух факторов. Первый фактор - это показанная ниже частичная вероятность, при которой базовый риск «нейтрализован». Второй фактор свободен от коэффициентов регрессии и зависит от данных только через шаблон цензуры . Таким образом, влияние ковариат, оцененных с помощью любой модели пропорциональных опасностей, можно представить в виде соотношений рисков .

Сэр Дэвид Кокс заметил, что если допущение о пропорциональных опасностях выполняется (или предполагается, что оно выполняется), то можно оценить параметр (ы) воздействия без какого-либо рассмотрения функции риска. Такой подход к данным выживания, называется применение модели пропорциональных рисков Кокса , [2] , иногда сокращенно модели Кокса или модели пропорциональных рисков . Однако Кокс также отметил, что биологическая интерпретация предположения о пропорциональных рисках может быть довольно сложной. [3] [4]

Пусть X i = ( X i 1 ,…, X ip ) - реализованные значения ковариат для субъекта i . Функция рисков для модели пропорциональных рисков Кокса имеет вид

Это выражение дает функцию риска в момент времени t для субъекта i с вектором ковариации (независимые переменные) X i .

Вероятность того, что событие, которое будет наблюдаться, произойдет для субъекта i в момент времени Y i, может быть записана как:

где θ j = exp ( X jβ ), и суммирование ведется по набору субъектов j, где событие не произошло до момента времени Y i (включая сам субъект i ). Очевидно, 0 <  L i (β) ≤ 1. Это частичное правдоподобие : влияние ковариат можно оценить без необходимости моделировать изменение риска во времени.

Если рассматривать субъектов так, как если бы они были статистически независимыми друг от друга, совокупная вероятность всех реализованных событий [5] представляет собой следующую частичную вероятность, где возникновение события обозначено C i  = 1:

Соответствующее логарифмическое частичное правдоподобие равно

Эта функция может быть максимизирована по β для получения оценок максимального парциального правдоподобия параметров модели.

Частичная функция оценки является

а матрица Гессе частичного логарифмического правдоподобия равна

Используя эту функцию оценки и матрицу Гессе, частичное правдоподобие можно максимизировать с помощью алгоритма Ньютона-Рафсона . Матрица, обратная матрице Гессе, оцениваемая при оценке β , может использоваться в качестве приближенной ковариационно-дисперсионной матрицы для оценки и использоваться для получения приблизительных стандартных ошибок для коэффициентов регрессии.

Связанные времена

Было предложено несколько подходов для обработки ситуаций, в которых есть связи во временных данных. Метод Бреслоу описывает подход, в котором описанная выше процедура используется без изменений, даже если есть связи. Альтернативный подход, который, как считается, дает лучшие результаты, - это метод Эфрона . [6] Пусть t j обозначает уникальные моменты времени, пусть H j обозначает набор индексов i таких, что Y i  =  t j и C i  = 1, и пусть m j  = | H j|, Подход Эфрона максимизирует следующую частичную вероятность.

Соответствующее логарифмическое частичное правдоподобие равно

функция оценки

а матрица Гессе

куда

Обратите внимание, что когда H j пусто (все наблюдения за время t j подвергаются цензуре), слагаемые в этих выражениях обрабатываются как нулевые.

Изменяющиеся во времени предикторы и коэффициенты

Расширения к зависящим от времени переменным, зависящим от времени слоям и множеству событий для каждого субъекта могут быть включены в формулировку процесса подсчета Андерсена и Гилла. [7] Одним из примеров использования моделей рисков с изменяющимися во времени регрессорами является оценка влияния страхования от безработицы на периоды безработицы. [8] [9]

В дополнение к разрешению изменяющихся во времени ковариат (т. Е. Предикторов) модель Кокса также может быть обобщена на изменяющиеся во времени коэффициенты. То есть пропорциональный эффект от лечения может меняться со временем; например, лекарство может быть очень эффективным, если его вводить в течение одного месяца после заболеваемости , и со временем становится менее эффективным. Затем можно проверить гипотезу об отсутствии изменений во времени (стационарность) коэффициента. Подробности и программное обеспечение ( пакет R ) доступны в Martinussen and Scheike (2006). [10] [11] Применение модели Кокса с изменяющимися во времени ковариатами рассматривается в математике надежности. [12]

В этом контексте можно также упомянуть, что теоретически возможно определить влияние ковариант с помощью дополнительных опасностей [13], т.е.

Если такие аддитивные модели опасностей используются в ситуациях, когда целью является максимизация (логарифмического) правдоподобия, необходимо соблюдать осторожность, чтобы ограничитьк неотрицательным значениям. Возможно, в результате такого усложнения такие модели встречаются редко. Если целью является метод наименьших квадратов, ограничение неотрицательности строго не требуется.

Определение базовой функции опасности

Модель Кокса может быть специализированной, если существует причина предполагать, что базовый риск следует определенной форме. В этом случае базовая опасностьзаменяется заданной функцией. Например, предполагая , что функция опасности быть Вейбулла функция риска дает модели пропорциональных рисков Вейбулла .

Между прочим, использование базовой опасности Вейбулла - единственное обстоятельство, при котором модель удовлетворяет как модели пропорциональных опасностей, так и модели ускоренного времени отказа .

Общий термин « параметрические модели пропорциональных опасностей» может использоваться для описания моделей пропорциональных опасностей, в которых задана функция опасностей. Модель пропорциональных рисков Кокса , напротив, иногда называют полупараметрической моделью .

Некоторые авторы используют термин модель пропорциональных рисков Кокса даже при определении основной функции рисков [14], чтобы признать долг всей области перед Дэвидом Коксом.

Термин « регрессионная модель Кокса» (без учета пропорциональных рисков ) иногда используется для описания расширения модели Кокса для включения факторов, зависящих от времени. Однако такое использование потенциально неоднозначно, поскольку модель пропорциональных рисков Кокса может быть описана как регрессионная модель.

Связь с моделями Пуассона

Существует взаимосвязь между моделями пропорциональных рисков и моделями регрессии Пуассона, которая иногда используется для подгонки приближенных моделей пропорциональных рисков в программном обеспечении для регрессии Пуассона. Обычно это делается потому, что расчет выполняется намного быстрее. Это было более важно во времена более медленных компьютеров, но все же может быть полезно для особенно больших наборов данных или сложных проблем. Лэрд и Оливье (1981) [15] предоставляют математические детали. Они отмечают: «Мы не предполагаем [модель Пуассона] истинной, а просто используем ее как средство для определения вероятности». В книге МакКаллага и Нелдера [16] по обобщенным линейным моделям есть глава, посвященная преобразованию моделей пропорциональных опасностей в обобщенные линейные модели .

Под высокоразмерной настройкой

В большой размерности, когда число ковариат p велико по сравнению с размером выборки n, метод LASSO является одной из классических стратегий выбора модели. Тибширани (1997) предложил процедуру Лассо для параметра регрессии пропорционального риска. [17] Оценка Лассо параметра регрессии β определяется как минимизатор противоположности частичной логарифмической вероятности Кокса при ограничении типа L 1 -норм .

В последнее время в этой теме наблюдается теоретический прогресс. [18] [19] [20] [21]

См. Также

  • Модель ускоренного отказа
  • Правило одного из десяти
  • Распределение Вейбулла

Примечания

  1. ^ Бреслоу, NE (1975). «Анализ данных о выживаемости в рамках модели пропорциональных опасностей». Международный статистический обзор / Revue Internationale de Statistique . 43 (1): 45–57. DOI : 10.2307 / 1402659 . JSTOR  1402659 .
  2. ^ Кокс, Дэвид Р. (1972). «Регрессионные модели и таблицы продолжительности жизни». Журнал Королевского статистического общества, Series B . 34 (2): 187–220. JSTOR 2985181 . Руководство по ремонту 0341758 .  
  3. ^ Рид, Н. (1994). «Разговор с сэром Дэвидом Коксом» . Статистическая наука . 9 (3): 439–455. DOI : 10,1214 / сс / 1177010394 .
  4. Перейти ↑ Cox, DR (1997). Несколько замечаний по анализу данных о выживаемости . Первый Сиэтлский симпозиум по биостатистике: анализ выживаемости.
  5. ^ «Каждый сбой вносит свой вклад в функцию правдоподобия», Кокс (1972), стр. 191.
  6. ^ Эфрон, Брэдли (1974). «Эффективность функции правдоподобия Кокса для цензурированных данных». Журнал Американской статистической ассоциации . 72 (359): 557–565. DOI : 10.1080 / 01621459.1977.10480613 . JSTOR 2286217 . 
  7. ^ Андерсен, П .; Гилл, Р. (1982). «Регрессионная модель Кокса для процессов подсчета, исследование большой выборки» . Анналы статистики . 10 (4): 1100–1120. DOI : 10.1214 / AOS / 1176345976 . JSTOR 2240714 . 
  8. Перейти ↑ Meyer, BD (1990). «Страхование от безработицы и заклинания по безработице» (PDF) . Econometrica . 58 (4): 757–782. DOI : 10.2307 / 2938349 . JSTOR 2938349 .  
  9. ^ Bover, O .; Ареллано, М .; Бентолила, С. (2002). «Продолжительность безработицы, продолжительность пособия и деловой цикл» (PDF) . Экономический журнал . 112 (479): 223–265. DOI : 10.1111 / 1468-0297.00034 .
  10. ^ Мартинуссен; Шайке (2006). Модели динамической регрессии для данных о выживании . Springer. DOI : 10.1007 / 0-387-33960-4 . ISBN 978-0-387-20274-7.
  11. ^ «timereg: модели гибкой регрессии для данных о выживании» . КРАН .
  12. ^ Wu, S .; Шарф, П. (2015). «Упадок, восстановление и ковариантные эффекты» (PDF) . Европейский журнал операционных исследований . 244 (1): 219–226. DOI : 10.1016 / j.ejor.2015.01.041 .
  13. Перейти ↑ Cox, DR (1997). Несколько замечаний по анализу данных о выживаемости . Первый Сиэтлский симпозиум по биостатистике: анализ выживаемости.
  14. ^ Бендер, R .; Августин, Т .; Блеттнер, М. (2006). «Создание времени выживания для моделирования моделей пропорциональных рисков Кокса». Статистика в медицине . 24 (11): 1713–1723. DOI : 10.1002 / sim.2369 . PMID 16680804 . 
  15. ^ Нан Лэрд и Дональд Оливье (1981). "Ковариационный анализ цензурированных данных о выживании с использованием методов лог-линейного анализа". Журнал Американской статистической ассоциации . 76 (374): 231–240. DOI : 10.2307 / 2287816 . JSTOR 2287816 . 
  16. ^ П. McCullagh и JA Nelder (2000). «Глава 13: Модели данных о выживании». Обобщенные линейные модели (второе изд.). Бока-Ратон, Флорида: Chapman & Hall / CRC. ISBN 978-0-412-31760-6. (Второе издание 1989 г .; первое переиздание КПР 1999 г.)
  17. ^ Tibshirani, R. (1997). «Метод Лассо для выбора переменных в модели Кокса». Статистика в медицине . 16 (4): 385–395. CiteSeerX 10.1.1.411.8024 . DOI : 10.1002 / (SICI) 1097-0258 (19970228) 16: 4 <385 :: AID-SIM380> 3.0.CO; 2-3 . 
  18. ^ Bradić, J .; Fan, J .; Цзян, Дж. (2011). «Регуляризация модели пропорциональных рисков Кокса с NP-размерностью» . Анналы статистики . 39 (6): 3092–3120. arXiv : 1010,5233 . DOI : 10.1214 / 11-AOS911 . PMC 3468162 . PMID 23066171 .  
  19. ^ Bradić, J .; Песня, Р. (2015). «Структурированное оценивание в непараметрической модели Кокса». Электронный статистический журнал . 9 (1): 492–534. arXiv : 1207,4510 . DOI : 10.1214 / 15-EJS1004 .
  20. ^ Kong, S .; Нан, Б. (2014). «Неасимптотические неравенства оракула для многомерной регрессии Кокса через Лассо» . Statistica Sinica . 24 (1): 25–42. arXiv : 1204.1992 . DOI : 10.5705 / ss.2012.240 . PMC 3916829 . PMID 24516328 .  
  21. ^ Хуанг, J .; Вс, Т .; Инь, З .; Yu, Y .; Чжан, CH (2011). «Неравенства Oracle для лассо в модели Кокса» . Летопись статистики . 41 (3): 1142–1165. arXiv : 1306,4847 . DOI : 10.1214 / 13-AOS1098 . PMC 3786146 . PMID 24086091 .  

Ссылки

  • Багдонавичюс, В .; Levuliene, R .; Никулин, М. (2010). «Критерии согласия для модели Кокса на основе усеченных слева и цензурированных справа данных». Журнал математических наук . 167 (4): 436–443. DOI : 10.1007 / s10958-010-9929-6 .
  • Кокс, Д.Р .; Оукс, Д. (1984). Анализ данных о выживаемости . Нью-Йорк: Чепмен и Холл. ISBN 978-0412244902.
  • Коллетт, Д. (2003). Моделирование данных о выживании в медицинских исследованиях (2-е изд.). Бока-Ратон: CRC. ISBN 978-1584883258.
  • Гурье, Кристиан (2000). «Модели продолжительности» . Эконометрика качественных зависимых переменных . Нью-Йорк: Издательство Кембриджского университета. С. 284–362. ISBN 978-0-521-58985-7.
  • Певица, Джудит Д .; Уиллетт, Джон Б. (2003). «Подгонка моделей регрессии Кокса» . Прикладной лонгитюдный анализ данных: моделирование изменений и возникновения событий . Нью-Йорк: Издательство Оксфордского университета. С. 503–542. ISBN 978-0-19-515296-8.
  • Therneau, TM; Грамбш, PM (2000). Моделирование данных о выживании: расширение модели Кокса . Нью-Йорк: Спрингер. ISBN 978-0387987842.