Из Википедии, бесплатной энциклопедии
Перейти к навигации Перейти к поиску

Конструкции Up-and-Down (UDD) - это семейство схем статистических экспериментов, используемых в экспериментах по определению дозы в науке, технике и медицинских исследованиях. Эксперименты по определению дозы имеют бинарные ответы : каждый отдельный результат можно описать как одно из двух возможных значений, например, успех против неудачи или токсичный против нетоксичного. Математически бинарные ответы кодируются как 1 и 0. Цель экспериментов по определению дозы состоит в том, чтобы оценить силу воздействия (т. Е. «Дозу»), которая вызовет реакцию «1» в заранее заданную пропорцию времени. Эта доза может быть представлена как процентиль в распределениипорогов срабатывания. Пример использования определения дозы: эксперимент по оценке LD 50 какого-либо токсичного химического вещества по отношению к мышам.

Смоделированные эксперименты с 3-мя разными конструкциями Up-and-Down Ответы «0» и «1» отмечены буквами «o» и «x» соответственно. Сверху вниз: исходный «простой» UDD, нацеленный на медианное значение, UDD Дарема-Флурного со смещением монет, ориентированный примерно на 20,6% процентиль, и UDD k-in-a-row / «преобразованный», нацеленный на тот же процентиль.

Планы поиска дозы являются последовательными и адаптивными к ответу: доза в данной точке эксперимента зависит от предыдущих результатов, а не фиксируется априори . Планы для определения дозы обычно более эффективны для этой задачи, чем фиксированные планы, но их свойства труднее анализировать, а для некоторых требуется специальное программное обеспечение для проектирования. В UDD используется дискретный набор доз, а не постоянное изменение дозы. Их относительно просто реализовать, и они также являются одними из наиболее понятных схем определения дозы. Несмотря на эту простоту, UDD генерируют случайные блуждания со сложными свойствами. [1] Исходный UDD был нацелен на поиск медианыпорог путем увеличения дозы на один уровень после ответа «0» и уменьшения его на один уровень после ответа «1». Отсюда и название «Вверх-вниз». Другие UDD нарушают эту симметрию, чтобы оценить процентили, отличные от медианы, или могут лечить группы субъектов, а не по одному за раз.

УДА были разработаны в 1940-х годах несколькими исследовательскими группами независимо. [2] [3] [4] В 1950-х и 1960-х годах произошла быстрая диверсификация, когда UDD ориентировались на процентили, отличные от медианы, и распространились на многочисленные прикладные области. С 1970-х до начала 1990-х годов было мало исследований по методам УДА, хотя конструкция продолжала широко использоваться. Возрождение исследований UDD с 1990-х годов обеспечило более глубокое понимание UDD и их свойств [5], а также новые и более совершенные методы оценки. [6] [7]

UDDS все еще широко используется в двух приложениях , для которых они изначально были разработаны: психофизика , где они используются для оценки сенсорных порогов и часто известны как фиксированные с принудительным выбором процедуры лестницы , [8] и тестирования чувствительности взрывчатого вещества, где средняя таргетированией UDD часто называют тестом Брюсетона . UDD также очень популярны в исследованиях токсичности и анестезиологии. [9] Они также считается жизнеспособным выбором для фазы I клинических испытаний . [10]

Математическое описание [ править ]

Определение [ править ]

Пусть будет размер выборки эксперимента UDD, а пока предположим, что субъектов лечат по одному. Затем дозы, которые получают эти субъекты, обозначаемые как случайные величины , выбираются из дискретного конечного набора возрастающих уровней доз. Кроме того, если , то в соответствии с простыми постоянными правилами, основанными на недавних ответах. На словах, следующий предмет должен рассматриваться на один уровень выше, на один уровень ниже или на том же уровне, что и текущий предмет; отсюда и название «вверх-вниз». Сами ответы обозначаются ниже. Мы называем ответы «1» положительными и «0» отрицательными. Многократное применение одних и тех же правил (известных как правила перехода от дозы) к конечному набору уровней дозы превращает в случайное блуждание . Различные правила перехода между дозами создают разные «вкусы» UDD, такие как три, показанные на рисунке выше.

Несмотря на то, что в эксперименте использовался только дискретный набор уровней доз, сама переменная величина дозы предполагается непрерывной, и предполагается, что вероятность положительного ответа непрерывно увеличивается с увеличением . Цель экспериментов по определению дозы - оценить дозу (по непрерывной шкале), которая вызовет положительные реакции с заранее заданной целевой скоростью ; часто называют «целевой дозой». Эта проблема может быть также выражена как оценки квантиля о наличии интегральной функции распределения , описывающой кривой доза-токсичности . Функция плотности, связанная с , интерпретируется как распределение пороговых значений отклика исследуемой популяции.

Матрица вероятности перехода [ править ]

Учитывая, что субъект получает дозу , обозначьте вероятность, что следующий субъект получит дозу , или , как или , соответственно. Эти вероятности перехода подчиняются ограничениям и граничным условиям .

Каждый конкретный набор правил UDD позволяет символьно вычислять эти вероятности, обычно как функцию от . Предположим, что вероятности перехода фиксированы во времени и зависят только от текущего распределения и его результата, т. Е. От них и через них (и, возможно, от набора фиксированных параметров). Тогда вероятности лучше всего представить с помощью трехдиагональной матрицы вероятностей перехода (TPM) :

Точка баланса [ править ]

Обычно правила изменения дозы УДА снижают дозу (или, по крайней мере, запрещают ее возрастание) после положительных ответов, и наоборот. Следовательно, случайные блуждания UDD имеют центральную тенденцию: назначения доз имеют тенденцию колебаться взад и вперед вокруг некоторой дозы, которую можно вычислить с помощью правил перехода, когда они выражаются как функция . [1] Эту дозу часто путают с формальной целью эксперимента , и они часто идентичны, но это не обязательно. Целью является доза, которую ставит перед экспериментом оценка, в то время как , известная как «точка баланса», приблизительно это то место, где вращается случайное блуждание UDD. [11]

Стационарное распределение распределения доз [ править ]

Поскольку случайные блуждания UDD представляют собой обычные цепи Маркова , они генерируют стационарное распределение распределения доз , как только эффект выбранной вручную начальной дозы прекращается. Это означает, что частота долгосрочных посещений различных доз будет приближаться к устойчивому состоянию, описываемому как . Согласно теории цепей Маркова эффект начальной дозы спадает довольно быстро, с геометрической скоростью. [12] Численные исследования показывают, что обычно требуется от и до субъектов, чтобы эффект почти полностью исчез. [11] также представляет собой асимптотическое распределение распределения кумулятивных доз.

Центральный гарантирует тенденция Удд, что в долгосрочной перспективе, наиболее часто посещаемые дозы (т.е. режим в ) будет один из двух доз , наиболее близких к точке равновесия . [1] Если выходит за пределы допустимого диапазона доз, то режим будет на границе дозы, ближайшей к нему. При исходном UDD с обнаружением медианы режим в любом случае будет наиболее близким к дозе . Вне режима асимптотические частоты посещений резко снижаются быстрее, чем геометрические. Несмотря на то, что эксперимент UDD по-прежнему является случайным блужданием, длительные поездки за пределы интересующей области маловероятны.

Примеры стационарных распределений УДА с . Слева: оригинал ( "классическая") УДА, . Справа: предвзятая монета, ориентированная на 30-й процентиль,

Обычные конструкции "вверх-вниз" [ править ]

Оригинальный ("простой" или "классический") UDD [ править ]

Исходный «простой» или «классический» UDD увеличивает дозу на один уровень при отрицательном ответе, и наоборот. Следовательно, вероятности перехода равны

Мы используем исходный UDD в качестве примера для расчета точки баланса . Функции дизайна «вверх» и «вниз». Мы приравниваем их, чтобы найти :

Как указывалось ранее, «классический» UDD предназначен для определения медианного порога. Это тот случай, когда

«Классический» UDD можно рассматривать как частный случай каждой из более универсальных конструкций, описанных ниже.

Предвзятый дизайн монет Дарема и Флурнуа [ править ]

Этот UDD сдвигает точку равновесия, добавляя возможность лечения следующего пациента той же дозой, а не только движения вверх или вниз. Решение о том, остаться ли здесь, определяется случайным подбрасыванием метафорической «монеты» с вероятностью. Этот предвзятый дизайн монеты (BCD) имеет два «вкуса», один для и один , правила которого показаны ниже:

Вероятность "орла" может принимать любое значение . Точка баланса

Точку баланса BCD можно сделать идентичной целевой ставке , установив вероятность "орла" равной . Например, для set . Сеттинг делает этот дизайн идентичным классическому UDD, а изменение правил путем наложения подбрасывания монеты на положительные, а не на отрицательные результаты создает точки баланса выше медианы. Также были опубликованы версии с двумя монетами, по одной для каждого результата, но они, похоже, не дают преимущества перед более простым BCD с одной монетой.

Групповые (когорты) UDD [ править ]

Некоторые эксперименты по поиску дозы, такие как испытания фазы I, требуют периода ожидания в несколько недель, прежде чем определять каждый отдельный результат. Тогда может быть предпочтительнее иметь возможность лечить несколько субъектов одновременно или в быстрой последовательности. В случае групповых UDD правила перехода применяются к когортам фиксированного размера, а не к отдельным лицам. становится дозой, данной когорте , и представляет собой количество положительных ответов в -й когорте, а не бинарный результат. Учитывая , что -й когорты обрабатывают при на внутренней стороне в -й когорте присваиваются

следуют условному биномиальному распределению с параметрами и . Вероятности "вверх" и "вниз" - это хвосты биномиального распределения, а вероятность "остаться" - его центр (если она равна нулю ). Конкретный набор параметров может быть сокращен как GUD

Номинально групповые UDD генерируют случайные блуждания порядка порядка, поскольку для определения следующего распределения необходимы самые последние наблюдения. Однако, когда когорты рассматриваются как отдельные математические объекты, эти схемы генерируют случайное блуждание первого порядка с трехдиагональным TPM, как указано выше. Представляют интерес некоторые групповые подсемейства UDD:

  • Симметричные планы (например, GUD ) явно нацелены на медианное значение.
  • Семейство GUD, обнаруженное в исследованиях токсичности, допускает эскалацию только при нулевых положительных ответах и ​​деэскалацию при любом положительном ответе. Вероятность эскалации составляет и, поскольку эта конструкция не позволяет оставаться при той же дозе, в точке баланса она будет точно . Следовательно,

With будет ассоциироваться с и , соответственно. Зеркальное семейство GUD имеет точки баланса, равные единице минус эти вероятности.

Для общих групповых UDD точку баланса можно рассчитать только численно, найдя дозу со степенью токсичности такой, что

Для решения можно использовать любой числовой алгоритм поиска корня, например Ньютона-Рафсона . [13]

-В-ряд (или «Преобразованный» или «Геометрический») УДД [ править ]

Это наиболее часто используемый немедианный UDD. Он был введен Уэзериллом в 1963 году [14] и вскоре после этого распространился им и его коллегами в психофизику [15], где он остается одним из стандартных методов поиска сенсорных порогов. [8] Уэзерилл назвал это «преобразованным» UDD; Гезму, который первым проанализировал его свойства случайного блуждания, в 1990-х назвал его «геометрическим» UDD; [16], а в 2000-х годах было принято более прямое название UDD «подряд». [11] Правила дизайна обманчиво просты:

Другими словами, каждое повышение дозы требует нетоксичности, наблюдаемой в последовательных точках данных, все при текущей дозе, в то время как деэскалация требует только одной токсичности. Он очень похож на GUD, описанный выше, и действительно имеет ту же точку баланса. Разница в том, что при первой токсичности один-один раз подряд может выйти из уровня дозы, тогда как его родственник из группы UDD может лечить всю когорту одновременно и, следовательно, может увидеть более одной токсичности, прежде чем снизиться.

Метод, используемый в сенсорных исследованиях, на самом деле является зеркальным отражением метода, определенного выше, с последовательными ответами, необходимыми для деэскалации, и только одним отсутствием реакции для эскалации, уступающим для . [17]

-in-a-row генерирует случайное блуждание -го порядка, поскольку может потребоваться знание последних ответов. Его можно представить как цепочку первого порядка с состояниями или как цепь Маркова с уровнями, каждое из которых имеет внутренние состояния, помеченные как Внутреннее состояние служит счетчиком количества непосредственно недавних последовательных нетоксичностей, наблюдаемых при текущей дозе. Это описание ближе к физическому процессу распределения доз, потому что все субъекты с разными внутренними состояниями уровня получают одинаковую дозу . В любом случае TPM есть (точнее, потому что внутренний счетчик бессмысленен при максимальной дозе) - и он не трехдиагональный.

Вот расширенный доверенный платформенный модуль в строке с и , используя аббревиатуру . Внутренние состояния каждого уровня смежны друг с другом.

-in-a-row часто рассматривается для клинических испытаний, нацеленных на дозу с низкой токсичностью. В этом случае точка баланса и цель не идентичны; скорее, выбирается так, чтобы стремиться к целевой норме, например, для исследований, ориентированных на 30-й процентиль, и для исследований, нацеленных на 20-й процентиль.

Оценка целевой дозы [ править ]

Пример оценки реверсивного усреднения психофизического эксперимента. Точки разворота обведены кружком, и первый разворот был исключен из среднего. Дизайн является двухэтапным, при этом второй (и основной) этап подряд нацелен на процентиль 70,7%. На первом этапе (до первого разворота) используется «классический» UDD, обычно используемая схема для ускорения прибытия в интересующую область.

В отличие от других подходов к проектированию, UDD не имеют определенного метода оценки, «связанного» с проектом в качестве выбора по умолчанию. Исторически сложилось так, что более распространенным выбором была некоторая средневзвешенная величина введенных доз, обычно исключая первые несколько доз для смягчения смещения исходной точки. Этот подход предшествовал более глубокому пониманию марковских свойств УДА, но его успех в численных оценках зависит от возможной выборки из , поскольку последняя ориентирована примерно на [5]

Самая популярная среди этих оценок усреднения была представлена ​​Wetherill et al. в 1966 году и включает только точки разворота (точки, где результат переключается с 0 на 1 или наоборот) в среднем. [18] См. Пример справа. В последние годы выяснились ограничения оценок усреднения, в частности, множество источников систематической ошибки, которые очень трудно устранить. Обратные оценки страдают как от множественных смещений (хотя есть некоторая непреднамеренная нейтрализация смещений), так и от увеличенной дисперсии из-за использования подвыборки доз. Однако знания об ограничениях оценки усреднения еще предстоит распространить за пределы методологической литературы и повлиять на реальную практику. [5]

В отличие от этого, оценщики регрессии пытаются аппроксимировать кривую, описывающую зависимость доза-реакция , в частности, около целевого процентиля. Исходными данными для регрессии являются дозы на горизонтальной оси и наблюдаемые частоты токсичности,

по вертикальной оси. Целевая оценка - это абсцисса точки пересечения подобранной кривой.

Пробит-регрессия использовалась в течение многих десятилетий для оценки целевых значений UDD, хотя и гораздо реже, чем оценка с обратным усреднением. В 2002 году Стилиану и Флорной представили интерполированную версию изотонической регрессии (IR) для оценки целевых показателей UDD и других данных «доза-реакция». [6] Совсем недавно Орон и Флорной разработали модификацию, названную «центрированная изотоническая регрессия» (CIR), которая в большинстве случаев обещает существенно лучшую производительность оценки, чем обычная изотоническая регрессия, а также предлагает первую жизнеспособную интервальную оценку для изотонической регрессии в целом. . [7]Оценщики изотонической регрессии, по-видимому, наиболее совместимы с UDD, поскольку оба подхода непараметрически и относительно устойчивы. [5] Общедоступный пакет R "cir" реализует как CIR, так и IR для определения дозы и других приложений. [19]

Ссылки [ править ]

  1. ^ а б в Дарем, SD; Flournoy, Н. "Конструкции вверх и вниз. I. Стационарные лечебные распределения.". В Flournoy, N; Розенбергер, У. Ф. (ред.). Серия монографий IMS Lecture Notes . 25: Адаптивный дизайн. С. 139–157.
  2. ^ Диксон, WJ; Настроение, AM (1948). «Метод получения и анализа данных о чувствительности». Журнал Американской статистической ассоциации . 43 : 109–126. DOI : 10.1080 / 01621459.1948.10483254 .
  3. ^ фон Бекеси, G (1947). «Новый аудиометр». Acta Oto-Laryngologica . 35 : 411–422. DOI : 10.3109 / 00016484709123756 .
  4. ^ Андерсон, TW; Маккарти, П.Дж.; Тьюки, JW (1946).«Лестничный» метод тестирования чувствительности (Технический отчет). Отчет о морской артиллерии. 65-46.
  5. ^ a b c d Flournoy, N; Орон, АП. «Подвижные конструкции для поиска дозы». В Дин, A (ред.). Справочник по планированию и анализу экспериментов . CRC Press. С. 858–894.
  6. ^ a b Стилиану, депутат; Флурной, Н. (2002). «Определение дозы с использованием конструкции смещенной вверх-вниз монеты и изотонической регрессии». Биометрия . 58 : 171–177. DOI : 10.1111 / j.0006-341x.2002.00171.x .
  7. ^ а б Орон, AP; Флурной, Н. (2017). "Центрированная изотоническая регрессия: точечная и интервальная оценка исследований" доза-реакция ". Статистика в биофармацевтических исследованиях . 9 : 258–267. arXiv : 1701.05964 . DOI : 10.1080 / 19466315.2017.1286256 .
  8. ^ а б Лик, MR (2001). «Адаптивные процедуры в психофизических исследованиях» . Восприятие и психофизика . 63 : 1279–1292. DOI : 10.3758 / bf03194543 .
  9. ^ Пейс, Нидерланды; Стилиану, депутат (2007). «Достижения и ограничения восходящей и нисходящей методологии: точность клинического использования, дизайн исследования и оценка дозы в исследованиях анестезии». Анестезиология . 107 : 144–152. DOI : 10,1097 / 01.anes.0000267514.42592.2a .
  10. ^ Орон, AP; Хофф, PD (2013). "Поведение малых выборок новых дизайнов испытаний рака фазы I". Клинические испытания . 10 : 63–80. arXiv : 1202,4962 . DOI : 10.1177 / 1740774512469311 .
  11. ^ а б в Орон, AP; Хофф, PD (2009). «Пересмотр конструкции« k-in-a-row вверх-вниз »». Статистика в медицине . 28 : 1805–1820. DOI : 10.1002 / sim.3590 .
  12. ^ Diaconis, P; Строок, Д. (1991). «Геометрические оценки собственных значений цепи Маркова» . Анналы прикладной теории вероятностей . 1 : 36–61. DOI : 10.1214 / aoap / 1177005980 .
  13. ^ Гезму, М; Флурной, Н. (2006). «Группируйте восходящие и нисходящие конструкции для определения дозы». Журнал статистического планирования и вывода . 6 : 1749–1764.
  14. ^ Уэзерилл, Великобритания; Левитт, H (1963). «Последовательная оценка кривых квантового отклика». Журнал Королевского статистического общества, Series B . 25 : 1–48. DOI : 10.1111 / j.2517-6161.1963.tb00481.x .
  15. ^ Wetherill, GB (1965). «Последовательная оценка баллов по психометрической функции». Британский журнал математической и статистической психологии . 18 : 1–10. DOI : 10.1111 / j.2044-8317.1965.tb00689.x .
  16. ^ Gezmu, Misrak (1996). Геометрический дизайн вверх и вниз для распределения уровней дозировки (PhD). Американский университет.
  17. Перейти ↑ Garcia-Perez, MA (1998). «Лестницы принудительного выбора с фиксированными размерами ступенек: асимптотические и малоразмерные свойства». Исследование зрения . 38 (12): 1861–81. DOI : 10.1016 / s0042-6989 (97) 00340-4 . PMID 9797963 . 
  18. ^ Уэзерилл, Великобритания; Чен, Н; Васудева, РБ (1966). «Последовательная оценка кривых квантового отклика: новый метод оценки». Биометрика . 53 : 439–454. DOI : 10.1093 / Biomet / 53.3-4.439 .
  19. Орон, Ассаф. «Пакет 'cir ' » . КРАН . R Фонд статистических вычислений . Проверено 26 декабря 2020 года .