Вверх-вниз конструкции - Up-and-Down Designs

Конструкции Up-and-Down (UDD) семья статистический планы экспериментов используется в доза поиск экспериментов в науке, технике и медицинских исследованиях. Эксперименты по определению дозы бинарные ответы: каждый отдельный результат можно описать как одно из двух возможных значений, например, успех или неудача или токсичный или нетоксичный. Математически бинарные ответы кодируются как 1 и 0. Цель экспериментов по определению дозы состоит в том, чтобы оценить силу воздействия (т.е. «дозу»), которая вызовет реакцию «1» в заранее заданную пропорцию времени. Эту дозу можно представить как процентиль из распределение порогов срабатывания. Пример использования определения дозы: эксперимент по оценке LD50 какого-то токсичного химического вещества по отношению к мышам.

Смоделированные эксперименты с 3-мя разными конструкциями Up-and-Down. Ответы «0» и «1» отмечены буквами «o» и «x» соответственно. Сверху вниз: исходный "простой" UDD, нацеленный на медианное значение, UDD Дарема-Флурного со смещенной монетой, ориентированный примерно на 20,6% процентиль, и UDD k-in-a-row / "преобразованный", нацеленный на тот же процентиль.

Планы поиска дозы являются последовательными и адаптивными к ответу: доза в данной точке эксперимента зависит от предыдущих результатов, а не фиксируется. априори. Конструкции для определения дозы обычно более эффективный для этой задачи, чем фиксированные конструкции, но их свойства труднее анализировать, а для некоторых требуется специальное программное обеспечение для проектирования. В UDD используется дискретный набор доз, а не постоянное изменение дозы. Их относительно просто реализовать, и они также являются одними из наиболее понятных схем определения дозы. Несмотря на эту простоту, UDD генерируют случайные прогулки со сложными свойствами.[1] Первоначальный UDD стремился найти медиана порог путем увеличения дозы на один уровень после ответа «0» и уменьшения его на один уровень после ответа «1». Отсюда и название «Вверх-вниз». Другие UDD нарушают эту симметрию, чтобы оценить процентили, отличные от медианы, или могут лечить группы субъектов, а не по одному за раз.

УДА были разработаны в 1940-х годах несколькими исследовательскими группами независимо.[2][3][4] В 1950-е и 1960-е годы произошла быстрая диверсификация: UDD ориентировались на процентили, отличные от медианы, и распространились на многочисленные прикладные области. С 1970-х до начала 1990-х годов было мало исследований по методам УДА, хотя конструкция продолжала широко использоваться. Возрождение исследований UDD с 1990-х годов обеспечило более глубокое понимание UDD и их свойств,[5] и новые и более совершенные методы оценки.[6][7]

UDD до сих пор широко используются в двух приложениях, для которых они были изначально разработаны: психофизика где они используются для оценки сенсорных порогов и часто известны как фиксированный принудительный выбор лестничные процедуры,[8] и испытание на взрывную чувствительность, при котором UDD, нацеленное на медианное значение, часто называют Брюсетон тест. UDD также очень популярны в исследованиях токсичности и анестезиологии.[9] Они также считаются жизнеспособным выбором для Клинические испытания фазы I.[10]

Математическое описание

Определение

Позволять быть размером выборки эксперимента UDD, и пока предположим, что субъектов лечат по одному. Затем дозы, получаемые этими субъектами, обозначаются как случайные переменные , выбираются из дискретного конечного набора увеличение уровни доз Кроме того, если , тогда в соответствии с простыми постоянными правилами, основанными на недавних ответах. На словах, следующий предмет должен рассматриваться на один уровень выше, на один уровень ниже или на том же уровне, что и текущий предмет; отсюда и название «вверх-вниз». Сами ответы обозначены в дальнейшем мы называем ответы «1» положительными, а «0» - отрицательными. Повторное применение одних и тех же правил (известных как правила перехода дозы) по конечному набору уровней дозы превращается в случайное блуждание . Различные правила перехода между дозами создают разные «вкусы» UDD, такие как три, показанные на рисунке выше.

Несмотря на то, что в эксперименте использовался только дискретный набор уровней доз, сама величина дозы , предполагается непрерывным, и предполагается, что вероятность положительного ответа непрерывно увеличивается с увеличением . Цель экспериментов по определению дозы - оценить дозу. (по непрерывной шкале), которые вызовут положительные отклики с заранее заданной целевой скоростью ; часто называют «целевой дозой». Эту проблему можно также выразить как оценку квантиль из кумулятивная функция распределения описание кривой доза-токсичность . В функция плотности связана с интерпретируется как распределение пороги ответа исследуемой популяции.

Матрица вероятности перехода

Учитывая, что субъект получает дозу , обозначают вероятность того, что следующий субъект получит дозу , или же , так как или же , соответственно. Эти вероятности перехода подчиняться ограничениям и граничные условия .

Каждый конкретный набор правил UDD позволяет символьно вычислять эти вероятности, обычно как функцию . Предположим, что вероятности перехода фиксированы во времени и зависят только от текущего распределения и его результата, т. Е. От и через них на (и, возможно, по набору фиксированных параметров). Тогда вероятности лучше всего представить через трехдиагональную матрица вероятности перехода (TPM) :

Точка баланса

Обычно правила изменения дозы УДА снижают дозу (или, по крайней мере, запрещают ее возрастание) после положительных ответов, и наоборот. Таким образом, случайные блуждания UDD имеют центральную тенденцию: назначение доз имеет тенденцию колебаться взад и вперед вокруг некоторой дозы. которые могут быть вычислены из правил перехода, когда они выражаются как функция .[1] Эту дозу часто путают с формальной целью эксперимента. , и эти два часто идентичны, но это не обязательно. Целью является доза, которую ставят перед экспериментом, в то время как , известная как «точка равновесия», приблизительно является местом, вокруг которого вращается случайное блуждание UDD.[11]

Стационарное распределение распределения доз

Поскольку случайные блуждания UDD являются регулярными Цепи Маркова, они генерируют стационарное распределение распределения доз, после того, как действие выбранной вручную начальной дозы прекратится. Это означает, что частота долгосрочных посещений для различных доз будет приближаться к устойчивому состоянию, описываемому . Согласно теории цепей Маркова эффект начальной дозы спадает довольно быстро, с геометрической скоростью.[12] Численные исследования показывают, что обычно это занимает от и предметы, чтобы эффект почти полностью исчез.[11] также асимптотическое распределение распределения кумулятивных доз.

Центральная тенденция UDD обеспечивает долгосрочную, наиболее часто посещаемую дозу (т. Е. Режим из ) будет одной из двух доз, ближайших к точке баланса .[1] Если находится вне диапазона допустимых доз, то режим будет на ближайшей к нему границе дозы. При исходном UDD с обнаружением медианы режим будет максимально близким к дозе в любом слючае. Вне режима асимптотические частоты посещений резко снижаются быстрее, чем геометрические. Несмотря на то, что эксперимент UDD по-прежнему является случайным блужданием, длительные поездки за пределы интересующей области маловероятны.

Примеры стационарных распределений УДА с . Слева: оригинальный ("классический") УДД, . Справа: предвзятая монета, ориентированная на 30-й процентиль,

Распространенные конструкции "вверх-вниз"

Оригинальный ("простой" или "классический") UDD

Исходный «простой» или «классический» UDD увеличивает дозу на один уровень при отрицательном ответе, и наоборот. Следовательно, вероятности перехода равны

Мы используем оригинальный UDD в качестве примера для расчета точки баланса. . Функции дизайна «вверх» и «вниз» Приравниваем их, чтобы найти :

Как указывалось ранее, «классический» UDD предназначен для определения медианного порога. Это тот случай, когда

«Классический» UDD можно рассматривать как частный случай каждой из более универсальных конструкций, описанных ниже.

Предвзятый дизайн монет Дарема и Флурнуа

Этот UDD сдвигает точку равновесия, добавляя возможность лечения следующего пациента той же дозой, а не только движения вверх или вниз. Останавливаться ли здесь определяется случайным подбрасыванием метафорической «монеты» с вероятностью. Этот дизайн с предвзятой монетой (BCD) имеет два «вкуса», один для и один для чьи правила показаны ниже:

Вероятность "орла" может принимать любое значение в. Точка баланса

Точку баланса BCD можно сделать идентичной целевой скорости установив вероятность "орлов" равной . Например, для набор . Параметр делает этот дизайн идентичным классическому UDD, а инвертирование правил путем наложения подбрасывания монеты на положительные, а не на отрицательные результаты дает точки баланса выше медианы. Также были опубликованы версии с двумя монетами, по одной для каждого результата, но они, похоже, не дают преимущества перед более простым BCD с одной монетой.

Группа (когорта) UDD

Некоторые эксперименты по поиску дозы, такие как испытания фазы I, требуют периода ожидания в несколько недель, прежде чем определять каждый отдельный результат. Тогда может быть предпочтительнее иметь возможность лечить несколько субъектов одновременно или в быстрой последовательности. В случае групповых UDD правила перехода применяются к когортам фиксированного размера. а не отдельным лицам. становится дозой, данной когорте , и это количество положительных отзывов в -я когорта, а не бинарный результат. Учитывая, что -я когорта лечится в на интерьере в -я когорта относится к

следовать биномиальному распределению при условии , с параметрами и. Вероятности "вверх" и "вниз" - это хвосты биномиального распределения, а вероятность "остаться" - его центр (она равна нулю, если ). Конкретный набор параметров может быть сокращен как GUD

Номинально групповые UDD генерируют -заказ случайных блужданий, так как самые последние наблюдения необходимы для определения следующего распределения. Однако, когда когорты рассматриваются как отдельные математические объекты, эти схемы генерируют случайное блуждание первого порядка с трехдиагональным TPM, как указано выше. Представляют интерес некоторые групповые подсемейства UDD:

  • Симметричные конструкции с (например, GUD) явно нацелены на медианное значение.
  • Семья ГУД встречается в исследованиях токсичности, допускает эскалацию только при нулевом положительном ответе и деэскалацию при любом положительном ответе. Вероятность эскалации при является и поскольку эта конструкция не позволяет оставаться в той же дозе, в точке баланса она будет точно . Следовательно,

С будет связан с и , соответственно. Зеркальное семейство ГУД имеет точки баланса на единицу минус эти вероятности.

Для общих групповых УДА точку баланса можно рассчитать только численно, найдя дозу со степенью токсичности такой, что

Любой числовой алгоритм поиска корней, например, Ньютон-Рафсон, можно использовать для решения .[13]

В -in-a-Row (или "преобразованный" или "геометрический") UDD

Это наиболее часто используемый немедианный UDD. Он был представлен Уэтериллом в 1963 году,[14] и вскоре после этого он и его коллеги распространили на психофизику,[15] где это остается одним из стандартных методов определения сенсорных порогов.[8] Уэзерилл назвал это «преобразованным» UDD; Гезму, который первым проанализировал его свойства случайного блуждания, в 1990-х назвал его «геометрическим» UDD;[16] а в 2000-е годы более прямолинейное название "подряд "УДД" был принят.[11] Правила дизайна обманчиво просты:

На словах, каждое повышение дозы требует нетоксичность, наблюдаемая в последовательных точках данных, все при текущей дозе, в то время как для деэскалации требуется только одна токсичность. Он очень похож на ГУД описанный выше, и действительно имеет ту же точку баланса. Разница в том, что -in-a-row может выйти из уровня дозы при первой токсичности, в то время как его родственник из группы UDD может лечить всю когорту сразу и, следовательно, может увидеть более одной токсичности, прежде чем снизиться.

Метод, используемый в сенсорных исследованиях, на самом деле является зеркальным отражением метода, определенного выше, с последовательные ответы, необходимые для деэскалации, и только одно отсутствие ответа для эскалации, в результате чего за .[17]

-in-a-row генерирует -Случайное блуждание порядка из-за знания последнего могут потребоваться ответы. Ее можно представить в виде цепочки первого порядка с состояний, или как цепь Маркова с уровней, каждый из которых внутренние состояния маркированный к Внутреннее состояние служит счетчиком числа недавних последовательных нетоксичных эффектов, наблюдаемых при текущей дозе. Это описание ближе к физическому процессу распределения доз, потому что субъекты, находящиеся в разных внутренних состояниях уровня , всем назначается одинаковая доза . В любом случае TPM (а точнее, , потому что внутренний счетчик бессмысленен при максимальной дозе) - и он не трехдиагональный.

Вот расширенный -в ряду TPM с и , используя сокращение Внутренние состояния каждого уровня смежны друг с другом.

-in-a-row часто рассматривается для клинических испытаний, нацеленных на малотоксичную дозу. В этом случае точка баланса и цель не идентичны; скорее, выбирается так, чтобы стремиться к целевой скорости, например, для исследований, ориентированных на 30-й процентиль, и для исследований, ориентированных на 20-й процентиль.

Оценка целевой дозы

Пример оценки реверсивного усреднения психофизического эксперимента. Точки разворота обведены кружком, и первый разворот был исключен из среднего. Дизайн двухступенчатый, со вторым (и основным) этапом. - подряд с таргетингом на процентиль 70,7%. На первом этапе (до первого разворота) используется «классический» UDD, обычно используемая схема для ускорения прибытия в интересующую область.

В отличие от других подходов к проектированию, UDD не имеют определенного метода оценки, «связанного» с проектом в качестве выбора по умолчанию. Исторически сложилось так, что более распространенным выбором была некоторая средневзвешенная величина введенных доз, обычно исключая первые несколько доз для смягчения смещения исходной точки. Этот подход предшествовал более глубокому пониманию марковских свойств УДА, но его успех в численных оценках зависит от возможной выборки из , так как последний примерно сосредоточен вокруг [5]

Самый популярный среди них оценки усреднения был введен Wetherill et al. в 1966 году и включает только точки разворота (точки, где результат меняется с 0 на 1 или наоборот) в среднем.[18] См. Пример справа. В последние годы выяснились ограничения оценок усреднения, в частности, множество источников систематической ошибки, которые очень трудно устранить. Обратные оценки страдают как от множественных смещений (хотя есть некоторые непреднамеренные исключения из смещений), так и от увеличенной дисперсии из-за использования подвыборки доз. Однако знания об ограничениях оценки усреднения еще предстоит распространить за пределы методологической литературы и повлиять на реальную практику.[5]

Напротив, оценки регрессии попытаться аппроксимировать кривую описывая доза-реакция, в частности, около целевого процентиля. Исходными данными для регрессии являются дозы по горизонтальной оси и наблюдаемые частоты токсичности,

по вертикальной оси. Целевая оценка - это абсцисса точки пересечения подобранной кривой

Пробит регрессия в течение многих десятилетий использовался для оценки целевых показателей UDD, хотя и гораздо реже, чем оценка с усреднением обратного хода. В 2002 году Стилиану и Флорной представили интерполированную версию изотоническая регрессия для оценки целей UDD и других данных о реакции на дозу.[6] Совсем недавно Орон и Флорной разработали модификацию, названную «центрированная изотоническая регрессия», которая в большинстве случаев обещает значительно лучшие характеристики оценки, чем обычная изотоническая регрессия, а также предлагает первую жизнеспособную интервальная оценка для изотонической регрессии в целом.[7] Оценщики изотонической регрессии, по-видимому, наиболее совместимы с UDD, поскольку оба подхода непараметрически и относительно устойчивы.[5]

Рекомендации

  1. ^ а б c Дарем, SD; Flournoy, Н. "Конструкции вверх и вниз. I. Стационарные лечебные распределения.". В Flournoy, N; Розенбергер, У. Ф. (ред.). Серия монографий IMS Lecture Notes. 25: Адаптивный дизайн. С. 139–157.
  2. ^ Диксон, WJ; Настроение, AM (1948). «Метод получения и анализа данных о чувствительности». Журнал Американской статистической ассоциации. 43: 109–126. Дои:10.1080/01621459.1948.10483254.
  3. ^ фон Бекеси, G (1947). «Новый аудиометр». Acta Oto-Laryngologica. 35: 411–422. Дои:10.3109/00016484709123756.
  4. ^ Андерсон, TW; Маккарти, П.Дж.; Тьюки, JW (1946). «Лестничный» метод тестирования чувствительности (Технический отчет). Отчет о морской артиллерии. 65-46.
  5. ^ а б c d Flournoy, N; Орон, АП. «Подвижные конструкции для поиска дозы». В Дин, A (ред.). Справочник по планированию и анализу экспериментов. CRC Press. С. 858–894.
  6. ^ а б Стилиану, депутат; Флурной, Н. (2002). «Определение дозы с использованием конструкции смещенной вверх-вниз монеты и изотонической регрессии». Биометрия. 58: 171–177. Дои:10.1111 / j.0006-341x.2002.00171.x.
  7. ^ а б Орон, AP; Флурной, Н. (2017). "Центрированная изотоническая регрессия: точечная и интервальная оценка для исследований" доза-реакция ". Статистика в биофармацевтических исследованиях. 9: 258–267. arXiv:1701.05964. Дои:10.1080/19466315.2017.1286256.
  8. ^ а б Лик, MR (2001). «Адаптивные процедуры в психофизических исследованиях». Восприятие и психофизика. 63: 1279–1292. Дои:10.3758 / bf03194543.
  9. ^ Пейс, Нидерланды; Стилиану, депутат (2007). «Достижения и ограничения восходящей и нисходящей методологии: точность клинического использования, дизайн исследования и оценка дозы в исследованиях анестезии». Анестезиология. 107: 144–152. Дои:10.1097 / 01.anes.0000267514.42592.2a.
  10. ^ Орон, AP; Хофф, PD (2013). "Поведение малых выборок новых дизайнов испытаний рака фазы I". Клинические испытания. 10: 63–80. arXiv:1202.4962. Дои:10.1177/1740774512469311.
  11. ^ а б c Орон, AP; Хофф, PD (2009). «Пересмотр конструкции« k-in-a-row вверх-вниз »». Статистика в медицине. 28: 1805–1820. Дои:10.1002 / sim.3590.
  12. ^ Diaconis, P; Строок, Д. (1991). «Геометрические оценки собственных значений цепи Маркова». Анналы прикладной теории вероятностей. 1: 36–61. Дои:10.1214 / aoap / 1177005980.
  13. ^ Гезму, М; Флурной, Н. (2006). «Группируйте восходящие и нисходящие конструкции для определения дозы». Журнал статистического планирования и вывода. 6: 1749–1764.
  14. ^ Уэзерилл, Великобритания; Левитт, H (1963). «Последовательная оценка кривых квантового отклика». Журнал Королевского статистического общества, серия B. 25: 1–48. Дои:10.1111 / j.2517-6161.1963.tb00481.x.
  15. ^ Уэзерилл, Великобритания (1965). «Последовательная оценка баллов по психометрической функции». Британский журнал математической и статистической психологии. 18: 1–10. Дои:10.1111 / j.2044-8317.1965.tb00689.x.
  16. ^ Гезму, Мисрак (1996). Геометрический дизайн вверх и вниз для распределения уровней дозировки (Кандидат наук). Американский университет.
  17. ^ Гарсиа-Перес, Массачусетс (1998). «Лестницы принудительного выбора с фиксированными размерами ступенек: асимптотические и маловыборочные свойства». Исследование зрения. 38 (12): 1861–81. Дои:10.1016 / с0042-6989 (97) 00340-4. PMID  9797963.
  18. ^ Уэзерилл, Великобритания; Чен, Н; Васудева, РБ (1966). «Последовательная оценка кривых квантового отклика: новый метод оценки». Биометрика. 53: 439–454. Дои:10.1093 / biomet / 53.3-4.439.