Многоуровневое моделирование повторных измерений - Multilevel modeling for repeated measures

Одно приложение многоуровневое моделирование (MLM) - это анализ данных повторных измерений. Многоуровневое моделирование повторных измерений данные чаще всего обсуждаются в контексте моделирования изменений во времени (т. е. моделирования кривой роста для продольных планов); однако его также можно использовать для данных повторных измерений, для которых время не имеет значения.[1]

В многоуровневом моделировании общая функция изменения (например, линейная, квадратичная, кубическая и т. Д.) Подбирается ко всей выборке, и, как и в многоуровневом моделировании для кластерных данных, склон и перехватить может быть разрешено варьироваться. Например, в исследовании, посвященном росту доходов с возрастом, можно предположить, что люди демонстрируют линейное улучшение с течением времени. Тем не менее, точное пересечение и наклон могут варьироваться от человека к человеку (то есть определяться как случайные коэффициенты).

Многоуровневое моделирование с повторяющимися измерениями использует те же статистические методы, что и MLM с кластеризованными данными. В многоуровневом моделировании данных с повторными измерениями случаи измерения вложены в наблюдения (например, индивидуальные или субъектные). Таким образом, 1-й уровень единицы состоят из повторных измерений для каждого предмета, а уровень 2 unit - это человек или субъект. В дополнение к оценке общих параметров, MLM позволяет использовать уравнения регрессии на уровне отдельного человека. Таким образом, в качестве метода моделирования кривой роста он позволяет оценивать межиндивидуальные различия во внутриличностных изменениях с течением времени путем моделирования дисперсий и ковариаций.[2] Другими словами, он позволяет тестировать индивидуальные различия в образцах ответов во времени (т. Е. Кривые роста). Эта характеристика многоуровневого моделирования делает его предпочтительным перед другими статистическими методами с повторными измерениями, такими как дисперсионный анализ с повторными измерениями (RM-ANOVA ) по определенным вопросам исследования.

Предположения

В предположения MLM, которые справедливы для кластеризованных данных, также применимы к повторяющимся мерам:

(1) Предполагается, что случайные компоненты имеют нормальное распределение со средним нулевым
(2) Предполагается, что зависимая переменная имеет нормальное распределение. Тем не мение, двоичные и дискретные зависимые переменные могут быть исследованы в MLM с использованием специализированных процедур (т.е. функции ссылок ).[3]

Одно из допущений использования MLM для моделирования кривой роста заключается в том, что все субъекты демонстрируют одинаковые отношения во времени (например, линейные, квадратичные и т. Д.). Другое предположение MLM для моделирования кривой роста состоит в том, что наблюдаемые изменения связаны с течением времени.[4]

Статистика и интерпретация

Математически многоуровневый анализ с повторными измерениями очень похож на анализ данных, в котором субъекты сгруппированы в группы. Однако следует отметить один момент: предикторы, связанные со временем, должны быть явно введены в модель, чтобы оценить анализ тенденций и получить общий тест повторяемого измерения. Кроме того, интерпретация этих анализов зависит от масштаба временной переменной (то есть от того, как она закодирована).

  • Фиксированные эффекты: Фиксированные коэффициенты регрессии могут быть получены для общего уравнения, которое представляет, как субъекты меняются с течением времени, усредняя по субъектам.
  • Случайные эффекты: Случайные эффекты - это компоненты дисперсии, возникающие в результате измерения отношения предикторов к Y для каждого предмета отдельно. Эти компоненты дисперсии включают: (1) различия в интерпретациях этих уравнений на уровне субъекта; (2) различия между испытуемыми в наклонах этих уравнений; и (3) ковариация между наклонами субъектов и пересечениями по всем субъектам. Когда указаны случайные коэффициенты, каждый субъект имеет собственное уравнение регрессии, что позволяет оценить, различаются ли субъекты по своим средствам и / или образцам реакции с течением времени.
  • Процедуры оценки и модели сравнения: Эти процедуры идентичны процедурам, используемым в многоуровневом анализе, когда испытуемые объединяются в группы.

Расширения

  • Моделирование нелинейных тенденций (полиномиальные модели):
  • Нелинейные тренды (квадратичные, кубические и т. Д.) Можно оценивать в MLM, добавляя к модели продукты времени (TimeXTime, TimeXTimeXTime и т. Д.) Как случайные или фиксированные эффекты.
  • Добавление предикторов в модель: Возможно, что некоторая случайная дисперсия (т.е. дисперсия, связанная с индивидуальными различиями) может быть связана с фиксированными предикторами, отличными от времени. В отличие от RM-ANOVA, многоуровневый анализ позволяет использовать непрерывные предикторы (а не только категориальные), и эти предикторы могут или не могут учитывать индивидуальные различия в перехватах, а также различия в наклонах. Кроме того, многоуровневое моделирование также допускает изменяющиеся во времени ковариаты.
  • Альтернативные спецификации:
  • Структура ковариации: Многоуровневое программное обеспечение предоставляет несколько различных структур ковариации или ошибок на выбор для анализа многоуровневых данных (например, авторегрессия). При необходимости они могут применяться к модели роста.
  • Зависимая переменная: Дихотомические зависимые переменные могут быть проанализированы с помощью многоуровневого анализа с использованием более специализированного анализа (например, с использованием логита или пробита). функции ссылок ).

Многоуровневое моделирование по сравнению с другими статистическими методами для повторяющихся измерений

Многоуровневое моделирование в сравнении с RM-ANOVA

Повторные измерения дисперсионного анализа (RM-ANOVA ) традиционно использовался для анализа повторные меры конструкции. Однако нарушение предположений RM-ANOVA может быть проблематичным. Многоуровневое моделирование (MLM) обычно используется для планов с повторными измерениями, потому что оно представляет собой альтернативный подход к анализу этого типа данных с тремя основными преимуществами по сравнению с RM-ANOVA:[5]

1. MLM имеет менее строгие допущения: MLM может использоваться, если допущения о постоянных дисперсиях (однородность дисперсии или гомоскедастичность ), постоянные ковариации (сложная симметрия) или постоянные дисперсии оценок различий (сферичность ) нарушаются для RM-ANOVA. MLM позволяет моделировать ковариационную матрицу на основе данных; таким образом, в отличие от RM-ANOVA, эти предположения не нужны.[6]
2. MLM допускает иерархическую структуру: MLM может использоваться для процедур выборки более высокого порядка, тогда как RM-ANOVA ограничивается исследованием двухуровневых процедур выборки. Другими словами, MLM может рассматривать повторяющиеся измерения внутри субъектов, в рамках третьего уровня анализа и т. Д., Тогда как RM-ANOVA ограничивается повторными измерениями внутри субъектов.
3. MLM может обрабатывать отсутствующие данные: Отсутствие данных разрешено в MLM без дополнительных осложнений. При использовании RM-ANOVA данные субъекта должны быть исключены, если в них отсутствует одна точка данных. Отсутствующие данные и попытки исправить недостающие данные (т. Е. Использование среднего значения субъекта для отсутствия недостающих данных) могут вызвать дополнительные проблемы в RM-ANOVA.
4. MLM также может обрабатывать данные, в которых есть различия в точном времени сбора данных. (т.е. переменная синхронизация по сравнению с фиксированной). Например, данные для продольного исследования могут пытаться собрать измерения в возрасте 6 месяцев, 9 месяцев, 12 месяцев и 15 месяцев. Тем не менее, доступность участников, государственные праздники и другие проблемы с расписанием могут повлиять на время сбора данных. Эта вариация может быть устранена в MLM путем добавления «возраста» в уравнение регрессии. Также нет необходимости в равных интервалах между точками измерения в MLM.
5. MLM относительно легко распространить на дискретные данные. [7]
Примечание: Несмотря на то что отсутствующие данные разрешено в MLM, предполагается, что он отсутствует случайно. Таким образом, систематически отсутствующие данные могут создавать проблемы.[5][8][9]

Многоуровневое моделирование в сравнении с моделированием структурным уравнением (SEM; модель скрытого роста)

Альтернативный метод анализа кривой роста: моделирование скрытой кривой роста с помощью структурное моделирование уравнение (SEM). Этот подход обеспечит те же оценки, что и подход многоуровневого моделирования, при условии, что модель идентично указана в SEM. Однако есть обстоятельства, при которых предпочтительнее использовать MLM или SEM:[4][6]

Подход к многоуровневому моделированию:
  • Для проектов с большим количеством неравных интервалов между точками времени (SEM не может управлять данными с большим разбросом точек времени)
  • Когда есть много точек данных на тему
  • Когда модель роста вложена в дополнительные уровни анализа (т. Е. Иерархическая структура)
  • В программах многоуровневого моделирования есть дополнительные возможности для обработки непостоянных зависимых переменных (функции ссылок ) и позволяя различные структуры ошибок
Подход к моделированию структурным уравнением:
  • Лучше подходит для расширенных моделей, в которых модель встроена в более крупную модель пути или пересечение и наклон используются в качестве предикторов для других переменных. Таким образом, SEM обеспечивает большую гибкость.

Различие между многоуровневым моделированием и анализом скрытой кривой роста стало менее определенным. Некоторые статистические программы включают многоуровневые функции в свое программное обеспечение для моделирования структурных уравнений, а некоторые программы для многоуровневого моделирования начинают добавлять функции скрытых кривых роста.

Структура данных

Многоуровневое моделирование с данными повторных измерений является сложным в вычислительном отношении. Компьютерное программное обеспечение, способное выполнять такой анализ, может потребовать, чтобы данные были представлены в «полной форме», а не в «широкой форме» до анализа. В развернутой форме данные каждого субъекта представлены в нескольких строках - по одной для каждой «временной» точки (наблюдение зависимой переменной). Это противоположно широкой форме, в которой есть одна строка для каждого предмета, а повторяющиеся меры представлены в отдельных столбцах. Также обратите внимание, что в полной форме переменные, не зависящие от времени, повторяются в строках для каждого предмета. См. Ниже пример данных широкой формы, преобразованных в длинную:

Широкая форма:

ПредметГруппаВремя0Время1Время2
111284
211176
32151210
4211109

Полная форма:

ПредметГруппаВремяDepVar
11012
1118
1124
............
42011
42110
4229

Смотрите также

дальнейшее чтение

  • Хо, Мунсон; Faith, Myles S .; Мотт, Джон В .; Горман, Бернард С .; Редден, Дэвид Т .; Эллисон, Дэвид Б. (2003). «Иерархические линейные модели для построения кривых роста: пример с индексом массы тела у взрослых с избыточным весом / ожирением». Статистика в медицине. 22 (11): 1911–1942. Дои:10.1002 / sim.1218. PMID  12754724.
  • Певец, Дж. Д. (1998). «Использование SAS PROC MIXED для соответствия многоуровневым моделям, иерархическим моделям и индивидуальным моделям роста». Журнал образовательной и поведенческой статистики. 23 (4): 323–355. Дои:10.3102/10769986023004323.
  • Уиллетт, Джудит Д. Сингер, Джон Б. (2003). Прикладной лонгитюдный анализ данных: моделирование изменений и возникновения событий. Оксфорд: Издательство Оксфордского университета. ISBN  978-0195152968. Концентрируется на SAS и более простых моделях роста.
  • Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN  978-0761958901.
  • Хедекер, Дональд (2006). Продольный анализ данных. Хобокен, штат Нью-Джерси: Wiley-Interscience. ISBN  978-0471420279. Охватывает множество моделей и показывает преимущества MLM перед другими подходами.
  • Вербеке, Герт (2013). Линейные смешанные модели для продольных данных. С.Л .: Springer-Verlag New York. ISBN  978-1475773842. Имеет обширный код SAS.
  • Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN  978-0387251448. Охватывает нелинейные модели. Имеет код SAS.
  • Пинейро, Хосе; Бейтс, Дуглас М. (2000). Модели со смешанными эффектами в S и S-PLUS. Нью-Йорк, штат Нью-Йорк u.a: Springer. ISBN  978-1441903174. Использует S и S-plus, но также будет полезен для пользователей R.

Примечания

  1. ^ Хоффман, Лиза; Ровин, Майкл Дж. (2007). «Многоуровневые модели для экспериментального психолога: основы и наглядные примеры». Методы исследования поведения. 39 (1): 101–117. Дои:10.3758 / BF03192848. PMID  17552476.
  2. ^ Курран, Патрик Дж .; Обейдат, Хаула; Лосардо, Дайан (2010). «Двенадцать часто задаваемых вопросов о моделировании кривой роста». Журнал познания и развития. 11 (2): 121–136. Дои:10.1080/15248371003699969. ЧВК  3131138. PMID  21743795.
  3. ^ Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN  978-0761958901.
  4. ^ а б Hox, Joop (2005). Многоуровневый и SEM-подход к моделированию кривой роста (PDF) ([Repr.]. Ed.). Чичестер: Вайли. ISBN  978-0-470-86080-9.
  5. ^ а б Кене, Хьюго; ван ден Берг, Хуб (2004). «По многоуровневому моделированию данных из планов повторных измерений: учебное пособие». Речевое общение. 43 (1–2): 103–121. CiteSeerX  10.1.1.2.8982. Дои:10.1016 / j.specom.2004.02.004.
  6. ^ а б Коэн, Джейкоб; Коэн, Патрисия; Запад, Стивен Дж .; Айкен, Леона С. (2003-10-03). Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [u.a.]: Эрлбаум. ISBN  9780805822236.
  7. ^ Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN  978-0387251448.
  8. ^ В целом, John E .; Тонидандель, Скотт (2007). «Анализ данных из плана контролируемых повторных измерений с отсевами, зависящими от исходного уровня». Методология: Европейский журнал методов исследования поведенческих и социальных наук. 3 (2): 58–66. Дои:10.1027/1614-2241.3.2.58.
  9. ^ В целом, Джон; Ан, Чул; Shivakumar, C .; Kalburgi, Яллапа (1999). «Проблемные формулировки моделей SAS PROC.MIXED для повторных измерений». Журнал биофармацевтической статистики. 9 (1): 189–216. Дои:10.1081 / BIP-100101008. PMID  10091918.

Рекомендации