Многоуровневое моделирование повторных измерений - Multilevel modeling for repeated measures

Одно приложение многоуровневое моделирование (MLM) - это анализ данных повторных измерений. Многоуровневое моделирование повторных измерений данные чаще всего обсуждаются в контексте моделирования изменений во времени (т. е. моделирования кривой роста для продольных планов); однако его также можно использовать для данных повторных измерений, для которых время не имеет значения.^[1]

В многоуровневом моделировании общая функция изменения (например, линейная, квадратичная, кубическая и т. Д.) Подбирается ко всей выборке, и, как и в многоуровневом моделировании для кластерных данных, склон и перехватить может быть разрешено варьироваться. Например, в исследовании, посвященном росту доходов с возрастом, можно предположить, что люди демонстрируют линейное улучшение с течением времени. Тем не менее, точное пересечение и наклон могут варьироваться от человека к человеку (то есть определяться как случайные коэффициенты).

Многоуровневое моделирование с повторяющимися измерениями использует те же статистические методы, что и MLM с кластеризованными данными. В многоуровневом моделировании данных с повторными измерениями случаи измерения вложены в наблюдения (например, индивидуальные или субъектные). Таким образом, 1-й уровень единицы состоят из повторных измерений для каждого предмета, а уровень 2 unit - это человек или субъект. В дополнение к оценке общих параметров, MLM позволяет использовать уравнения регрессии на уровне отдельного человека. Таким образом, в качестве метода моделирования кривой роста он позволяет оценивать межиндивидуальные различия во внутриличностных изменениях с течением времени путем моделирования дисперсий и ковариаций.^[2] Другими словами, он позволяет тестировать индивидуальные различия в образцах ответов во времени (т. Е. Кривые роста). Эта характеристика многоуровневого моделирования делает его предпочтительным перед другими статистическими методами с повторными измерениями, такими как дисперсионный анализ с повторными измерениями (RM-ANOVA ) по определенным вопросам исследования.

Предположения

В предположения MLM, которые справедливы для кластеризованных данных, также применимы к повторяющимся мерам:

(1) Предполагается, что случайные компоненты имеют нормальное распределение со средним нулевым

(2) Предполагается, что зависимая переменная имеет нормальное распределение. Тем не мение, двоичные и дискретные зависимые переменные могут быть исследованы в MLM с использованием специализированных процедур (т.е. функции ссылок ).^[3]

Одно из допущений использования MLM для моделирования кривой роста заключается в том, что все субъекты демонстрируют одинаковые отношения во времени (например, линейные, квадратичные и т. Д.). Другое предположение MLM для моделирования кривой роста состоит в том, что наблюдаемые изменения связаны с течением времени.^[4]

Статистика и интерпретация

Математически многоуровневый анализ с повторными измерениями очень похож на анализ данных, в котором субъекты сгруппированы в группы. Однако следует отметить один момент: предикторы, связанные со временем, должны быть явно введены в модель, чтобы оценить анализ тенденций и получить общий тест повторяемого измерения. Кроме того, интерпретация этих анализов зависит от масштаба временной переменной (то есть от того, как она закодирована).

Фиксированные эффекты: Фиксированные коэффициенты регрессии могут быть получены для общего уравнения, которое представляет, как субъекты меняются с течением времени, усредняя по субъектам.
Случайные эффекты: Случайные эффекты - это компоненты дисперсии, возникающие в результате измерения отношения предикторов к Y для каждого предмета отдельно. Эти компоненты дисперсии включают: (1) различия в интерпретациях этих уравнений на уровне субъекта; (2) различия между испытуемыми в наклонах этих уравнений; и (3) ковариация между наклонами субъектов и пересечениями по всем субъектам. Когда указаны случайные коэффициенты, каждый субъект имеет собственное уравнение регрессии, что позволяет оценить, различаются ли субъекты по своим средствам и / или образцам реакции с течением времени.
Процедуры оценки и модели сравнения: Эти процедуры идентичны процедурам, используемым в многоуровневом анализе, когда испытуемые объединяются в группы.

Расширения

Моделирование нелинейных тенденций (полиномиальные модели):

Нелинейные тренды (квадратичные, кубические и т. Д.) Можно оценивать в MLM, добавляя к модели продукты времени (TimeXTime, TimeXTimeXTime и т. Д.) Как случайные или фиксированные эффекты.

Добавление предикторов в модель: Возможно, что некоторая случайная дисперсия (т.е. дисперсия, связанная с индивидуальными различиями) может быть связана с фиксированными предикторами, отличными от времени. В отличие от RM-ANOVA, многоуровневый анализ позволяет использовать непрерывные предикторы (а не только категориальные), и эти предикторы могут или не могут учитывать индивидуальные различия в перехватах, а также различия в наклонах. Кроме того, многоуровневое моделирование также допускает изменяющиеся во времени ковариаты.
Альтернативные спецификации:

Структура ковариации: Многоуровневое программное обеспечение предоставляет несколько различных структур ковариации или ошибок на выбор для анализа многоуровневых данных (например, авторегрессия). При необходимости они могут применяться к модели роста.

Зависимая переменная: Дихотомические зависимые переменные могут быть проанализированы с помощью многоуровневого анализа с использованием более специализированного анализа (например, с использованием логита или пробита). функции ссылок ).

Многоуровневое моделирование по сравнению с другими статистическими методами для повторяющихся измерений

Многоуровневое моделирование в сравнении с RM-ANOVA

Повторные измерения дисперсионного анализа (RM-ANOVA ) традиционно использовался для анализа повторные меры конструкции. Однако нарушение предположений RM-ANOVA может быть проблематичным. Многоуровневое моделирование (MLM) обычно используется для планов с повторными измерениями, потому что оно представляет собой альтернативный подход к анализу этого типа данных с тремя основными преимуществами по сравнению с RM-ANOVA:^[5]

1. MLM имеет менее строгие допущения: MLM может использоваться, если допущения о постоянных дисперсиях (однородность дисперсии или гомоскедастичность ), постоянные ковариации (сложная симметрия) или постоянные дисперсии оценок различий (сферичность ) нарушаются для RM-ANOVA. MLM позволяет моделировать ковариационную матрицу на основе данных; таким образом, в отличие от RM-ANOVA, эти предположения не нужны.^[6]

2. MLM допускает иерархическую структуру: MLM может использоваться для процедур выборки более высокого порядка, тогда как RM-ANOVA ограничивается исследованием двухуровневых процедур выборки. Другими словами, MLM может рассматривать повторяющиеся измерения внутри субъектов, в рамках третьего уровня анализа и т. Д., Тогда как RM-ANOVA ограничивается повторными измерениями внутри субъектов.

3. MLM может обрабатывать отсутствующие данные: Отсутствие данных разрешено в MLM без дополнительных осложнений. При использовании RM-ANOVA данные субъекта должны быть исключены, если в них отсутствует одна точка данных. Отсутствующие данные и попытки исправить недостающие данные (т. Е. Использование среднего значения субъекта для отсутствия недостающих данных) могут вызвать дополнительные проблемы в RM-ANOVA.

4. MLM также может обрабатывать данные, в которых есть различия в точном времени сбора данных. (т.е. переменная синхронизация по сравнению с фиксированной). Например, данные для продольного исследования могут пытаться собрать измерения в возрасте 6 месяцев, 9 месяцев, 12 месяцев и 15 месяцев. Тем не менее, доступность участников, государственные праздники и другие проблемы с расписанием могут повлиять на время сбора данных. Эта вариация может быть устранена в MLM путем добавления «возраста» в уравнение регрессии. Также нет необходимости в равных интервалах между точками измерения в MLM.

5. MLM относительно легко распространить на дискретные данные. ^[7]

Примечание: Несмотря на то что отсутствующие данные разрешено в MLM, предполагается, что он отсутствует случайно. Таким образом, систематически отсутствующие данные могут создавать проблемы.^[5]^[8]^[9]

Многоуровневое моделирование в сравнении с моделированием структурным уравнением (SEM; модель скрытого роста)

Альтернативный метод анализа кривой роста: моделирование скрытой кривой роста с помощью структурное моделирование уравнение (SEM). Этот подход обеспечит те же оценки, что и подход многоуровневого моделирования, при условии, что модель идентично указана в SEM. Однако есть обстоятельства, при которых предпочтительнее использовать MLM или SEM:^[4]^[6]

Подход к многоуровневому моделированию:

Для проектов с большим количеством неравных интервалов между точками времени (SEM не может управлять данными с большим разбросом точек времени)
Когда есть много точек данных на тему
Когда модель роста вложена в дополнительные уровни анализа (т. Е. Иерархическая структура)
В программах многоуровневого моделирования есть дополнительные возможности для обработки непостоянных зависимых переменных (функции ссылок ) и позволяя различные структуры ошибок

Подход к моделированию структурным уравнением:

Лучше подходит для расширенных моделей, в которых модель встроена в более крупную модель пути или пересечение и наклон используются в качестве предикторов для других переменных. Таким образом, SEM обеспечивает большую гибкость.

Различие между многоуровневым моделированием и анализом скрытой кривой роста стало менее определенным. Некоторые статистические программы включают многоуровневые функции в свое программное обеспечение для моделирования структурных уравнений, а некоторые программы для многоуровневого моделирования начинают добавлять функции скрытых кривых роста.

Структура данных

Многоуровневое моделирование с данными повторных измерений является сложным в вычислительном отношении. Компьютерное программное обеспечение, способное выполнять такой анализ, может потребовать, чтобы данные были представлены в «полной форме», а не в «широкой форме» до анализа. В развернутой форме данные каждого субъекта представлены в нескольких строках - по одной для каждой «временной» точки (наблюдение зависимой переменной). Это противоположно широкой форме, в которой есть одна строка для каждого предмета, а повторяющиеся меры представлены в отдельных столбцах. Также обратите внимание, что в полной форме переменные, не зависящие от времени, повторяются в строках для каждого предмета. См. Ниже пример данных широкой формы, преобразованных в длинную:

Широкая форма:

Предмет	Группа	Время0	Время1	Время2
1	1	12	8	4
2	1	11	7	6
3	2	15	12	10
4	2	11	10	9

Полная форма:

Предмет	Группа	Время	DepVar
1	1	0	12
1	1	1	8
1	1	2	4
...	...	...	...
4	2	0	11
4	2	1	10
4	2	2	9

Смотрите также

дальнейшее чтение

Хо, Мунсон; Faith, Myles S .; Мотт, Джон В .; Горман, Бернард С .; Редден, Дэвид Т .; Эллисон, Дэвид Б. (2003). «Иерархические линейные модели для построения кривых роста: пример с индексом массы тела у взрослых с избыточным весом / ожирением». Статистика в медицине. 22 (11): 1911–1942. Дои:10.1002 / sim.1218. PMID 12754724.
Певец, Дж. Д. (1998). «Использование SAS PROC MIXED для соответствия многоуровневым моделям, иерархическим моделям и индивидуальным моделям роста». Журнал образовательной и поведенческой статистики. 23 (4): 323–355. Дои:10.3102/10769986023004323.
Уиллетт, Джудит Д. Сингер, Джон Б. (2003). Прикладной лонгитюдный анализ данных: моделирование изменений и возникновения событий. Оксфорд: Издательство Оксфордского университета. ISBN 978-0195152968. Концентрируется на SAS и более простых моделях роста.
Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN 978-0761958901.
Хедекер, Дональд (2006). Продольный анализ данных. Хобокен, штат Нью-Джерси: Wiley-Interscience. ISBN 978-0471420279. Охватывает множество моделей и показывает преимущества MLM перед другими подходами.
Вербеке, Герт (2013). Линейные смешанные модели для продольных данных. С.Л .: Springer-Verlag New York. ISBN 978-1475773842. Имеет обширный код SAS.
Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN 978-0387251448. Охватывает нелинейные модели. Имеет код SAS.
Пинейро, Хосе; Бейтс, Дуглас М. (2000). Модели со смешанными эффектами в S и S-PLUS. Нью-Йорк, штат Нью-Йорк u.a: Springer. ISBN 978-1441903174. Использует S и S-plus, но также будет полезен для пользователей R.

Примечания

^ Хоффман, Лиза; Ровин, Майкл Дж. (2007). «Многоуровневые модели для экспериментального психолога: основы и наглядные примеры». Методы исследования поведения. 39 (1): 101–117. Дои:10.3758 / BF03192848. PMID 17552476.
^ Курран, Патрик Дж .; Обейдат, Хаула; Лосардо, Дайан (2010). «Двенадцать часто задаваемых вопросов о моделировании кривой роста». Журнал познания и развития. 11 (2): 121–136. Дои:10.1080/15248371003699969. ЧВК 3131138. PMID 21743795.
^ Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN 978-0761958901.
^ ^а ^б Hox, Joop (2005). Многоуровневый и SEM-подход к моделированию кривой роста (PDF) ([Repr.]. Ed.). Чичестер: Вайли. ISBN 978-0-470-86080-9.
^ ^а ^б Кене, Хьюго; ван ден Берг, Хуб (2004). «По многоуровневому моделированию данных из планов повторных измерений: учебное пособие». Речевое общение. 43 (1–2): 103–121. CiteSeerX 10.1.1.2.8982. Дои:10.1016 / j.specom.2004.02.004.
^ ^а ^б Коэн, Джейкоб; Коэн, Патрисия; Запад, Стивен Дж .; Айкен, Леона С. (2003-10-03). Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [u.a.]: Эрлбаум. ISBN 9780805822236.
^ Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN 978-0387251448.
^ В целом, John E .; Тонидандель, Скотт (2007). «Анализ данных из плана контролируемых повторных измерений с отсевами, зависящими от исходного уровня». Методология: Европейский журнал методов исследования поведенческих и социальных наук. 3 (2): 58–66. Дои:10.1027/1614-2241.3.2.58.
^ В целом, Джон; Ан, Чул; Shivakumar, C .; Kalburgi, Яллапа (1999). «Проблемные формулировки моделей SAS PROC.MIXED для повторных измерений». Журнал биофармацевтической статистики. 9 (1): 189–216. Дои:10.1081 / BIP-100101008. PMID 10091918.