Многоуровневое моделирование повторных измерений - Multilevel modeling for repeated measures
Одно приложение многоуровневое моделирование (MLM) - это анализ данных повторных измерений. Многоуровневое моделирование повторных измерений данные чаще всего обсуждаются в контексте моделирования изменений во времени (т. е. моделирования кривой роста для продольных планов); однако его также можно использовать для данных повторных измерений, для которых время не имеет значения.[1]
В многоуровневом моделировании общая функция изменения (например, линейная, квадратичная, кубическая и т. Д.) Подбирается ко всей выборке, и, как и в многоуровневом моделировании для кластерных данных, склон и перехватить может быть разрешено варьироваться. Например, в исследовании, посвященном росту доходов с возрастом, можно предположить, что люди демонстрируют линейное улучшение с течением времени. Тем не менее, точное пересечение и наклон могут варьироваться от человека к человеку (то есть определяться как случайные коэффициенты).
Многоуровневое моделирование с повторяющимися измерениями использует те же статистические методы, что и MLM с кластеризованными данными. В многоуровневом моделировании данных с повторными измерениями случаи измерения вложены в наблюдения (например, индивидуальные или субъектные). Таким образом, 1-й уровень единицы состоят из повторных измерений для каждого предмета, а уровень 2 unit - это человек или субъект. В дополнение к оценке общих параметров, MLM позволяет использовать уравнения регрессии на уровне отдельного человека. Таким образом, в качестве метода моделирования кривой роста он позволяет оценивать межиндивидуальные различия во внутриличностных изменениях с течением времени путем моделирования дисперсий и ковариаций.[2] Другими словами, он позволяет тестировать индивидуальные различия в образцах ответов во времени (т. Е. Кривые роста). Эта характеристика многоуровневого моделирования делает его предпочтительным перед другими статистическими методами с повторными измерениями, такими как дисперсионный анализ с повторными измерениями (RM-ANOVA ) по определенным вопросам исследования.
Предположения
В предположения MLM, которые справедливы для кластеризованных данных, также применимы к повторяющимся мерам:
- (1) Предполагается, что случайные компоненты имеют нормальное распределение со средним нулевым
- (2) Предполагается, что зависимая переменная имеет нормальное распределение. Тем не мение, двоичные и дискретные зависимые переменные могут быть исследованы в MLM с использованием специализированных процедур (т.е. функции ссылок ).[3]
Одно из допущений использования MLM для моделирования кривой роста заключается в том, что все субъекты демонстрируют одинаковые отношения во времени (например, линейные, квадратичные и т. Д.). Другое предположение MLM для моделирования кривой роста состоит в том, что наблюдаемые изменения связаны с течением времени.[4]
Статистика и интерпретация
Математически многоуровневый анализ с повторными измерениями очень похож на анализ данных, в котором субъекты сгруппированы в группы. Однако следует отметить один момент: предикторы, связанные со временем, должны быть явно введены в модель, чтобы оценить анализ тенденций и получить общий тест повторяемого измерения. Кроме того, интерпретация этих анализов зависит от масштаба временной переменной (то есть от того, как она закодирована).
- Фиксированные эффекты: Фиксированные коэффициенты регрессии могут быть получены для общего уравнения, которое представляет, как субъекты меняются с течением времени, усредняя по субъектам.
- Случайные эффекты: Случайные эффекты - это компоненты дисперсии, возникающие в результате измерения отношения предикторов к Y для каждого предмета отдельно. Эти компоненты дисперсии включают: (1) различия в интерпретациях этих уравнений на уровне субъекта; (2) различия между испытуемыми в наклонах этих уравнений; и (3) ковариация между наклонами субъектов и пересечениями по всем субъектам. Когда указаны случайные коэффициенты, каждый субъект имеет собственное уравнение регрессии, что позволяет оценить, различаются ли субъекты по своим средствам и / или образцам реакции с течением времени.
- Процедуры оценки и модели сравнения: Эти процедуры идентичны процедурам, используемым в многоуровневом анализе, когда испытуемые объединяются в группы.
Расширения
- Моделирование нелинейных тенденций (полиномиальные модели):
- Нелинейные тренды (квадратичные, кубические и т. Д.) Можно оценивать в MLM, добавляя к модели продукты времени (TimeXTime, TimeXTimeXTime и т. Д.) Как случайные или фиксированные эффекты.
- Добавление предикторов в модель: Возможно, что некоторая случайная дисперсия (т.е. дисперсия, связанная с индивидуальными различиями) может быть связана с фиксированными предикторами, отличными от времени. В отличие от RM-ANOVA, многоуровневый анализ позволяет использовать непрерывные предикторы (а не только категориальные), и эти предикторы могут или не могут учитывать индивидуальные различия в перехватах, а также различия в наклонах. Кроме того, многоуровневое моделирование также допускает изменяющиеся во времени ковариаты.
- Альтернативные спецификации:
- Структура ковариации: Многоуровневое программное обеспечение предоставляет несколько различных структур ковариации или ошибок на выбор для анализа многоуровневых данных (например, авторегрессия). При необходимости они могут применяться к модели роста.
- Зависимая переменная: Дихотомические зависимые переменные могут быть проанализированы с помощью многоуровневого анализа с использованием более специализированного анализа (например, с использованием логита или пробита). функции ссылок ).
Многоуровневое моделирование по сравнению с другими статистическими методами для повторяющихся измерений
Многоуровневое моделирование в сравнении с RM-ANOVA
Повторные измерения дисперсионного анализа (RM-ANOVA ) традиционно использовался для анализа повторные меры конструкции. Однако нарушение предположений RM-ANOVA может быть проблематичным. Многоуровневое моделирование (MLM) обычно используется для планов с повторными измерениями, потому что оно представляет собой альтернативный подход к анализу этого типа данных с тремя основными преимуществами по сравнению с RM-ANOVA:[5]
- 1. MLM имеет менее строгие допущения: MLM может использоваться, если допущения о постоянных дисперсиях (однородность дисперсии или гомоскедастичность ), постоянные ковариации (сложная симметрия) или постоянные дисперсии оценок различий (сферичность ) нарушаются для RM-ANOVA. MLM позволяет моделировать ковариационную матрицу на основе данных; таким образом, в отличие от RM-ANOVA, эти предположения не нужны.[6]
- 2. MLM допускает иерархическую структуру: MLM может использоваться для процедур выборки более высокого порядка, тогда как RM-ANOVA ограничивается исследованием двухуровневых процедур выборки. Другими словами, MLM может рассматривать повторяющиеся измерения внутри субъектов, в рамках третьего уровня анализа и т. Д., Тогда как RM-ANOVA ограничивается повторными измерениями внутри субъектов.
- 3. MLM может обрабатывать отсутствующие данные: Отсутствие данных разрешено в MLM без дополнительных осложнений. При использовании RM-ANOVA данные субъекта должны быть исключены, если в них отсутствует одна точка данных. Отсутствующие данные и попытки исправить недостающие данные (т. Е. Использование среднего значения субъекта для отсутствия недостающих данных) могут вызвать дополнительные проблемы в RM-ANOVA.
- 4. MLM также может обрабатывать данные, в которых есть различия в точном времени сбора данных. (т.е. переменная синхронизация по сравнению с фиксированной). Например, данные для продольного исследования могут пытаться собрать измерения в возрасте 6 месяцев, 9 месяцев, 12 месяцев и 15 месяцев. Тем не менее, доступность участников, государственные праздники и другие проблемы с расписанием могут повлиять на время сбора данных. Эта вариация может быть устранена в MLM путем добавления «возраста» в уравнение регрессии. Также нет необходимости в равных интервалах между точками измерения в MLM.
- 5. MLM относительно легко распространить на дискретные данные. [7]
- Примечание: Несмотря на то что отсутствующие данные разрешено в MLM, предполагается, что он отсутствует случайно. Таким образом, систематически отсутствующие данные могут создавать проблемы.[5][8][9]
Многоуровневое моделирование в сравнении с моделированием структурным уравнением (SEM; модель скрытого роста)
Альтернативный метод анализа кривой роста: моделирование скрытой кривой роста с помощью структурное моделирование уравнение (SEM). Этот подход обеспечит те же оценки, что и подход многоуровневого моделирования, при условии, что модель идентично указана в SEM. Однако есть обстоятельства, при которых предпочтительнее использовать MLM или SEM:[4][6]
- Подход к многоуровневому моделированию:
- Для проектов с большим количеством неравных интервалов между точками времени (SEM не может управлять данными с большим разбросом точек времени)
- Когда есть много точек данных на тему
- Когда модель роста вложена в дополнительные уровни анализа (т. Е. Иерархическая структура)
- В программах многоуровневого моделирования есть дополнительные возможности для обработки непостоянных зависимых переменных (функции ссылок ) и позволяя различные структуры ошибок
- Подход к моделированию структурным уравнением:
- Лучше подходит для расширенных моделей, в которых модель встроена в более крупную модель пути или пересечение и наклон используются в качестве предикторов для других переменных. Таким образом, SEM обеспечивает большую гибкость.
Различие между многоуровневым моделированием и анализом скрытой кривой роста стало менее определенным. Некоторые статистические программы включают многоуровневые функции в свое программное обеспечение для моделирования структурных уравнений, а некоторые программы для многоуровневого моделирования начинают добавлять функции скрытых кривых роста.
Структура данных
Многоуровневое моделирование с данными повторных измерений является сложным в вычислительном отношении. Компьютерное программное обеспечение, способное выполнять такой анализ, может потребовать, чтобы данные были представлены в «полной форме», а не в «широкой форме» до анализа. В развернутой форме данные каждого субъекта представлены в нескольких строках - по одной для каждой «временной» точки (наблюдение зависимой переменной). Это противоположно широкой форме, в которой есть одна строка для каждого предмета, а повторяющиеся меры представлены в отдельных столбцах. Также обратите внимание, что в полной форме переменные, не зависящие от времени, повторяются в строках для каждого предмета. См. Ниже пример данных широкой формы, преобразованных в длинную:
Широкая форма:
Предмет | Группа | Время0 | Время1 | Время2 |
---|---|---|---|---|
1 | 1 | 12 | 8 | 4 |
2 | 1 | 11 | 7 | 6 |
3 | 2 | 15 | 12 | 10 |
4 | 2 | 11 | 10 | 9 |
Полная форма:
Предмет | Группа | Время | DepVar |
---|---|---|---|
1 | 1 | 0 | 12 |
1 | 1 | 1 | 8 |
1 | 1 | 2 | 4 |
... | ... | ... | ... |
4 | 2 | 0 | 11 |
4 | 2 | 1 | 10 |
4 | 2 | 2 | 9 |
Смотрите также
- Многоуровневая модель
- Дизайн повторных мероприятий
- Кривая роста
- Структурное моделирование уравнение
- Длительное обучение
дальнейшее чтение
- Хо, Мунсон; Faith, Myles S .; Мотт, Джон В .; Горман, Бернард С .; Редден, Дэвид Т .; Эллисон, Дэвид Б. (2003). «Иерархические линейные модели для построения кривых роста: пример с индексом массы тела у взрослых с избыточным весом / ожирением». Статистика в медицине. 22 (11): 1911–1942. Дои:10.1002 / sim.1218. PMID 12754724.
- Певец, Дж. Д. (1998). «Использование SAS PROC MIXED для соответствия многоуровневым моделям, иерархическим моделям и индивидуальным моделям роста». Журнал образовательной и поведенческой статистики. 23 (4): 323–355. Дои:10.3102/10769986023004323.
- Уиллетт, Джудит Д. Сингер, Джон Б. (2003). Прикладной лонгитюдный анализ данных: моделирование изменений и возникновения событий. Оксфорд: Издательство Оксфордского университета. ISBN 978-0195152968. Концентрируется на SAS и более простых моделях роста.
- Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN 978-0761958901.
- Хедекер, Дональд (2006). Продольный анализ данных. Хобокен, штат Нью-Джерси: Wiley-Interscience. ISBN 978-0471420279. Охватывает множество моделей и показывает преимущества MLM перед другими подходами.
- Вербеке, Герт (2013). Линейные смешанные модели для продольных данных. С.Л .: Springer-Verlag New York. ISBN 978-1475773842. Имеет обширный код SAS.
- Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN 978-0387251448. Охватывает нелинейные модели. Имеет код SAS.
- Пинейро, Хосе; Бейтс, Дуглас М. (2000). Модели со смешанными эффектами в S и S-PLUS. Нью-Йорк, штат Нью-Йорк u.a: Springer. ISBN 978-1441903174. Использует S и S-plus, но также будет полезен для пользователей R.
Примечания
- ^ Хоффман, Лиза; Ровин, Майкл Дж. (2007). «Многоуровневые модели для экспериментального психолога: основы и наглядные примеры». Методы исследования поведения. 39 (1): 101–117. Дои:10.3758 / BF03192848. PMID 17552476.
- ^ Курран, Патрик Дж .; Обейдат, Хаула; Лосардо, Дайан (2010). «Двенадцать часто задаваемых вопросов о моделировании кривой роста». Журнал познания и развития. 11 (2): 121–136. Дои:10.1080/15248371003699969. ЧВК 3131138. PMID 21743795.
- ^ Снайдерс, Том А.Б .; Боскер, Роэл Дж. (2002). Многоуровневый анализ: введение в базовое и расширенное многоуровневое моделирование (Перепечатка. Ред.). Лондон: Sage Publications. ISBN 978-0761958901.
- ^ а б Hox, Joop (2005). Многоуровневый и SEM-подход к моделированию кривой роста (PDF) ([Repr.]. Ed.). Чичестер: Вайли. ISBN 978-0-470-86080-9.
- ^ а б Кене, Хьюго; ван ден Берг, Хуб (2004). «По многоуровневому моделированию данных из планов повторных измерений: учебное пособие». Речевое общение. 43 (1–2): 103–121. CiteSeerX 10.1.1.2.8982. Дои:10.1016 / j.specom.2004.02.004.
- ^ а б Коэн, Джейкоб; Коэн, Патрисия; Запад, Стивен Дж .; Айкен, Леона С. (2003-10-03). Прикладной множественный регрессионный / корреляционный анализ для поведенческих наук (3-е изд.). Махва, Нью-Джерси [u.a.]: Эрлбаум. ISBN 9780805822236.
- ^ Моленбергс, Герт (2005). Модели для дискретных продольных данных. Нью-Йорк: Springer Science + Business Media, Inc. ISBN 978-0387251448.
- ^ В целом, John E .; Тонидандель, Скотт (2007). «Анализ данных из плана контролируемых повторных измерений с отсевами, зависящими от исходного уровня». Методология: Европейский журнал методов исследования поведенческих и социальных наук. 3 (2): 58–66. Дои:10.1027/1614-2241.3.2.58.
- ^ В целом, Джон; Ан, Чул; Shivakumar, C .; Kalburgi, Яллапа (1999). «Проблемные формулировки моделей SAS PROC.MIXED для повторных измерений». Журнал биофармацевтической статистики. 9 (1): 189–216. Дои:10.1081 / BIP-100101008. PMID 10091918.
Рекомендации
- Коэн, Джейкоб; Коэн, Патрисия; Запад, Стивен Дж .; Айкен, Леона С. (2002). Прикладная множественная регрессия / корреляционный анализ для поведенческих наук (3-е изд.). Routledge Academic. ISBN 9780805822236.
- Курран, Патрик Дж .; Обейдат, Хаула; Лосардо, Дайан (2010). «Двенадцать часто задаваемых вопросов о моделировании кривой роста». Журнал познания и развития. 11 (2): 121–136. Дои:10.1080/15248371003699969. ЧВК 3131138. PMID 21743795.
- Fidell, Barbara G .; Табачник, Линда С. (2007). Использование многомерной статистики (5-е изд.). Бостон; Монреаль: Пирсон / A&B. ISBN 978-0205459384.
- Хоффман, Лиза; Ровин, Майкл Дж. (2007). «Многоуровневые модели для экспериментального психолога: основы и наглядные примеры». Методы исследования поведения. 39 (1): 101–117. Дои:10.3758 / BF03192848. PMID 17552476.
- Хауэлл, Дэвид С. (2010). Статистические методы психологии (7-е изд.). Бельмонт, Калифорния: Томсон Уодсворт. ISBN 978-0-495-59784-1.
- Hox, Joop (2005). Многоуровневый и SEM-подход к моделированию кривой роста (PDF) ([Repr.]. Ed.). Чичестер: Вайли. ISBN 978-0-470-86080-9.
- В целом, John E .; Тонидандель, Скотт (2007). «Анализ данных из плана контролируемых повторных измерений с отсевами, зависящими от исходного уровня». Методология: Европейский журнал методов исследования поведенческих и социальных наук. 3 (2): 58–66. Дои:10.1027/1614-2241.3.2.58.
- В целом, Джон; Ан, Чул; Shivakumar, C .; Kalburgi, Яллапа (2007). «Проблемные формулировки смешанных моделей Sas Proc. Для повторных измерений». Журнал биофармацевтической статистики. 9 (1): 189–216. Дои:10.1081 / BIP-100101008. PMID 10091918.
- Кене, Хьюго; ван ден Берг, Хуб (2004). «По многоуровневому моделированию данных из планов повторных измерений: учебное пособие». Речевое общение. 43 (1–2): 103–121. CiteSeerX 10.1.1.2.8982. Дои:10.1016 / j.specom.2004.02.004.