Строго стандартизированная разница средних значений - Strictly standardized mean difference
Похоже, что один из основных авторов этой статьи тесная связь со своим предметом.Июль 2011 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
В статистика, то строго стандартизированная разница средних значений (SSMD) это мера размер эффекта. Это значить разделенный на среднеквадратичное отклонение разницы между двумя случайными значениями, каждое из одной из двух групп. Изначально предлагалось для контроля качества[1]и выбор попаданий[2]в высокопроизводительный скрининг (HTS) и стал статистическим параметром, измеряющим величину эффекта для сравнения любых двух групп со случайными значениями.[3]
Задний план
В высокопроизводительный скрининг (HTS), контроль качества (QC) имеет решающее значение. Важная характеристика контроля качества в HTS проба сколько положительных контролей, тест соединения, и отрицательные контроли отличаются друг от друга. Эта характеристика контроля качества может быть оценена путем сравнения двух типов скважин в HTS. анализы. Отношение сигнал / шум (S / N), отношение сигнал / фон (S / B) и Z-фактор были приняты для оценки качества HTS анализы путем сравнения двух исследуемых типов скважин. Однако S / B не принимает во внимание информацию об изменчивости; и S / N может фиксировать изменчивость только в одной группе и, следовательно, не может оценивать качество проба когда две группы имеют разные вариативности.[1]Zhang JH et al. предложил Z-фактор.[4] Преимущество Z-фактор над S / N и S / B заключается в том, что он учитывает изменчивость в обеих сравниваемых группах. В результате Z-фактор широко используется в качестве показателя контроля качества в тестах HTS.[нужна цитата ] Абсолютный знак в Z-фактор делает неудобным математический вывод статистических выводов.
Чтобы получить лучший интерпретируемый параметр для измерения различий между двумя группами, Zhang XHD[1]предложил SSMD для оценки различий между положительным контролем и отрицательным контролем в анализах HTS. SSMD имеет вероятностную основу из-за его сильной связи с d+- вероятность (т.е. вероятность того, что разница между двумя группами положительна).[2] В какой-то степени d+-вероятность эквивалентна установленному вероятностному индексу P (Икс > Y), который изучается и применяется во многих областях.[5][6][7][8][9] Поддерживаемый на вероятностной основе, SSMD использовался как для контроля качества, так и для выбор попаданий в высокопроизводительном грохочении.[1][2][10][11][12][13][14][15][16][17][18][19][20][21]
Концепция
Статистический параметр
В качестве статистического параметра SSMD (обозначается как ) определяется как отношение значить к среднеквадратичное отклонение разницы двух случайных величин соответственно из двух групп. Предположим, что одна группа со случайными значениями имеет значить и отклонение а другая группа значить и отклонение . В ковариация между двумя группами Тогда SSMD для сравнения этих двух групп определяется как[1]
Если две группы независимы,
Если две независимые группы имеют равные отклонения ,
В ситуации, когда две группы коррелированы, обычно используется стратегия, позволяющая избежать расчета сначала получить парные наблюдения от двух групп, а затем оценить SSMD на основе парных наблюдений. На основе парной разницы с населением значить и , SSMD - это
Статистическая оценка
В ситуации, когда две группы независимы, Zhang XHD[1]получили оценку максимального правдоподобия (MLE) и оценку методом момента (MM) SSMD. Предположим, что группы 1 и 2 имеют образец значить , и образец отклонения . Тогда оценка ММ SSMD равна[1]
Когда две группы имеют нормальное распределение с равными отклонение, несмещенная оценка с равномерной минимальной дисперсией (UMVUE) SSMD равна,[10]
где - размеры выборки в двух группах и.[3]
В ситуации, когда две группы коррелированы на основе парных различий с размером выборки , образец значить и образец отклонение , ММ-оценка SSMD равна
Оценка SSMD UMVUE составляет[22]
SSMD похож на t-статистику и d Коэна, но они отличаются друг от друга, как показано на.[3]
Применение в высокопроизводительных скрининговых анализах
SSMD - это соотношение значить к среднеквадратичное отклонение различия между двумя группами. Когда данные предварительно обрабатываются с использованием преобразования журнала, как мы обычно делаем в экспериментах HTS, SSMD является значить изменения складки журнала, деленной на среднеквадратичное отклонение изменения кратности журнала относительно отрицательной ссылки. Другими словами, SSMD - это среднее кратное изменение (в логарифмической шкале), за которое накладывается непостоянство кратного изменения (в логарифмической шкале).[23]. Для контроля качества одним из показателей качества HTS-анализа является величина разницы между положительным контролем и отрицательным эталоном в тесте. проба тарелка. Для выбора попаданий размер эффектов соединение (т.е. малая молекула или миРНК ) представлена величиной разницы между соединение и отрицательная ссылка. SSMD напрямую измеряет величину разницы между двумя группами. Таким образом, SSMD можно использовать как для контроля качества, так и для отбора попаданий в экспериментах с HTS.
Контроль качества
Количество лунок для положительного и отрицательного контролей в планшете на 384-луночной или 1536-луночной платформе обычно рассчитывается достаточно большим.[24]Предположим, что положительный и отрицательный контроли в планшете содержат образец значить , образец отклонения , и размеры выборки . Обычно выполняется предположение, что элементы управления имеют одинаковую дисперсию в тарелке. В таком случае SSMD для оценки качества этой пластины оценивается как[10]
где Если предположение о равной дисперсии не выполняется, SSMD для оценки качества этой пластины оценивается как[1]
Если явно выбросы в элементах управления SSMD можно оценить как[23]
где являются медианы и средние абсолютные отклонения в положительном и отрицательном контроле соответственно.
В Z-фактор основанный на критерии QC широко используется в анализах HTS. Однако было продемонстрировано, что этот критерий контроля качества наиболее подходит для проба с очень или очень сильным положительным контролем.[10] В РНКи Анализ HTS, сильный или умеренный положительный контроль обычно более поучителен, чем очень или чрезвычайно сильный положительный контроль, потому что эффективность этого контроля больше похожа на интересующие результаты. Кроме того, положительные контроли в двух экспериментах с HTS теоретически имеют разные размеры эффектов. Следовательно, пороги QC для умеренного контроля должны отличаться от пороговых значений для сильного контроля в этих двух экспериментах. Кроме того, обычно в одном эксперименте принимают два или более положительных контроля.[11] Применяя то же самое Z-фактор Критерии контроля качества на основе обоих контролей приводят к противоречивым результатам, как показано в литературе.[10][11]
Критерии контроля качества на основе SSMD, перечисленные в следующей таблице.[20] принять во внимание размер эффекта положительного контроля в анализе HTS, где положительный контроль (такой как контроль ингибирования) теоретически имеет значения меньше, чем отрицательный эталон.
Тип качества | A: умеренный контроль | B: сильный контроль | C: очень сильный контроль | D: Чрезвычайно сильный контроль |
---|---|---|---|---|
Отлично | ||||
Хорошо | ||||
Низший | ||||
Бедный |
При применении, если величина эффекта положительного контроля известна биологически, примите соответствующий критерий на основе этой таблицы. В противном случае следующая стратегия должна помочь определить, какой критерий QC следует применять: (i) во многих анализах низкомолекулярных HTS с одним положительным контролем, обычно следует применять критерий D (а иногда и критерий C), потому что этот контроль обычно очень или чрезвычайно сильные эффекты; (ii) для тестов RNAi HTS, в которых жизнеспособность клеток является измеренным ответом, критерий D должен быть принят для контролей без клеток (а именно, лунок без добавленных клеток) или фоновых контролей; (iii) в вирусном проба в котором количество вирусов в клетках-хозяевах представляет интерес, обычно используется критерий C, а критерий D иногда используется для положительного контроля, состоящего из миРНК вируса.[20]
Подобные критерии контроля качества на основе SSMD могут быть созданы для анализа HTS, где положительный контроль (такой как контроль активации) теоретически имеет значения, превышающие отрицательный эталон. Более подробную информацию о том, как применять критерии контроля качества на основе SSMD в экспериментах с HTS, можно найти в книге.[20]
Выбор хита
В анализе HTS одной из основных целей является выбор соединения с желаемой величиной эффекта ингибирования или активации. Величина сложного эффекта представлена величиной разницы между тестами. соединение и отрицательная контрольная группа без специфических эффектов ингибирования / активации. А соединение с желаемым размером эффектов на экране HTS называется хитом. Процесс выбора совпадений называется выбором совпадений. Есть две основные стратегии выбора хитов с большими эффектами.[20] Один из них - использовать определенные метрики для ранжирования и / или классификации соединения по их эффектам, а затем выбрать наибольшее количество сильнодействующих соединения это практично для проверки анализы.[17][19][22]Другая стратегия - проверить, действительно ли соединение имеет достаточно сильные эффекты, чтобы достичь заданного уровня. В этой стратегии необходимо контролировать частоту ложноотрицательных (FNR) и / или ложноположительных (FPR).[14][15][16][25][26]
SSMD может не только ранжировать размер эффектов, но и классифицировать эффекты, как показано в следующей таблице, на основе значения совокупности () ССМД.[20][27]
Подтип эффекта | Пороги для отрицательного SSMD | Пороги для положительного SSMD |
---|---|---|
Чрезвычайно сильный | ||
Очень сильный | ||
Сильный | ||
Довольно сильный | ||
Умеренный | ||
Довольно умеренный | ||
Довольно слабый | ||
Слабый | ||
Очень слаб | ||
Крайне слаб | ||
Нет эффекта |
Оценка SSMD для экранов без реплик отличается от оценки для экранов с репликами.[20][23]
На первичном экране без реплик, принимая измеренное значение (обычно в логарифмической шкале) в скважине для тестируемого соединение является и отрицательная ссылка в этой пластине имеет размер образца , образец значить , медиана , среднеквадратичное отклонение и среднее абсолютное отклонение , SSMD для этого соединение оценивается как[20][23]
где .Если в проба что обычно встречается в экспериментах с HTS, надежная версия SSMD [23] можно получить с помощью
На подтверждающем или первичном скрининге с повторениями для i-го теста соединение с участием повторяется, мы вычисляем парную разницу между измеренным значением (обычно в логарифмической шкале) соединение и медиана значение отрицательного контроля в планшете, затем получить значить и отклонение парных различий между повторами. ССМД для этого соединение оценивается как[20]
Во многих случаях ученые могут использовать как SSMD, так и среднее кратное изменение для выбора попаданий в экспериментах HTS. Сюжет с двойным фонариком[28]может отображать как среднее кратное изменение, так и SSMD для всех тестов соединения в проба и помогите объединить их обоих, чтобы выбрать хиты в экспериментах с HTS[29]. Использование SSMD для выбора попаданий в экспериментах HTS шаг за шагом проиллюстрировано в[23]
Смотрите также
- Размер эффекта
- высокопроизводительный скрининг
- Z-фактор
- Выбор хита
- SMCV
- c+-вероятность
- Переменная контрастности
- Сюжет с двойным фонариком
дальнейшее чтение
использованная литература
- ^ а б c d е ж г час Чжан XHD (2007). «Пара новых статистических параметров для контроля качества в высокопроизводительных скрининговых анализах РНК-интерференции». Геномика. 89 (4): 552–61. Дои:10.1016 / j.ygeno.2006.12.014. PMID 17276655.
- ^ а б c Чжан XHD (2007). «Новый метод с гибким и сбалансированным контролем ложноотрицательных и ложноположительных результатов для отбора попаданий в высокопроизводительных скрининговых анализах РНК-интерференции». Журнал биомолекулярного скрининга. 12 (5): 645–55. Дои:10.1177/1087057107300645. PMID 17517904.
- ^ а б c Чжан XHD (2010). «Строго стандартизированная разница средних, стандартизованная разница средних и классический t-тест для сравнения двух групп». Статистика в биофармацевтических исследованиях. 2 (2): 292–99. Дои:10.1198 / сбр.2009.0074.
- ^ Чжан Дж. Х., Чунг TDY, Ольденбург, КР (1999). «Простой статистический параметр для использования при оценке и валидации высокопроизводительных скрининговых анализов». Журнал биомолекулярного скрининга. 4 (2): 67–73. Дои:10.1177/108705719900400206. PMID 10838414.
- ^ Оуэн Д. Б., Грасуэлл К. Дж., Хэнсон Д. Л. (1964). "Непараметрические верхние доверительные границы для P (Y
Y < Икс) когда Икс и Y нормальные ". Журнал Американской статистической ассоциации. 59 (307): 906–24. Дои:10.2307/2283110. HDL:2027 / mdp.39015094992651. JSTOR 2283110. - ^ Черч JD, Харрис Б. (1970). «Оценка надежности по зависимости напряжения от прочности». Технометрика. 12: 49–54. Дои:10.1080/00401706.1970.10488633.
- ^ Даунтон F (1973). «Оценка Pr (Y
Технометрика. 15 (3): 551–8. Дои:10.2307/1266860. JSTOR 1266860. - ^ Райзер Б, Гутман I (1986). «Статистический вывод для Pr (Y-less-thaqn-X) - нормальный случай». Технометрика. 28 (3): 253–7. Дои:10.2307/1269081. JSTOR 1269081.
- ^ Асьон Л., Петерсон Дж. Дж., Темпл С., Арндт С. (2006). «Вероятностный индекс: интуитивно понятный непараметрический подход к измерению размера лечебных эффектов». Статистика в медицине. 25 (4): 591–602. Дои:10.1002 / sim.2256. PMID 16143965.
- ^ а б c d е Чжан XHD (2008). «Новые аналитические критерии и эффективный дизайн планшетов для контроля качества при полногеномном скрининге РНКи». Журнал биомолекулярного скрининга. 13 (5): 363–77. Дои:10.1177/1087057108317062. PMID 18567841.
- ^ а б c Zhang XHD, Espeseth AS, Johnson E, Chin J, Gates A, Mitnaul L, Marine SD, Tian J, Stec EM, Kunapuli P, Holder DJ, Heyse JF, Stulovici B., Ferrer M (2008). «Интеграция экспериментальных и аналитических подходов для улучшения качества данных в полногеномных экранах РНКи». Журнал биомолекулярного скрининга. 13 (5): 378–89. Дои:10.1177/1087057108317145. PMID 18480473.
- ^ Чжан XHD, Феррер М., Эспесет А.С., Марин С.Д., Стек Э.М., Крэковер М.А., Холдер Д.Д., Хейсе Дж.Ф., Струловичи Б. «Использование строго стандартизированной разницы средних для отбора попаданий в высокопроизводительных скрининговых экспериментах с первичной интерференцией РНК». Журнал биомолекулярного скрининга. 12 (4): 645–55. Дои:10.1177/1087057107300646. PMID 17435171.
- ^ Quon K, Kassner PD (2009). «Скрининг РНК-интерференции для обнаружения онкологических целей». Мнение экспертов о терапевтических целях. 13 (9): 1027–35. Дои:10.1517/14728220903179338. PMID 19650760.
- ^ а б Чжан XHD (2010). «Эффективный метод контроля ложных открытий и ложных необнаружений на экранах РНКи в масштабе генома». Журнал биомолекулярного скрининга. 15 (9): 1116–22. Дои:10.1177/1087057110381783. PMID 20855561.
- ^ а б Чжан XHD, Лаксон Р., Ян Р., Марин С.Д., Маккэмпбелл А., Тулан Д.М., Харе Т.Р., Кайдас Дж., Бергер Дж. П., Держатель Д. Д., Хейсе Дж. Ф., Феррер М. (2010). «Использование основанных на SSMD ложных обнаружений и ложных невыявлений в скринингах РНКи в масштабе генома». Журнал биомолекулярного скрининга. 15 (9): 1123–31. Дои:10.1177/1087057110381919. PMID 20852024.
- ^ а б Чжан XHD, Морской SD, Феррер М (2009). «Частота ошибок и мощность при сканировании РНКи в масштабе генома». Журнал биомолекулярного скрининга. 14 (3): 230–38. Дои:10.1177/1087057109331475. PMID 19211781.
- ^ а б Бирмингем А., Селфорс Л.М., Форстер Т., Вробель Д., Кеннеди С.Дж., Шанкс Е., Сантойо-Лопес Дж., Дуникан Д.Д., Лонг А., Келлехер Д., Смит К., Бейерсберген Р.Л., Газаль П., Шаму К.Э. (2009). «Статистические методы анализа высокопроизводительных РНК-интерференционных экранов». Методы природы. 6 (8): 569–75. Дои:10.1038 / nmeth.1351. ЧВК 2789971. PMID 19644458.
- ^ Клингхоффер Р.А., Фрейзер Дж., Аннис Дж., Берндт Дж. Д., Робертс Б.С., Артур В.Т., Лаксон Р., Чжан XHD, Феррер М., Мун РТ, Клири М.А. (2010). Бересвилл С (ред.). «Опосредованный лентивирусом генетический скрининг идентифицирует дигидрофолатредуктазу (DHFR) как модулятор передачи сигналов бета-катенин / GSK3». PLoS ONE. 4 (9): e6892. Дои:10.1371 / journal.pone.0006892. ЧВК 2731218. PMID 19727391.
- ^ а б Мало Н., Хэнли Дж. А., Карлайл Дж., Лю Дж., Пеллетье Дж., Томас Д., Надон Р. (2010). «Экспериментальный дизайн и статистические методы для улучшенного обнаружения попаданий при высокопроизводительном скрининге». Журнал биомолекулярного скрининга. 15 (8): 990–1000. Дои:10.1177/1087057110377497. PMID 20817887.
- ^ а б c d е ж г час я Чжан XHD (2011). Оптимальный высокопроизводительный скрининг: практический экспериментальный план и анализ данных для исследования РНКи в масштабе генома. Издательство Кембриджского университета. ISBN 978-0-521-73444-8.
- ^ Чжоу Х.Л., Сюй М., Хуан К., Гейтс А.Т., Чжан Х.Д., Касл Дж.С., Стец Э., Феррер М., Струлович Б., Хазуда Д.Д., Эспесет А.С. (2008). «Геномный скрининг РНКи на факторы хозяина, необходимые для репликации ВИЧ». Клеточный хозяин и микроб. 4 (5): 495–504. Дои:10.1016 / j.chom.2008.10.004. PMID 18976975.
- ^ а б Чжан XHD (2010). «Полногеномный скрининг эффективных миРНК посредством оценки размера эффектов миРНК». BMC Research Notes. 1: 33. Дои:10.1186/1756-0500-1-33. ЧВК 2526086. PMID 18710486.
- ^ а б c d е ж Чжан XHD (2011). «Иллюстрация SSMD, z Score, SSMD *, z * Score и t-статистики для выбора попаданий на экранах высокой пропускной способности RNAi». Журнал биомолекулярного скрининга. 16 (7): 775–85. Дои:10.1177/1087057111405851. PMID 21515799.
- ^ Чжан XHD, Heyse JF (2009). «Определение размера выборки в скринингах РНКи в масштабе генома». Биоинформатика. 25 (7): 841–44. Дои:10.1093 / биоинформатика / btp082. PMID 19223447.
- ^ Мало Н., Хэнли Дж. А., Черкоцци С., Пеллетье Дж., Надон Р. (2006). «Статистическая практика в высокопроизводительном скрининговом анализе данных». Природа Биотехнологии. 24 (2): 167–75. Дои:10.1038 / nbt1186. PMID 16465162.
- ^ Чжан XHD, Куан П.Ф., Феррер М., Шу X, Лю Ю.С., Гейтс А.Т., Кунапули П., Стец Э.М., Сюй М., Марин С.Д., Держатель Д.Д., Стуловичи Б., Хейсе Дж.Ф., Эспесет А.С. «Отбор совпадений с контролем ложной скорости обнаружения на экранах РНКи в масштабе генома». Исследования нуклеиновых кислот. 36 (14): 4667–79. Дои:10.1093 / nar / gkn435. ЧВК 2504311. PMID 18628291.
- ^ Чжан XHD (2009). «Метод эффективного сравнения эффектов генов в различных условиях в РНКи и исследования профилей экспрессии». Фармакогеномика. 10 (3): 345–58. Дои:10.2217/14622416.10.3.345. PMID 20397965.
- ^ Чжан XHD (2010). «Оценка размера гена или эффектов РНКи в многофакторных высокопроизводительных экспериментах». Фармакогеномика. 11 (2): 199–213. Дои:10.2217 / PGS.09.136. PMID 20136359.
- ^ Чжао В.К., Сантини Ф., Бриз Р., Росс Д., Чжан XD, Стоун DJ, Феррер М., Таунсенд М., Вулф А.Л., Сигер М.А., Кинни Г.Г., Шугруе П.Дж., Рэй В.Дж. (2010). «Ингибирование опосредованного кальциневрином эндоцитоза и рецепторов альфа-амино-3-гидрокси-5-метил-4-изоксазолепропионовой кислоты (AMPA) предотвращает синаптическое разрушение, вызванное амилоидным бета-олигомером». Журнал биологической химии. 285 (10): 7619–32. Дои:10.1074 / jbc.M109.057182. ЧВК 2844209. PMID 20032460.