Коррекция Бонферрони - Bonferroni correction - Wikipedia

В статистика, то Коррекция Бонферрони один из нескольких методов, используемых для противодействия проблеме множественные сравнения.

Фон

Итальянский математик Карло Эмилио Бонферрони разработали поправку на множественные сравнения для ее использования на Неравенства Бонферрони.[1]Расширение метода на доверительные интервалы был предложен Олив Джин Данн.[2]

Статистическая проверка гипотез основан на отказе от нулевая гипотеза если вероятность наблюдаемых данных при нулевых гипотезах мала. Если проверяется несколько гипотез, вероятность наблюдения редкого события увеличивается, и, следовательно, вероятность неверного отклонения нулевой гипотезы (т. Е. Ошибка типа I ) увеличивается.[3]

Поправка Бонферрони компенсирует это увеличение, проверяя каждую отдельную гипотезу на уровне значимости , куда желаемый общий альфа-уровень и - количество гипотез.[4] Например, если пробная версия тестирует гипотезы с желаемым , то поправка Бонферрони будет проверять каждую отдельную гипотезу на . Точно так же при построении нескольких доверительных интервалов возникает одно и то же явление.

Определение

Позволять быть семьей гипотез и их соответствующие p-значения. Позволять - общее количество нулевых гипотез и количество истинных нулевых гипотез. В частота ошибок в семье (FWER) - вероятность отклонения хотя бы одного истинного , то есть сделать хотя бы один ошибка типа I. Поправка Бонферрони отклоняет нулевую гипотезу для каждого , тем самым контролируя FWER в . Доказательство этого контроля следует из Неравенство Буля, следующее:

Этот элемент управления не требует никаких предположений о зависимости между p-значениями или о том, сколько из нулевых гипотез верны.[5]

Расширения

Обобщение

Вместо того, чтобы проверять каждую гипотезу на уровень, гипотезы могут быть проверены на любой другой комбинации уровней, которые в сумме дают при условии, что уровень каждого теста определяется до просмотра данных.[6] Например, для двух тестов гипотез общий 0,05 можно поддерживать, проводя одно испытание при 0,04, а другое при 0,01.

Доверительные интервалы

Процедура, предложенная Данном[2] (не путать с Процедура Данна для рангового анализа дисперсии) может использоваться для корректировки доверительные интервалы. Если установить доверительные интервалы и желает иметь общий уровень достоверности , каждый индивидуальный доверительный интервал можно отрегулировать до уровня .[2]

Непрерывные проблемы

При поиске сигнала в непрерывном пространстве параметров также может возникнуть проблема множественных сравнений или эффекта поиска в другом месте. Например, физик может стремиться открыть частицу неизвестной массы, рассматривая широкий диапазон масс; Так было во время открытия Нобелевской премии бозон Хиггса. В таких случаях можно применить непрерывное обобщение поправки Бонферрони, используя Байесовский логика для соотнесения эффективного количества испытаний, к соотношению переднего и заднего объема.[7]

Альтернативы

Есть альтернативные способы контролировать частота ошибок в семье. Например, Метод Холма – Бонферрони и Поправка Шидака универсально более действенные процедуры, чем поправка Бонферрони, а это означает, что они всегда по крайней мере столь же эффективны. В отличие от процедуры Бонферрони, эти методы не контролируют ожидаемое число ошибок типа I для каждой семьи (частота ошибок типа I для каждой семьи).[8]

Критика

Что касается FWER В качестве контроля поправка Бонферрони может быть консервативной, если имеется большое количество тестов и / или статистические данные тестов положительно коррелированы.[9]

Поправка происходит за счет увеличения вероятности производства ложные отрицания, т.е. сокращение статистическая мощность.[10][9] Нет единого мнения о том, как определять семью во всех случаях, и скорректированные результаты тестов могут варьироваться в зависимости от количества тестов, включенных в семья гипотез.[нужна цитата ] Такая критика относится к FWER контроля в целом и не относятся к коррекции Бонферрони.

Рекомендации

  1. ^ Бонферрони, К. Э., Теория статистики класса и расчета вероятности, Pubblicazioni del R Istituto Superiore di Scienze Economiche e Commerciali di Firenze 1936
  2. ^ а б c Данн, Олив Джин (1961). «Множественные сравнения между средствами» (PDF). Журнал Американской статистической ассоциации. 56 (293): 52–64. CiteSeerX  10.1.1.309.1277. Дои:10.1080/01621459.1961.10482090.
  3. ^ Mittelhammer, Ron C .; Судья, Джордж Г .; Миллер, Дуглас Дж. (2000). Эконометрические основы. Издательство Кембриджского университета. С. 73–74. ISBN  978-0-521-62394-0.
  4. ^ Миллер, Руперт Г. (1966). Одновременный статистический вывод. Springer. ISBN  9781461381228.
  5. ^ Goeman, Jelle J .; Солари, Альдо (2014). «Проверка множественных гипотез в геномике». Статистика в медицине. 33 (11): 1946–1978. Дои:10.1002 / sim.6082. PMID  24399688.
  6. ^ Neuwald, AF; Грин, П. (1994). «Выявление закономерностей в белковых последовательностях». J. Mol. Биол. 239 (5): 698–712. Дои:10.1006 / jmbi.1994.1407. PMID  8014990.
  7. ^ Байер, Адриан Э .; Селяк, Урош (2020). «Эффект поиска в другом месте с объединенной байесовской и частотной точки зрения». Журнал космологии и физики астрономических частиц. 2020 (10): 009–009. arXiv:2007.13821. Дои:10.1088/1475-7516/2020/10/009.
  8. ^ Фран, Эндрю (2015). «Уместны ли показатели ошибок типа I на уровне семьи в социальных и поведенческих науках?». Журнал современных прикладных статистических методов. 14 (1): 12–23. Дои:10.22237 / jmasm / 1430453040.
  9. ^ а б Моран, Мэтью (2003). «Аргументы в пользу отказа от последовательного Бонферрони в экологических исследованиях». Ойкос. 100 (2): 403–405. Дои:10.1034 / j.1600-0706.2003.12010.x.
  10. ^ Накагава, Шиничи (2004). «Прощание с Бонферрони: проблемы низкой статистической мощности и предвзятости публикации». Поведенческая экология. 15 (6): 1044–1045. Дои:10.1093 / beheco / arh107.

дальнейшее чтение

внешняя ссылка