Ложноположительная ставка - False positive rate

В статистика, при выполнении множественные сравнения, а коэффициент ложноположительных результатов (также известен как выпадать или же коэффициент ложной тревоги) это вероятность ложного отклонения нулевая гипотеза для конкретного тест. Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).

Ложное срабатывание ставка (или «уровень ложных тревог») обычно относится к ожидание ложных срабатываний соотношение.

Определение

Уровень ложных срабатываний

куда количество ложных срабатываний, это количество истинных негативов и - общее количество отрицательных значений истинности.

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода (одновременный вывод против выборочного вывода ) и его вспомогательные критерии (например, FWER или же FDR ), которые были предварительно определены исследователем.

При выполнении множественные сравнения в статистический структура, такая как выше, коэффициент ложноположительных результатов (также известный как коэффициент ложной тревоги, в отличие от ложноположительных ставка / ложная тревога ставка ) обычно относится к вероятности ошибочного отклонения нулевая гипотеза для конкретного тест. Используя предложенную здесь терминологию, это просто .

С V случайная величина и постоянная (), ложное срабатывание соотношение также является случайной величиной в диапазоне от 0 до 1.
В ложноположительный рейтинг (или «уровень ложных тревог») обычно относится к ожидание ложноположительного отношения, выраженный .

Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в указанной статье[1] служит ложноположительным «коэффициентом», а не его «соотношением».

Классификация нескольких тестов гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число м нулевых гипотез, обозначаемых: ЧАС1ЧАС2, ..., ЧАСм.Используя статистический тест, мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отклоняем нулевую гипотезу, если тест несущественен. Суммируя каждый тип результата по всем ЧАСя дает следующие случайные величины:

Нулевая гипотеза верна (H0)Верна альтернативная гипотеза (HА)Общий
Тест объявлен значимымVSр
Тест объявлен несущественнымUТ
Общийм

В м гипотезы проверки которых верны нулевые гипотезы, р - наблюдаемая случайная величина, а S, Т, U, и V ненаблюдаемы случайные переменные.

Отличие от "частоты ошибок первого типа" и других близких терминов

В то время как количество ложных срабатываний математически равно ошибка типа I ставка, она рассматривается как отдельный термин по следующим причинам:[нужна цитата ]

  • В ошибка типа I ставка часто связана с априори установка уровень значимости со стороны исследователя: уровень значимости представляет собой приемлемую частоту ошибок учитывая, что все нулевые гипотезы верны (гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.)
В отличие от этого, количество ложных срабатываний связано с пост-приор результат, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез в соответствии с настоящий комбинация истинных и ложных нулевых гипотез (без учета "глобальной нулевой" гипотезы). Поскольку количество ложных срабатываний является параметром, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.
  • Кроме того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), а ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).

Показатель ложных срабатываний также не следует путать с частота ошибок в семье, который определяется как . По мере роста количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.

Наконец, важно отметить глубокую разницу между количеством ложноположительных результатов и коэффициент ложного обнаружения: в то время как первый определяется как , второй определяется как .

Смотрите также

Рекомендации

  1. ^ Берк, Дональд; Брандейдж, Джон; Редфилд, Роберт (1988). «Измерение количества ложноположительных результатов в программе скрининга вирусных инфекций иммунодефицита человека». Медицинский журнал Новой Англии. 319 (15): 961–964. Дои:10.1056 / NEJM198810133191501. PMID  3419477.