Ложноположительная ставка - False positive rate

В статистика, при выполнении множественные сравнения, а коэффициент ложноположительных результатов (также известен как выпадать или же коэффициент ложной тревоги) это вероятность ложного отклонения нулевая гипотеза для конкретного тест. Частота ложных срабатываний рассчитывается как отношение количества отрицательных событий, ошибочно классифицированных как положительные (ложные срабатывания), и общего количества фактических отрицательных событий (независимо от классификации).

Ложное срабатывание ставка (или «уровень ложных тревог») обычно относится к ожидание ложных срабатываний соотношение.

Определение

Уровень ложных срабатываний ${displaystyle {frac {mathrm {FP}} {N}} = {frac {mathrm {FP}} {mathrm {FP} + mathrm {TN}}}}$

куда ${displaystyle mathrm {FP}}$ количество ложных срабатываний, ${displaystyle mathrm {TN}}$ это количество истинных негативов и ${displaystyle N = mathrm {FP} + mathrm {TN}}$ - общее количество отрицательных значений истинности.

Уровень значимости, который используется для проверки каждой гипотезы, устанавливается на основе формы вывода (одновременный вывод против выборочного вывода ) и его вспомогательные критерии (например, FWER или же FDR ), которые были предварительно определены исследователем.

При выполнении множественные сравнения в статистический структура, такая как выше, коэффициент ложноположительных результатов (также известный как коэффициент ложной тревоги, в отличие от ложноположительных ставка / ложная тревога ставка ) обычно относится к вероятности ошибочного отклонения нулевая гипотеза для конкретного тест. Используя предложенную здесь терминологию, это просто ${displaystyle V / m_ {0}}$ .

С V случайная величина и ${displaystyle m_ {0}}$ постоянная ( ${displaystyle Vleq m_ {0}}$ ), ложное срабатывание соотношение также является случайной величиной в диапазоне от 0 до 1.
В ложноположительный рейтинг (или «уровень ложных тревог») обычно относится к ожидание ложноположительного отношения, выраженный ${displaystyle E (В / м_ {0})}$ .

Стоит отметить, что эти два определения («коэффициент ложных срабатываний» / «процент ложных срабатываний») в некоторой степени взаимозаменяемы. Например, в указанной статье^[1] ${displaystyle V / m_ {0}}$ служит ложноположительным «коэффициентом», а не его «соотношением».

Классификация нескольких тестов гипотез

В следующей таблице определены возможные результаты при проверке нескольких нулевых гипотез. Предположим, у нас есть число м нулевых гипотез, обозначаемых: $ЧАС 1, ЧАС 2, ..., ЧАС м .$ Используя статистический тест, мы отклоняем нулевую гипотезу, если тест объявлен значимым. Мы не отклоняем нулевую гипотезу, если тест несущественен. Суммируя каждый тип результата по всем ЧАС_я дает следующие случайные величины:

	Нулевая гипотеза верна (H₀)	Верна альтернативная гипотеза (H_А)	Общий
Тест объявлен значимым	$V$	$S$	$р$
Тест объявлен несущественным	$U$	$Т$	${displaystyle m-R}$
Общий	${displaystyle m_ {0}}$	${displaystyle m-m_ {0}}$	$м$

$м$ общее количество проверенных гипотез
${displaystyle m_ {0}}$ это число истинных нулевые гипотезы, неизвестный параметр
${displaystyle m-m_ {0}}$ это число истинных альтернативные гипотезы
$V$ это количество ложные срабатывания (ошибка типа I) (также называемые «ложными открытиями»)
$S$ это количество истинные положительные моменты (также называемые «истинными открытиями»)
$Т$ это количество ложноотрицательные результаты (ошибка типа II)
$U$ это количество истинные негативы
${displaystyle R = V + S}$ это количество отклоненных нулевых гипотез (также называемых «открытиями», истинными или ложными)

В $м$ гипотезы проверки которых ${displaystyle m_ {0}}$ верны нулевые гипотезы, $р$ - наблюдаемая случайная величина, а $S$ , $Т$ , $U$ , и $V$ ненаблюдаемы случайные переменные.

Отличие от "частоты ошибок первого типа" и других близких терминов

В то время как количество ложных срабатываний математически равно ошибка типа I ставка, она рассматривается как отдельный термин по следующим причинам:^{[нужна цитата ]}

В ошибка типа I ставка часто связана с априори установка уровень значимости со стороны исследователя: уровень значимости представляет собой приемлемую частоту ошибок учитывая, что все нулевые гипотезы верны (гипотеза «глобального нуля»). Таким образом, выбор уровня значимости может быть несколько произвольным (например, установка 10% (0,1), 5% (0,05), 1% (0,01) и т. д.)

В отличие от этого, количество ложных срабатываний связано с пост-приор результат, который представляет собой ожидаемое количество ложных срабатываний, деленное на общее количество гипотез в соответствии с настоящий комбинация истинных и ложных нулевых гипотез (без учета "глобальной нулевой" гипотезы). Поскольку количество ложных срабатываний является параметром, который не контролируется исследователем, его нельзя отождествить с уровнем значимости.

Кроме того, коэффициент ложных срабатываний обычно используется в отношении медицинского теста или диагностического устройства (например, «уровень ложных срабатываний определенного диагностического устройства составляет 1%»), а ошибка типа I - это термин, связанный со статистическими тестами, где значение слово «положительный» не так однозначно (например, «ошибка типа I теста составляет 1%»).

Показатель ложных срабатываний также не следует путать с частота ошибок в семье, который определяется как ${displaystyle mathrm {FWER} = Pr (Vgeq 1),}$ . По мере роста количества тестов частота ошибок в семье обычно сходится к 1, в то время как частота ложных срабатываний остается неизменной.

Наконец, важно отметить глубокую разницу между количеством ложноположительных результатов и коэффициент ложного обнаружения: в то время как первый определяется как ${displaystyle E (В / м_ {0})}$ , второй определяется как ${displaystyle E (V / R)}$ .

Ложноположительная ставка - False positive rate

Содержание

Определение

Классификация нескольких тестов гипотез

Отличие от "частоты ошибок первого типа" и других близких терминов

Смотрите также

Рекомендации