Определение размера выборки - Sample size determination

Определение размера выборки это акт выбора количества наблюдений или копирует включить в статистическая выборка. Размер выборки - важная особенность любого эмпирического исследования, цель которого - сделать выводы Об численность населения по образцу. На практике размер выборки, используемой в исследовании, обычно определяется на основе стоимости, времени или удобства сбора данных, а также необходимости предоставления достаточных данных. статистическая мощность. В сложных исследованиях может быть несколько разных размеров выборки: например, в стратифицированный опрос для каждого слоя будут разные размеры. В перепись, данные ищутся для всей генеральной совокупности, следовательно, предполагаемый размер выборки равен генеральной совокупности. В экспериментальная конструкция, где исследование можно разделить на разные лечебные группы, для каждой группы могут быть разные размеры выборки.

Объем выборки можно выбрать несколькими способами:

  • используя опыт - небольшие выборки, хотя иногда и неизбежны, могут привести к большим доверительные интервалы и риск ошибок в статистическая проверка гипотез.
  • использование целевой дисперсии для оценки, которая должна быть получена из выборки, полученной в конечном итоге, то есть если требуется высокая точность (узкий доверительный интервал), это приводит к низкой целевой дисперсии оценщика.
  • используя мишень для силы статистический тест наносить после взятия пробы.
  • с использованием уровня достоверности, т. е. чем больше требуемый уровень достоверности, тем больше размер выборки (с учетом требования постоянной точности).

Вступление

Большие размеры выборки обычно приводят к увеличению точность когда оценка неизвестные параметры. Например, если мы хотим узнать долю определенного вида рыб, инфицированных патогеном, мы обычно можем получить более точную оценку этой доли, если бы мы взяли и исследовали 200, а не 100 рыб. Несколько фундаментальных фактов математической статистики описывают это явление, в том числе закон больших чисел и Центральная предельная теорема.

В некоторых ситуациях повышение точности для больших размеров выборки минимально или даже отсутствует. Это может произойти из-за наличия систематические ошибки или сильный зависимость в данных, или если данные соответствуют распределению с тяжелым хвостом.

Размеры выборки можно оценить по качеству полученных оценок. Например, если оценивается пропорция, можно пожелать, чтобы 95% доверительный интервал быть менее 0,06 единицы шириной. В качестве альтернативы размер выборки можно оценить на основе мощность проверки гипотезы. Например, если мы сравниваем поддержку определенного политического кандидата среди женщин с поддержкой этого кандидата среди мужчин, мы можем пожелать иметь 80% мощности, чтобы обнаружить разницу в уровнях поддержки в 0,04 единицы.

Оценка

Оценка пропорции

Относительно простая ситуация - оценка пропорция. Например, мы можем захотеть оценить долю жителей в сообществе, которым исполнилось 65 лет.

В оценщик из пропорция является , куда Икс количество «положительных» наблюдений (например, количество людей из п отобранные люди в возрасте от 65 лет). Когда наблюдения независимый, эта оценка имеет (масштабированный) биномиальное распределение (а также образец иметь в виду данных из Распределение Бернулли ). Максимум отклонение этого распределения составляет 0,25п, что происходит при истинном параметр является п = 0,5. На практике, поскольку п неизвестно, максимальная дисперсия часто используется для оценки размера выборки. Если известна разумная оценка p, то величина может использоваться вместо 0,25.

Для достаточно больших п, распределение будут близко аппроксимированы нормальное распределение.[1] Используя это и Метод Вальда для биномиального распределения, дает доверительный интервал вида

,
где Z - стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь доверительный интервал, равный W единиц по ширине (W / 2 на каждой стороне выборочного среднего), мы решим

за п, что дает размер выборки

, в случае использования 0,5 в качестве наиболее консервативной оценки доли. (Примечание: W / 2 = погрешность.)

В противном случае формула была бы такой , что дает .

Например, если нас интересует оценка доли населения США, поддерживающей конкретного кандидата в президенты, и мы хотим, чтобы ширина 95% доверительного интервала составляла не более 2 процентных пунктов (0,02), тогда нам потребуется размер выборки. из (1.962)/(0.022) = 9604. В этом случае разумно использовать оценку 0,5 для p, потому что президентские гонки часто близки к 50/50, и также разумно использовать консервативную оценку. В погрешность в данном случае - 1 процентный пункт (половина 0,02).

Сказанное обычно упрощается ...

сформирует 95% доверительный интервал для истинной пропорции. Если этот интервал должен быть не более W единиц шириной, уравнение

можно решить для п, уступая[2][3] п = 4/W2 = 1/B2 куда B - граница ошибки оценки, т.е. оценка обычно дается как в пределах ± B. Таким образом, для B = 10% требуется п = 100, для B = 5% нужно п = 400, для B = 3% требование приближается к п = 1000, а для B = 1% размер выборки п = 10000 требуется. Эти цифры часто цитируются в новостях опросы мнений и другие выборочные опросы. Однако всегда помните, что сообщаемые результаты могут не соответствовать точному значению, поскольку числа предпочтительно округлять в большую сторону. Зная, что ценность п - минимальное количество выборок, необходимое для получения желаемого результата, тогда количество респондентов должно быть не меньше минимума.

Оценка среднего

Пропорция - это частный случай среднего. При оценке совокупности среднее значение с использованием независимой и одинаково распределенной (iid) выборки размера п, где каждое значение данных имеет дисперсию σ2, то стандартная ошибка выборочного среднего составляет:

Это выражение количественно описывает, как оценка становится более точной по мере увеличения размера выборки. С использованием Центральная предельная теорема для обоснования аппроксимации выборочного среднего с нормальным распределением дает доверительный интервал вида

,
где Z - стандартная Z-оценка для желаемого уровня достоверности (1,96 для 95% доверительного интервала).

Если мы хотим иметь доверительный интервал, равный W единиц по ширине (W / 2 на каждой стороне выборочного среднего), мы решим

за п, что дает размер выборки

. (Примечание: W / 2 = погрешность.)

Например, если мы заинтересованы в оценке степени, на которую лекарство снижает кровяное давление субъекта, с доверительным интервалом 95% шириной в шесть единиц, и мы знаем, что стандартное отклонение кровяного давления в популяции составляет 15, тогда требуемый размер выборки , которое будет округлено до 97, поскольку полученное значение является минимум размер выборки и размеры выборки должны быть целыми числами и не должны превышать рассчитанный минимум.

Необходимые размеры выборки для проверки гипотез

Обычная проблема, с которой сталкиваются статистики, - это вычисление размера выборки, необходимого для получения определенного мощность для теста, учитывая заранее определенный Ошибка типа I ставка α. Как показано ниже, это можно оценить с помощью заранее определенных таблиц для определенных значений, с помощью уравнения ресурсов Мида или, в более общем смысле, с помощью кумулятивная функция распределения:

Столы

[4]
 
Мощность
Коэна d
0.20.50.8
0.2584146
0.501933213
0.602464016
0.703105020
0.803936426
0.905268534
0.9565110542
0.9992014858

Таблица, показанная справа, может использоваться в двухвыборочный t-критерий для оценки размеров выборки экспериментальная группа и контрольная группа которые имеют равный размер, то есть общее количество людей в испытании вдвое больше указанного числа, и желаемое уровень значимости составляет 0,05.[4] Используемые параметры:

Уравнение ресурсов Мида

Уравнение ресурсов Мида часто используется для оценки размеров выборки лабораторные животные, а также во многих других лабораторных экспериментах. Он может быть не таким точным, как использование других методов при оценке размера выборки, но дает намек на то, что является подходящим размером выборки, когда такие параметры, как ожидаемые стандартные отклонения или ожидаемые различия в значениях между группами, неизвестны или очень трудно оценить.[5]

Фактически, все параметры в уравнении степени свободы количества их концептов, и, следовательно, их числа вычитаются на 1 перед вставкой в ​​уравнение.

Уравнение:[5]

куда:

  • N общее количество людей или единиц в исследовании (минус 1)
  • B это блокирующий компонент, представляющий воздействие окружающей среды, разрешенное в проекте (минус 1)
  • Т это компонент лечения, что соответствует количеству лечебные группы (включая контрольная группа ) или количество задаваемых вопросов (минус 1)
  • E это степени свободы компонент ошибки, и должно быть где-то между 10 и 20.

Например, если исследование с использованием лабораторных животных планируется с четырьмя группами лечения (Т= 3), по восемь животных в группе, всего 32 животных (N= 31), без дальнейшего стратификация (B= 0), то E будет равно 28, что выше порогового значения 20, что указывает на то, что размер выборки может быть слишком большим, и шесть животных на группу могут быть более подходящими.[6]

Кумулятивная функция распределения

Позволять Икся, я = 1, 2, ..., п быть независимыми наблюдениями, взятыми из нормальное распределение с неизвестным средним μ и известной дисперсией σ2. Рассмотрим две гипотезы: нулевая гипотеза:

и альтернативная гипотеза:

для некоторой "наименьшей значимой разницы" μ* > 0. Это наименьшее значение, при котором мы хотим наблюдать разницу. Теперь, если мы хотим (1) отклонить ЧАС0 с вероятностью не менее 1 -β когдаЧАСа верно (т.е. мощность из 1 -β) и (2) отклонить ЧАС0 с вероятностью α, когда ЧАС0 верно, то нам понадобится следующее:

Если zα - верхняя α процентная точка стандартного нормального распределения, тогда

и так

'Отклонять ЧАС0 если наша выборочная средняя () больше чем '

это правило принятия решения которое удовлетворяет (2). (Это односторонний тест.)

Теперь мы хотим, чтобы это произошло с вероятностью не менее 1 -β когдаЧАСа правда. В этом случае среднее значение по нашей выборке будет получено из нормального распределения со средним μ*. Следовательно, мы требуем

Путем осторожных манипуляций это можно показать (см. Статистическая мощность # Пример ) случиться, когда

куда это нормальный кумулятивная функция распределения.

Размер стратифицированной выборки

С более сложными методами отбора проб, такими как стратифицированная выборка, образец часто можно разделить на подвыборки. Обычно, если есть ЧАС такие подвыборки (из ЧАС разные страты), то каждый из них будет иметь размер выборки пчас, час = 1, 2, ..., ЧАС. Эти пчас должен соответствовать правилу, что п1 + п2 + ... + пЧАС = п (т.е. общий размер выборки определяется как сумма размеров подвыборки). Выбор этих пчас оптимально можно сделать различными способами, используя (например) оптимальное распределение Неймана.

Есть много причин использовать стратифицированную выборку:[7] для уменьшения дисперсии оценок выборки, использования частично неслучайных методов или изучения слоев по отдельности. Полезным, частично неслучайным методом может быть выборка отдельных лиц там, где они легко доступны, а где нет, выборка кластеров для экономии транспортных расходов.[8]

В общем, для ЧАС страты, средневзвешенное значение выборки

с

[9]

Веса, , часто, но не всегда, представляют собой пропорции элементов населения в стратах, и . Для фиксированного размера выборки, то есть ,

[10]

который можно свести к минимуму, если частота выборки внутри каждой страты делается пропорционально стандартному отклонению внутри каждой страты: , куда и константа такая, что .

«Оптимальное распределение» достигается, когда частота дискретизации внутри страт прямо пропорциональна стандартным отклонениям внутри страты и обратно пропорциональна квадратному корню из стоимости выборки на элемент внутри страт, :

[11]

куда константа такая, что , или, в более общем смысле, когда

[12]

Качественное исследование

При определении размера выборки в качественных исследованиях используется другой подход. Как правило, это субъективное суждение, принимаемое по ходу исследования.[13] Один из подходов состоит в том, чтобы продолжать включать других участников или материал, пока насыщенность достигнуто.[14] Число, необходимое для достижения насыщения, было исследовано эмпирически.[15][16][17][18]

Существует нехватка надежных указаний по оценке размеров выборки перед началом исследования с рядом приведенных предложений.[16][19][20][21] Инструмент, похожий на количественный расчет мощности, основанный на отрицательное биномиальное распределение, был предложен для тематический анализ.[22][21]

Смотрите также

Примечания

  1. ^ NIST /SEMATECH, «7.2.4.2. Требуемые размеры выборки», Электронный справочник статистических методов.
  2. ^ «Вывод для регресса». utdallas.edu.
  3. ^ «Доверительный интервал для пропорции» В архиве 2011-08-23 на Wayback Machine
  4. ^ а б Глава 13, стр. 215, в: Кенни, Дэвид А. (1987). Статистика для социальных и поведенческих наук. Бостон: Маленький, Браун. ISBN  978-0-316-48915-7.
  5. ^ а б Кирквуд, Джеймс; Роберт Хубрехт (2010). Справочник UFAW по уходу за лабораторными и другими исследовательскими животными и управлению ими. Вили-Блэквелл. п. 29. ISBN  978-1-4051-7523-4. онлайн Страница 29
  6. ^ Isogenic.info> Уравнение ресурсов пользователя Michael FW Festing. Обновлено сентябрь 2006 г.
  7. ^ Киш (1965, раздел 3.1)
  8. ^ Киш (1965), стр. 148.
  9. ^ Киш (1965), стр. 78.
  10. ^ Киш (1965), стр. 81.
  11. ^ Киш (1965), стр. 93.
  12. ^ Киш (1965), стр. 94.
  13. ^ Санделовски, М. (1995). Размер выборки при качественном исследовании. Исследования в области сестринского дела и здравоохранения, 18, 179–183
  14. ^ Глейзер, Б. (1965). Постоянный сравнительный метод качественного анализа. Социальные проблемы, 12, 436–445
  15. ^ Фрэнсис, Дж. Дж., Джонстон, М., Робертсон, К., Глидуэлл, Л., Энтвистл, В., Экклс, М. П., и Гримшоу, Дж. М. (2010). Каков адекватный размер выборки? Использование насыщенности данными для теоретических интервью. Психология и здоровье, 25, 1229–1245. Дои:10.1080/08870440903194015
  16. ^ а б Гость, Г., Банс, А., и Джонсон, Л. (2006). Сколько интервью достаточно ?: эксперимент с насыщением и вариативностью данных. Полевые методы, 18, 59–82. Дои:10.1177 / 1525822X05279903
  17. ^ Райт, А., Мэлони, Ф. Л., и Фебловиц, Дж. К. (2011). Отношение клиницистов к электронным спискам проблем и их использование: тематический анализ. BMC Медицинская информатика и принятие решений, 11, 36. Дои:10.1186/1472-6947-11-36
  18. ^ «Размер выборки и насыщенность в исследованиях PhD с использованием качественных интервью - Мейсон - Forum Qualitative Sozialforschung / Forum: Качественные социальные исследования». Qualitative-research.net. 11 (3). 2010-08-24.
  19. ^ Эммель, Н. (2013). Отбор и выбор случаев в качественном исследовании: реалистичный подход. Лондон: Мудрец.
  20. ^ Onwuegbuzie, A. J., & Leech, N. L. (2007). Призыв к качественному анализу мощности. Качество и количество, 41, 105–121. Дои:10.1007 / s11135-005-1098-1
  21. ^ а б Fugard AJB; Potts HWW (10 февраля 2015 г.). «Поддержка размышлений о размерах выборки для тематического анализа: количественный инструмент» (PDF). Международный журнал методологии социальных исследований. 18 (6): 669–684. Дои:10.1080/13645579.2015.1005453. S2CID  59047474.
  22. ^ Гэлвин Р. (2015). Сколько интервью достаточно? Обеспечивают ли качественные интервью при исследовании энергопотребления здания надежные знания? Журнал строительной техники, 1: 2–12.

Рекомендации

дальнейшее чтение

  • NIST: выбор размеров образцов
  • ASTM E122-07: Стандартная практика расчета размера выборки для оценки с заданной точностью среднего значения для характеристики партии или процесса

внешняя ссылка