Основа выборки - Sampling frame

В статистика, а основа выборки исходный материал или устройство, из которого образец нарисован.[1] Это список всех, кто находится в Население кто может быть включен в выборку и может включать отдельных лиц, домохозяйства или учреждения.[1]

Йессен подчеркивает важность основы выборки.[2] и Салант и Диллман.[3]

Во многих практических ситуациях рамка - это вопрос выбора планировщика обследования, а иногда и критический. [...] Некоторые очень важные исследования вообще не проводятся из-за отсутствия очевидной основы; другие, из-за ошибочных кадров, закончились катастрофой или в облаке сомнений.

— Раймонд Джеймс Джессен

Получение и организация основы выборки

В самых простых случаях, например, при работе с партией материала из производственного цикла или при использовании перепись, можно идентифицировать и измерить каждый элемент в генеральной совокупности и включить любой из них в нашу выборку; это известно как прямой отбор элементов.[1] Однако во многих других случаях это невозможно; либо потому, что это слишком дорого (охват каждого гражданина страны), либо невозможно (охват всех живущих людей).

Создав структуру, существует несколько способов ее организации для повышения эффективности и результативности. Именно на этом этапе исследователь должен решить, действительно ли выборка представляет собой всю совокупность и, следовательно, будет ли она перепись.

Этот список также должен облегчить доступ к выбранной выборке. единицы. Фрейм также может предоставлять дополнительную «вспомогательную информацию» о своих элементах; когда эта информация связана с переменными или группами интересов, ее можно использовать для улучшения дизайна обследования. Хотя это не обязательно для простой выборки, основа выборки используется для более сложных методов выборки, таких как стратифицированная выборка, может содержать дополнительную информацию (например, демографическая информация ).[1] Например, список избирателей может включать имя и пол; эту информацию можно использовать для гарантии того, что выборка, взятая из этого фрейма, охватывает все интересующие демографические категории. (Иногда вспомогательная информация менее ясна; например, номер телефона может предоставить некоторую информацию о местонахождении.

Качество основы выборки

Идеальная основа выборки должна обладать следующими качествами:[1]

  • все блоки имеют логический числовой идентификатор
  • можно найти все объекты - их контактная информация, местоположение на карте или другая важная информация присутствует
  • фрейм организован логично, систематично
  • в структуре есть дополнительная информация об единицах, которая позволяет использовать более сложные структуры выборки
  • каждый элемент интересующей популяции присутствует в кадре
  • присутствует каждый элемент населения только один раз в рамке
  • в кадре отсутствуют элементы, не относящиеся к интересующей нас популяции
  • данные "актуальны"[4]

Типы рамок выборки

Самый простой тип фрейма - это список элементов совокупности (предпочтительно всего населения) с соответствующей контактной информацией. Например, в опрос общественного мнения возможные рамки выборки включают список избирателей или телефонный справочник. Другие основы выборки могут включать записи о занятости, списки школьных классов, файлы пациентов в больнице, организации, перечисленные в тематической базе данных, и так далее.[1][5] На более практическом уровне основы выборки имеют вид компьютерные файлы.[1]

Не во всех фреймах явно перечислены элементы совокупности; некоторые перечисляют только «кластеры». Например, карта улиц можно использовать как каркас для поквартирного осмотра; хотя он не показывает отдельные дома, мы можем выбрать улицы на карте, а затем выбрать дома на этих улицах. Это дает некоторые преимущества: такой фрейм будет включать людей, которые недавно переехали и еще не вошли в список фреймов, обсужденных выше, и его может быть проще использовать, потому что он не требует хранения данных для каждой единицы в генеральной совокупности, только для меньшее количество кластеров.

Проблемы с рамками выборки

Основа выборки должна быть репрезентативной для населения, и это вопрос, выходящий за рамки статистической теории, требующий заключения экспертов по конкретному изучаемому предмету. Во всех вышеупомянутых кадрах отсутствуют некоторые люди, которые будут голосовать на следующих выборах, и указаны люди, которые не будут голосовать; некоторые кадры будут содержать несколько записей для одного и того же человека. Люди, не попавшие в кадр, не имеют никаких шансов попасть в выборку.

Поскольку основанный на кластере фрейм содержит меньше информации о генеральной совокупности, он может накладывать ограничения на план выборки, возможно, требуя использования менее эффективных методов выборки и / или усложняя интерпретацию полученных данных.

Статистическая теория говорит нам о неопределенностях при экстраполяции от выборки к структуре. Следует ожидать, что образцы кадров всегда будут содержать некоторые ошибки.[5] В некоторых случаях это может привести к систематическая ошибка выборки.[1] Такую предвзятость следует свести к минимуму и выявить, хотя полностью избежать ее в реальном мире практически невозможно.[1] Не следует также предполагать, что таковыми являются источники, претендующие на объективность и репрезентативность.[1]

При определении рамок необходимо учитывать практические, экономические, этические и технические вопросы. Необходимость получения своевременных результатов может помешать расширить рамки далеко в будущее. Сложности могут быть очень серьезными, когда численность населения и непересекающийся. Это особая проблема в прогнозирование где выводы о будущем делаются из исторических данные. Фактически, в 1703 году, когда Джейкоб Бернулли предложил Готфрид Лейбниц возможность использования исторических данных о смертности для прогнозирования вероятность ранней смерти живого человека, Готфрид Лейбниц признал проблему в ответе:[6]

Природа установила закономерности, берущие начало в возвращении событий, но только по большей части. Новые болезни наводняют человечество, так что сколько бы экспериментов вы ни проводили над трупами, вы тем самым не наложили ограничения на природу событий, чтобы в будущем они не могли меняться.

— Готфрид Лейбниц

Лесли Киш сформулировал четыре основные проблемы основ выборки:[7]

  1. Отсутствующие элементы: некоторые представители населения не включены в кадр.
  2. Посторонние элементы: в кадр включены лица, не являющиеся членами населения.
  3. Повторяющиеся записи: член населения опрашивается более одного раза.
  4. Группы или кластеры: во фрейме перечислены кластеры, а не отдельные лица.

Проблемы, подобные перечисленным, могут быть выявлены с помощью предварительных тестов и пилотные исследования.

Рекомендации

  1. ^ а б c d е ж грамм час я j Карл-Эрик Сэрндал; Бенгт Свенссон; Ян Ретман (2003). Выборка обследования с помощью модели. Springer. С. 9–12. ISBN  978-0-387-40620-6. Получено 2 января 2011.
  2. ^ Раймонд Джеймс Джессен (1978). Методы статистических исследований. Wiley. Получено 2 января 2011.[страница нужна ]
  3. ^ Салант, Присцилла и Дон А. Диллман. «Как провести собственное исследование: ведущий профессионал дает вам проверенные методы для получения надежных результатов» (1995 г.)
  4. ^ Тернер, Энтони Г. «Основы выборки и эталонные образцы» (PDF). Секретариат ООН. Дата обращения 11.12.2012.. Проверить значения даты в: | accessdate = (Помогите)
  5. ^ а б Роджер Сапсфорд; Виктор Юпп (29 марта 2006 г.). Сбор и анализ данных. Шалфей. С. 28–. ISBN  978-0-7619-4363-1. Получено 2 января 2011.
  6. ^ Питер Л. Бернштейн (1998). Против богов: замечательная история риска. Джон Уайли и сыновья. стр.118 –. ISBN  978-0-471-29563-1. Получено 2 января 2011.
  7. ^ Лесли Киш (1995). Выборка опроса. Вайли. ISBN  978-0-471-10949-5. Получено 11 января 2011.[страница нужна ]