Математическая статистика - Mathematical statistics - Wikipedia

Иллюстрация линейной регрессии на наборе данных. Регрессивный анализ является важной частью математической статистики.

Математическая статистика это применение теория вероятности, филиал математика, к статистика, в отличие от методов сбора статистических данных. Конкретные математические методы, которые используются для этого, включают: математический анализ, линейная алгебра, стохастический анализ, дифференциальные уравнения, и теория меры.[1][2]

Вступление

Сбор статистических данных связан с планированием исследований, особенно с дизайн рандомизированных экспериментов и с планированием опросы с помощью случайная выборка. Первоначальный анализ данных часто следует протоколу исследования, указанному до его проведения. Данные исследования также можно анализировать, чтобы рассмотреть вторичные гипотезы, основанные на первоначальных результатах, или предложить новые исследования. Для вторичного анализа данных запланированного исследования используются инструменты из анализ данных, и процесс этого - математическая статистика.

Анализ данных делится на:

  • описательная статистика - часть статистики, которая описывает данные, то есть суммирует данные и их типичные свойства.
  • выведенный статистика - часть статистики, которая делает выводы из данных (с использованием некоторой модели для данных): например, выводимая статистика включает в себя выбор модели для данных, проверку того, соответствуют ли данные условиям конкретной модели, и с количественной оценкой вовлеченной неопределенности. (например, используя доверительные интервалы ).

Хотя инструменты анализа данных лучше всего работают с данными рандомизированных исследований, они также применяются к другим типам данных. Например, из естественные эксперименты и наблюдательные исследования, и в этом случае вывод зависит от модели, выбранной статистиком, и поэтому субъективен.[3]

Темы

Ниже приведены некоторые из важных тем математической статистики:[4][5]

Распределения вероятностей

А распределение вероятностей это функция который присваивает вероятность для каждого измеримое подмножество возможных исходов случайного эксперимент, опрос, или процедура статистические выводы. Примеры найдены в экспериментах, в которых пространство образца нечисловой, где распределение было бы категориальное распределение; эксперименты, пространство выборки которых кодируется дискретными случайные переменные, где распределение может быть задано функция массы вероятности; и эксперименты с выборочными пространствами, закодированными непрерывными случайными величинами, где распределение может быть задано функция плотности вероятности. Более сложные эксперименты, например с участием случайные процессы определено в непрерывное время, может потребовать использования более общих вероятностные меры.

Распределение вероятностей может быть одномерный или же многомерный. Одномерное распределение дает вероятности одного случайная переменная принятие различных альтернативных ценностей; многомерное распределение ( совместное распределение вероятностей ) дает вероятности случайный вектор - набор из двух или более случайных величин, принимающих различные комбинации значений. Важные и часто встречающиеся одномерные распределения вероятностей включают биномиальное распределение, то гипергеометрическое распределение, а нормальное распределение. В многомерное нормальное распределение - часто встречающееся многомерное распределение.

Специальные раздачи

Статистические выводы

Статистические выводы это процесс вывода на основании данных, которые подвержены случайным изменениям, например ошибкам наблюдений или вариациям выборки.[6] Первоначальные требования такой системы процедур для вывод и индукция заключаются в том, что система должна давать разумные ответы, когда применяется к четко определенным ситуациям, и что она должна быть достаточно общей для применения в целом ряде ситуаций. Статистические данные используются для проверки гипотез и выполнения оценок с использованием выборочных данных. В то время как описательная статистика описывать выборку, выводимая статистика делает выводы относительно большей совокупности, которую представляет выборка.

Результат статистического вывода может быть ответом на вопрос «что делать дальше?», Где это может быть решение о проведении дальнейших экспериментов или опросов, или о том, как сделать вывод перед реализацией какой-либо организационной или правительственной политики. частично, статистический вывод делает предположения о популяциях, используя данные, полученные от интересующей совокупности с помощью некоторой формы случайной выборки. В более общем смысле данные о случайном процессе получают из его наблюдаемого поведения в течение конечного периода времени. Учитывая параметр или гипотезу, о которой нужно сделать вывод, статистический вывод чаще всего использует:

  • а статистическая модель случайного процесса, который должен генерировать данные, который известен при использовании рандомизации, и
  • конкретная реализация случайного процесса; то есть набор данных.

Регресс

В статистика, регрессивный анализ это статистический процесс для оценки взаимосвязей между переменными. Он включает в себя множество способов моделирования и анализа нескольких переменных, когда основное внимание уделяется взаимосвязи между зависимая переменная и один или несколько независимые переменные. В частности, регрессионный анализ помогает понять, как изменяется типичное значение зависимой переменной (или «критериальной переменной»), когда изменяется одна из независимых переменных, в то время как другие независимые переменные остаются неизменными. Чаще всего регрессионный анализ оценивает условное ожидание зависимой переменной с учетом независимых переменных, то есть Средняя стоимость зависимой переменной, когда независимые переменные фиксированы. Реже акцент делается на квантиль, или другой параметр местоположения условного распределения зависимой переменной с учетом независимых переменных. Во всех случаях целью оценки является функция независимых переменных, называемых функция регрессии. В регрессионном анализе также представляет интерес охарактеризовать изменение зависимой переменной вокруг функции регрессии, которое может быть описано с помощью распределение вероятностей.

Разработано много методов проведения регрессионного анализа. Знакомые методы, например линейная регрессия, находятся параметрический, в том, что функция регрессии определяется в терминах конечного числа неизвестных параметры которые оцениваются из данные (например, используя обыкновенный метод наименьших квадратов ). Непараметрическая регрессия относится к методам, которые позволяют функции регрессии находиться в указанном наборе функции, который может быть бесконечномерный.

Непараметрическая статистика

Непараметрическая статистика - значения, рассчитанные на основе данных способом, не основанным на параметризованный семьи распределения вероятностей. Они включают как описательный и выводимый статистика. Типичными параметрами являются среднее значение, дисперсия и т. Д. параметрическая статистика, непараметрическая статистика не делает предположений о распределения вероятностей оцениваемых переменных[нужна цитата ].

Непараметрические методы широко используются для изучения популяций, которые занимают ранжированный порядок (например, обзоры фильмов, получившие от одной до четырех звезд). Использование непараметрических методов может быть необходимо, когда данные имеют рейтинг но нет четкой числовой интерпретации, например, при оценке предпочтения. С точки зрения уровни измерения, непараметрические методы приводят к "порядковым" данным.

Поскольку непараметрические методы делают меньше предположений, их применимость намного шире, чем у соответствующих параметрических методов. В частности, они могут применяться в ситуациях, когда о рассматриваемом приложении известно меньше. Кроме того, из-за использования меньшего количества предположений непараметрические методы более эффективны. крепкий.

Еще одно оправдание использования непараметрических методов - простота. В некоторых случаях, даже когда использование параметрических методов оправдано, непараметрические методы могут быть проще в использовании. Как из-за этой простоты, так и из-за их большей надежности, непараметрические методы рассматриваются некоторыми статистиками как оставляющие меньше места для неправильного использования и недопонимания.

Статистика, математика и математическая статистика

Математическая статистика - это ключевая часть дисциплины статистика. Статистические теоретики изучать и улучшать статистические процедуры с помощью математики, а статистические исследования часто поднимают математические вопросы. Статистическая теория опирается на вероятность и теория принятия решений.

Математикам и статистикам нравится Гаусс, Лаплас, и К. С. Пирс использовал теория принятия решений с распределения вероятностей и функции потерь (или же служебные функции ). Теоретический подход к статистическому выводу был усилен Авраам Вальд и его преемники,[7][8][9][10][11][12][13] и широко использует научные вычисления, анализ, и оптимизация; для дизайн экспериментов, статистики используют алгебра и комбинаторика.

Смотрите также

Рекомендации

  1. ^ Лакшмикантам, изд. Д. Каннан, ... В. (2002). Справочник по стохастическому анализу и приложениям. Нью-Йорк: М. Деккер. ISBN  0824706609.CS1 maint: дополнительный текст: список авторов (связь)
  2. ^ Шервиш, Марк Дж. (1995). Теория статистики (Корр. 2-е изд. Изд.). Нью-Йорк: Спрингер. ISBN  0387945466.
  3. ^ Фридман, Д.А. (2005) Статистические модели: теория и практика, Издательство Кембриджского университета. ISBN  978-0-521-67105-7
  4. ^ Хогг, Р. В., А. Крейг и Дж. У. Маккин. «Введение в математическую статистику». (2005).
  5. ^ Ларсен, Ричард Дж. И Маркс, Моррис Л. «Введение в математическую статистику и ее приложения» (2012). Прентис Холл.
  6. ^ Аптон, Г., Кук, И. (2008) Оксфордский статистический словарь, ОУП. ISBN  978-0-19-954145-4
  7. ^ Вальд, Авраам (1947). Последовательный анализ. Нью-Йорк: Джон Уайли и сыновья. ISBN  0-471-91806-7. См. Перепечатку Dover, 2004 г .: ISBN  0-486-43912-7
  8. ^ Вальд, Авраам (1950). Статистические функции принятия решений. Джон Вили и сыновья, Нью-Йорк.
  9. ^ Леманн, Эрих (1997). Проверка статистических гипотез (2-е изд.). ISBN  0-387-94919-4.
  10. ^ Леманн, Эрих; Касселла, Джордж (1998). Теория точечного оценивания (2-е изд.). ISBN  0-387-98502-6.
  11. ^ Бикель, Питер Дж.; Доксум, Челл А. (2001). Математическая статистика: основные и избранные темы. 1 (Второе (обновленное издание 2007 г.) изд.). Пирсон Прентис-Холл.
  12. ^ Ле Кам, Люсьен (1986). Асимптотические методы в статистической теории принятия решений. Springer-Verlag. ISBN  0-387-96307-3.
  13. ^ Лизе, Фридрих и Миске, Клаус-Дж. (2008). Статистическая теория принятия решений: оценка, тестирование и выбор. Springer.

дальнейшее чтение

  1. ^ Ray, M .; Шарма, Х.С. (1966). Математическая статистика. Рам Прасад и сыновья.