Достаточная статистика - Sufficient statistic

В статистика, а статистика является достаточно по отношению к статистическая модель и связанные с ним неизвестные параметр если "нет другой статистики, которая может быть рассчитана на основе того же образец предоставляет любую дополнительную информацию о значении параметра ".[1] В частности, статистика достаточно для семья из распределения вероятностей если выборка, по которой она рассчитана, не дает дополнительной информации, кроме статистики, то какое из этих распределений вероятностей является выборочное распределение.

Связанная концепция - это концепция линейная достаточность, что слабее, чем достаточность но может применяться в некоторых случаях, когда нет достаточной статистики, хотя и ограничивается линейными оценками.[2] В Структурная функция Колмогорова имеет дело с отдельными конечными данными; с этим связано понятие алгоритмической достаточной статистики.

Концепция обусловлена Сэр Рональд Фишер в 1920 году. Стивен Стиглер в 1973 году отметил, что концепция достаточности потеряла популярность в описательная статистика из-за сильной зависимости от предположения о форме распределения (см. Теорема Питмана – Купмана – Дармуа. ниже), но оставался очень важным в теоретической работе.[3]

Задний план

Примерно, учитывая набор из независимые одинаково распределенные данные, обусловленные неизвестным параметром , достаточной статистикой является функция значение которого содержит всю информацию, необходимую для вычисления любой оценки параметра (например, максимальная вероятность оценить). По теореме факторизации (см. ниже ), для достаточной статистики , плотность вероятности можно записать как . Из этой факторизации легко увидеть, что оценка максимального правдоподобия будет взаимодействовать с только через . Обычно достаточная статистика является простой функцией данных, например сумма всех точек данных.

В более общем смысле «неизвестный параметр» может представлять собой вектор неизвестных величин или может представлять все о модели, что неизвестно или не полностью определено. В таком случае достаточной статистикой может быть набор функций, называемых совместно достаточная статистика. Обычно функций столько, сколько параметров. Например, для Гауссово распределение с неизвестным значить и отклонение, совместно достаточная статистика, из которой могут быть оценены оценки максимального правдоподобия обоих параметров, состоит из двух функций, суммы всех точек данных и суммы всех квадратов точек данных (или, что эквивалентно, выборочное среднее и выборочная дисперсия ).

Эта концепция эквивалентна утверждению, что, условный от значения достаточной статистики для параметра, совместное распределение вероятностей данных не зависит от этого параметра. И статистика, и базовый параметр могут быть векторами.

Математическое определение

Статистика т = Т(Икс) является достаточно для базового параметра θ именно если условное распределение вероятностей данных Икс, учитывая статистику т = Т(Икс), не зависит от параметра θ.[4]

пример

Например, выборочного среднего достаточно для среднего (μ) из нормальное распределение с известной дисперсией. Как только среднее значение выборки известно, никакой дополнительной информации о μ можно получить из самого образца. С другой стороны, для произвольного распределения медиана недостаточно для среднего значения: даже если известно среднее значение выборки, знание самой выборки предоставит дополнительную информацию о среднем значении генеральной совокупности. Например, если наблюдения, которые меньше медианы, лишь немного меньше, но наблюдения, превышающие медианное значение, значительно превышают ее, то это будет иметь отношение к выводу о среднем населении.

Теорема факторизации Фишера – Неймана

Фишера теорема факторизации или критерий факторизации обеспечивает удобный характеристика достаточной статистики. Если функция плотности вероятности является ƒθ(Икс), тогда Т достаточно для θ если и только если неотрицательные функции г и час можно найти так, что

т.е. плотность ƒ может быть разложена на продукт так, что один фактор, час, не зависит от θ и другой фактор, который зависит от θ, зависит от Икс только через Т(Икс).

Легко видеть, что если F(т) является взаимно однозначной функцией и Т является достаточной статистикой, то F(Т) является достаточной статистикой. В частности, мы можем умножить достаточную статистику на ненулевую константу и получить другую достаточную статистику.

Интерпретация принципа правдоподобия

Смысл теоремы заключается в том, что при использовании вывода на основе правдоподобия два набора данных дают одно и то же значение для достаточной статистики. Т(Икс) всегда будет приводить к одним и тем же выводам о θ. По критерию факторизации зависимость правдоподобия от θ только в сочетании с Т(Икс). Поскольку в обоих случаях это одно и то же, зависимость от θ будет таким же, что приведет к идентичным выводам.

Доказательство

Из-за Хогга и Крейга.[5] Позволять , обозначают случайную выборку из распределения, имеющего pdf ж(Иксθ) для ι < θ < δ. Позволять Y1 = ты1(Икс1Икс2, ..., Иксп) - статистика, pdf которой г1(y1θ). Мы хотим доказать, что Y1 = ты1(Икс1, Икс2, ..., Иксп) является достаточной статистикой для θ тогда и только тогда, когда для некоторой функции ЧАС,

Сначала предположим, что

Мы сделаем преобразование yя = тыя(Икс1Икс2, ..., Иксп), для я = 1, ..., п, имеющий обратные функции Икся = шя(y1y2, ..., yп), для я = 1, ..., п, и Якобиан . Таким образом,

Левая часть - это совместный pdf г(y1, y2, ..., yп; θ) из Y1 = ты1(Икс1, ..., Иксп), ..., Yп = тып(Икс1, ..., Иксп). В правом члене это PDF-файл , так что является частным от и ; то есть это условный pdf из данный .

Но , и поэтому , дано не зависеть от . поскольку не был введен в преобразование и, соответственно, не в якобиан , это следует из того не зависит от и это достаточная статистика для .

Обратное доказывается следующим образом:

где не зависит от потому что зависеть только от , которые не зависят от когда обусловлено Достаточная статистика по гипотезе. Теперь разделите оба члена на абсолютное значение ненулевого якобиана. и заменить по функциям в . Это дает

где это якобиан с заменены их стоимостью в терминах . Левый член обязательно является объединенным pdf из . поскольку , и поэтому , не зависит от , тогда

это функция, которая не зависит от .

Еще одно доказательство

Более простое и наглядное доказательство состоит в следующем, хотя оно применимо только в дискретном случае.

Мы используем сокращенные обозначения для обозначения совместной плотности вероятности от . поскольку является функцией , у нас есть , так долго как и ноль в противном случае. Следовательно:

причем последнее равенство верно по определению достаточной статистики. Таким образом с участием и .

Наоборот, если , у нас есть

При первом равенстве определение PDF для нескольких переменных, второй - по замечанию выше, третий - по гипотезе, а четвертый - потому что суммирование не окончено .

Позволять обозначим условную плотность вероятности данный . Тогда мы можем получить явное выражение для этого:

Первое равенство по определению условной плотности вероятности, второе - по замечанию выше, третье - по доказанному выше равенству, а четвертое - по упрощению. Это выражение не зависит от и поэтому это достаточная статистика.[6]

Минимальная достаточность

Достаточная статистика минимально достаточный если он может быть представлен как функция любой другой достаточной статистики. Другими словами, S(Икс) является минимально достаточный если и только если[7]

  1. S(Икс) достаточно, и
  2. если Т(Икс) достаточно, то существует функция ж такой, что S(Икс) = ж(Т(Икс)).

Интуитивно минимальная достаточная статистика наиболее эффективно фиксирует всю возможную информацию о параметре θ.

Полезной характеристикой минимальной достаточности является то, что когда плотность жθ существуют, S(Икс) является минимально достаточный если и только если

не зависит от θ : S(Икс) = S(y)

Это следует как следствие из Теорема факторизации Фишера указано выше.

Случай, в котором нет минимально достаточной статистики, был показан Бахадуром, 1954.[8] Однако в мягких условиях всегда существует минимальная достаточная статистика. В частности, в евклидовом пространстве эти условия всегда выполняются, если случайные величины (связанные с ) все дискретны или все непрерывны.

Если существует минимальная достаточная статистика, а это обычно так, то каждый полный достаточная статистика обязательно минимальная достаточная[9](обратите внимание, что это утверждение не исключает вариант патологического случая, когда существует полное достаточное количество, а минимально достаточная статистика отсутствует). Хотя трудно найти случаи, когда отсутствует минимальная достаточная статистика, не так сложно найти случаи, в которых нет полной статистики.

Сборник отношений правдоподобия является минимальной достаточной статистикой, если дискретна или имеет функцию плотности.

Примеры

Распределение Бернулли

Если Икс1, ...., Иксп независимы Распределенный по Бернулли случайные величины с ожидаемым значением п, то сумма Т(Икс) = Икс1 + ... + Иксп является достаточной статистикой для п (здесь "успех" соответствует Икся = 1 и 'отказ' до Икся = 0; так Т это общее количество успехов)

Это видно при рассмотрении совместного распределения вероятностей:

Поскольку наблюдения независимы, это можно записать как

и, собирая полномочия п и 1 -п, дает

которое удовлетворяет критерию факторизации, при этом час(Икс) = 1 является просто константой.

Обратите внимание на важную особенность: неизвестный параметр п взаимодействует с данными Икс только по статистике Т(Икс) = ΣИкся.

В качестве конкретного приложения это дает процедуру различения честная монета из смещенной монеты.

Равномерное распределение

Если Икс1, ...., Иксп независимы и равномерно распределены на интервале [0,θ], тогда Т(Икс) = макс (Икс1, ..., Иксп) достаточно для θ - максимум выборки - достаточная статистика для максимума популяции.

Чтобы убедиться в этом, рассмотрим сустав функция плотности вероятности из Икс  (Икс1,...,Иксп). Поскольку наблюдения независимы, pdf можно записать как произведение индивидуальных плотностей

где 1{...} это индикаторная функция. Таким образом, плотность принимает форму, требуемую теоремой Фишера – Неймана о факторизации, где час(Икс) = 1{min {Икся}≥0}, а остальная часть выражения является функцией только θ и Т(Икс) = max {Икся}.

Фактически, несмещенная оценка с минимальной дисперсией (MVUE) для θ является

Это максимум выборки, масштабированный с поправкой на предвзятость, и является MVUE по Теорема Лемана – Шеффе. Максимум непересчитанной выборки Т(Икс) это оценщик максимального правдоподобия для θ.

Равномерное распределение (с двумя параметрами)

Если независимы и равномерно распределены на интервале (где и - неизвестные параметры), то - двумерная достаточная статистика для .

Чтобы убедиться в этом, рассмотрим сустав функция плотности вероятности из . Поскольку наблюдения независимы, PDF может быть записан как произведение индивидуальных плотностей, т.е.

Совместная плотность образца принимает форму, требуемую теоремой Фишера – Неймана о факторизации, если позволить

поскольку не зависит от параметра и зависит только от через функцию

из теоремы факторизации Фишера – Неймана следует является достаточной статистикой для .

распределение Пуассона

Если Икс1, ...., Иксп независимы и имеют распределение Пуассона с параметром λ, то сумма Т(Икс) = Икс1 + ... + Иксп является достаточной статистикой дляλ.

Чтобы увидеть это, рассмотрим совместное распределение вероятностей:

Поскольку наблюдения независимы, это можно записать как

который можно записать как

что показывает выполнение критерия факторизации, где час(Икс) является обратной величиной произведения факториалов. Обратите внимание, что параметр λ взаимодействует с данными только через свою сумму Т(Икс).

Нормальное распределение

Если независимы и нормально распределенный с ожидаемой стоимостью (параметр) и известная конечная дисперсия тогда

является достаточной статистикой для

Чтобы убедиться в этом, рассмотрим сустав функция плотности вероятности из . Поскольку наблюдения независимы, PDF может быть записан как произведение индивидуальных плотностей, т.е.

Совместная плотность образца принимает форму, требуемую теоремой Фишера – Неймана о факторизации, если позволить

поскольку не зависит от параметра и зависит только от через функцию

из теоремы факторизации Фишера – Неймана следует является достаточной статистикой для .

Если неизвестно и с тех пор , указанная выше вероятность может быть переписана как

Теорема факторизации Фишера – Неймана все еще верна и влечет, что является совместной достаточной статистикой для .

Экспоненциальное распределение

Если независимы и экспоненциально распределенный с ожидаемой стоимостью θ (неизвестный положительный параметр с действительным знаком), то является достаточной статистикой для θ.

Чтобы убедиться в этом, рассмотрим сустав функция плотности вероятности из . Поскольку наблюдения независимы, PDF может быть записан как произведение индивидуальных плотностей, т.е.

Совместная плотность образца принимает форму, требуемую теоремой Фишера – Неймана о факторизации, если позволить

поскольку не зависит от параметра и зависит только от через функцию

из теоремы факторизации Фишера – Неймана следует является достаточной статистикой для .

Гамма-распределение

Если независимы и распределены как , где и неизвестные параметры Гамма-распределение, тогда - двумерная достаточная статистика для .

Чтобы убедиться в этом, рассмотрим сустав функция плотности вероятности из . Поскольку наблюдения независимы, PDF может быть записан как произведение индивидуальных плотностей, т.е.

Совместная плотность образца принимает форму, требуемую теоремой Фишера – Неймана о факторизации, если позволить

поскольку не зависит от параметра и зависит только от через функцию

из теоремы факторизации Фишера – Неймана следует является достаточной статистикой для

Теорема Рао – Блэквелла

Достаточность находит полезное применение в Теорема Рао – Блэквелла, который гласит, что если г(Икс) - это любая оценка θ, то обычно условное ожидание г(Икс) при достаточной статистике Т(Икс) лучше[расплывчатый ] оценщик θ, и хуже не бывает. Иногда очень легко построить очень грубую оценку г(Икс), а затем оценить это условное ожидаемое значение, чтобы получить оценку, которая является оптимальной в различных смыслах.

Экспоненциальная семья

Согласно Теорема Питмана – Купмана – Дармуа, среди семейств вероятностных распределений, область определения которых не меняется в зависимости от оцениваемого параметра, только в экспоненциальные семейства существует ли достаточная статистика, размерность которой остается ограниченной по мере увеличения размера выборки.

Менее кратко, предположим находятся независимые одинаково распределенные случайные величины, распределение которых, как известно, принадлежит некоторому семейству вероятностных распределений с фиксированной поддержкой. Только если эта семья экспоненциальный семья имеется достаточная статистика (возможно, векторная) чье количество скалярных компонентов не увеличивается с увеличением размера выборки п увеличивается.

Эта теорема показывает, что достаточность (или, скорее, наличие скалярной или векторной достаточной статистики ограниченной размерности) резко ограничивает возможные формы распределения.

Другие виды достаточности

Байесовская достаточность

Альтернативная формулировка условия достаточности статистики, заданная в байесовском контексте, включает апостериорные распределения, полученные с использованием полного набора данных и с использованием только статистики. Таким образом, требуется, чтобы почти для каждого Икс,

В более общем плане, не предполагая параметрической модели, мы можем сказать, что статистика Т является предсказуемо достаточно если

Оказывается, эта «байесовская достаточность» является следствием приведенной выше формулировки:[10] однако они не эквивалентны прямо в бесконечномерном случае.[11] Доступен ряд теоретических результатов для достаточности в байесовском контексте.[12]

Линейная достаточность

Концепция, называемая «линейная достаточность», может быть сформулирована в байесовском контексте,[13] и вообще.[14] Сначала определите лучший линейный предиктор вектора Y на основе Икс так как . Тогда линейная статистика Т(Икс) линейно достаточно[15] если

Смотрите также

Заметки

  1. ^ Фишер, Р.А. (1922). «О математических основах теоретической статистики». Философские труды Королевского общества A. 222 (594–604): 309–368. Дои:10.1098 / рста.1922.0009. JFM  48.1280.02. JSTOR  91208.
  2. ^ Додж, Ю. (2003) - запись о линейной достаточности
  3. ^ Стиглер, Стивен (Декабрь 1973 г.). «Исследования по истории вероятности и статистики. XXXII: Лаплас, Фишер и открытие концепции достаточности». Биометрика. 60 (3): 439–445. Дои:10.1093 / biomet / 60.3.439. JSTOR  2334992. Г-Н  0326872.
  4. ^ Казелла, Джордж; Бергер, Роджер Л. (2002). Статистический вывод, 2-е изд.. Duxbury Press.
  5. ^ Хогг, Роберт В .; Крейг, Аллен Т. (1995). Введение в математическую статистику. Прентис Холл. ISBN  978-0-02-355722-4.
  6. ^ "Теорема факторизации Фишера – Неймана".. Веб-страница Connexions (cnx.org)
  7. ^ Dodge (2003) - запись для минимально достаточной статистики
  8. ^ Леманн и Казелла (1998), Теория точечного оценивания, 2-е издание, Springer, стр. 37
  9. ^ Леманн и Казелла (1998), Теория точечного оценивания, 2-е издание, Springer, стр. 42
  10. ^ Бернардо, Дж.; Смит, А.Ф.М. (1994). «Раздел 5.1.4». Байесовская теория. Вайли. ISBN  0-471-92416-4.
  11. ^ Блэквелл, Д.; Рамамурти, Р. В. (1982). «Байесовская, но недостаточно классическая статистика». Анналы статистики. 10 (3): 1025–1026. Дои:10.1214 / aos / 1176345895. Г-Н  0663456. Zbl  0485.62004.
  12. ^ Ногалес, А.Г .; Oyola, J.A .; Перес, П. (2000). «Об условной независимости и соотношении достаточности и инвариантности с байесовской точки зрения». Письма о статистике и вероятности. 46 (1): 75–84. Дои:10.1016 / S0167-7152 (99) 00089-9. Г-Н  1731351. Zbl  0964.62003.
  13. ^ Goldstein, M .; О'Хаган, А. (1996). «Байесовская линейная достаточность и системы апостериорных экспертных оценок». Журнал Королевского статистического общества. Серия Б. 58 (2): 301–316. JSTOR  2345978.
  14. ^ Годамб, В. П. (1966). "Новый подход к выборке из конечных совокупностей. II Достаточность без распределения". Журнал Королевского статистического общества. Серия Б. 28 (2): 320–328. JSTOR  2984375.
  15. ^ Уиттинг, Т. (1987). «Линейное марковское свойство в теории достоверности». Бюллетень АСТИН. 17 (1): 71–84. Дои:10.2143 / аст.17.1.2014984.

использованная литература