Инвариантная оценка - Invariant estimator

В статистика, концепция быть инвариантная оценка это критерий, который можно использовать для сравнения свойств различных оценщики за такое же количество. Это способ формализовать идею о том, что оценщик должен обладать некоторыми интуитивно привлекательными качествами. Строго говоря, «инвариантный» будет означать, что сами оценки не изменяются, когда и измерения, и параметры преобразуются совместимым образом, но смысл был расширен, чтобы оценки могли изменяться соответствующим образом с такими преобразованиями.[1] Период, термин эквивариантная оценка используется в формальных математических контекстах, которые включают точное описание взаимосвязи способа, которым оценщик изменяется в ответ на изменения в наборе данных и параметризации: это соответствует использованию "эквивалентность "в более общей математике.

Общие настройки

Задний план

В статистические выводы, есть несколько подходов к теория оценки это можно использовать для немедленного решения, какие оценки следует использовать в соответствии с этими подходами. Например, идеи из Байесовский вывод приведет непосредственно к Байесовские оценки. Точно так же теория классического статистического вывода может иногда приводить к четким выводам о том, какую оценку следует использовать. Однако полезность этих теорий зависит от наличия полностью предписанного статистическая модель и также может зависеть от наличия соответствующей функции потерь для определения оценщика. Таким образом Байесовский анализ могут быть предприняты, что приведет к апостериорному распределению соответствующих параметров, но использование конкретной функции полезности или потерь может быть неясным. Идеи инвариантности затем могут быть применены к задаче резюмирования апостериорного распределения. В других случаях статистический анализ проводится без полностью определенной статистической модели или классическая теория статистического вывода не может быть легко применена, поскольку рассматриваемое семейство моделей не поддается такой обработке. В дополнение к этим случаям, когда общая теория не предписывает оценку, концепция инвариантности оценки может применяться при поиске оценок альтернативных форм, либо для простоты применения оценки, либо для того, чтобы оценка была крепкий.

Концепция инвариантности иногда используется сама по себе как способ выбора между оценками, но это не обязательно окончательно. Например, требование инвариантности может быть несовместимо с требованием, чтобы оценка быть объективной; с другой стороны, критерий срединная непредвзятость определяется в терминах распределения выборки оценщика и поэтому инвариантен при многих преобразованиях.

Одно из применений концепции инвариантности - это когда предлагается класс или семейство оценок, и среди них должна быть выбрана конкретная формулировка. Одна из процедур состоит в том, чтобы наложить соответствующие свойства инвариантности, а затем найти формулировку в этом классе, которая имеет наилучшие свойства, что приводит к так называемой оптимальной инвариантной оценке.

Некоторые классы инвариантных оценок

Есть несколько типов преобразований, которые полезно учитывать при работе с инвариантными оценками. Каждый порождает класс оценок, которые инвариантны к этим конкретным типам преобразований.

  • Инвариантность к сдвигу: теоретически оценки параметр местоположения должен быть инвариантным к простым сдвигам значений данных. Если все значения данных увеличиваются на заданную величину, оценка должна измениться на такую ​​же величину. При рассмотрении оценки с использованием средневзвешенное, это требование инвариантности немедленно означает, что суммы весов должны быть равны единице. Хотя тот же результат часто получается из требования к объективности, использование «инвариантности» не требует наличия среднего значения и вообще не использует какое-либо распределение вероятностей.
  • Масштабная инвариантность: обратите внимание, что эту тему об инвариантности параметра шкалы оценки не следует путать с более общими масштабная инвариантность о поведении систем при совокупных свойствах (по физике).
  • Инвариантность преобразования параметров: здесь преобразование применяется только к параметрам. Идея здесь заключается в том, что, по сути, из данных и модели, включающей параметр θ, следует сделать такой же вывод, как если бы модель использовала параметр φ, где φ - взаимно однозначное преобразование θ, φ =час(θ). Согласно этому типу инвариантности результаты инвариантных преобразований оценок также должны быть связаны соотношением φ =час(θ). Оценщики максимального правдоподобия иметь это свойство, когда преобразование монотонный. Хотя асимптотические свойства оценщика могут быть инвариантными, свойства малой выборки могут отличаться, и необходимо получить конкретное распределение.[2]
  • Инвариантность перестановок: когда набор значений данных может быть представлен статистической моделью, из которой они являются независимые и одинаково распределенные случайные переменные, разумно наложить требование, чтобы любая оценка любого свойства общего распределения была инвариантной к перестановкам: в частности, чтобы оценка, рассматриваемая как функция набора значений данных, не изменялась, если элементы данных меняются местами. в наборе данных.

Комбинация инвариантности перестановок и инвариантности местоположения для оценки параметра местоположения из независимые и одинаково распределенные набор данных с использованием средневзвешенного значения подразумевает, что веса должны быть идентичны и в сумме равны единице. Конечно, могут быть предпочтительнее оценки, отличные от средневзвешенного.

Оптимальные инвариантные оценки

В этой настройке нам дается набор измерений который содержит информацию о неизвестном параметре . Измерения моделируются как векторная случайная величина иметь функция плотности вероятности который зависит от вектора параметров .

Проблема в том, чтобы оценить данный . Оценка, обозначенная , является функцией измерений и принадлежит множеству . Качество результата определяется функция потерь что определяет функция риска . Множества возможных значений , , и обозначаются , , и соответственно.

В классификации

В статистическая классификация, правило, присваивающее класс новому элементу данных, можно рассматривать как специальный тип оценки. Ряд соображений типа инвариантности можно использовать при формулировании предварительные знания для распознавания образов.

Математическая установка

Определение

Инвариантная оценка - это оценка, которая подчиняется следующим двум правилам:[нужна цитата ]

  1. Принцип рациональной инвариантности: действие, предпринимаемое при решении задачи, не должно зависеть от преобразования используемого измерения.
  2. Принцип инвариантности: если две задачи решения имеют одинаковую формальную структуру (с точки зрения , , и ), то в каждой задаче следует использовать одно и то же правило принятия решения.

Для формального определения инвариантной или эквивариантной оценки сначала необходимы некоторые определения, относящиеся к группам преобразований. Позволять обозначают набор возможных выборок данных. А группа преобразований из , чтобы обозначить , представляет собой набор (измеримых) 1: 1 и на преобразования в себя, что удовлетворяет следующим условиям:

  1. Если и тогда
  2. Если тогда , где (То есть каждое преобразование имеет обратное внутри группы.)
  3. (т.е. есть тождественное преобразование )

Наборы данных и в эквивалентны, если для некоторых . Все эквивалентные точки образуют класс эквивалентности.Такой класс эквивалентности называется орбита). В орбита , это множество .Если состоит из одной орбиты, тогда называется транзитивным.

Семья плотностей называется инвариантным относительно группы если для каждого и существует уникальный такой, что имеет плотность . будет обозначаться .

Если инвариантен относительно группы тогда функция потерь называется инвариантным относительно если для каждого и существует такой, что для всех . Преобразованное значение будем обозначать .

В приведенном выше описании группа преобразований из себе и группа преобразований из себе.

Задача оценивания инвариантна (эквивариантна) относительно если есть три группы как определено выше.

Для задачи оценивания, инвариантной относительно , оценщик является инвариантной оценкой относительно если для всех и ,

Характеристики

  1. Функция риска инвариантной оценки, , постоянна на орбитах . Эквивалентно для всех и .
  2. Функция риска инвариантной оценки с транзитивным постоянно.

Для данной проблемы инвариантная оценка с наименьшим риском называется «наилучшей инвариантной оценкой». Не всегда удается получить наилучшую инвариантную оценку. Особым случаем, в котором это может быть достигнуто, является случай, когда транзитивен.

Пример: параметр местоположения

Предположим является параметром местоположения, если плотность имеет форму . За и , задача инвариантна относительно . Инвариантная оценка в этом случае должна удовлетворять

таким образом, это имеет форму (). транзитивен на поэтому риск не зависит от : это, . Лучшая инвариантная оценка - та, которая приносит риск к минимуму.

В случае, если L - квадрат ошибки

Оценщик Питмана

Проблема оценки заключается в том, что имеет плотность , где θ - параметр, который необходимо оценить, и где функция потерь является . Эта задача инвариантна со следующими (аддитивными) группами преобразований:

Лучшая инвариантная оценка тот, который сводит к минимуму

и это оценка Питмана (1939).

Для случая квадратичной ошибки потери результат будет

Если (т.е. многомерное нормальное распределение с независимыми компонентами единичной дисперсии), то

Если (независимые компоненты, имеющие Распределение Коши с параметром масштаба σ) тогда,. Однако результат

с участием

использованная литература

  1. ^ см. раздел 5.2.1 в Gourieroux, C. and Monfort, A. (1995). Статистика и эконометрические модели, том 1. Cambridge University Press.
  2. ^ Гурье и Монфор (1995)
  • Бергер, Джеймс О. (1985). Теория статистических решений и байесовский анализ (2-е изд.). Нью-Йорк: Springer-Verlag. ISBN  0-387-96098-8. Г-Н  0804611.[страница нужна ]
  • Freue, Габриэла В. Коэн (2007). «Оценка Питмана параметра местоположения Коши». Журнал статистического планирования и вывода. 137: 1900–1913. Дои:10.1016 / j.jspi.2006.05.002.
  • Pitman, E.J.G. (1939). «Оценка местоположения и масштабных параметров сплошной популяции любой заданной формы». Биометрика. 30 (3/4): 391–421. Дои:10.1093 / biomet / 30.3-4.391. JSTOR  2332656.
  • Pitman, E.J.G. (1939). «Проверка гипотез о параметрах расположения и масштаба». Биометрика. 31 (1/2): 200–215. Дои:10.1093 / биомет / 31.1-2.200. JSTOR  2334983.