Наименее обрезанные квадраты - Least trimmed squares - Wikipedia

Наименее обрезанные квадраты (LTS), или же наименьшая усеченная сумма квадратов, это надежный статистический метод который соответствует функции набора данных, но не подвергается чрезмерному влиянию присутствия выбросы. Это один из многих способов надежная регрессия.

Описание метода

Вместо стандартного наименьших квадратов метод, который минимизирует сумма квадратов остатков над п точек, метод LTS пытается минимизировать сумму квадратов остатков по подмножеству, , из этих точек. Неиспользованный очки не влияют на посадку.

В стандартной задаче наименьших квадратов оценочные значения параметра β определяются как те значения, которые минимизируют целевую функцию S(β) квадратов остатков:

где остатки определяются как различия между значениями зависимые переменные (наблюдения) и модельные значения:

и где п - общее количество точек данных. Для анализа методом наименьших усеченных квадратов эта целевая функция заменяется функцией, построенной следующим образом. Для фиксированного значения β пусть обозначают набор упорядоченных абсолютных значений остатков (в порядке возрастания абсолютного значения). В этих обозначениях стандартная функция суммы квадратов имеет вид

а целевая функция для LTS равна

Вычислительные соображения

Поскольку этот метод является двоичным, в нем точки либо включаются, либо исключаются, закрытого решения не существует. В результате методы поиска решения LTS просматривают комбинации данных, пытаясь найти k подмножество, которое дает наименьшую сумму квадратов остатков. Методы существуют для низких п что найдет точное решение; однако, как п растет, количество комбинаций быстро растет, что дает методы, которые пытаются найти приближенные (но обычно достаточные) решения.

Рекомендации

  • Руссеу, П. Дж. (1984). «Наименьшая медиана квадратов регрессии». Журнал Американской статистической ассоциации. 79 (388): 871–880. Дои:10.1080/01621459.1984.10477105. JSTOR  2288718.
  • Rousseeuw, P.J .; Лерой, А. М. (2005) [1987]. Надежная регрессия и обнаружение выбросов. Вайли. Дои:10.1002/0471725382. ISBN  978-0-471-85233-9.
  • Ли, Л. М. (2005). «Алгоритм для вычисления точной оценки методом наименьших квадратов простой линейной регрессии с ограничениями». Вычислительная статистика и анализ данных. 48 (4): 717–734. Дои:10.1016 / j.csda.2004.04.003.
  • Аткинсон, А. С .; Ченг, Т.-К. (1999). «Вычисление регрессии наименьших обрезанных квадратов с прямым поиском». Статистика и вычисления. 9 (4): 251–263. Дои:10.1023 / А: 1008942604045.
  • Юнг, Канг-Мо (2007). «Оценка наименьших усеченных квадратов в модели ошибок в переменных». Журнал прикладной статистики. 34 (3): 331–338. Дои:10.1080/02664760601004973.