Чау-тест - Chow test - Wikipedia

В Чау-тест(Мандарин: 鄒檢定), предложенный эконометрист Грегори Чоу в 1960 году, это проверка того, являются ли истинные коэффициенты в двух линейная регрессия на разных наборах данных равны. В эконометрике он чаще всего используется в анализ временных рядов проверить наличие структурный разрыв в период, который можно считать известным априори (например, крупное историческое событие, такое как война). В оценка программы, тест Чоу часто используется для определения того, оказывают ли независимые переменные разное влияние на разные подгруппы населения.

Иллюстрации

Применение теста Чау
Структурный разрыв (уклоны разные)	Оценка программы (точки пересечения различаются)

В ${ displaystyle x = 1,7}$ есть структурный разрыв; отдельные регрессии на подынтервалы ${ displaystyle [0,1.7]}$ и ${ displaystyle [1,7,4]}$ дает лучшую модель, чем комбинированная регрессия (пунктирная линия) на всем интервале.	Сравнение двух разных программ (красный, зеленый) в общем наборе данных: отдельные регрессии для обеих программ дают лучшую модель, чем комбинированная регрессия (черный).

Первый тест чау

Предположим, что мы моделируем наши данные как

{ displaystyle y_ {t} = a + bx_ {1t} + cx_ {2t} + varepsilon. ,}

Если мы разделим наши данные на две группы, мы получим

{ displaystyle y_ {t} = a_ {1} + b_ {1} x_ {1t} + c_ {1} x_ {2t} + varepsilon ,}

и

{ displaystyle y_ {t} = a_ {2} + b_ {2} x_ {1t} + c_ {2} x_ {2t} + varepsilon. ,}

В нулевая гипотеза теста Чау утверждает, что ${ displaystyle a_ {1} = a_ {2}}$ , ${ displaystyle b_ {1} = b_ {2}}$ , и ${ displaystyle c_ {1} = c_ {2}}$ , и есть предположение, что ошибки модели ${ displaystyle varepsilon}$ находятся независимые и одинаково распределенные из нормальное распределение с неизвестным отклонение.

Позволять ${ displaystyle S_ {C}}$ быть суммой в квадрате остатки из объединенных данных, ${ displaystyle S_ {1}}$ быть суммой в квадрате остатки из первой группы, и ${ displaystyle S_ {2}}$ быть суммой в квадрате остатки из второй группы. ${ displaystyle N_ {1}}$ и ${ displaystyle N_ {2}}$ количество наблюдений в каждой группе и ${ displaystyle k}$ - общее количество параметров (в данном случае 3, т.е. 2 коэффициента независимых переменных + точка пересечения). Тогда статистика критерия Чоу равна

{ displaystyle { frac {(S_ {C} - (S_ {1} + S_ {2})) / k} {(S_ {1} + S_ {2}) / (N_ {1} + N_ {2 } -2k)}}.}

Статистика теста соответствует F-распределение с ${ displaystyle k}$ и ${ displaystyle N_ {1} + N_ {2} -2k}$ степени свободы.

Тот же результат может быть достигнут с помощью фиктивных переменных.

Рассмотрим два сравниваемых набора данных. Во-первых, это «первичный» набор данных i = {1, ..., ${ displaystyle n_ {1}}$ } и «вторичный» набор данных i = { ${ displaystyle n_ {1}}$ +1, ..., n}. Тогда существует объединение этих двух множеств: i = {1, ..., n}. Если нет структурных изменений между первичными и вторичными наборами данных, можно провести регрессию по объединению без возникновения проблемы смещения оценок.

Рассмотрим регрессию:

${ displaystyle y_ {t} = beta _ {0} + beta _ {1} x_ {1t} + beta _ {3} x_ {2t} + ... + beta _ {k} x_ {kt } + gamma _ {0} D_ {t} + sum _ {i = 1} ^ {k} gamma _ {i} x_ {it} D_ {t} + varepsilon _ {t}. ,}$

Которая выполняется по i = {1, ..., n}.

D - фиктивная переменная, принимающая значение 1 для i = { ${ displaystyle n_ {1}}$ +1, ..., n} и 0 в противном случае.

Если оба набора данных можно полностью объяснить с помощью ${ displaystyle ( beta _ {0}, beta _ {1}, ..., beta _ {k})}$ тогда фиктивная переменная не используется, поскольку набор данных полностью объясняется ограниченным уравнением. Таким образом, при условии отсутствия структурных изменений у нас есть нулевая и альтернативная гипотеза:

${ displaystyle H_ {0}: gamma _ {0} = 0, gamma _ {1} = 0, ..., gamma _ {k} = 0}$

${ displaystyle H_ {1}: в противном случае}$

Нулевая гипотеза о совместной незначимости D может быть запущена как F-тест с n-2 (k + 1) степенями свободы. То есть: ${ displaystyle F = { frac {(RSS ^ {R} -RSS ^ {U}) / (k + 1)} {RSS ^ {U} / DoF}}}$ .

Замечания

Глобальную сумму квадратов (SSE) часто называют Ограниченной суммой квадратов (RSSM), поскольку мы в основном тестируем модель с ограничениями, в которой у нас есть ${ displaystyle 2k}$ предположения (с ${ displaystyle k}$ количество регрессоров).
Некоторое программное обеспечение, такое как SAS, будет использовать прогнозирующий тест Чоу, когда размер подвыборки меньше количества регрессоров.

внешняя ссылка

Вычисление статистики Чоу, Тесты Чоу и Уолда, Чау-тесты: Серия объяснений FAQ из Stata Корпорация в https://www.stata.com/support/faqs/
[1]: Серия объяснений FAQ из SAS Корпорация

Чау-тест - Chow test - Wikipedia

Содержание

Иллюстрации

Первый тест чау

Рекомендации

внешняя ссылка