На практике нередки случаи, когда имеются две выборки пар значений зависимой и объясняющей переменных
. Например, одна выборка пар значений переменных объемом
получена при одних условиях, а другая, объемом
, - при несколько измененных условиях. Необходимо выяснить, действительно ли две выборки однородны в регрессионном смысле? Другими словами, можно ли объединить две выборки в одну и рассматривать единую модель регрессии
по
(гипотеза
)?
Для проверки гипотезы
применяется тест Чоу (Chow), состоящий в следующем:
1. Используя МНК, построить модель по выборке объемом
и найти для нее
.
2. Пусть есть основание предполагать, что вся выборка состоит из двух подвыборок объемами
и
соответственно. Для каждой из них строится линейная регрессия.
- сумма квадратов отклонений значений
от регрессионных значений
, посчитанных по первой подвыборке,
– сумма квадратов отклонений значений
от регрессионных значений
, посчитанных по второй подвыборке.

3. Вычислить F – статистику:
,
где
– число объясняющих переменных модели.
4. Найти критическую точку распределения Фишера при выбранном уровне значимости
.
5. Если
, то мы можем объединить две выборки в одну. Если
, то необходимо использовать две модели.
Проведем тест Чоу на материале примера 2.
Для этих данных в таблице 5 приведены результаты построения модели по первым
наблюдениям.
Таблица 5а.
| df | SS | MS | F | Значимость F | |
| Регрессия | 0,1271 | 0,0212 | 41,9637 | 0,0055 | |
| Остаток | ESS1 =0,0015 | 0,0005 | |||
| Итого | 0,1286 |
Таблица 5б.
| Коэффи-циенты | Стандарт-ная ошибка | t-статис-тика | P-Значение | Нижние 95% | Верхние 95% | |
| -1,4996 | 0,9134 | -1,6417 | 0,1992 | -4,4066 | 1,4074 |
| 0,0004 | 0,0014 | 0,3087 | 0,7777 | -0,0040 | 0,0048 |
| 0,0001 | 0,0001 | 1,0128 | 0,3857 | -0,0002 | 0,0004 |
| 0,0155 | 0,0046 | 3,3830 | 0,0430 | 0,0009 | 0,0301 |
| 0,0085 | 0,0052 | 1,6184 | 0,2040 | -0,0082 | 0,0251 |
| 0,0007 | 0,0055 | 0,1355 | 0,9008 | -0,0167 | 0,0182 |
| 0,0069 | 0,0079 | 0,8798 | 0,4437 | -0,0182 | 0,0320 |
В таблице 6 приведены результаты построения модели по последним
наблюдениям. Из таблиц 5 и 6 получаем, что

Отчет по модели, построенной по всем
наблюдениям, приведен в таблице 3.
данного теста совпадает со значением
таблицы 3, т.е.
= 0.0088.
Считаем статистику
и находим табличное значение
= FРАСПОБР(0.05; 7; 11) = 3,0123. Так как
, то справедлива гипотеза
, т.е. надо использовать единую модель по всем наблюдениям.
Таблица 6а.
| df | SS | MS | F | Значимость F | |
| Регрессия | 0,1126 | 0,0188 | 38,6470 | 0,00002 | |
| Остаток | ESS2 = 0,0039 | 0,0005 | |||
| Итого | 0,1165 |
Таблица 6б.
| Коэффи-циенты | Стандарт-ная ошибка | t-статис-тика | P-Значение | Нижние 95% | Верхние 95% | |
| -1,4996 | 0,9134 | -1,6417 | 0,1992 | -4,4066 | 1,4074 |
| 0,0004 | 0,0014 | 0,3087 | 0,7777 | -0,0040 | 0,0048 |
| 0,0001 | 0,0001 | 1,0128 | 0,3857 | -0,0002 | 0,0004 |
| 0,0155 | 0,0046 | 3,3830 | 0,0430 | 0,0009 | 0,0301 |
| 0,0085 | 0,0052 | 1,6184 | 0,2040 | -0,0082 | 0,0251 |
| 0,0007 | 0,0055 | 0,1355 | 0,9008 | -0,0167 | 0,0182 |
| 0,0069 | 0,0079 | 0,8798 | 0,4437 | -0,0182 | 0,0320 |
Тесты на гетероскедастичность.
Гомоскедастичность – дисперсия каждого отклонения
одинакова для всех значений
.
Гетероскедастичность – дисперсия объясняемой переменной (а следовательно, и случайных ошибок) не постоянна.
В тестах на гетероскедастичность проверяется основная гипотеза
(т.е. модель гомоскедастична) против альтернативной гипотезы
: не
(т.е. модель гетероскедастична).






