Графический анализ остатков
Обнаружение гетероскедастичности
Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладываются значения (хi) объясняющей переменной X (либо линейной комбинации объясняющих переменных Y = b0 + b1X1 +... + bтХт), а по оси ординат либо отклонения ei, либо их квадраты, i = l, 2,..., п. Примеры таких графиков приведены на рис. 1.
На рис. 1, а все отклонения ei находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий от значений переменной X и их постоянстве, т.е. в этом случае выполняются условия гомо-скедастичности.
На рис. 1, б – д наблюдаются некоторые систематические изменения в соотношениях между значениями хi переменной X и квадратами отклонений. На рис. 1, в отражена линейная, 1, г – квадратичная, 1, д – гиперболическая зависимости между квадратами отклонений и значениями объясняющей переменной X. C итуации, представленные на рис. 1, б – д, отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных.
|
|
Рисунок 1 – Графический анализ
Графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных Xj, j = 1, 2,..., т, отдельно. Чаще же вместо объясняющих переменных Xj по оси абсцисс откладывают значения, i = 1, 2,..., п, получаемые из эмпирического уравнения регрессии. Поскольку по уравнению множественной линейной регрессии является линейной комбинацией хij, j = 1, 2,..., т, i = 1, 2,..., п, то график, отражающий зависимость от, может указать на наличие гетероскедастичности аналогично ситуациям на рис. 1, б – д. Такой анализ наиболее целесообразен при большом количестве объясняющих переменных.
Предполагается, что дисперсии отклонений будут либо увеличиваться, либо уменьшаться с ростом значении х. Пусть п – число наблюдений. Значения переменной х и ранжируются (упорядочиваются по величине). Обозначим через d разность между рангами значений переменной х и.
Коэффициент ранговой корреляции.
Зададим доверительную вероятность р. α = (1 – р)/2. По t-таблицам находим граничную точку
Статистика.
Если t < то на уровне значимости а принимается гипотеза об отсутствии гетероскедастичности. Иначе гипотеза об отсутствии гетероскедастичности отклоняется. В модели, содержащей несколько факторов, проверка гипотезы об отсутствии гетероскедастичности проводится с помощью статистики t для каждого из них отдельно.
|
|
Пример: проверим гипотезу об отсутствии гетероскедастичности с помощью теста ранговой корреляции Спирмена (таблица 1). Доверительная вероятность р = 95%.
Таблица 1 – Расчетная таблица
х | d1 | d2 | d= d1 – d2 | d2 | ||
-0,09 | 0,09 | |||||
0,12 | 0,12 | |||||
0,03 | 0,03 | -2 | ||||
-0,06 | 0.06 | -2 | ||||
Сумма |
Заполним таблицу. Модули элементов второго столица запишем в 3-й столбец. В 4-м и 5-м столбцах ранжированы по убыванию элементы 1-го и 3-го столбцов соответственно, п = 5 наблюдений.
.
α = (1 – р)/ 2 = (1 – 0,95)/ 2 = 0,025. По t -таблицам находим граничную точку = t 0,025;5-2 = 3,182.
Статистика
Мы принимаем гипотезу об отсутствии гетероскедастичности на уровне значимости 5%.