Тест ранговой корреляции Спирмена

Графический анализ остатков

Обнаружение гетероскедастичности

Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладываются значения (х_i) объясняющей переменной X (либо линейной комбинации объясняющих переменных Y = b₀ + b₁X₁ +... + b_тХ_т), а по оси ординат либо отклонения e_i, либо их квадраты, i = l, 2,..., п. Примеры таких графиков приведены на рис. 1.

На рис. 1, а все отклонения e_i находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий от значений переменной X и их постоянстве, т.е. в этом случае выполняются условия гомо-скедастичности.

На рис. 1, б – д наблюдаются некоторые систематические изменения в соотношениях между значениями х_i переменной X и квадратами отклонений. На рис. 1, в отражена линейная, 1, г – квадратичная, 1, д – гиперболическая зависимости между квадратами отклонений и значениями объясняющей переменной X. C итуации, представленные на рис. 1, б – д, отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных.

Рисунок 1 – Графический анализ

Графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных X_j, j = 1, 2,..., т, отдельно. Чаще же вместо объясняющих переменных X_j по оси абсцисс откладывают значения, i = 1, 2,..., п, получаемые из эмпирического уравнения регрессии. Поскольку по уравнению множественной линейной регрессии является линейной комбинацией х_ij, j = 1, 2,..., т, i = 1, 2,..., п, то график, отражающий зависимость от, может указать на наличие гетероскедастичности аналогично ситуациям на рис. 1, б – д. Такой анализ наиболее целесообразен при большом количестве объясняющих переменных.

Предполагается, что дисперсии отклонений будут либо увеличиваться, либо уменьшаться с ростом значении х. Пусть п – число наблюдений. Значения переменной х и ранжируются (упорядочиваются по величине). Обозначим через d разность между рангами значений переменной х и.

Коэффициент ранговой корреляции.

Зададим доверительную вероятность р. α = (1 – р)/2. По t-таблицам находим граничную точку

Статистика.

Если t < то на уровне значимости а принимается гипотеза об отсутствии гетероскедастичности. Иначе гипотеза об отсутствии гетероскедастичности отклоняется. В модели, содержащей несколько факторов, проверка гипотезы об отсутствии гетероскедастичности проводится с помощью статистики t для каждого из них отдельно.

Пример: проверим гипотезу об отсутствии гетероскедастичности с помощью теста ранговой корреляции Спирмена (таблица 1). Доверительная вероятность р = 95%.

Таблица 1 – Расчетная таблица

х			d₁	d₂	d= d₁ – d₂	d²

	-0,09	0,09
	0,12	0,12
	0,03	0,03			-2
	-0,06	0.06			-2
Сумма

Заполним таблицу. Модули элементов второго столица запишем в 3-й столбец. В 4-м и 5-м столбцах ранжированы по убыванию элементы 1-го и 3-го столбцов соответственно, п = 5 наблюдений.

α = (1 – р)/ 2 = (1 – 0,95)/ 2 = 0,025. По t -таблицам находим граничную точку = t _0,025;5-2 = 3,182.

Статистика

Мы принимаем гипотезу об отсутствии гетероскедастичности на уровне значимости 5%.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: