Тест ранговой корреляции Спирмена

Графический анализ остатков

Обнаружение гетероскедастичности

Использование графического представления отклонений позволяет определиться с наличием гетероскедастичности. В этом случае по оси абсцисс откладываются значения (хi) объясняющей переменной X (либо линейной комбинации объясняющих переменных Y = b0 + b1X1 +... + bтХт), а по оси ординат либо отклонения ei, либо их квадраты, i = l, 2,..., п. Примеры таких графиков приведены на рис. 1.

На рис. 1, а все отклонения ei находятся внутри полуполосы постоянной ширины, параллельной оси абсцисс. Это говорит о независимости дисперсий от значений переменной X и их постоянстве, т.е. в этом случае выполняются условия гомо-скедастичности.

На рис. 1, б – д наблюдаются некоторые систематические изменения в соотношениях между значениями хi переменной X и квадратами отклонений. На рис. 1, в отражена линейная, 1, г – квадратичная, 1, д – гиперболическая зависимости между квадратами отклонений и значениями объясняющей переменной X. C итуации, представленные на рис. 1, б – д, отражают большую вероятность наличия гетероскедастичности для рассматриваемых статистических данных.

Рисунок 1 – Графический анализ

Графический анализ отклонений является удобным и достаточно надежным в случае парной регрессии. При множественной регрессии графический анализ возможен для каждой из объясняющих переменных Xj, j = 1, 2,..., т, отдельно. Чаще же вместо объясняющих переменных Xj по оси абсцисс откладывают значения, i = 1, 2,..., п, получаемые из эмпирического уравнения регрессии. Поскольку по уравнению множественной линейной регрессии является линейной комбинацией хij, j = 1, 2,..., т, i = 1, 2,..., п, то график, отражающий зависимость от, может указать на наличие гетероскедастичности аналогично ситуациям на рис. 1, б – д. Такой анализ наиболее целесообразен при большом количестве объясняющих переменных.

Предполагается, что дисперсии отклонений будут либо увеличиваться, либо уменьшаться с ростом значении х. Пусть п – число наблюдений. Значения переменной х и ранжируются (упорядочиваются по величине). Обозначим через d разность между рангами значений переменной х и.

Коэффициент ранговой корреляции.

Зададим доверительную вероятность р. α = (1 – р)/2. По t-таблицам находим граничную точку

Статистика.

Если t < то на уровне значимости а принимается гипотеза об отсутствии гетероскедастичности. Иначе гипотеза об отсутствии гетероскедастичности отклоняется. В модели, содержащей несколько факторов, проверка гипотезы об отсутствии гетероскедастичности проводится с помощью статистики t для каждого из них отдельно.

Пример: проверим гипотезу об отсутствии гетероскедастичности с помощью теста ранговой корреляции Спирмена (таблица 1). Доверительная вероятность р = 95%.

Таблица 1 – Расчетная таблица

х     d1 d2 d= d1 – d2 d2
             
  -0,09 0,09        
  0,12 0,12        
  0,03 0,03     -2  
  -0,06 0.06     -2  
Сумма            

Заполним таблицу. Модули элементов второго столица запишем в 3-й столбец. В 4-м и 5-м столбцах ранжированы по убыванию элементы 1-го и 3-го столбцов соответственно, п = 5 наблюдений.

.

α = (1 – р)/ 2 = (1 – 0,95)/ 2 = 0,025. По t -таблицам находим граничную точку = t 0,025;5-2 = 3,182.

Статистика

Мы принимаем гипотезу об отсутствии гетероскедастичности на уровне значимости 5%.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: