double arrow

Гомоскедастичность и гетероскедастичность дисперсии остатков

Условие независимости дисперсии ошибки от номера наблюдения (от регрессора xi): Е (e i 2) = Var (e i) = s2. i = l,...,n. называется гомоскедастичностъю (homoscedasticity); случай, когда условие гомоскедастичности не выполняется, называется гетероскедастичностъю (heteroscedasticity). На рис. 7.2а приведен пример типичной картинки для случая гомоскедастичности ошибок; на рис. 7.26 — пример данных с гетероскедастичными ошибками (возможно, что в этом примере Var (e i) ~ xi2).

Рис 7.2а Рис. 7.2б

Условие Е (ei ej)= 0 при i ≠ j указывает на некоррелированность ошибок для разных наблюдений. Это условие часто нарушается в случае, когда наши данные являются временными рядами. В случае, когда это условие не выполняется, говорят об автокорреляции ошибок (serial correlation).

Для проверки случайного характера остатков ej, строится график их зависимости от теоретических значений результативного признака. Если на графике получена горизонтальная полоса, то остатки представляют собой случайные величины и МНК оправдан, теоретические значения хорошо аппроксимируют фактические значения yi.

Возможны следующие случаи, если ej зависит от , то:

· Остатки e j не случайны (рис 7.3а)

· Остатки e j не имеют постоянной дисперсии (рис. 7.3в)

· Остатки e j носят систематический характер (рис. 7.3б)

В таких случаях необходимо либо применять другую функцию (например, вводить кусочно-линейные- модели), либо вводить дополнительную информацию и заново строить уравнение регрессии до тех пор, пока остатки не будут случайными величинами.

Предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии с помощью критериев t, F.

Тем не менее, нарушение этого условия не оказывает решающего действия на свойства оценок регрессии, найденных с применением МНК.

20. Коэффициент детерминации R2

Для оценки качества подбора линейной функции рассчитывается коэффициент детерминации. Коэффициент детерминации характеризует долю дисперсии результативного признака y,объясняемую регрессией, в общей регрессии результативного признака: Величина коэффициента детерминации служит одним из критериев оценки качества линейной модели. Чем больше доля объясненной вариации, тем соответственно меньше роль прочих факторов и, следовательно, линейная модель хорошо аппроксимирует исходные данные и ею можно воспользоваться для прогноза.

В силу определения R2 принимает значения между 0 и 1. Если коэффициент детерминации равен 0, то это означает, что регрессия ничего не дает, не улучшает качество предсказания у по сравнению с тривиальным предсказанием у среднее. Чем ближе к 1 значение R2, тем лучше качество подгонки, т.е точность аппроксимации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: