О необходимости проверки модельных предположений

Метод наименьших квадратов является одним из самых популярных в эконометрике. Это связано не только с тем, что его практическая реализация встроена в большинство статистических и эконометрических компьютерных программ, но и со следующими соображениями.

Статистическая значимость коэффициентов регрессии и близкое к единице значение коэффициента детерминации еще не гарантируют высокое качество регрессионной модели. Даже при таких условиях оценки параметров , , …, линейной модели не всегда являются надежными. Во многом это объясняется тем, что они зависят от случайной составляющей , которая в отличие от случайной величины является ненаблюдаемой. Ненаблюдаемость и не позволяет в общем случае делать выводы о точности и достоверности оценок параметров регрессии.

Поэтому для получения надежных (несмещенных, эффективных и состоятельных) оценок параметров регрессии, мы вынуждены при моделировании зависимости от факторов потребовать для выполнения ряда дополнительных условий. Эти условия (таблица 5.1) называются классическими предпосылками МНК или модельными предположениями (они также известны как условия Гаусса-Mapкова).

Как утверждает теорема Гаусса-Маркова, при совокупном выполнении условий 1-4 метод наименьших квадратов для линейной относительно параметров модели дает наилучшие из всех возможных результаты: оценки параметров регрессии являются несмещенными, состоятельными и эффективными, а модель адекватной и надежной.Эти свойства оценок имеют чрезвычайно важное практическое значение (в частности, для принятия решений и прогнозирования).

Несмещенность гарантирует правдоподобность результатов: математическое ожидание оценки каждого параметра регрессии равно его истинному значению, т.е. оценки центрируются вокруг значений истинных коэффициентов.

Эффективность обеспечивает точность: оценки коэффициентов регрессии наиболее компактно группируются вокруг истинных значений параметров. Никакой другой метод оценки коэффициентов не дает меньшую дисперсию для каждого из оцененных коэффициентов, чем МНК. В практических исследованиях свойство несмещенности оценки, дополненное свойством эффективности, создает возможность перехода от точечного оценивания к интервальному.

Состоятельность характеризует увеличение точности оценок с увеличением объема выборки. С ростом числа наблюдений, дисперсия становится меньше, и каждая оценка приближается к истинному значению параметра.

Таблица 5.1. Модельные предположения

1 условие Математическое ожидание случайной переменной равно нулю
2 условие Дисперсия случайной переменной постоянна для всех наблюдений
3 условие Отсутствует систематическая связь между значениями случайной переменной для любых двух наблюдений
4 условие Случайная переменная независима от объясняющих переменных
5 условие Случайная переменная имеет нормальный закон распределения вероятностей с нулевым математическим ожиданием и постоянной дисперсией

Если не выполняются условия 1 или 4, то появляется систематическое смещение; если не выполняются условия 2 или 3 – оценки становятся неэффективными. В обоих случаях модель некорректна.

Условие 4, кроме того, позволяет утверждать, что величина состоит из двух составляющих: объясняемой и случайной. Невыполнение условия 4, в частности, не дает возможности при анализе общей дисперсии разграничивать вклады объясняющих переменных и случайных факторов. Условие 4 имеет значение, если факторные переменные являются случайными величинами. Оно автоматически выполняется, если переменные являются неслучайными величинами.

Условие 5 необходимо для проведения проверки статистических гипотез и определения доверительных интервалов прогноза и коэффициентов регрессии. Невыполнение этого условия приводит к отказу от использования

тестов.

Не следует забывать и о такой предпосылке МНК как правильность спецификации. Под этим понимается следующее:

1) В модели отсутствует недоопределённость (не упущены важные факторы) и переопределённость (не включены ненужные факторы).

2) Модель адекватна устройству данных. Например, если точки наблюдений явно расположены вдоль невидимой экспоненты, логарифма или любой нелинейной функции, то нет смысла строить линейное уравнение регрессии.

В случае множественной регрессии важной предпосылкой МНК является также условие отсутствия в модели мультиколлинеарности.

Если игнорировать проверку выполнимости модельных предположений, то регрессионная модель может оказаться статистически незначимой, а значит, прогнозы по ней будут подвергаться сомнению.

В связи с этим и возникает необходимость рассмотрения методов обнаружения и устранения нарушений предпосылок МНК. Проверка их является важным и неотъемлемым этапом верификации регрессионной модели.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: