Статистический анализ модели

Проверка общего качества уравнения регрессии.

 

После того, как получено уравнение линейной регрессии, обязательно проводится оценка его значимости. Центральное место при этом занимает анализ трех сумм:

- общая сумма квадратов отклонений изучаемого показателя y от его среднего арифметического значения

- сумма квадратов отклонений y, объясняемая регрессией

- остаточная сумма квадратов отклонений y, объясняемая влиянием неучтенных при моделировании факторов

Общая сумма квадратов отклонений = сумма квадратов отклонений y, объясняемая регрессией + остаточная сумма квадратов отклонений y

Одним из показателей качества построенного уравнения регрессии является коэффициент детерминации.

  Коэффициент детерминации называют также квадратом множественной корреляции. Для случая парной регрессии это квадрат коэффициента корреляции переменных x и   y. Коэффициент детерминации показывает долю дисперсии, объясняемую с помощью уравнения регрессии, в общей дисперсии показателя у. Другими словами, коэффициент детерминации  показывает, какую часть вариации (изменения) результативной переменной Y объясняет вариация (изменение) фактора X.

Коэффициент детерминации d рассчитывается по формуле:

 Коэффициент детерминации принимает значения от 0 (отсутствует линейная связь) до 1 (отсутствует корреляционная связь между показателями). Чем ближе этот коэффициент к 1, тем лучше подобрана модель для описания конкретного экономического явления. Для парной регрессии коэффициент детерминации равен квадрату коэффициента корреляции.

 Коэффициент корреляции показывает,  насколько значимым является влияние переменной X на Y, т.е.является мерой линейной связи между случайными величинами x и y. Для линейной регрессии коэффициент корреляции.

,

Изменяется в диапазоне от –1 до +1. Чем ближе абсолютное значение коэффициента к единице, тем теснее связь.

Можно считать, что:

1) если , то имеется прямая линейная связь между переменными Х и Y;

2) если , то имеется обратная линейная связь между переменными Х и Y;

3) если  (), то линейная связь между переменными Х и Y отсутствует.

 Считается, что связь достаточно сильная, если коэффициент по абсолютной величине превышает 0,7, и слабая, если он менее 0,3.

   

Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. Проверяется гипотеза Н0 о статистической незначимости уравнения регрессии. Для этого рассчитывается фактическое значение критерия по формуле

 , где n –число наблюдений, m- число параметров при переменных X. 

Fтабл – это максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы и уровне значимости  a.  Уровень значимости a – вероятность отвергнуть правильную гипотезу при условии, что она верна. Имеются таблицы критических (табличных) значений F-критерия. Если       Fтабл < Fфакт, то гипотеза Н0 о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: