Проверка общего качества уравнения регрессии.
После того, как получено уравнение линейной регрессии, обязательно проводится оценка его значимости. Центральное место при этом занимает анализ трех сумм:
- общая сумма квадратов отклонений изучаемого показателя y от его среднего арифметического значения
- сумма квадратов отклонений y, объясняемая регрессией
- остаточная сумма квадратов отклонений y, объясняемая влиянием неучтенных при моделировании факторов
Общая сумма квадратов отклонений = сумма квадратов отклонений y, объясняемая регрессией + остаточная сумма квадратов отклонений y
Одним из показателей качества построенного уравнения регрессии является коэффициент детерминации.
Коэффициент детерминации называют также квадратом множественной корреляции. Для случая парной регрессии это квадрат коэффициента корреляции переменных x и y. Коэффициент детерминации показывает долю дисперсии, объясняемую с помощью уравнения регрессии, в общей дисперсии показателя у. Другими словами, коэффициент детерминации показывает, какую часть вариации (изменения) результативной переменной Y объясняет вариация (изменение) фактора X.
|
|
Коэффициент детерминации d рассчитывается по формуле:
Коэффициент детерминации принимает значения от 0 (отсутствует линейная связь) до 1 (отсутствует корреляционная связь между показателями). Чем ближе этот коэффициент к 1, тем лучше подобрана модель для описания конкретного экономического явления. Для парной регрессии коэффициент детерминации равен квадрату коэффициента корреляции.
Коэффициент корреляции показывает, насколько значимым является влияние переменной X на Y, т.е.является мерой линейной связи между случайными величинами x и y. Для линейной регрессии коэффициент корреляции.
,
Изменяется в диапазоне от –1 до +1. Чем ближе абсолютное значение коэффициента к единице, тем теснее связь.
Можно считать, что:
1) если , то имеется прямая линейная связь между переменными Х и Y;
2) если , то имеется обратная линейная связь между переменными Х и Y;
3) если (), то линейная связь между переменными Х и Y отсутствует.
Считается, что связь достаточно сильная, если коэффициент по абсолютной величине превышает 0,7, и слабая, если он менее 0,3.
Оценка статистической значимости уравнения регрессии в целом осуществляется с помощью F-критерия Фишера. Проверяется гипотеза Н0 о статистической незначимости уравнения регрессии. Для этого рассчитывается фактическое значение критерия по формуле
, где n –число наблюдений, m- число параметров при переменных X.
Fтабл – это максимально возможное значение критерия, которое могло сформироваться под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Уровень значимости a – вероятность отвергнуть правильную гипотезу при условии, что она верна. Имеются таблицы критических (табличных) значений F-критерия. Если Fтабл < Fфакт, то гипотеза Н0 о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность.
|
|