Проверка значимости уравнения и его параметров

 

После того как найдено уравнение линейной регрессии, проводится оценка значимости как уравнения в целом, так и отдельных его параметров.

Чтобы иметь общее суждение о качестве модели, определяют среднюю ошибку аппроксимации. Средняя ошибка аппроксимации оценивает точность модели, рассчитывается как среднее отклонение теоретических значений  от эмпирических значений yi.

Ошибка аппроксимации в пределах 5%-7% свидетельствует о хорошем качестве подбора уравнения регрессии к исходным данным. Допустимый предел не более 8%-10%.

Таблица 4 – Расчет средней ошибки аппроксимации

№ наблюдения, хi Объем продаж (эмпирический ряд), yi Объем продаж (теоретический ряд), Ошибка аппроксимации, Аi
1 15668,25 14318,51 8,61
2 13496,87 14144,06 4,80
3 12021,97 11971,12 0,42
4 13582,01 12680,77 6,64
5 14276,34 14958,58 4,78
6 12789,01 16026,2 25,31
7 18617,17 17457,8 6,23
8 18667,22 18256,6 2,20
9 18166,07 17471,26 3,82
Итого 137284,91 137284,9 62,81
Среднее 15253,88 15253,88 6,98

Для оценки качества модели используется коэффициент детерминации R2, который рассчитывается как квадрат линейного коэффициента корреляции, .

Коэффициент детерминации принимает значения от 0 до 1. Чем ближе значение коэффициента к 1, тем сильнее зависимость. При оценке регрессионных моделей это интерпретируется как соответствие модели данным. Для приемлемых моделей предполагается, что коэффициент детерминации должен быть хотя бы не меньше 50%. Модели с коэффициентом детерминации выше 80% можно признать хорошими. Значение коэффициента детерминации 1 означает функциональную зависимость между переменными.

Для рассмотренного примера:

Полученная модель по данному критерию оценивается как приемлемая.

Оценка значимости уравнения регрессии производится на основе F –критерия Фишера. Fфакт расчетное значение F -критерия (критерия Фишера) определяется по формуле:

где п  – число наблюдений, т – число объясняющих переменных.

Для уравнения парной линейной регрессии т = 1, поэтому значение F для оценки качества модели парной линейной регрессии оценивается по формуле:

Расчетное значение F -критерия сравнивается с табличным (критическим) для выбранного уровня значимости α (в общем случае α принимается равным 0,05) и чисел степеней свободы: k 1 = m и k 2 = n – m.

Если фактическое значение F -критерия превышает его табличное значение, то уравнение регрессии признается статистически значимым, то есть позволяет установить, соответствует ли математическая модель, выражающая зависимость между переменными, эмпирическим данным и достаточно ли включенных в уравнение регрессии объясняющих переменных для описания объясняемой переменной.

Для рассмотренного примера:

Табличное значение при k 1 = 1 и k 2 = 9 – 2 = 7 составляет 5,50. Поскольку расчетное значение превышает табличное, уравнение признается статистически значимым.

Значимость отдельных параметров уравнения регрессии оценивается по показателям стандартной ошибки. С этой целью по каждому из параметров определяется его стандартная ошибка: mb и ma. Величина стандартной ошибки коэффициента регрессии позволяет оценить отклонение полученного расчетным путем коэффициента от его истинного значения.

Стандартная ошибка коэффициента регрессии b определяется по формуле:

Стандартная ошибка коэффициента регрессии a определяется по формуле:

Величина ошибки коэффициента корреляции определяется по формуле:

Таблица 5 – Исходные данные для расчета значений стандартной ошибки коэффициентов регрессии

№ наблюдения Расходы на рекламу, хi Объем продаж (эмпирический ряд), yi Объем продаж (теоретический ряд),
1 1515,83 2297740,5 -104,18 10853,47 15668,25 14318,51 1349,74 1821798,07
2 1496,40 2239212,9 -123,61 15279,43 13496,87 14144,06 -647,19 418854,896
3 1254,38 1573469,1 -365,63 133685,3 12021,97 11971,12 50,85 2585,7225
4 1333,42 1778008,8 -286,59 82133,83 13582,01 12680,77 901,24 812233,538
5 1587,12 2518949,8 -32,89 1081,75 14276,34 14958,58 -682,24 465451,418
6 1706,03 2910538,3 86,02 7399,44 12789,01 16026,2 -3237,19 10479399,1
7 1865,48 3480015,6 245,47 60255,52 18617,17 17457,8 1159,37 1344138,8
8 1954,45 3819874,8 334,44 111850,1 18667,22 18256,6 410,62 168608,784
9 1866,98 3485614,3 246,97 60994,18 18166,07 17471,26 694,81 482760,936
Итого 14580,0 24103424, 483533,0 137284,9 137284,9 0,01 15995831,3
Среднее 1620,01 53725,89 15253,88 15253,88

 

Стандартная ошибка коэффициента регрессии b:

Стандартная ошибка коэффициента регрессии a:

Ошибка коэффициента корреляции:

Значимость коэффициентов регрессии и коэффициента корреляции оценивается с помощью t -статистики Стьюдента. Для оценки существенности коэффициентов для них определяется фактическое значение t -критерия Стьюдента.

Для коэффициента регрессии b:

Для коэффициента регрессии а:

Для коэффициента корреляции rxy:

Полученные расчетные значения сравниваются с табличными значениями t -критерия Стьюдента (t с) при определенном уровне значимости α и числе степеней свободы k = n – 2.

При | t | > tс коэффициент является статистически значимым;

При | t | ≤ tс коэффициент является статистически незначимым.

Для рассмотренного примера расчетные значения составляют:

Табличное значение tс (0,05; 7) составляет 2,3646. Следовательно, коэффициент регрессии b и коэффициент корреляции являются статистически значимыми, а коэффициент регрессии a статистически незначим (при отсутствии расходов на рекламу объем продаж будет отличаться от расчетного значения 708,8570 тыс. руб.).

Полученные оценки коэффициентов регрессии являются точечными. Для получения интервальной оценки, которая предпочтительна, рассчитываются доверительные интервалы:

Для рассмотренного примера:

 (−0,7876;18,7444);

(708,3857;709,3283) – оценка формальная, так как коэффициент статистически незначим.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: