Регрессия и MS Excel

Обычно зависимую переменную называют результативным при­знаком, а независимую переменную — фактором. Очень часто на­блюдается случай, когда результативный признак зависит не от одно­го, а от многих факторов.

Тогда вместо парной линейной регрессии используют множест­венную линейную регрессию: y = b0 + b1 x1 + b2 x2 +... + bm xm.

Пусть n – число наблюдений, m – число объясняющих перемен­ных.

Excel позволяет при построении уравнения линейной регрессии большую часть работы сделать очень быстро. Важно понять, как ин­терпретировать полученные результаты. Воспользуемся надстройкой Пакет анализа.

СервисАнализ данных → Регрессия → ОК. Появляется диалого­вое окно, которое нужно заполнить. В графе Входной интервал Y: ука­зывается ссылка на ячейки, содержащие значения результативного признака y. В графе Входной интервал X: указывается ссылка на ячейки, содержащие значения факторов х1,..., xm (m < 16). Если первая из ячеек содержит пояснительный текст, то рядом со словом Метки нужно поставить «галочку».

Уровень надежности (доверительная вероятность) по умолчанию предполагается равным 95%. Если исследователя это значение не ус­траивает, то рядом со словами Уровень надежности нужно поставить «галочку» и указать требуемое значение. Поставив «галочку» рядом со словом константа-ноль, исследователь получит b0 = 0 по умолча­нию.

Если нужны значения остатков ei и их график, то нужно поставить «галочки» рядом со словами Остатки и Трафик остатков. Также ука­зываются параметры вывода (Выходной интервал, Новый рабочий лист, Новая рабочая книга). ОК. Появляется итоговое окно.

Если число в графе Значимость F превышает 1 – Уровень надежно­сти, то принимается гипотеза о равенстве нулю коэффициента де­терминации.

Если P-значение превышает 1 – Уровень надежности, то соответст­вующая переменная статистически незначима и ее можно исключить из модели.

Нижние 95% и Верхние 95% – это нижние и верхние границы 95-процентных доверительных интервалов для коэффициентов тео­ретического уравнения линейной регрессии. Если исследователь согласился с принятым по умолчанию значением доверительной вероятности, то последние два столбца будут дублировать два преды­дущих. Если исследователь вводил свое значение доверительной вероятности p, то последние два столбца содержат значения соответ­ственно нижней и верхней границы p -процентных доверительных интервалов.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: