Регрессионный анализ. Параметры линейноймодели регрессии в Excel получают с помощью встроенной функции линейн

Параметры линейноймодели регрессии в Excel получают с помощью встроенной функции ЛИНЕЙН:

ЛИНЕЙН(изв_знач_Y, изв_знач_Х, конст, статистика).

В Calc аналогичная функция называется LINEST:

LINEST(изв_знач_Y, изв_знач_Х, тип линии, статистика).

Первые два аргумента задают диапазоны размещения выборочных данных для результативного и факторного признаков, соответственно. Два последних аргумента имеют логический тип с допустимыми значениями «истина» или «ложь» (1 или 0 в цифровом варианте). Если конст (тип линии) полагается равным «истина» либо отсутствует, то свободный член b 0 в уравнении регрессии может быть любым, в противном случае (конст – «ложь») b 0 принудительно полагается равным нулю. Последний аргумент статистика указывает, требуется ли вычислять дополнительную статистику по регрессии: если здесь введено значение «истина», то дополнительная статистика выдается, в противном случае (статистика – «ложь» или отсутствует) вычисляются только коэффициенты выборочного уравнения регрессии b 0 и b 1.

Поскольку в полном варианте (с дополнительной статистикой) функции ЛИНЕЙН и LINEST выдают массивы значений, их следует вводить специальным образом, а именно:

­ выделяют блок из пяти строк и двух столбцов, необходимый для размещения результатов;

­ в Мастере функций выбирают ЛИНЕЙН или LINEST;

­ в диалоговом окне указывают аргументы: (изв_знач_Y, изв_знач_Х, 1, 1);

­ команда на исполнение: <Ctrl>+<Shift>+<Enter> (! не используя кнопку «ОК»).

При правильном обращении к встроенной функции выделенная под результаты область заполняется следующим образом.

Угловой коэффициент b 1 Свободный член b 0
Стандартная ошибка b 1 Стандартная ошибка b 0
Коэффициент детерминации R2 Стандартная ошибка регрессии S
F-статистика Фишера Число степеней свободы ν
Регрессионная дисперсия Остаточная дисперсия

Перечисленные здесь параметры модели линейной регрессии не нуждаются в дополнительном разъяснении. Напомним только, что статистика Фишера Fm,v при m = 1 равна квадрату статистики Стьюдента. Тогда наблюдаемое значение
t -статистики его используют при проверке гипотез о значимости параметров регрессионной модели.

Таким образом, построение уравнения регрессии и его статистический анализ, аналогичный по полноте рассмотренному выше «ручному» варианту, обеспечивается автоматизированными средствами MS Excel и OO Calc.

Продемонстрируем сказанное на том же примере изучения связи между размером прожиточного минимума Y и величиной расходов на питание X (рис. 13).

Рис. 13. Выборочные данные

1. Размер прожиточного минимума (Y) является результативным признаком, а величина расходов на питание (X) – факторным признаком.

2. Корреляционное поле (рис. 14), представляющее данные рис. 13, строим с помощью Мастера диаграмм (тип диаграммы – «Точечная»).

Рис. 14. Корреляционное поле для изучаемых признаков

3. По виду корреляционного поля предполагаем, что линейная функция f (x) = β0 + β1 ∙x пригодна для описания связи между Х и Y.

4. Для вычисления выборочного коэффициента корреляции в Excel используем функцию КОРРЕЛ, а в Calc – CORREL, в качестве аргументов укажем область размещения массивов X и Y (рис. 13):

КОРРЕЛ(В2:В6; С2:С6), или CORREL(В2:В6; С2:С6).

Полученная в результате оценка коэффициента корреляции rxy проверяется на существенное отличие от нуля.

В нашем примере получим rxy = 0,952, тогда наблюдаемое значение t -статистики:

Критические точки распределения Стьюдента для заданного уровня значимости a и числа степеней свободы n = n – 2 в Excel находят с помощью встроенной функции СТЬДРАСПОБР(a, n). Соответствующая функция в Calc – TINV(a, n).

Для нашего примера, по результатам применения СТЬДРАСПОБР(0,05;3) (или TINV(0,05;3)), найдём критическое значение t (a/2, n) = 3,18.

Так как коэффициент корреляции статистически значим.

5. Параметры модели линейной регрессии находим с помощью следующих функций:

ЛИНЕЙН(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter>, либо

LINEST(С2:С6; В2:В6; 1; 1) <Ctrl><Shift><Enter>.

Заметим, что здесь наиболее частая ошибка – несинхронное нажатие клавиш <Ctrl><Shift><Enter>. Ошибка сразу же обнаружится: вместо ожидаемых десяти значений получится всего одно! Для исправления вернитесь в строку формул и повторите запуск (<Ctrl><Shift><Enter>) аккуратно.

Результат работы функции ЛИНЕЙН (или LINEST) для нашего примера представлен на рис. 15.

Рис. 15. Оценки параметров линейной регрессии в примере

Оценки коэффициентов уравнения регрессии b 0 и b 1 указаны в ячейках В10 и А10 (рис. 15), соответственно, тогда выборочное уравнение регрессии имеет вид: = 6,25+0,775∙ х.

6. Оценка значимости коэффициентов b 0 и b 1.

Стандартные ошибки коэффициентов уравнения регрессии и приведены в ячейках А11 и В11 (рис. 15), соответственно. Тогда наблюдаемые значения t -статистик:

; .

Сравнение этих величин с найденным ранее (в п. 4) критическим значением t (a/2, n) = 3,18, свидетельствует о значимости коэффициентов уравнения регрессии.

Параметры модели, найденные выше, обеспечивают построение доверительных интервалов для теоретических коэффициентов уравнения регрессии b1 и b0. При заданном уровне значимости a = 0,05 имеем:

0,775 – 3,18×0,143 < b1 < 0,775 + 3,18×0,143, или

0,32 < b1 < 1,23;

6,25 – 3,18×1,65 < β0 < 6,25 + 3,18×1,65, или

1,003 < β0 < 11,497.

7. Коэффициент детерминации R2 = rxy 2 ≈ 0,91 приведен в ячейке А12 (рис. 15), его значимость следует из установленной выше (в п. 4) значимости коэффициента корреляции.

Таким образом, полученные в электронных таблицах результаты подтверждают правильность «ручного» варианта решения поставленной задачи. Понятно, что вывод также сохраняется.

Варианты к заданию № 1

В таблице (табл. 15) приведены данные величины прибыли (млн руб.) магазинов в зависимости от их площади (м2). Изучить парную зависимость этих признаков по приведённым выборочным значениям.

Таблица 15

№ варианта п/п № магазина
         
Вариант 1
Площадь          
Прибыль 0,5 0,7 1,1 1,5 2,0
Вариант 2
Площадь          
Прибыль 0,6 0,8 1,2 1,5 2,0
Вариант 3
Площадь          
Прибыль 0,5 0,8 1,2 1,5 1,9
Вариант 4
Площадь          
Прибыль 0,5 0,7 1,2 1,5 1,8
Вариант 5
Площадь          
Прибыль 0,5 0,7 1,2 1,5 2,0
Вариант 6
Площадь          
Прибыль 0,6 0,8 1,2 1,4 2,0
                   

Продолжение табл. 15

№ варианта п/п № магазина
         
Вариант 7
Площадь          
Прибыль 0,5 0,8 1,1 1,5 1,9
Вариант 8
Площадь          
Прибыль 0,5 0,7 1,0 1,5 1,8
Вариант 9
Площадь          
Прибыль 0,5 0,7 1,2 1,5 2,0
Вариант 10
Площадь          
Прибыль 0,6 0,8 1,2 1,4 2,0
                   

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: