Пакет анализа Excel (программа «Регрессия»)

Расчет параметров уравнения линейной регрессии, проверку их статистической значимости и построения интервальных оценок можно выполнить значительно быстрее автоматически при использовании Пакета анализа Excel (программа «Регрессия»)

Пусть исходные данные примера 2.1 (расходы на питание – личный доход) представлены в Excel.

Выбираем команду Анализ данных→Регрессия.

В диалоговом окне режима Регрессия задаются следующие параметры:

® Входной интервал У – вводится ссылка на ячейки, содержащие данные по результативному признаку.

® Входной интервал Х – вводится ссылка на ячейки, содержащие факторные признаки.

® Метки – установите флажок в активное состояние, если выделены и заголовки столбцов.

® Константа- ноль – установите флажок в активное состояние, если оцениваете регрессионное уравнение без свободного члена.

При необходимости задаются и другие параметры.

Результаты расчетов с использованием инструмента Регрессия выводятся под общим названием Вывод итогов в виде следующих таблиц.

Регрессионная статистика
Множественный R 0,952
R- квадрат 0,907
Нормированный R- квадрат 0,875
Стандартная ошибка 1,817
Наблюдения  

 

Дисперсионный анализ
  df SS MS F Значимость F
Регрессия   96,1 96,1 29,12 0,01247
Остаток   9,9 3,3    
Итого          

 

 

  Коэффи- циенты Стандартная ошибка t-статис- тика P- зна- чение Нижнее 95% Верхние 95%
Y – пересеч. -1,75 1,65 -1,06 0,36669 -7,001 3,501
X 0,775 0,14361 5,40 0,01247 0,318 1,232

 

Результаты работы программы «Регрессия» полностью совпадают с полученными ранее расчетами.

При необходимости выводятся предсказанные значения результативного признака и значения остатков.

 

ВЫВОД ОСТАТКА
Наблюдение Предсказанное у Остатки
  -0,2 1,2
  2,9 -0,9
    -2
  9,1 1,9
  12,2 -0,2

 

Коэффициенты регрессии, их стандартные ошибки и коэффициент детерминации составляют:

a = -1,75; b =0,775; = 1,65; =0,143; = 0,907

Результаты регрессионного анализа принято записывать в виде:

ȳ= -1,75+0,775х; = 0,907,

( 1,65 )( 0,143 )

где в скобках указаны стандартные ошибки коэффициентов регрессии.

Статическая значимость коэффициента = 0,907 устанавливается по F – тесту. Поскольку Значимость F= 0,0124 <α=0,05, то = 0,907 значим при уровне 5%. Модель в целом значима.

Обычно проверка значимости коэффициента а не производится. Оценим статистическую значимость коэффициента b.

Поскольку P – значение = 0,0124 < 0,05, то коэффициент b = 0,775 значим на уровне 5%.

Результаты оценивания регрессии совместимы не только с полученным значением коэффициента регрессии b = 0,775, но и с некоторым его множеством (доверительным интервалом). С вероятностью 95% доверительный интервал коэффициента b есть (0,318 ….1,232).

Пример. Имеются данные (усл. ед.) о расходах на питание y и душевого похода х для девяти групп семей:

х                  
у                  

 

Используя результаты работы программы «Регрессия», проанализируйте зависимость расходов на питание от величины душевого дохода.

Результаты регрессионного анализа записываем в виде:

ȳ= 66,04+0,107 х, = 0,885,

( 11,72 ) ( 0,015 )

где в скобках указаны стандартные ошибки коэффициентов регрессии.

Качество модели оценивается коэффициентов .

Величина = 0,885 означает, что фактором душевого дохода можно объяснить 88,5% вариации (разброса) расходов на питание.

Установим статистическую значимость коэффициента .

Поскольку Значимость F = 0,000158 < α = 0,05, то =0,885 значим при уровне 5%.

Направление связи между переменными у и х определяет знак коэффициента b =0,107 ˃ 0, т.е. связь является прямой(положительной).

Коэффициент b =0,107 показывает, что при увеличении душевого дохода на 1 усл. ед. расходы на питание в среднем увеличиваются на 0,107 усл. ед.

Оценим статистическую значимость коэффициента b. Поскольку Р – значение = 0,000158 < α = 0,05, то коэффициент b =0,107 значим на 5 %-ном уровне. С вероятностью 95% доверительный интервал коэффициента b есть (0,073; 0,142).

Вследствие большой популярности эконометрических исследований на Западе средства построения эконометрических моделей включены во все известные интегрированные офисные средства (Microsoft Office, Perfect Office и т. д.) и табличные процессоры (Excel, Lotus 1-2-3, Quattro Pro и др.).

Рассмотрим методику построения эконометрических моделей с помощью встроенных функций Microsoft Excel.

Построение эконометрических моделей требует выполнения множества расчетов по определению параметров и характеристик.

В зависимости от целей исследования и вида уравнения регрессии расчеты в Excel могут быть выполнены с помощью различных функций ЛИНЕЙН, ЛГРФПРИБЛ, ТЕНДЕНЦИЯ, РОСТ и др.

Приведем методику использования MS Excel для построения эконометрических уравнений на примере линейной регрессии (ЛИНЕЙН).

Встроенная статистическая функция ЛИНЕЙН определяет параметры линейной регрессии:

y=mx+b или y=m1x1 + m2x2 +...+ b,

где зависимое значение y является функцией независимого значения x. Значения m - это коэффициенты, соответствующие каждой независимой переменной x, а b - константа.

Синтаксис:

ЛИНЕЙН (известные значения y; известные значения x; конст; статистика)

известные значения y - это множество значений y, которые уже известны для соотношения y=mx+b.

Массив известные значения х может содержать одно или несколько множеств переменных.

Конст - это логическое значение, которое указывает, требуются ли, чтобы константа b была равна нулю. Константа принимает одно из двух значений ИСТИНА или ЛОЖЬ. Если конст имеет значение истина или опущено, то b вычисляется, если конст имеет значение ЛОЖЬ, то b полагается равным 0.

Статистика - это логическое значение, которое указывает, требуется ли вернуть дополнительную статистику по регрессии.

Статистика также принимает одно из значений ИСТИНА или ЛОЖЬ. В первом случае дополнительная статистика рассчитывается, во втором случае не рассчитывается.

Дополнительные статистические характеристики функции ЛИНЕЙН приведены ниже Дополнительные статистические характеристики функции ЛИНЕЙН приведены ниже:

b, m1, m2,…mn – коэффициенты регрессии (параметры модели);

se1, se­2,...,sen - стандартные значения ошибок для коэффициентов m1,m2,...,mn;

seb - стандартное значение ошибки для постоянной b;

r2 - коэффициент детерминированности;

sey - стандартная ошибка для оценки y;

F - F -статистика, используемая для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет;

df - степени свободы, используемые для нахождения F -критических значений в статистической таблице (для определения уровня надежности модели нужно сравнить значения в таблице с F -статистикой функции ЛИНЕЙН);

ssreg - регрессионая сумма квадратов;

ssresid - остаточная сумма квадратов.

Характеристики выводятся на экран дисплея в виде приведенного ниже массива (таблицы):

 

mn mn-1 m2 m1 b
sen Sen-1 se2 se1 seb
r2 Seу      
F Df      
ssreg ssresid      

 

Порядок выполнения расчетов следующий:

1. Вводятся исходные данные или открывается существующий файл, содержащий исходные данные.

2. В рабочем окне Excel выделяется диапазон ячеек 5*(n +1) (5 число строк, (n +1) - число столбцов, n – число показателей факторов) для вывода результатов расчета.

3. Активизируются "Мастер функций" любым из способов:

а) в главном меню выбирается Вставка/Функция;

б) на панели инструментов Стандартная нажимается кнопка (fx)


4. В появившемся окне "Мастер функций шаг 1 из 2" среди категорий выбирается Статистические, среди функций - ЛИНЕЙН шаг 1 из 2 (рис. 3.1.1)

Рис. 3. 1. 1. Диалоговое окно "Мастер функций шаг 1 из 2"

 

5. В появившемся втором окне "Мастер функций" (рис. 3. 1. 2)

вводятся аргументы, т.е. указываются диапазоны ячеек рабочего окна EXCEL, в которых находятся исходные данные для У и Х, а также значения аргументов константа и статистика.

 

 

Рис. 3. 1. 2. Второе диалоговое окно "Мастер функций"

 

 

Рис. 3. 1. 3. Результат вычисления функции ЛИНЕЙН

6. Нажимается кнопка ОК. В выделенном диапазоне рабочего окна

Excel появляется результат - численное значение для коэффициента регрессии (b). Чтобы вывести всю статистику следует нажать клавишу <F2>, а затем - комбинацию клавиш <Ctrl>+<Shift>+<Enter>.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow