Пакет анализа Excel (программа «Регрессия»)

Расчет параметров уравнения линейной регрессии, проверку их статистической значимости и построения интервальных оценок можно выполнить значительно быстрее автоматически при использовании Пакета анализа Excel (программа «Регрессия»)

Пусть исходные данные примера 2.1 (расходы на питание – личный доход) представлены в Excel.

Выбираем команду Анализ данных→Регрессия.

В диалоговом окне режима Регрессия задаются следующие параметры:

® Входной интервал У – вводится ссылка на ячейки, содержащие данные по результативному признаку.

® Входной интервал Х – вводится ссылка на ячейки, содержащие факторные признаки.

® Метки – установите флажок в активное состояние, если выделены и заголовки столбцов.

® Константа- ноль – установите флажок в активное состояние, если оцениваете регрессионное уравнение без свободного члена.

При необходимости задаются и другие параметры.

Результаты расчетов с использованием инструмента Регрессия выводятся под общим названием Вывод итогов в виде следующих таблиц.

Регрессионная статистика
Множественный R	0,952
R- квадрат	0,907
Нормированный R- квадрат	0,875
Стандартная ошибка	1,817
Наблюдения

Дисперсионный анализ
	df	SS	MS	F	Значимость F
Регрессия		96,1	96,1	29,12	0,01247
Остаток		9,9	3,3
Итого

	Коэффи- циенты	Стандартная ошибка	t-статис- тика	P- зна- чение	Нижнее 95%	Верхние 95%
Y – пересеч.	-1,75	1,65	-1,06	0,36669	-7,001	3,501
X	0,775	0,14361	5,40	0,01247	0,318	1,232

Результаты работы программы «Регрессия» полностью совпадают с полученными ранее расчетами.

При необходимости выводятся предсказанные значения результативного признака и значения остатков.

ВЫВОД ОСТАТКА
Наблюдение	Предсказанное у	Остатки
	-0,2	1,2
	2,9	-0,9
		-2
	9,1	1,9
	12,2	-0,2

Коэффициенты регрессии, их стандартные ошибки и коэффициент детерминации составляют:

a = -1,75; b =0,775; = 1,65; =0,143; = 0,907

Результаты регрессионного анализа принято записывать в виде:

ȳ= -1,75+0,775х; = 0,907,

( 1,65 )( 0,143 )

где в скобках указаны стандартные ошибки коэффициентов регрессии.

Статическая значимость коэффициента = 0,907 устанавливается по F – тесту. Поскольку Значимость F= 0,0124 <α=0,05, то = 0,907 значим при уровне 5%. Модель в целом значима.

Обычно проверка значимости коэффициента а не производится. Оценим статистическую значимость коэффициента b.

Поскольку P – значение = 0,0124 < 0,05, то коэффициент b = 0,775 значим на уровне 5%.

Результаты оценивания регрессии совместимы не только с полученным значением коэффициента регрессии b = 0,775, но и с некоторым его множеством (доверительным интервалом). С вероятностью 95% доверительный интервал коэффициента b есть (0,318 ….1,232).

Пример. Имеются данные (усл. ед.) о расходах на питание y и душевого похода х для девяти групп семей:

х
у

Используя результаты работы программы «Регрессия», проанализируйте зависимость расходов на питание от величины душевого дохода.

Результаты регрессионного анализа записываем в виде:

ȳ= 66,04+0,107 х, = 0,885,

( 11,72 ) ( 0,015 )

где в скобках указаны стандартные ошибки коэффициентов регрессии.

Качество модели оценивается коэффициентов .

Величина = 0,885 означает, что фактором душевого дохода можно объяснить 88,5% вариации (разброса) расходов на питание.

Установим статистическую значимость коэффициента .

Поскольку Значимость F = 0,000158 < α = 0,05, то =0,885 значим при уровне 5%.

Направление связи между переменными у и х определяет знак коэффициента b =0,107 ˃ 0, т.е. связь является прямой(положительной).

Коэффициент b =0,107 показывает, что при увеличении душевого дохода на 1 усл. ед. расходы на питание в среднем увеличиваются на 0,107 усл. ед.

Оценим статистическую значимость коэффициента b. Поскольку Р – значение = 0,000158 < α = 0,05, то коэффициент b =0,107 значим на 5 %-ном уровне. С вероятностью 95% доверительный интервал коэффициента b есть (0,073; 0,142).

Вследствие большой популярности эконометрических исследований на Западе средства построения эконометрических моделей включены во все известные интегрированные офисные средства (Microsoft Office, Perfect Office и т. д.) и табличные процессоры (Excel, Lotus 1-2-3, Quattro Pro и др.).

Рассмотрим методику построения эконометрических моделей с помощью встроенных функций Microsoft Excel.

Построение эконометрических моделей требует выполнения множества расчетов по определению параметров и характеристик.

В зависимости от целей исследования и вида уравнения регрессии расчеты в Excel могут быть выполнены с помощью различных функций ЛИНЕЙН, ЛГРФПРИБЛ, ТЕНДЕНЦИЯ, РОСТ и др.

Приведем методику использования MS Excel для построения эконометрических уравнений на примере линейной регрессии (ЛИНЕЙН).

Встроенная статистическая функция ЛИНЕЙН определяет параметры линейной регрессии:

y=mx+b или y=m1x1 + m2x2 +...+ b,

где зависимое значение y является функцией независимого значения x. Значения m - это коэффициенты, соответствующие каждой независимой переменной x, а b - константа.

Синтаксис:

ЛИНЕЙН (известные значения y; известные значения x; конст; статистика)

известные значения y - это множество значений y, которые уже известны для соотношения y=mx+b.

Массив известные значения х может содержать одно или несколько множеств переменных.

Конст - это логическое значение, которое указывает, требуются ли, чтобы константа b была равна нулю. Константа принимает одно из двух значений ИСТИНА или ЛОЖЬ. Если конст имеет значение истина или опущено, то b вычисляется, если конст имеет значение ЛОЖЬ, то b полагается равным 0.

Статистика - это логическое значение, которое указывает, требуется ли вернуть дополнительную статистику по регрессии.

Статистика также принимает одно из значений ИСТИНА или ЛОЖЬ. В первом случае дополнительная статистика рассчитывается, во втором случае не рассчитывается.

Дополнительные статистические характеристики функции ЛИНЕЙН приведены ниже Дополнительные статистические характеристики функции ЛИНЕЙН приведены ниже:

b, m₁, m₂,…m_n – коэффициенты регрессии (параметры модели);

se₁, se₂,...,se_n - стандартные значения ошибок для коэффициентов m₁,m₂,...,m_n;

se_b - стандартное значение ошибки для постоянной b;

r² - коэффициент детерминированности;

se_y - стандартная ошибка для оценки y;

F - F -статистика, используемая для определения того, является ли наблюдаемая взаимосвязь между зависимой и независимой переменными случайной или нет;

df - степени свободы, используемые для нахождения F -критических значений в статистической таблице (для определения уровня надежности модели нужно сравнить значения в таблице с F -статистикой функции ЛИНЕЙН);

ss_reg - регрессионая сумма квадратов;

ss_resid - остаточная сумма квадратов.

Характеристики выводятся на экран дисплея в виде приведенного ниже массива (таблицы):

m_n	m_n-1	…	m₂	m₁	b
se_n	Se_n-1	…	se₂	se₁	se_b
r²	Se_у	…
F	Df	…
ss_reg	ss_resid	…

Порядок выполнения расчетов следующий:

1. Вводятся исходные данные или открывается существующий файл, содержащий исходные данные.

2. В рабочем окне Excel выделяется диапазон ячеек 5*(n +1) (5 число строк, (n +1) - число столбцов, n – число показателей факторов) для вывода результатов расчета.

3. Активизируются "Мастер функций" любым из способов:

а) в главном меню выбирается Вставка/Функция;

б) на панели инструментов Стандартная нажимается кнопка (f_x)

4. В появившемся окне "Мастер функций шаг 1 из 2" среди категорий выбирается Статистические, среди функций - ЛИНЕЙН шаг 1 из 2 (рис. 3.1.1)

Рис. 3. 1. 1. Диалоговое окно "Мастер функций шаг 1 из 2"

5. В появившемся втором окне "Мастер функций" (рис. 3. 1. 2)

вводятся аргументы, т.е. указываются диапазоны ячеек рабочего окна EXCEL, в которых находятся исходные данные для У и Х, а также значения аргументов константа и статистика.

Рис. 3. 1. 2. Второе диалоговое окно "Мастер функций"

Рис. 3. 1. 3. Результат вычисления функции ЛИНЕЙН

6. Нажимается кнопка ОК. В выделенном диапазоне рабочего окна

Excel появляется результат - численное значение для коэффициента регрессии (b). Чтобы вывести всю статистику следует нажать клавишу <F2>, а затем - комбинацию клавиш <Ctrl>+<Shift>+<Enter>.

2 3 4 5 6 7 8

Подборка статей по вашей теме: