Регрессия

Наряду с корреляционным анализом проводится регрессионный анализ, который заключается в определении формы связи зависимой случайной величины y с независимыми случайными величинами
X 1, X 2, …, Xn.

Форма связи результативного признака y с факторами X 1, X 2, …, Xn называется уравнением регрессии. В зависимости от типа выбранного уравнения различают линейную и нелинейную регрессию (квадратичную, экспоненциальную, логарифмическую и т. д.).

В зависимости от числа взаимосвязанных признаков различают парную и множественную регрессии. Если исследуется связь между двумя признаками (результативным и факторным), то регрессия называется парной, если между тремя и более признаками – множественной (многофакторной) регрессией.

Тест 9.5. Уравнение y = 5 + 0,2 x 1 + 1,7 x 2 определяет следующий вид регрессии:

1) множественный линейный;

2) множественный нелинейный;

3) парный линейный;

4) парный нелинейный.

При изучении регрессии следует придерживаться определенной последовательности этапов.

Этап 1. Установление формы зависимости. Пусть в результате наблюдений двумерной случайной величины (X; Y) получены данные, представляющие собой совокупность точек (x 1; y 1), (x 2; y 2), …, (xn;yn). Графическое изображение этих точек в плоскости Oxy представляет собой корреляционное поле (диаграмму рассеяния). Диаграмма рассеяния позволяет произвести визуальный анализ эмпирических данных и графически определить вид функции регрессии.

Тест 9.6. Результаты измерений признаков X и Y изображены в виде точек (xi; yj), на корреляционном поле в виде рис. 20.

Рис. 20

Тогда связь между признаками является:

1) линейной;

2) квадратической;

3) экспоненциальной ;

4) логарифмической;

5) кубической.

Тест 9.7. Результаты измерений признаков X и Y изображены в виде точек (xi; yj), на корреляционном поле в виде рис. 20. зависимость между признаками определяется уравнением:

1) y = ax + b;

2) y = ax 2 + bx + c;

3) y = aebx ;

4) y = a ln x;

5) y = ax 3 + bx 2 + cx + d.

Этап 2. Определение параметров (коэффициентов) уравнения регрессии.

Параметры уравнения регрессии определяются с помощью метода наименьших квадратов.

Этап 3. Проверка общего качества уравнения регрессии. Для определения величины степени стохастической взаимосвязи результативного признака и факторов необходимо знать следующие дисперсии:

общую дисперсию результативного признака , отображающую влияние как основных, так и остаточных факторов: , где – выборочное среднее значение результативного признака по выборке ;

факторную дисперсию результативного признака , отображающую влияние только основных факторов: , где значения, найденные по уравнению регрессии;

остаточную дисперсию результативного признака, отображающую влияние только остаточных факторов:

.

При корреляционной связи результативного признака и факторов выполняется соотношение: , при этом = + .

Для анализа общего качества уравнения линейной регрессии обычно используется множественный коэффициент детерминации R 2, называемый также квадратом коэффициента множественной корреляции. Множественный коэффициент детерминации рассчитывается по формуле = и определяет долю разброса результативного признака, обусловленную изменением факторных признаков, входящих в многофакторную модель. Чем теснее линейная связь между признаками, тем ближе коэффициент детерминации к единице. Однако, при достаточно близком к единице коэффициенте детерминации не всегда наблюдается тесная взаимосвязь между случайными величинами. Поэтому необходимы дополнительные исследования.

Этап 4. Проверка статистической значимости каждого коэффициента уравнения регрессии и определение их доверительных интервалов.

Проверяются соответствующие гипотезы

Вопросы для самоконтроля

1. Что называется гипотезой?

2. Какая гипотеза называется нулевой, альтернативной, простой и сложной?

3. Какая зависимость называется стохастической?

4. Каковы основные задачи корреляционного анализа?

5. Какая зависимость называется корреляционной?

6. Какая величина называется выборочной ковариацией? Что она характеризует?

7. Как по коэффициенту корреляции оценить тесноту связи между случайными величинами?

8. В чем разница между корреляционным и регрессионным анализом?

9. Как построить корреляционное поле?

10. Какое уравнение называется уравнением регрессии?

11. Какой вид имеет уравнение линейной регрессии?

12. Как связаны общая и факторная дисперсия при корреляционной зависимости результативного признака и факторов?

13. Что используется для анализа общего качества уравнения линейной регрессии?


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: