Тема 9. Корреляционный метод анализа связей. Модели множественной регрессии

В парной корреляции исходят из постулата, что результативный признак зависит от одного факторного признака.

В действительности связь в экономических явлениях чаще является многофакторной. Уравнения, выражающие зависимость результативного признака от многих факторов, называются многофакторными (множественными) корреляционными уравнениями.

Линейное уравнение множественной регрессии в общем виде представляется формулой

,

где – значение результативного признака, соответствующее заданным факторным признакам .

, – параметры уравнения.

Параметр экономической интерпретации не имеет. Параметр называется коэффициентом условно-чистой регрессии.

Термин «коэффициент условно-чистой регрессии» означает, что каждая из величин измеряет среднее по совокупности отклонение результативного признака от его средней величины при отклонении данного фактора от своей средней величины на единицу его измерения и при условии, что все прочие факторы, входящие в уравнение регрессии, закреплены на средних значениях, не изменяются, не варьируют.

Таким образом, в отличие от коэффициента парной регрессии коэффициент условно-чистой регрессии измеряет влияние фактора, абстрагируясь от связи вариации этого фактора с вариацией остальных факторов. Если было бы возможным включить в уравнение регрессии все факторы, влияющие на вариацию результативного признака, то величины можно было бы считать мерами чистого влияния факторов. Но так как реально невозможно включить все факторы в уравнение, то коэффициенты не свободны от примеси влияния факторов, не входящих в уравнение.

Параметры уравнения , найдем методом наименьших квадратов (МНК). Для этого необходимо минимизировать сумму квадратов отклонений результативного признака от теоретического значения результативного признака , т.е. найти параметры , , при которых функция достигает минимума.

Запишем необходимые условия экстремума:

,

,

,

или

,

,

,

.

Раскроем скобки и получим стандартную форму нормальных уравнений. Параметры уравнения , найдем из решения системы этих нормальных уравнений:

Уравнение множественной регрессии в нелинейной форме не применяют в связи с тем, что их решение в математическом плане становится сверхсложной задачей.

При построении уравнения множественной регрессии принципиальное значение приобретает отбор факторов, которые будут участвовать в данной модели.

Выбранная функция должна отразить основные закономерности, но в то же время иметь по возможности простой вид.

Отбор факторов для модели может быть выполнен в следующей последовательности.

На первой стадии производится априорный анализ явления, и устанавливаются все возможные факторы.

На второй стадии осуществляется сравнительная оценка и отсев части факторов с помощью парных коэффициентов корреляции.

Если абсолютная величина парного коэффициента корреляции =0,8 и более, то факторы и считаются коллинеарными (дублирующими друг друга) и один из них отбрасывается.

На третьей стадии выполняется многошаговый процесс вычислений с последовательным отсевом наименее значимого фактора , у которого парный коэффициент корреляции оказался наименьшим.

Для каждой модели, включающей в себя число факторов, последовательно уменьшенное на один из них, рассчитывается совокупный коэффициент корреляции или корреляционное отношение, которые равны между собой. Модель с наибольшим совокупным коэффициентом корреляции (или корреляционным отношением) считается наиболее оптимальной.

Рассмотрим множественное уравнение регрессии с двумя признаками-факторами:

.

Параметры уравнения найдем из решения системы нормальных уравнений:

Решение данной системы имеет вид:

Совокупный коэффициент корреляции вычисляется по формуле:

,

где – это линейный коэффициент корреляции, который исчислен по указанным парам показателей и , и , и . Так, например,

,

где – среднее значение произведения признаков и ;

– средние значения признаков и ;

– средние квадратические отклонения признаков и ;

Корреляционное отношение вычисляется по формуле:

,

где – индивидуальные значения результативного признака,

– теоретические значения результативного признака, которые находятся по уравнению множественной регрессии,

– среднее значение результативного признака.

При этом совокупный коэффициент корреляции равен корреляционному отношению.

Для оценки степени соответствия модели фактическим данным служит коэффициент детерминации

.

Коэффициент детерминации показывает, какую часть фактической вариации переменной y составляет вариация регрессии.

Значимость модели множественной регрессии проверяется с помощью F-критерия Фишера. Проверяется нулевая гипотеза при конкурирующей гипотезе .

1. Наблюдаемое значение критерия находится по формуле:

,

где m – количество объясняющих переменных модели.

2. Критическую точку F-критерия Фишера определяем по соответствующей таблице

,

где - уровень значимости, обычно или (, где - доверительная вероятность);

m и n-m- 1 – числа степеней свободы, а n – количество наблюдений;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу об отсутствии линейной регрессии между показателями и y.

Если , то отклоняем нулевую гипотезу о равенстве нулю коэффициента детерминации. Т.е. принимаем конкурирующую гипотезу о наличии линейной регрессии между показателями и y.

Значимость коэффициента регрессии () проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза () (о незначимости коэффициента регрессии) при конкурирующей гипотезе ().

1. Наблюдаемое значение критерия находится по формуле:

(),

где () - среднеквадратическая (стандартная) ошибка параметра регрессии (), находится по формуле

(),

где - среднеквадратическая (стандартная) ошибка регрессии, рассчитывается по формуле:

2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице

,

где - уровень значимости, обычно или (, где - доверительная вероятность);

– число степеней свободы, а n – количество наблюдений;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии почти не отличается от нуля или равен нулю.

Если , то отклоняем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии не равен нулю.

Значимость параметра a проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза при конкурирующей гипотезе .

1. Наблюдаемое значение критерия находится по формуле:

,

где - среднеквадратическая (стандартная) ошибка параметра регрессии a.

;

2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице

;

3. Сравниваем наблюдаемое значение критерия и критическую точку:

Если , то принимаем нулевую гипотезу о незначимости параметра a, т.е. параметра a почти не отличается от нуля или равен нулю.

Если , то отклоняем нулевую гипотезу о незначимости параметра a, т.е. параметра a не равен нулю.

Доверительные интервалы параметров регрессии при уровне значимости определяются по формулам:

где , , - среднеквадратические ошибки параметров регрессии a, и , соответственно,

- табличное значение критерия Стьюдента при заданном уровне значимости и числе степеней свободы .

Точечный прогноз находится по построенной модели множественной линейной регрессии.

Пример. Имеются данные об объеме сбережений домохозяйства, располагаемого им дохода и процентной ставки за 11 лет (см. табл. 9.1).

Таблица 9.1

Год Располагаемый доход домохозяйства, тыс. руб. Процентная ставка, % Объем сбережений домохозяйства, тыс. руб.
       

Необходимо:

1) построить модель множественной линейной регрессии зависимости объема сбережений домохозяйства от располагаемого им дохода и процентной ставки;

2) оценить тесноту связи между указанными признаками с помощью совокупного коэффициента корреляции;

3) определить значимость построенной модели с помощью коэффициента детерминации;

4) при уровне значимости проверить значимость

а) модели множественной линейной регрессии,

б) параметров регрессии

и сделать соответствующие выводы;

5) построить 95%-ные доверительные интервалы для найденных параметров регрессии.

6) спрогнозировать средний объем сбережений в 1991 году, если предполагаемый доход составит 170 тыс. руб., а процентная ставка будет равна 5,5%.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: