В парной корреляции исходят из постулата, что результативный признак зависит от одного факторного признака.
В действительности связь в экономических явлениях чаще является многофакторной. Уравнения, выражающие зависимость результативного признака от многих факторов, называются многофакторными (множественными) корреляционными уравнениями.
Линейное уравнение множественной регрессии в общем виде представляется формулой
,
где – значение результативного признака, соответствующее заданным факторным признакам .
, – параметры уравнения.
Параметр экономической интерпретации не имеет. Параметр называется коэффициентом условно-чистой регрессии.
Термин «коэффициент условно-чистой регрессии» означает, что каждая из величин измеряет среднее по совокупности отклонение результативного признака от его средней величины при отклонении данного фактора от своей средней величины на единицу его измерения и при условии, что все прочие факторы, входящие в уравнение регрессии, закреплены на средних значениях, не изменяются, не варьируют.
|
|
Таким образом, в отличие от коэффициента парной регрессии коэффициент условно-чистой регрессии измеряет влияние фактора, абстрагируясь от связи вариации этого фактора с вариацией остальных факторов. Если было бы возможным включить в уравнение регрессии все факторы, влияющие на вариацию результативного признака, то величины можно было бы считать мерами чистого влияния факторов. Но так как реально невозможно включить все факторы в уравнение, то коэффициенты не свободны от примеси влияния факторов, не входящих в уравнение.
Параметры уравнения , найдем методом наименьших квадратов (МНК). Для этого необходимо минимизировать сумму квадратов отклонений результативного признака от теоретического значения результативного признака , т.е. найти параметры , , при которых функция достигает минимума.
Запишем необходимые условия экстремума:
,
,
,
…
или
,
,
,
…
.
Раскроем скобки и получим стандартную форму нормальных уравнений. Параметры уравнения , найдем из решения системы этих нормальных уравнений:
Уравнение множественной регрессии в нелинейной форме не применяют в связи с тем, что их решение в математическом плане становится сверхсложной задачей.
При построении уравнения множественной регрессии принципиальное значение приобретает отбор факторов, которые будут участвовать в данной модели.
Выбранная функция должна отразить основные закономерности, но в то же время иметь по возможности простой вид.
Отбор факторов для модели может быть выполнен в следующей последовательности.
|
|
На первой стадии производится априорный анализ явления, и устанавливаются все возможные факторы.
На второй стадии осуществляется сравнительная оценка и отсев части факторов с помощью парных коэффициентов корреляции.
Если абсолютная величина парного коэффициента корреляции =0,8 и более, то факторы и считаются коллинеарными (дублирующими друг друга) и один из них отбрасывается.
На третьей стадии выполняется многошаговый процесс вычислений с последовательным отсевом наименее значимого фактора , у которого парный коэффициент корреляции оказался наименьшим.
Для каждой модели, включающей в себя число факторов, последовательно уменьшенное на один из них, рассчитывается совокупный коэффициент корреляции или корреляционное отношение, которые равны между собой. Модель с наибольшим совокупным коэффициентом корреляции (или корреляционным отношением) считается наиболее оптимальной.
Рассмотрим множественное уравнение регрессии с двумя признаками-факторами:
.
Параметры уравнения найдем из решения системы нормальных уравнений:
Решение данной системы имеет вид:
Совокупный коэффициент корреляции вычисляется по формуле:
,
где – это линейный коэффициент корреляции, который исчислен по указанным парам показателей и , и , и . Так, например,
,
где – среднее значение произведения признаков и ;
– средние значения признаков и ;
– средние квадратические отклонения признаков и ;
Корреляционное отношение вычисляется по формуле:
,
где – индивидуальные значения результативного признака,
– теоретические значения результативного признака, которые находятся по уравнению множественной регрессии,
– среднее значение результативного признака.
При этом совокупный коэффициент корреляции равен корреляционному отношению.
Для оценки степени соответствия модели фактическим данным служит коэффициент детерминации
.
Коэффициент детерминации показывает, какую часть фактической вариации переменной y составляет вариация регрессии.
Значимость модели множественной регрессии проверяется с помощью F-критерия Фишера. Проверяется нулевая гипотеза при конкурирующей гипотезе .
1. Наблюдаемое значение критерия находится по формуле:
,
где m – количество объясняющих переменных модели.
2. Критическую точку F-критерия Фишера определяем по соответствующей таблице
,
где - уровень значимости, обычно или (, где - доверительная вероятность);
m и n-m- 1 – числа степеней свободы, а n – количество наблюдений;
3. Сравниваем наблюдаемое значение критерия и критическую точку:
Если , то принимаем нулевую гипотезу об отсутствии линейной регрессии между показателями и y.
Если , то отклоняем нулевую гипотезу о равенстве нулю коэффициента детерминации. Т.е. принимаем конкурирующую гипотезу о наличии линейной регрессии между показателями и y.
Значимость коэффициента регрессии () проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза () (о незначимости коэффициента регрессии) при конкурирующей гипотезе ().
1. Наблюдаемое значение критерия находится по формуле:
(),
где () - среднеквадратическая (стандартная) ошибка параметра регрессии (), находится по формуле
(),
где - среднеквадратическая (стандартная) ошибка регрессии, рассчитывается по формуле:
2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице
,
где - уровень значимости, обычно или (, где - доверительная вероятность);
– число степеней свободы, а n – количество наблюдений;
3. Сравниваем наблюдаемое значение критерия и критическую точку:
Если , то принимаем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии почти не отличается от нуля или равен нулю.
|
|
Если , то отклоняем нулевую гипотезу о незначимости коэффициента регрессии, т.е. коэффициент регрессии не равен нулю.
Значимость параметра a проверяется с помощью t-критерия Стьюдента. Проверяется нулевая гипотеза при конкурирующей гипотезе .
1. Наблюдаемое значение критерия находится по формуле:
,
где - среднеквадратическая (стандартная) ошибка параметра регрессии a.
;
2. Критическую точку t-критерия Стьюдента определяем по соответствующей таблице
;
3. Сравниваем наблюдаемое значение критерия и критическую точку:
Если , то принимаем нулевую гипотезу о незначимости параметра a, т.е. параметра a почти не отличается от нуля или равен нулю.
Если , то отклоняем нулевую гипотезу о незначимости параметра a, т.е. параметра a не равен нулю.
Доверительные интервалы параметров регрессии при уровне значимости определяются по формулам:
где , , - среднеквадратические ошибки параметров регрессии a, и , соответственно,
- табличное значение критерия Стьюдента при заданном уровне значимости и числе степеней свободы .
Точечный прогноз находится по построенной модели множественной линейной регрессии.
Пример. Имеются данные об объеме сбережений домохозяйства, располагаемого им дохода и процентной ставки за 11 лет (см. табл. 9.1).
Таблица 9.1
Год | Располагаемый доход домохозяйства, тыс. руб. | Процентная ставка, % | Объем сбережений домохозяйства, тыс. руб. |
Необходимо:
1) построить модель множественной линейной регрессии зависимости объема сбережений домохозяйства от располагаемого им дохода и процентной ставки;
2) оценить тесноту связи между указанными признаками с помощью совокупного коэффициента корреляции;
3) определить значимость построенной модели с помощью коэффициента детерминации;
4) при уровне значимости проверить значимость
а) модели множественной линейной регрессии,
б) параметров регрессии
и сделать соответствующие выводы;
5) построить 95%-ные доверительные интервалы для найденных параметров регрессии.
6) спрогнозировать средний объем сбережений в 1991 году, если предполагаемый доход составит 170 тыс. руб., а процентная ставка будет равна 5,5%.
|
|