Множественная регрессия и корреляция

Парную регрессию используют тогда, когда влияние прочих факторов воздействующих на объект исследования можно пренебречь, иначе надо работать с моделью множественной регрессии.

Можно сводить работу с множественной регрессии к парной для этого необходимо из генеральной совокупности формировать выборку с фиксированным значением факторов кроме одного.

Например, изучая расходы семьи на продукты питания, которые зависят от кол-ва человек в семье(х1), от дохода семьи (х2), можно выбирать семьи с одинаковым составом семьи(фиксировали х1), то такая модель теряет «привлекательность», односторонне отражает изученные явления.

В настоящее время множественная регрессия широко используется в решении проблем спроса, доходности акций при изучений функций издержек производства. Основная цель множественной регрессии состоит в построении модели с несколькими факторами, при этом необходимо определить влияние каждого фактора на результат, а также их совокупное влияние.

Построению модели множественной регрессии предшествует решение двух вопросов:

1)отбор факторов влияющих на результативный признак;

2)выбор вида уравнения регрессии.

 

 

МНК для оценки параметров множественной регрессионной модели. Теорема Гаусса-Маркова.

Для оценки вектора неизвестного параметра В применим МНК для этого мы должны мин-ть функцию.

S=∑(yi-yi(кр))^2 ->мин

S=∑ei2 = е12 + е22 +…+ еn2->мин

S=∑(yi-yi(кр))^2=∑ei2 = е’е = (y-xb)’ (y-xb)= y’y-y’xb-x’b’y+x’b’xb -> мин

Находя частные производные по каждой из K переменных и приравнивая их к 0, можно получить систему уравнений в матричной форме для определения коэф-ов b, она будет иметь вид:

X’Xb=X’Y

b=(X’x)-1 X’Y

Обратная матрица сущ., когда ее определитель не равен 0, т.е. матрица X’x является невырожденной. Это условие и есть 6 предпосылка регрессионного анализа.

Теорема Гаусса-Маркова

При выполнении предпосылок множ.регрес.анализа оценкиb=(X’x)-1 X’Y, полученные по МНК являются наиболее эффективными, т.е. обладают наимен.дисперсией в классе линейных несмещ.оценок.

15. Оценка значимости множественной регрессии. (16)

Оценку тесноты связи между результативным признаком и факторами дает показатель множественной корреляции. Он обозначается  +++++++++++++++

0≤R≤1   

Слабая

Средняя

Сильная

Коэффициент детерминации R^2 = 1-[∑(yi-yi(кр))^2/∑(yi-y(ср))]

Коэффициент детерминации показывает на сколько % вариация результатив.признака у объясняется вариацией факторов x1, x2… xk и сколько % приходится на неучтенные факторы в модели.

Включая в модель новый фактор коэффициент детерминации должен увеличиваться, если этого не происходит или рост незначительный, то включение данной переменной в модель не целесообразно.

Большое число переменных в модели может преувеличить коэффициент детерминации чтобы этого не произошло рассчитывают скорректированный нормированный коэффициент детерминации, который учитывает число степеней свободы. +++++++++++++++

Для проверки значимости уравнения используют критерий Фишера, аналогично, как для парной регрессии. Для оценки значимости коэффициентов в модели используют t критерий Стьюдента аналогично парной регрессии.  

Мультиколлинеарность, Отбор факторов при построении множественной регрессии. (11)

Факторы включаемые во множественную регрессию, должны удовлетворять следующим требованиям:

1. Они должны быть количественно измеримы, если есть необходимость включить в модель качественный показатель, то ему надо придать количественную определённость.

(степень жилья зависит от района, в котором оно расположено, районы можно проронжировать по степени востребованности, качество почвы можно определить по баллам.)

2. Факторы не должны находиться в точной функциональной или тесной корреляционной зависимости, если факторы тесно корреляционируются между собой, то они дублируют друг друга и в этом …. Нельзя изучить влияние отдельных факторов на результат, а параметры уравнения регрессии могут оказаться не интерпритируемыми.

Выбор факторов во множественную регрессию осущ. В 2 этапа:

1. подбир.ф-ры, исходя из сущности проблемы.

2. 2. Рассчит.матрица парных коэф-ов корреляции и на основе матрицы анализир.ф-ры и находим те, которые тесно коррелир.между собой, если таких факторов 2, то один надо исключить.

Для трехфакторной модели матрица парных коэф-ов имеет вид:

rx1x1 rx1x2 rx1x3
rx2x1 rx2x2 rx2x3
rx3x1 rx3x2 rx3x3

rx1x2= rx2x1 и т.д.

rx1x1 = rx2x2= rx3x3 = 1 (прямая функцион.связь)

если коэф-т корреляции r>0.7, то факторы тесно коррел.между собой. Один из них надо исключить. В модели оставл.тот фактор, который при достаточно тесной связи с у (результ.признаком) имеет меньшую связь с оставшимися ф-ми.

Иногда более чем два ф-ра коррелир.между собой – мультиколлинеарность.

Чтобы выявить присут.ли данное явление в модели рассчит.определитель, составл.из коэффициентов парной корреляции для факторов:

+++++++++++++++

1. Между ф-ми Связь отсутствует => определитель =1.

2. Между факторами функцион.зависимость => определитель =0.

Если определитель -> 1, то мультиколлинеарность отсутствует.

Если к 0, то это говорят о наличии мультиколлинеарности.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: