Парную регрессию используют тогда, когда влияние прочих факторов воздействующих на объект исследования можно пренебречь, иначе надо работать с моделью множественной регрессии.
Можно сводить работу с множественной регрессии к парной для этого необходимо из генеральной совокупности формировать выборку с фиксированным значением факторов кроме одного.
Например, изучая расходы семьи на продукты питания, которые зависят от кол-ва человек в семье(х1), от дохода семьи (х2), можно выбирать семьи с одинаковым составом семьи(фиксировали х1), то такая модель теряет «привлекательность», односторонне отражает изученные явления.
В настоящее время множественная регрессия широко используется в решении проблем спроса, доходности акций при изучений функций издержек производства. Основная цель множественной регрессии состоит в построении модели с несколькими факторами, при этом необходимо определить влияние каждого фактора на результат, а также их совокупное влияние.
Построению модели множественной регрессии предшествует решение двух вопросов:
|
|
1)отбор факторов влияющих на результативный признак;
2)выбор вида уравнения регрессии.
МНК для оценки параметров множественной регрессионной модели. Теорема Гаусса-Маркова.
Для оценки вектора неизвестного параметра В применим МНК для этого мы должны мин-ть функцию.
S=∑(yi-yi(кр))^2 ->мин
S=∑ei2 = е12 + е22 +…+ еn2->мин
S=∑(yi-yi(кр))^2=∑ei2 = е’е = (y-xb)’ (y-xb)= y’y-y’xb-x’b’y+x’b’xb -> мин
Находя частные производные по каждой из K переменных и приравнивая их к 0, можно получить систему уравнений в матричной форме для определения коэф-ов b, она будет иметь вид:
X’Xb=X’Y
b=(X’x)-1 X’Y
Обратная матрица сущ., когда ее определитель не равен 0, т.е. матрица X’x является невырожденной. Это условие и есть 6 предпосылка регрессионного анализа.
Теорема Гаусса-Маркова
При выполнении предпосылок множ.регрес.анализа оценкиb=(X’x)-1 X’Y, полученные по МНК являются наиболее эффективными, т.е. обладают наимен.дисперсией в классе линейных несмещ.оценок.
15. Оценка значимости множественной регрессии. (16)
Оценку тесноты связи между результативным признаком и факторами дает показатель множественной корреляции. Он обозначается +++++++++++++++
0≤R≤1
Слабая
Средняя
Сильная
Коэффициент детерминации R^2 = 1-[∑(yi-yi(кр))^2/∑(yi-y(ср))]
Коэффициент детерминации показывает на сколько % вариация результатив.признака у объясняется вариацией факторов x1, x2… xk и сколько % приходится на неучтенные факторы в модели.
Включая в модель новый фактор коэффициент детерминации должен увеличиваться, если этого не происходит или рост незначительный, то включение данной переменной в модель не целесообразно.
|
|
Большое число переменных в модели может преувеличить коэффициент детерминации чтобы этого не произошло рассчитывают скорректированный нормированный коэффициент детерминации, который учитывает число степеней свободы. +++++++++++++++
Для проверки значимости уравнения используют критерий Фишера, аналогично, как для парной регрессии. Для оценки значимости коэффициентов в модели используют t критерий Стьюдента аналогично парной регрессии.
Мультиколлинеарность, Отбор факторов при построении множественной регрессии. (11)
Факторы включаемые во множественную регрессию, должны удовлетворять следующим требованиям:
1. Они должны быть количественно измеримы, если есть необходимость включить в модель качественный показатель, то ему надо придать количественную определённость.
(степень жилья зависит от района, в котором оно расположено, районы можно проронжировать по степени востребованности, качество почвы можно определить по баллам.)
2. Факторы не должны находиться в точной функциональной или тесной корреляционной зависимости, если факторы тесно корреляционируются между собой, то они дублируют друг друга и в этом …. Нельзя изучить влияние отдельных факторов на результат, а параметры уравнения регрессии могут оказаться не интерпритируемыми.
Выбор факторов во множественную регрессию осущ. В 2 этапа:
1. подбир.ф-ры, исходя из сущности проблемы.
2. 2. Рассчит.матрица парных коэф-ов корреляции и на основе матрицы анализир.ф-ры и находим те, которые тесно коррелир.между собой, если таких факторов 2, то один надо исключить.
Для трехфакторной модели матрица парных коэф-ов имеет вид:
rx1x1 | rx1x2 | rx1x3 |
rx2x1 | rx2x2 | rx2x3 |
rx3x1 | rx3x2 | rx3x3 |
rx1x2= rx2x1 и т.д.
rx1x1 = rx2x2= rx3x3 = 1 (прямая функцион.связь)
если коэф-т корреляции r>0.7, то факторы тесно коррел.между собой. Один из них надо исключить. В модели оставл.тот фактор, который при достаточно тесной связи с у (результ.признаком) имеет меньшую связь с оставшимися ф-ми.
Иногда более чем два ф-ра коррелир.между собой – мультиколлинеарность.
Чтобы выявить присут.ли данное явление в модели рассчит.определитель, составл.из коэффициентов парной корреляции для факторов:
+++++++++++++++
1. Между ф-ми Связь отсутствует => определитель =1.
2. Между факторами функцион.зависимость => определитель =0.
Если определитель -> 1, то мультиколлинеарность отсутствует.
Если к 0, то это говорят о наличии мультиколлинеарности.