Отбор факторов в уравнение множественной регрессии

С пом матрицы k-тов коррел определ ф-ры, кот тесно связаны м\у собой. Если надо исключить из модели 1 из ф-ров, то исключ то, кот теснее связан с др. Кроме того не рекомендуется вкл в круг объясняющих переменных признаки, кот представлены как абсолютн и средн (или относит) величины. Нельзя включ признаки, функционально связан с рез-том. Н-р, признаки, кот явл составн частью рез-та (суммарн доход и з\п).
Методы отбора: 1) метод всех возможных регрессий. Он предполагает расчет ур-ий регрессии по сериям. Серия соответ числу фактор. признаков. По кажд ур-ию серии определяется k-т детерминации и выбирается ур-ие с наиб. k-том. Кроме этого по кажд ур-ию определ остаточн вариация и по кажд серии среднее из остат вариаций. Эти средние остат вариации сравнивают м\у собой и останавлив на том ур-ии из серии, когда ср.остат вариация существенно меньше средн остат вариации предыдущей серии и незначительно больше последующ.
2)метод исключения. Строится множеств. ур-ие регрессии с полным набором факторн признаков. Дальше ур-ие проверяется на статистич значимость с пом общего F-критерия Фишера и для кажд факторн признака определ частн F-критерий в предположении, что дан ф-р включен в последн. Если все частн F-критерии>Fтабл., то на этом метод заканчивается. Если для какого-то ф-ра частн F-критерии<Fтабл., то этот ф-р исключ из модели и строится нов модель без этого ф-ра, которая проверяется на общий F-критерий, считаются частн F-критерии. И всё заново. При наличии нескольких ф-ров, у кот частн F-критерии меньше Fтабл, исключ ф-р, имеющий наим знач частн F-критерия.
3)метод включения переменных: 1.Строится матрица парных k-тов коррел (r м\у y и xj). В модель отбтрается ф-р с max знач k-та коррел (r м\у y и x1). Далее строится ур-ие y=f(x1). Это ур-ие провер-ся на общий F-критерий Фишера, опред-ся значи-сть r м\у y и x1.
2.Опред-ся частн k-ты коррел первого порядка (r м\у y и xj∙x1) при наличии ф-ра x1. Закрепленного на постоян ур-не. В модель отбир ф-р с наиб знач k-та коррел 1ого порядка: r м\у y и x2∙x1=max. Далее строится ур-ие y=f(x1,x2). Это ур-ие проверяется на статист значи-сть с пом F-критерия Фишера.
Если ф-р вкл нецелесообразно, то метод заканчивается.
3.при закреплении ф-ра x1 и x2 на пост ур-не: r м\у y и x3∙x1x2. Ур-ие: y=f(x1,x2,x3). Проверяем на статист знач-сть. Если целесообразно вкл ф-р х3, то метод продолжается, если нет, то принимается предыд модель.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: