1. Они должны быть количественно измеримы. Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность (например, в модели урожайности качество почвы задается в виде баллов).
2. Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи. Включение в модель факторов с высокой интеркорреляцией может привести к нежелательным последствиям — система нормальных уравнений может оказаться плохо обусловленной.
Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель.
Количество наблюдений д.б. 5-7 раз больше чем количество факторов.
Мультиколлинеарность
В случаи множественной регрессии, коэффициент корреляции показывает на сколько в среднем изменится результат при изменении соответствующего фактора и неизменных закрепленных на среднем уровне значениях основных факторов.
|
|
Для того чтобы можно было определить влияние каждого конкретного фактора на результат исключив всех прочих факторов необходимо чтобы эти факторы были между собой независимы. В том случаи если между факторами существует линейная связь в этом случаи построение уравнения невозможно без исключения какого либо фактора. такая ситуация имеет название полной коллинеарности. Если между факторами существует корреляциооная связь, то имеет место мультиколлинеарность.
Мультиколлинеарность может возникать в силу разных причин. Например, несколько независимых переменных могут иметь общий временной тренд, относительно которого они совершают малые колебания.
Включение в модель мультиколлинеарных факторов нежелательно в силу следующих последствий:
· Затрудняется интерпретация параметров множественной регрессии как характеристик действия факторов в «чистом» виде, ибо факторы коррелированны; параметры линейной регрессии теряют смысл:
· Оценки параметров ненадежны, обнаруживают большие стандартные ошибки и меняются с изменением объема наблюдений (не только по величине, но и по знаку), что делает модель непригодной для анализа и прогнозирования.