Система показателей тесноты многофакторной связи

Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции:

(4.17)

Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:

(4.18)

При правильном включении факторов в регрессионный анализ величина индекса множественной корреляции будет существенно отличаться от индекса корреляции парной зависимости. Если же дополнительно включенные в уравнение множественной регрессии факторы третьестепенны, то индекс множественной корреляции может практически совпадать с индексом парной корреляции. Т.о. сравнивая индексы множественной и парной корреляции, можно сделать вывод о целесообразности включения в уравнение регрессии того или иного фактора.

Индекс множественной корреляции для уравнения в стандартизованном масштабе можно записать в виде:

(4.19)

Формула индекса множественной корреляции для линейной регрессии получила название линейного коэффициента множественной корреляции(совокупного коэффициента корреляции).

При линейной зависимости коэффициент множественной корреляции можно определит через матрицу парных коэффициентов корреляции:

, (4.20)

где

– определитель матрицы парных коэффициентов корреляции;

– определитель матрицы межфакторной корреляции.

Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции (). Множественный коэффициент детерминации характеризует отношение части вариации результативного признака, объясненного за счет вариации, входящей в уравнение факторов к общей вариации результативного признака за счет всех факторов.

В рассмотренных показателях множественной корреляции используется остаточная дисперсия, которая имеет систематическую ошибку в сторону преуменьшения, тем более значительную, чем больше параметров определяется в уравнении регрессии при заданном объеме наблюдений.

Учитывая конечность объема совокупности N и число фактов к, а также свойства метода, по которому по мере приближения числа к к числу N коэффициент детерминации R2 автоматически приближается к единице и достигает ее при к = N – 1 независимо от реальной роли фактов, возникает необходимость корректировать коэффициент множественной детерминации на потерю степеней свободы вариации.

Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле:

(4.21)

где n – число наблюдений;

m – число факторов.

Чем больше величина m, тем сильнее различия и R2. Скорректированный коэффициент всегда ниже, чем нескорректированный.

Исключение слабого фактора всегда снижает некорректируемый коэффициент детерминации, чего нельзя сказать о значении R2, поэтому мы не можем сделать точный вывод о целесообразности исключения данного фактора из модели по R2.

Коэффициент (индекс) множественной детерминации используется для оценки качества регрессионной модели. Низкое значение индекса множественной детерминации означает, что в регрессионную модель не включены существенные факторы – с одной стороны, а с другой стороны – рассматриваемая форма связи не отражает реальны соотношения между переменными, включенными в модель. Требуются дальнейшие исследования по улучшению качества модели и увеличению ее практической значимости.

Частные коэффициенты (или индексы) корреляции, измеряющие влияние на y фактора xi при неизменном уровне других факторов можно определить по формуле:

r yx i ·x1x2…x i-1 x i+1 …xp = (4.19)

Частные коэффициенты корреляции изменяются в пределах от –1 до 1.

Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера:

(4.22)

Частный F-критерий оценивает статистическую значимость присутствия каждого их факторов в уравнении. В общем виде для фактора xi частный F-критерий определиться как

(4.23)

Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводиться к вычислению значения

(4.24)

где mbi – средняя квадратическая ошибка коэффициента регрессии bi, она может быть определена как

(4.25)

Уравнение множественной регрессии могут включать в качестве независимых переменных качественные признаки (например, профессия, пол, образование, климатические условия, отдельные регионы, качество почв, форма собственности предприятия и т.д.). Чтобы ввести такие переменные в регрессионную модель, их необходимо упорядочить и присвоить им те или иные значения, т.е. качественные переменные преобразовать в количественные. Эти переменные называют фиктивными переменными.

Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории к другой при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: