Множественная линейная регрессия

Парная корреляция или парная регрессия могут рассмат­риваться как частный случай отражения связи некоторой зависимой переменной, с одной стороны, и одной из множества независимых переменных — с другой. Когда же требуется охарактеризовать связь всего указанного множества незави­симых переменных с результативным признаком, говорят о множественной корреляции или множественной регрессии.

Рассмотрим вопрос о регрессии. В ряде случаев именно от его решения — оценки уравнений регрессии — зависят оценки тесноты связи, а они, в свою очередь, дополняют результаты регрессионного анализа. Прежде всего следует определить перечень независимых переменных X, включаемых в уравнение. Это должно делаться на основе теоретических положений. Список Х может быть достаточно широк и ограничен только исходной информацией. На практике теоретические положения о сути взаимосвязи подкрепляются парными коэффициентами корреляции между зависимой и независимыми переменными. Отбор наиболее значимых из них можно провести с помощью ЭВМ, выбирая в соответствии с коэффициентами корреляции и другими критериями факторы, наиболее тесно связанные с У. Параллельно решается вопрос о форме уравнения. Современные средства вычислительной техники позволяют за относительно короткое время рассчитать достаточно много вариантов уравнений. В ЭВМ вводятся значения зависимой переменной У и матрица независимых переменных X, прини­мается форма уравнения, например линейная. Ставится задача включить в уравнение k наиболее значимых X. В результате получим уравнение регрессии с k наиболее значимыми факторами. Аналогично можно выбрать наилучшую форму связи. Этот традиционный прием, называемый пошаговой регрессией, если он не противоречит качественным посылкам, достигает приемлемых результатов. Первоначально обычно берется линейная модель множественной регрессии

Уi = а0 + а1Хi1 + а2 Хi2 +... + аk Хik + ei

или — в форме уравнения регрессии –

Утеор = а0 + а1Х1 + а2 Х2 +... + аk Хk,

где Утеор – расчетное значение регрессии, которое представляет собой оценку ожидаемого значения У при фиксированных значениях переменных Х1, Х2,..., Хk;

а1, а2, …, аk - коэффициенты регрессии, каждый из которых показывает, на сколько единиц изменится У с изменением соответствующего признака Х на единицу при условии, что остальные признаки останутся на прежнем уровне.

Параметры уравнения множественной регрессии, как правило, находятся методом наименьших квадратов. В матричной записи система уравнений имеет вид

т Х) * А = ХтУ,

1 Х11 … Х1k У1 а0

где Х = 1 Х21 … Х2k; У = У2; А = а1.

… … … … …

1 Хn1 … Хnk Уn аk

Оценка параметров множественной регрессии вручную затруднительна, приводит к потерям точности и может лишь удовлетворить любопытство. Получение же оценок параметров на ЭВМ в настоящее время не представляет большой проблемы. Гораздо важнее, насколько линейная форма связи соответствует реально существующей зависимости между У, с одной стороны, и множеством Х — с другой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: