Линейный коэффициент корреляции. Коэффициент детерминации. Значимость линейного коэффициента корреляции

Парный линейный коэффициент корреляции. С помощью парного линейного коэффициента корреляции измеряется теснота связи между двумя признаками.

Линейный коэффициент корреляции изменяется в пределах от —1 до +1. Равенство коэффициента нулю свидетельствует об отсутствии линейной связи. Равенство коэффициента —1 или +1 показывает наличие функциональной связи. Знак «+» указывает на связь прямую (увеличение или уменьшение одного признака сопровождается аналогичным изменением другого признака), знак «—» — на связь обратную (увеличение или уменьшение одного признака сопровождается противоположным по направлению изменением другого признака).

Коэффициент детерминации (— R-квадрат) — это доля дисперсии зависимой переменной, объясняемая рассматриваемой моделью зависимости, то есть объясняющими переменными. Более точно — это единица минус доля необъяснённой дисперсии (дисперсии случайной ошибки модели, или условной по факторам дисперсии зависимой переменной) в дисперсии зависимой переменной. Его рассматривают как универсальную меру зависимости одной случайной величины от множества других. В частном случае линейной зависимости является квадратом так называемого множественного коэффициента корреляции между зависимой переменной и объясняющими переменными. В частности, для модели парной линейной регрессии коэффициент детерминации равен квадрату обычного коэффициента корреляции между y и x.

Проверка значимости парного линейного коэффициента корреляции. Коэффициенты корреляции, как правило, рассчитываются для выборочных данных. Чтобы распространить полученные частные результаты на генеральную совокупность, приходится допустить некоторую ошибку, которую можно оценить с помощью средней квадратической ошибки. Средняя квадратическая ошибка для парного линейного коэффициента корреляции достаточно большой выборки вычисляется по формуле

где ρ — коэффициент корреляции генеральной совокупности; n — объем выборки.

В математической статистике доказано, что если признаки х и y распределены по нормальному закону, то в достаточно больших выборках коэффициенты корреляции можно считать распределенными нормально со средним значением ρ и средним квадратическим отклонением σr(нормальное распределение рассмотрено в гл. 4). Этот факт используется для построения доверительных интервалов коэффициента корреляции в генеральной совокупности, а также для проверки значимости выборочных коэффициентов корреляции, т. е. для проверки того, могло ли данное значение r получиться в выборке из некоррелированной генеральной совокупности (ρ=0) в силу простой случайности.

Очевидно, чем больше отклонение r от ρ, тем менее вероятно, что оно случайно.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: