Коэффициент корреляции изменяется в пределах от минус единицы до плюс единицы.
.
· Коэффициент корреляции равен тогда и только тогда, когда и линейно зависимы (исключая события нулевой вероятности, когда несколько точек «выбиваются» из прямой, отражающей линейную зависимость случайных величин):
,
где .
Более того в этом случае знаки и совпадают:
l Коэффициент парной корреляции вычисляется для количественных признаков.
l Коэффициент корреляции симметричен, т.е. не изменяется, если X и Y поменять местами.
l Коэффициент корреляции является величиной безразмерной.
l Коэффициент корреляции не изменяетсяпри изменении единиц измерения признаков X и Y.
l Сам по себе коэффициент корреляции не имеет содержательной интерпретации. Однако его квадрат (r2), называемый коэффициентом детерминации (обозначается d и обычно выражается в %), имеет простой смысл – это показатель того, насколько изменения зависимого признака объясняются изменениями независимого.
Коэффициент детерминации ()— это квадрат множественного коэффициента корреляции. Он показывает, какая доля дисперсии результативного признака объясняется влиянием независимых переменных.
|
|
Формула для вычисления коэффициента детерминации:
где — выборочные данные, а — соответствующие им значения модели.
Также это квадрат корреляции Пирсона между двумя переменными. Он выражает количество дисперсии, общей между двумя переменными.
Коэффициент принимает значения из интервала . Чем ближе значение к 1 тем ближе модель к эмпирическим наблюдениям.
В случае парной линейной регрессионной модели коэффициент детерминации равен квадрату коэффициента корреляции, то есть .
l Более точно, это доля дисперсии (разброса) одного признака, объясняемая влиянием другого (если связь интерпретировать как причинно-следственную).
l Из определения коэффициента детерминации следует, что он принимает значения в диапазоне от 0% до 100%.
l Если две переменные функционально линейно зависимы (точки на диаграмме рассеяния лежат на одной прямой), то можно сказать, что изменение одной из них полностью объясняется изменением другой, а это как раз тот случай, когда коэффициент детерминации равен 100% (при этом коэффициент корреляции может быть равен как 1, так и –1).