Для вычисления коэффициента корреляции и корреляционного отношения предварительно составляются корреляционные таблицы. По характеру таблицы можно ориентировочно судить о наличии или отсутствии корреляционной связи между переменными. Например, по двум приведенным ниже таблицам можно сказать, что в первом случае такая связь может быть обнаружена, а во втором ее нет.
X Y | X Y | |||||||||
- - | - - | - - | - - - |
Имея корреляционную таблицу, в каждой клетке которой указана частота некоторой пары значений Х и Y вычисляют величину Сxy:
Cxy = nxy(x - )(y -)/n.
Величина Cxy носит название ковариации X и Y. Частное от деления величины Cxy на произведение средних квадратических отклонений величин Sx и Sy представляет собой выборочный коэффициент корреляции:
rxy = Cxy / SxSy.
Для упрощения вычислений ковариации Cxy, а также Sx и Sy можно пользоваться следующими формулами:
Cxy = (xnxy y)/ n -;
Sx = ;
Sy = ;
где nx и my - частоты соответствующих значений x и y. Корреляционное отношение y вычисляется по формуле:
|
|
y = S/ Sy;
где Sy - среднее квадратическое отклонение значений y от средней ,
S - среднее квадратическое отклонение значений частной средней x от общей средней , т.е.
S= .
Если на основании анализа коэффициента корреляции и корреляционного отношения установлено наличие прямолинейной корреляционной связи между Y и X, то эту связь можно выразить в виде следующего уравнения:
x - = (rxySy / Sx )(x - ) = b (x - ); (7.1)
где b = rxySy / Sx называется коэффициентом регрессии Y на X.
Уравнение (7.1) часто представляют в виде x = a + bx.
Если в результате расчета получено небольшое значение rxy, то может возникнуть вопрос, не случайно ли значение rxy отличается от нуля и не равен ли действительный коэффициент корреляции нулю. Этот вопрос разрешается сравнением численного значения rxy с Sr. Приближенно можно считать, что среднее квадратическое отклонение Sr коэффициента корреляции rxy численно равно
Sr = (1 - r) / .
Когда действительное значение коэффициента корреляции rxy равно нулю, то
Sr= 1 / .
Поэтому, если
| rxy | / Sr = | rxy | 3,
то можно считать rxy значащим, а связь реальной, если же
| rxy | < 3 ,
то можно предполагать, что линейная связь между переменными отсутствует, но возможна криволинейная.