1. Коэффициент корреляции
является безразмерной величиной и его значение не зависит от единиц измерения случайных величин Х и Y.
2. Абсолютная величина коэффициента корреляции
не превышает единицы: -1 ≤
≤ 1.
3. Если 0<
<1, то случайные величины Х и Y положительно коррелируемы, то есть с ростом одной величины вторая в среднем также растет (прямая корреляционная зависимость).
4. Если -1<
<0, то случайные величины Х и Y отрицательно коррелируемы, то есть с ростом одной величины вторая в среднем убывает (обратная корреляционная зависимость).
5. Если
=0, то случайные величины Х и Y являются некоррелированными.
6. Если
= ±1, то между случайными величинами Х и Y имеется точная линейная зависимость.
Качественная оценка корреляционной связи между случайными величинами может быть выявлена на основе шкалы Чеддока (табл. 10.1).
Т а б л и ц а 10.1
Значение
| 0,1 – 0,3 | 0,3 – 0,5 | 0,5 – 0,7 | 0,7 – 0,9 | 0,9 – 0,99 |
| Теснота связи | слабая | умеренная | заметная | высокая | очень высокая |
Практическая значимость коэффициента корреляции определяется его величиной, возведенной в квадрат, получившая название коэффициента детерминации.
Например, если
= 0,8, то
= 0,64, т.е. 64 % всех изменений одного признака связано с изменением другого.
Доверительным интервалом статистической оценки истинного значения коэффициента корреляции нормально распределенных случайных величин Х и Y является интервал
.
Здесь
– выборочный коэффициент корреляции, величина
находится по таблице значений функции Лапласа (прил. 1) из условия Ф(
) =
, где
– заданный доверительный уровень.
УРАВНЕНИЯ ЛИНЕЙНЫХ
СРЕДНЕКВАДРАТИЧЕСКИХ РЕГРЕССИЙ
Уравнением линейной среднеквадратической регрессии величины X на величину Y называется уравнение
.
Уравнением линейной среднеквадратической регрессии величины Y на величину X называется уравнение
.
Пример 11.1
Найти коэффициент корреляции и составить уравнение линейной регрессии величины
на величину
.
| 20 | 25 | 30 | 35 | 40 | 45 |
|
| 30 | 6 | 4 | 10 | ||||
| 40 | 4 | 1 | 5 | 7 | 17 | ||
| 50 | 3 | 4 | 5 | 6 | 18 | ||
| 60 | 5 | 3 | 10 | 2 | 20 | ||
| 70 | 2 | 3 | 3 | 5 | 13 | ||
| 12 | 12 | 12 | 19 | 12 | 11 | =78
|
Решение.
Для упрощения расчетов введем условные варианты:

где

= 5 (разность между соседними значениями вариант
);
= 10 (разность между соседними значениями вариант
).
Составим корреляционную таблицу с условными вариантами:
| –3 | –2 | –1 | 0 | 1 | 2 |
|
| –3 | 6 | 4 | 10 | ||||
| –2 | 4 | 1 | 5 | 7 | 17 | ||
| –1 | 3 | 4 | 5 | 6 | 18 | ||
| 0 | 5 | 3 | 10 | 2 | 20 | ||
| 1 | 2 | 3 | 3 | 5 | 13 | ||
| 12 | 12 | 12 | 19 | 12 | 11 | =78
|
Затем находим
и 


Теперь находим
и


Определяем
и 
= 
= 
Коэффициент корреляции
найдем по формуле

где
корреляционный момент.
При вычислении
складываем члены вида
(
частота появления пары (
)):

Тогда
, а значит

Осуществим переход к исходным вариантам:




Находим уравнение линейной регрессии величины
на величину
. Это уравнение имеет вид:

Подставляя вычисленные значения
в это уравнение, получаем

После упрощения получаем уравнение линейной регрессии величины
на величину
в виде:
=0,325
+40,566.
=78






