Если задачей регрессионного анализа является определение формы зависимости, то задачей корреляционного анализа является определение силы этой зависимости.
Коэффициент парной корреляции находится по формуле
Он характеризует степень отклонения связи между xi и yi от линейной. Если |R| близок к 1, то эта связь линейна, причем знак R определяет знак коэффициента a. Если R>0, то a>0, и, напротив, если R<0, то a<0. Величина коэффициента корреляции указывает на тесноту связи между переменными. Если | R | = 1, то связь является чисто линейной; если |R| = 0, то корреляционной связи между xi и yi нет или она нелинейная. Обычно считают тесноту связи удовлетворительной при | R | ≥ 0,5, линейность связи достоверной при | R | ≥ 0,95.
При малом числе парных измерений (n ≤ 50) оценивается достоверность связи путем расчета дисперсии коэффициента корреляции по уравнению
.
Связь считается достоверной с доверительной вероятностью 0,95, если выполняется условие
Пример (заимствован у А.Ю. Барыкина [2]). Методом наименьших квадратов определить коэффициенты линейного уравнения, тесноту и достоверность связи между величиной макронеровностей дороги hд и изменением максимальной динамической реакции на упругом элементе подвески при данных представленных в таблице 6.
Таблица 6 - Исходные данные
hд (x), мм | ||||||
(y), Н |
Заносим исходные значения x, y и промежуточные расчетные величины в сводную таблицу 7:
Таблица 7 - Сводные данные.
№ п/п | x | y | x · y | x2 | y2 |
∑ |
Определим значения постоянных коэффициентов в линейном уравнении регрессии:
Таким образом, уравнение линейной связи имеет вид
Определим коэффициент корреляции
Полученное значение R, близкое к 1, свидетельствует о чисто линейном характере связи. В связи с малым числом измерений проверяем достоверность связи расчетом дисперсии коэффициента корреляции
Связь достоверна.