Регрессионный и корреляционный анализы — это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.
Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак.
Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).
Решение всех названных задач приводит к необходимости комплексного использования этих методов.
КОРРЕЛЯЦИЯ [correlation] — величина, характеризующая взаимную зависимость двух случайных величин, X и Y, безразлично, определяется ли она некоторой причинной связью или просто случайным совпадением (ложной К.). Для того чтобы определить эту зависимость, рассмотрим новую случайную величину — произведение отклонения значений x от его среднего Mx и отклонения y от своего среднего My. Можно вычислить среднее значение новой случайной величины:
|
|
rxy = M {(x – Mx) (y – My)}.
Это среднее получило название корреляционной функции, или ковариации. На ее основе (делением на корень из произведения дисперсий σ2x, σ2y, т. е. на произведение стандартных отклонений) строится коэффициент К.:
При нелинейной зависимости аналогичный показатель носит название индекса К.
Если x и y независимы, то Rxy = 0. Если же x и y зависимы, то обычно Rxy ≠ 0. Причем в тех случаях, когда зависимость полная, то либо Rxy = 1 (x и y растут или уменьшаются одновременно), либо Rxy = –1 (при увеличении одной из них другая уменьшается). Следовательно, коэффициент К. может изменяться от –1 до +1.
К. используется для выявления статистической зависимости величин при обработке данных. Наряду с указанной формулой используется ряд формул эмпирического определения тесноты корреляционной связи между наблюдаемыми признаками исследуемых величин.