Корреляционный и регрессионный анализ

Регрессионный и корреляционный анализы — это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух или больше переменных.

Задачи корреляционного анализа сводятся к измерению тесноты известной связи между варьирующими признаками, определению неизвестных причинных связей (причинный характер которых должен быть выяснен с помощью теоретического анализа) и оценки факторов, оказывающих наибольшее влияние на результативный признак.

Задачами регрессионного анализа являются выбор типа модели (формы связи), установление степени влияния независимых переменных на зависимую и определение расчётных значений зависимой переменной (функции регрессии).

Решение всех названных задач приводит к необходимости комплексного использования этих методов.

КОРРЕЛЯЦИЯ [correlation] — величина, характеризующая взаимную зависимость двух случайных величин, X и Y, безразлично, определяется ли она некоторой причинной связью или просто случайным совпадением (ложной К.). Для того чтобы определить эту зависимость, рассмотрим новую случайную величину — произведение отклонения значений x от его среднего Mx и отклонения y от своего среднего My. Можно вычислить среднее значение новой случайной величины:

rxy = M {(x – Mx) (y – My)}.

Это среднее получило название корреляционной функции, или ковариации. На ее основе (делением на корень из произведения дисперсий σ2x, σ2y, т. е. на произведение стандартных отклонений) строится коэффициент К.:

При нелинейной зависимости аналогичный показатель носит название индекса К.

Если x и y независимы, то Rxy = 0. Если же x и y зависимы, то обычно Rxy ≠ 0. Причем в тех случаях, когда зависимость полная, то либо Rxy = 1 (x и y растут или уменьшаются одновременно), либо Rxy = –1 (при увеличении одной из них другая уменьшается). Следовательно, коэффициент К. может изменяться от –1 до +1.

К. используется для выявления статистической зависимости величин при обработке данных. Наряду с указанной формулой используется ряд формул эмпирического определения тесноты корреляционной связи между наблюдаемыми признаками исследуемых величин.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: