Корреляционно-регрессионный анализ заключается в определении аналитического выражения и степени тесноты связи между различными социально-экономическими явлениями и процессами или их признаками.
Признаки, обусловливающие изменение других, связанных с ними признаков, называют факторными и обозначают х. Признаки, изменяющиеся под воздействием факторных признаков, называют результативными и обозначают
.
Связи между явлениями и их признаками классифицируются по:
– аналитическому выражению (линейная связь и нелинейная связь);
– направлению (прямая связь и обратная связь);
– степени тесноты (связь отсутствует, слабая, умеренная, сильная).
Линейная связь выражается уравнением прямой
,
где
и
– параметры линейной функции в уравнении связи, выражающей зависимость у от х.
Степень тесноты связи между различными явлениями определяют с помощью эмпирического корреляционного отношения (
)
,
где
– дисперсия в ряду результативного признака под влиянием фактора х, т. е. рассчитанных по уравнению регрессии;
– дисперсия в ряду фактических значений результативного признака.
Если
, т. е.
= 1, то существует полная зависимость уx от х. Если
= 0, то вариация факторного признака не влияет на вариацию результативного признака.
В случае линейной зависимости между двумя признаками степень тесноты связи между ними можно определить также с помощью линейного коэффициента корреляции по формулам
r =
и r =
,
где
– параметр линейной функции в уравнении связи, выражающей зависимость у от х;
и
– среднеквадратическое отклонение в рядах х и у, соответственно;
– средняя величина факторного признака;
– средняя величина результативного признака;
– средняя величина произведений факторного и результативного признаков.
Коэффициент регрессии
показывает, на сколько единиц изменяются значения результативного признака при изменении факторного признака на единицу. В случае прямой связи между признаками линейный коэффициент корреляции принимает положительные значения, а в случае обратной связи – отрицательные.
По величине линейного коэффициента корреляции судят о степени тесноты связи между признаками.
| Величина коэффициента корреляции по модулю | Теснота связи |
| От 0 до ± 0,3 | практически отсутствует |
| От ± 0,3 до ± 0,5 | слабая |
| От ± 0,5 до ± 0,7 | умеренная |
| От ± 0,7 до ± 1,0 | сильная |
Графически связь между двумя количественными признаками изучают с помощью поля корреляции.
Пример 1. Приводятся данные за 2004 г. по отдельным отраслям промышленности в целом по РФ:
| Отрасль промышленности | Среднегодовая численность персонала, тыс. чел. | Объем промышленной продукции, млрд. руб. | Среднемесячная номинальная заработная плата, тыс. руб. |
| Электроэнергетика | 10,96 | ||
| Топливная | 1 996 | 19,35 | |
| Черная металлургия | 1 126 | 9,35 | |
| Цветная металлургия | 13,45 | ||
| Машиностроение | 3 180 | 1 748 | 6,68 |
Составить уравнение линейной функции, выражающей зависимость среднемесячной заработной платы от уровня производительности труда, и измерить тесноту связи между этими показателями. Полученную связь изучить графически.
Решение. Все предварительные расчеты представим в таблице. Факторный признак – уровень производительности труда, рассчитанная путем деления объема промышленной продукции на среднегодовую численность персонала (графа 2), результативный признак – размер средней месячной номинальной заработной платы (графа 3).
| Отрасль промышлен-ности | x | y | | | | |
| Электро-энергетика | 1,127 | 10,96 | 1,2701 | 12,3519 | 120,1216 | 10,405 |
| Топливная | 2,630 | 19,35 | 6,9169 | 50,8906 | 374,4225 | 18,402 |
| Черная металлургия | 1,632 | 9,35 | 2,6634 | 15,2592 | 87,4225 | 13,092 |
| Цветная металлургия | 1,155 | 13,45 | 1,3340 | 15,5348 | 180,9025 | 10,554 |
| Машино-строение | 0,550 | 6,68 | 0,3025 | 3,6740 | 44,6224 | 7,336 |
| Итого | 7,094 | 59,79 | 12,4869 | 97,7159 | 807,4915 | 59,789 |
Вычисляем все необходимые показатели.
1,4188;
11,958;
19,54318;
2,49738;
61,64983;
0,696; 
4,319.
Вычислим линейный коэффициент корреляции
r =
=
= 0,857.
Для определения параметров линейной функции
и
составляют систему уравнений

Подставим в систему уравнений все вычисленные показатели

Решая эту систему уравнений, получаем, что
= 4,40930 и
= 5,32048.
Уравнение имеет вид:
.
В графе 7 с помощью полученной линейной функции рассчитаем теоретические значения результативного признака.
Вычислим линейный коэффициент корреляции
r =
=
= 0,857.
Зависимость средней месячной номинальной заработной платы от уровня производительности труда в представленных отраслях промышленности сильная (
близок к 1) и прямая (
больше нуля), т. е. с увеличением производительности труда увеличивается среднемесячная номинальная заработная плата. Построим поле корреляции.

Рис. 8. Поле корреляции
Поскольку наблюдается сосредоточение точек на графике, то существует сильная связь между уровнем производительности труда и среднемесячной номинальной заработной платой.
Оценку существенности корреляционной связи производят с помощью F -критерия Фишера и t -критерия Стьюдента.
Коэффициент эластичности (
) показывает, на сколько процентов изменяется результативный признак при изменении факторного признака на 1% и рассчитывается по формуле
=
,
где
– среднее значение факторного признака;
– среднее значение результативного признака;
– параметр линейной функции, выражающей зависимость у от х.
Если с возрастанием факторного признака происходит ускоренное возрастание или убывание результативного признака, то корреляционная зависимость может быть выражена параболой второго порядка
.
Система уравнений для расчета параметров параболы второго порядка принимает вид

При наличии линейной зависимости результативного признака от двух факторных признаков вычисляют множественный коэффициент корреляции
R =
,
где r – парные коэффициенты корреляции между признаками.
Множественный коэффициент корреляции изменяется в пределах от 0 до + 1, и его приближение к единице свидетельствует о сильной зависимости между рассматриваемыми признаками.






