Методы выявления наличия корреляционной связи между двумя признаками

1). Метод сопоставления параллельных рядов значений факторного и результативного признака.

Для этого факторы, характеризующие результативный признак, располагаются в возрастающем порядке, т. е. составляется ранжированный ряд, параллельно записываются признаки фактора и прослеживается направление изменения величины результативного признака. Путём сопоставления расположенных таким образом рядов определяются существенные связи и их направления.

Пример: даны уровни энерговооружённости (х) и производительности труда (у) по 15 заводам.

№ п/п х у № п/п х у № п/п х у
1 6,0 2 6 7,9 3 11 9,4 5
2 6,1 3 7 8,2 4 12 9,9 7
3 6,8 6 8 8,5 5 13 10,5 7
4 7,2 4 9 8,6 6 14 11,2 8
5 7,4 2 10 9,1 8 15 11,3 6

Рассматривая данные таблицы можно заметить, что с возрастанием признака х возрастает и признак у. Отсюда можно сделать вывод о наличии прямой корреляционной связи.

Если же с увеличением факторного признака величина результативного признака имеет тенденцию к уменьшению, то можно предполагать обратную связь между признаками.

Для сравнительного анализа параллельных рядов могут применяться элементарные относительные показатели, например, коэффициент корреляции знаков Густава Фехнера (1801-1887) (Кф), который оценивает связь на основе сравнения признаков с их средней арифметической. Этот показатель основан на оценке степени согласованности направлений отклонений ин­дивидуальных значений факторного и результативного призна­ков от соответствующих средних. Для его расчёта вычисляют средние значения результативного и факторного признаков, а за­тем проставляют знаки отклонений для всех значений взаимос­вязанных пар признаков.

Для нашего примера:

Определяем знак отклонения каждого значения признака от его средней арифметической для каждого из рядов:

№ п/п

Знаки отклонений

№ п/п

Знаки отклонений

№ п/п

Знаки отклонений

х у х у х у
1 - - 6 - - 11 + -
2 - - 7 - - 12 + +
3 - + 8 - - 13 + +
4 - - 9 + + 14 + +
5 - - 10 + + 15 + +

Рассчитываем коэффициент Фехнера по формуле:

где   С – число совпадений знаков отклонений индивидуальных величин х и у от средней;

  Н – число несовпадений знаков отклонений х и у от средней.

Кф изменяется от –1 до +1.

Если Кф  равен +1, то имеет место полностью согласованная прямая связь.

Если коэффициент Фехнера равен 0 – изменчивость не согласуется.

Если этот коэффициент равен –1, то имеется полная обратная согласованная связь.

Как видно из приведённой формулы для расчёта коэффици­ента Фехнера, величина этого показателя не зависит от величи­ны отклонений факторного и результативного признака от соот­ветствующей средней величины. В связи с этим нельзя говорить о сте­пени тесноты корреляционной связи, а тем более об оценке её су­щественности на основании только коэффициента Фехнера. При малом объёме исходной информации коэффициент Фехнера практически решает ту же задачу, которая ставится при построе­нии групповых и корреляционных таблиц, т. е. отвечает на вопрос о наличии и направлении корреляционной связи между признаками.

2). Метод аналитической группировки связан с построением статистических таблиц:

а) построение групповой таблицы

Значительно более сильно будет выделяться корреляционная зависимость, если применять метод группировки и сравнивать не индивидуальные значения, а групповые средние. Все наблюдения разбиваются на группы в зависимости от величины факторного признака, и по каждой группе вычисляются средние значения результативного признака.

Такой приём единственно возможный, если нужно выявить зависимость на примере 100, 1000 единиц. При этом необходимо образовать такое количество групп, при котором в вариации групповых средних в максимальной степени будет проявляться влияние группировочного признака. Предполагается, что все прочие причины, носящие случайный характер, при определении средней по группам взаимопогашаются, т. е. дают в каждой группе один и тот же результат.

Чем больше групп образуется, тем больше увеличивается межгрупповая вариация, но при этом нельзя растягивать группировку, особенно при небольшом числе наблюдений. В этом случае группы получаются малочисленные, и средние из них будут носить случайный характер, а межгрупповая вариация будет отражать не только влияние фактора-признака, но и других факторов. Следовательно, нужно выбрать оптимальное число групп для конкретного случая, чтобы групповые средние перестали носить случайный характер и с каждой новой группой имели тенденцию к росту или снижению. Исходя из этого, делается вывод о наличии прямой или обратной корреляционной зависимости между признаками.

Недостатком метода является неоднозначность результатов, которые зависят как от числа выделенных групп, так и от установления границ интервалов.

б) построение корреляционной таблицы

Корреляционная таблица предполагает группировку значений как факторного признака (в строках), так и результативного признака (в столбцах) и распределение частот повторения каждого сочетания их значений. Если частоты расположены в таблице беспорядочно, можно говорить об отсутствии связи между переменными. В случае образования какого-либо характерного сочетания частот допустимо утверждать о связи между признаками. Если частоты в корреляционной таблице расположены на диагонали из левого верхнего угла в правый нижний угол (т. е. большим значениям фактора соответствуют большие значения функции), то можно предположить наличие прямой корреляционной зависимости между признаками. Если же частоты расположены по диагонали справа налево, то имеет место обратная связь. Корреляционная таблица компактно представляет статистический материал и служит основой для расчёта показателей корреляции.

 

\ Y \ X \ Y1 Y2 ... Yz Итого Yi
X1 f11 f12 ... f1z
X2 f21 f22 ... f2z
... ... ... ... ... ... ...
Xr fk1 fk2 ... fkz
Итого ... n
... -

 

3). Графический метод.

В прямоугольной системе координат по оси абсцисс откладываются индивидуальные значения факторного признака, а по оси ординат соответствующие ему значения результативного признака, а их сочетания обозначается точками. Получается точечный график, который принято называть полем корреляции. По расположению точек, их концентрации в определённом направлении можно судить о наличии связи.

Для большей наглядности можно построить график, иллюстрирующий зависимость от факторного признака среднего значения результативного признака. Соединяя полученные точки на графике, получаем прямую линию, которая является эмпирической линией регрессии, которая показывает, как в целом изменяется y по мере изменения x.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: