Корреляционный анализ и сущность корреляционной связи

Общие приемы и математические методы изучения и измерения связей общественных явлений.

Существуют два типа зависимости между общественными явлениями:

1. Корреляционная

2. Функциональная

При корреляционной связи определенному изменению одного явления соответствует в отдельных случаях различные по величине и направлению изменения другого явления.

Корреаляционная связь существует напрямую между уровнем квалификации и размером заработной платы работников, между величиной мощности заводского оборудования и объемом продукции предприятия, а также в бесчисленном множестве случаев.

При функциональной связи изменению одного явления соответствует строго определенные изменения другого явления, находящегося с ним в причинно-следственной связи.

При корреляционной связи изменению одного явления соответствует различные по величине и направлению изменения другого явления.

В теории статистики различают следующие виды признаков, корреляционная связь между которыми является предметом изучения:

1. Факториальные – признаки или факторы, обуславливающие изменение других признаков

2. Результативные или признаки результата – изменяющиеся под воздействием факториальных признаков.

Задачи статистики при исследовании корреалиционной связи между изучаемыми явлениями:

· выявление наличия корреляционной связи

· измерение (количественное выражени) степени тесноты корреалиционной связи между признаками

Корреляционная связь обнаруживается более ясно только при рассмотрении средних значений результативного признака, соответствующего средним значениям факториального признака. Благодаря исчислению групповых средних значений, влияние прочих причин взаимно погашаются и проявляются факториальные признаки. Поэтому основным методом выявления наличия корреалиционной связи является метод аналитических группировок и определение групповых средних. Сущность его состоит в том, что совокупность результатов разбивается на группы по величине факториального признака и для каждой группы вычисляются средние величины, как среднеарифметические результативного признака.

Для решения данной задачи с методом аналитических группировок и параллельно с ним применяется также графический метод. Главным образом для предварительного анализа и оценок предшествующих статистических характеристик или показателей. Графическое изображение результатов статистического наблюдения представляет собой корреляционное поле, т.е. точечный график, для построения которого на оси абсцисс откладываются значения факториально признака х, а по оси ординат – значения результативного признака у. Каждой единице изучаемой совокупности на графике соответствует одна точка, значение которой определяется величиной двух признаков, характеризующих эту единицу.

Пример: имеющиеся следующие данные, характеризующие результативность с/х производства (таблица 4)

Таблица 4

Зависимость сбора зерна от размера посевных площадей зерновых культур

Номер фермерского хозяйства Посевная площадь, тыс. га Валовый сбор зерна, тыс т xy x2 y2
  4,0 6,0                
  2,0 4,6                
  3,1 4,4                
  3,2 4,5                
  3,4 5,5                
  3,5 4,8                
  3,7 5,1                
  3,2 5,2                
  3,9 7,0                
  3,5 5,3                
  5,0 7,5                
  3,7 7,7                
  5,0 7,3                
  3,8 7,0                
  5,0 6,7                
ИТОГО 56,0 88,6                

Для выявления корреалиционной связи между посевом зерновых и валовым сбором зерна для наглядности используют графический метод.

Зависимость сбора зерна от размера посевных площадей зерновых культур за 2003г (рисунок 1)

Точки не соединяются.

Задача №2

Корреляционная связь может быть прямая или положительная, когда увеличению одного явления соответствует увеличение значения другого явления. Обратная или отрицательная связь наблюдается тогда, когда увеличение одного явления вызывает уменьшение другого.

Если материалы статистического наблюдения были подвергнуты аналитической группировке, были вычислены средние, как среднеарифметическая, то эти средние в виде точек наносятся на график корреляционного поля. Соединив последовательно эти точки, мы получим так называемую эмпирическую линию регрессии, которая позволяет судить не только о наличии, но и форме корреляционной связи.

Линия корреляционной связи двух признаков фактора и результата отражает все изменения величины результативного признака, которые имели бы место при уравновешивании влияния всех других факторов, кроме признака фактора, называется теоретической линией регрессии.

Для нахождения параметров а и b необходимо решить систему параметрических уравнений следующего вида:

n – число параметрических данных х и у

Подставим полученные суммы в систему параметрических уравнений, определим величины a и b:

Построение на графике уравнения теоретической регрессии.

Измерение степени тесноты корреляционной связи. Для этого в статистике при прямолинейной форме зависимости используется коэффициент корреляции – rxy, как частный случай коэффициента детерминации.

Коэффициент корреляции применяется потому, что в статистике при изучении корреляционной связи имеют дело не с приращением функции в связи с изменением аргумента, а с сопряжением вариацией результативного признака и факториального признака, при этом определение степени тесноты связи сводится к изучению этой сопряженности, т.е. того, в какой мере отклонение от среднего уровня одного признака сопряжено с другим, т.е. результативным признаком. Это означает, что при наличии полной прямой связи отклонение факториального признака должно обуславливать отклонение результативного признака. А при обратной связи отклонение последнего должно быть с противоположным знаком. Для расчета коэффициента корреляции предлагается использовать ряд формул, среди которых для данного примера рекомендуется выбрать следующую:

Коэффициент корреальности находится в пределах

Если значение коэффициента корреляции >0, наблюдается прямая корреляционная связь, если <0, то обратная корреляционная связь. В частном случае, если =0, корреляционная связь полностью отсутствует. В двух других случаях, если =+1(-1), корреляционная связь вырождается в функцию. В статистической практике, если коэффициент корреляции находится в пределах корреляционная связь практически отсутствует. Если наблюдается соотношение , то корреляционная связь считается слабой. При значениях корреляционная связь считается сильной.

При криволинейной зависимости между признаками значение коэффициент корреальности не применимо, т.к. оно недооценивает степень тесноты связи и в этом случае исчисляется коэффициент детерминации:

- средняя арифметическая из фактических значений признака-результата в ряду распределения.

Коэффициент детерминации находится в следующих пределах:

(6)

Чем ближе значение коэффициента детерминации к 1, тем теснее связь между двумя признаками, или факториальный признак х оказывает большее влияние, чем результативный признак у.

Если же не наблюдается такого влияния, тогда вариация результативного признака, обусловленная влиянием факториального признака , т.е. числитель равен нулю и коэффициент детерминации тоже становится равным нулю, что указывает на полное отсутствие связи между двумя признаками.

Равенство коэффициента детерминации (1) говорит о вырождении корреляционной связи в функции:



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: