Ограничения корреляционного анализа

1. Изучаемая совокупность значений должна быть однородной.

2. Необходимо, чтобы совокупность значений факторного и результативного признаков подчинялась нормальному закону распределения.

3. Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.

1. Линейный коэффициент корреляции (r)

Это самый популярный измеритель тесноты линейной связи между X иY.

Особенности расчета линейного коэффициента корреляции.

1. Линейный коэффициент корреляции имеет значение лишь при линейном характере взаимосвязи переменных, если связь криволинейная, то его не используют.

2. Кроме этого, число наблюдений достаточно велико (n >30).

3. Данные должны быть однородными и распределены по нормальному закону распределения.

Формула линейного коэффициента корреляции:

Линейный коэффициент корреляции r может принимать значения от –1 до +1.

Если r будет положительным, то это говорит о наличии прямой зависимости между х и у,

в противном случае (r< 0) – об обратной связи.

Если r= 0 - отсутствие линейной зависимости между х и у,

а при r= 1 функциональная зависимость между х и у.

Шкала Чеддока используется для оценки тесноты связи.

Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.

В нашей задаче для расчета r построим вспомогательную таблицу.

Таблица 1. Вспомогательные расчеты линейного коэффициента корреляции

№ п/п x y x – y – ) )
  27,068 172,17 -9,534 -66,504 634,078
  29,889 200,9 -6,713 -37,774 253,594
  33,158 232,1 -3,444 -6,574 22,644
  34,444 231,83 -2,158 -6,844 14,773
  37,299 246,53 0,697 7,856 5,472
  37,554 236,99 0,952 -1,684 -1,603
  37,755 233,4 1,153 -5,274 -6,079
  37,909 256,43 1,307 17,756 23,199
  38,348 261,89 1,746 23,216 40,525
  39,137 259,36 2,535 20,686 52,430
  40,37 253,62 3,768 14,946 56,310
  46,298 278,87 9,696 40,196 389,722
итого         1 485,066

В нашей задаче: = = 4,784; = = 27,618.

Тогда линейный коэффициент корреляции по формуле

r = = 0,937

Найденное значение свидетельствует о том, что связь между величиной стоимостного внешнеторгового товарооборота и величиной таможенных платежей в федеральный бюджетпрямая, сильная (по шкале Чеддока), близкая к линейной.

Проверка коэффициента корреляции на значимость. Интерпретируя значение коэффициента корреляции, следует иметь в виду, что, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями.

Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо

1) рассчитать среднюю квадратическую ошибку коэффициента корреляции σr.

2) Сравнить математический модуль значения r с его средней квадратической ошибкой:

Если >3, то r считается значимым (существенным), а связь – реальной.

В нашем случае проверить по этой формуле коэффициент на значимость нельзя, т.к. мы анализируем всего 12 единиц наблюдения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: