1. Изучаемая совокупность значений должна быть однородной.
2. Необходимо, чтобы совокупность значений факторного и результативного признаков подчинялась нормальному закону распределения.
3. Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.
1. Линейный коэффициент корреляции (r)
Это самый популярный измеритель тесноты линейной связи между X иY.
Особенности расчета линейного коэффициента корреляции.
1. Линейный коэффициент корреляции имеет значение лишь при линейном характере взаимосвязи переменных, если связь криволинейная, то его не используют.
2. Кроме этого, число наблюдений достаточно велико (n >30).
3. Данные должны быть однородными и распределены по нормальному закону распределения.
Формула линейного коэффициента корреляции:
Линейный коэффициент корреляции r может принимать значения от –1 до +1.
|
|
Если r будет положительным, то это говорит о наличии прямой зависимости между х и у,
в противном случае (r< 0) – об обратной связи.
Если r= 0 - отсутствие линейной зависимости между х и у,
а при r= 1 функциональная зависимость между х и у.
Шкала Чеддока используется для оценки тесноты связи.
Таким образом, коэффициент корреляции при линейной зависимости служит как мерой тесноты связи, так и показателем, характеризующим степень приближения корреляционной зависимости между х и у к линейной. Поэтому близость значения r к 0 в одних случаях может означать отсутствие связи между х и у, а в других свидетельствовать о том, что зависимость не линейная.
В нашей задаче для расчета r построим вспомогательную таблицу.
Таблица 1. Вспомогательные расчеты линейного коэффициента корреляции
№ п/п | x | y | x – | y – | ) ) |
27,068 | 172,17 | -9,534 | -66,504 | 634,078 | |
29,889 | 200,9 | -6,713 | -37,774 | 253,594 | |
33,158 | 232,1 | -3,444 | -6,574 | 22,644 | |
34,444 | 231,83 | -2,158 | -6,844 | 14,773 | |
37,299 | 246,53 | 0,697 | 7,856 | 5,472 | |
37,554 | 236,99 | 0,952 | -1,684 | -1,603 | |
37,755 | 233,4 | 1,153 | -5,274 | -6,079 | |
37,909 | 256,43 | 1,307 | 17,756 | 23,199 | |
38,348 | 261,89 | 1,746 | 23,216 | 40,525 | |
39,137 | 259,36 | 2,535 | 20,686 | 52,430 | |
40,37 | 253,62 | 3,768 | 14,946 | 56,310 | |
46,298 | 278,87 | 9,696 | 40,196 | 389,722 | |
итого | 1 485,066 |
В нашей задаче: = = 4,784; = = 27,618.
Тогда линейный коэффициент корреляции по формуле
r = = 0,937
Найденное значение свидетельствует о том, что связь между величиной стоимостного внешнеторгового товарооборота и величиной таможенных платежей в федеральный бюджетпрямая, сильная (по шкале Чеддока), близкая к линейной.
Проверка коэффициента корреляции на значимость. Интерпретируя значение коэффициента корреляции, следует иметь в виду, что, как любой выборочный показатель, он содержит случайную ошибку и не всегда однозначно отражает действительно реальную связь между изучаемыми показателями.
|
|
Для того, чтобы оценить существенность (значимость) самого r и, соответственно, реальность измеряемой связи между х и у, необходимо
1) рассчитать среднюю квадратическую ошибку коэффициента корреляции σr.
2) Сравнить математический модуль значения r с его средней квадратической ошибкой:
Если >3, то r считается значимым (существенным), а связь – реальной.
В нашем случае проверить по этой формуле коэффициент на значимость нельзя, т.к. мы анализируем всего 12 единиц наблюдения.