Корреляция и взаимосвязь величин

Статистика 5.

Корреляция (корреляционная зависимость) – статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин. Математической мерой корреляции двух случайных величин служит корреляционное отношение, либо коэффициент корреляции - r.

Строим поле корреляции (первый шаг): на оси Х распределяем значения первого ряда (якобы независимого), на оси У распределяем значения второго ряда (якобы зависимого) и отмечаем точками их парные значения. Обязательно проставляем годы у каждой точки. Вид поля корреляции уже наводит на некоторые размышления о степени связи исследуемых переменных. Для более чёткого определения этой степени рассчитываем следующие характеристики.

Парный коэффициент корреляции Пирсона рассчитывается с использованием таблицы № 7 следующего вида (второй шаг):

X i X i – X ср. Y i Y i - Y ср. (Xi – Xср.) (Yi – Yср.)
         
 
         
        ∑ =

Где в первом и третьем столбцах значения Х и У из неранжированных рядов.

∑ (Xi – X) (Yi – Y)

Далее расчёт производится по формуле (третий шаг): r(x,y) = —————————;

N σ(x) σ(y)

1 - r²

Определяется ошибка r по формуле (четвёртый шаг): δ r = √ ————;

N – 2

Таким образом r = r ± δ r; записываем.

Теперь необходимо определить статистическую значимость полученной связи (проверка нулевой гипотезы об отсутствии этой связи). Для этого используем распределение и критерий Стьюдента – t. Рассчитанное t получаем по формуле (пятый шаг):

t = r / δ r, а табличное t определяем по α = 0,05, а m = N – 2. Сравниваем. Если t > t табл., значит данная связь статистически значима, в противном случае – наоборот.

Ранговый коэффициент корреляции Спирмена используется в следующих случаях:

- переменные имеют ранговую (рейтинговую) шкалу измерения;

- распределение данных слишком отличается от нормального или вообще неизвестно;

- выборки имеют небольшой объем (N<30);

В нашем случае для расчёта r s cначала на основе ранжированных рядов каждому значению Х i присваивается ранг: минимальному – 1, максимальному – N. Если несколько членов ряда имеют одинаковое значение, то ранги рассчитываются по формуле: d= di +di+1 + di+2 + …..dn / n, где i ÷ n – номера рангов и записываются с десятыми долями в следующую таблицу. После распределения рангов выполняется таблица № 8 уже по неранжированным рядам (шестой шаг):

Хi Уi dx dy di=dx-dy (di)²
           
 
           
         

6 ·∑(di)²

Затем производится расчёт: rs= 1 - ──────;

N· (N²-1)

1 – r s

Ошибка определяется по формуле: δ r s = √ ─────; r s = r s ± δ r s;

N – 2

Проверка значимости (нулевой гипотезы об отсутствии связи) производится так же, как и для парного коэффициента корреляции Пирсона.

Корреляционное отношение η позволяетоценить степень зависимости одной переменной (зависимой) – У, от другой (независимой) – Х. Для каждого интервала по Х суммируются значения У и делятся на их количество в этом интервале, т.е. получаем У ср. в каждом интервале по Х. Для помощи используется построенное ранее поле корреляции и таблица № 9 (седьмой шаг):

У

   
 
·

·

  ·    
 
 


·

·

·

  ·     ·     · ·   · ·     · · ·  
 
 


·

·

·

    ·
 
 


·

·

·

·

·

  ·   · · ·  

а 1 а 2 а 3 а 4 а 5 а 6 а 7 Х

Табл.№ 9.

К аi ÷ аi+1 n k Yk ср. Yk ср. - Y ср. (Yk ср. – Yср.)²· n k
           
           
          ∑=

Где К – номер интервала; аi ÷ аi+1 - границы интервала; n k - количество значений (сами значения Y находятся по годам в исходном ряду) в данном интервале; Yk cр. – среднее значение в данном интервале. η²=σ²y/x / σ²y, где σ²y/x – межгрупповая дисперсия У по Х и считается по формуле:

σ²y/x =∑ (Yk ср.– Yср.)²· n k /N-1; затем считается:η²=σ²y/x / σ²y, где σ²y- известная дисперсия У

1- η² η

η=√η². Ошибка δη = √────; η=η±δη; проверка значимости t = ──; табличное t определяем

N-2 δη

по α = 0,05, а m = N – 2. Сравниваем. Если t > t табл., значит данная связь статистически значима, в противном случае – наоборот.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: