Значимость коэффициента корреляции

Из двумерной генеральной совокупности (X, Y) извлечена выборка объёма n и по ней найден выборочный коэффициент корреляции rв, который оказался отличным от нуля. Поскольку выборка отобрана случайно, то нельзя заключить, что коэффициент корреляции генеральной совокупности r также отличен от нуля. Возникает необходимость при данном уровне значимости α проверить нулевую гипотезу H0={r=0} о равенстве нулю генерального коэффициента корреляции при конкурирующей гипотезе H1={rs≠0}.

В качестве критерия проверки нулевой гипотезы применяют случайную величину

Величина T при справедливости нулевой гипотезы имеет распределение Стьюдента с k=n-2 степенями свободы. Поэтому вычисляется эмпирическое значение критерия:

и по таблице критических точек распределения Стьюдента по выбранному уровню значимости α и числу степеней свободы k=n-2 находят критическую точку tкр(α;k).

Если |Tэмп|>tкр, то нулевую гипотезу отвергают, и выборочный коэффициент корреляции значимо отличается от нуля, а X и Y коррелированны, т.е. связаны линейной зависимостью.

Если |Tэмп|≤tкр, то нет оснований отвергать нулевую гипотезу и говорят, что выборочный коэффициент корреляции незначим, а X и Y некоррелированы, т.е. не связаны линейной зависимостью.

Проиллюстрируем использование t-распределения Стьюдента для определения значимости коэффициента корреляции. Для этого воспользуемся рассмотренной ранее задачей и определим, можно ли считать связь между результатами ЕГЭ по русскому языку и математике значимой.

В данном примере коэффициент корреляции Спирмена равен rs=0.75. Решим поставленную задачу на уровне значимости Для этого выдвинем основную гипотезу H0, утверждающую, что связь несущественна: H0={rs=0} и H1={rs≠0}. Чтобы оценить истинность этой гипотезы на заданном уровне значимости, необходимо сначала найти критическое значение tкр( ;k) критерия, которое определяется по специальной таблице. tкр зависит от уровня значимости и степени свободы k, равной в данном случае n-2, где n – объём выборки. Т.к. и n=7, то по таблице находим tкр= tкр(0,05; 5) 2.57.

Далее следует воспользоваться формулой:

Выполнив расчёты, получим:

Поскольку Tэмп≈2,54<2.57≈tкр(0,05;5), то принимается гипотеза H0, т.е. можно говорить о несущественности связи на уровне значимости 0.05. В этом случае можно понизить уровень значимости до

tкр(0,1; 5) 2.02 и Tэмп≈2,54>2,02=tкр(0,1;5)

Следовательно, гипотеза H0 на уровне значимости α=0,1 отвергается, и связь можно считать существенной.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: