Показатель наличия линейной связи в генеральной совокупности – это коэффициент корреляции. Для генеральной совокупности он равен ρ. Нам это значение неизвестно. По данным выборки мы Получаем оценку для ρ – выборочный коэффициент корреляции r – и на основании r проводим испытание гипотезы о наличии линейной связи между переменными x, y в генеральной совокупности. Наш вывод о наличии линейной связи между переменными x, y генеральной совокупности зависит от объема выборки. Чем больше чем нашей выборки, тем надежнее полученный результат.
H0: ρ = 0, то есть между переменными x, у отсутствует линейная связь в генеральной совокупности.
H1: ρ ≠ 0, то есть между переменными x, у есть линейная связь в генеральной совокупности.
Задается доверительная вероятность p. Пусть n — объем парной выборки. Двусторонняя проверка, α = (1 – p)/2.
По таблице t -распределения находим tα ; n-2. В Excel для двусторонней проверки tα ; n-2 = СТЬЮДРАСПОБР (1 – p; n – 2), для односторонней проверки tα ; n-2 = СТЬЮДРАСПОБР (2×(1 – р); n – 2).
|
|
Граничные точки tα ; n-2.
Статистика t = √ r 2(n – 2)/(1 – r 2).
Пример 4. Вернемся к примерам 1, 2. Проверим гипотезу о наличии линейной связи между переменными x, y в генеральной совокупности. Доверительная вероятность p = 95%. n = 5.
H0: ρ = 0, то есть между переменными x, у отсутствует линейная связь в генеральной совокупности.
H1: ρ ≠ 0, то есть между переменными x, у есть линейная связь в генеральной совокупности.
Проведем двустороннюю проверку.
α = (1 – p)/2(1 – 0,95)/2 = 0,025.
По таблице t -распределения находим tα ; n-2 = t0,025 ; 5-2 = 3,182. Граничные точки ±3,182.
Статистика t = √ r 2(n – 2)/(1 – r 2) = √0,817× (5 – 2)/(1 – 0,817) ≈ 3,660.
Отметим значения на числовой оси.
H0 H1 2,5% | H0 95 % | H0 H1 2,5% |
-3,182 | 3,182 | 3,660 |
Мы отклоняем гипотезу H0 и принимаем гипотезу H1 на уровне значимости 5%. Между переменными x, y есть линейная связь в генеральной совокупности.