Двухвыборочный t-тест с одинаковыми и различными дисперсиями

На основе t-теста строится процедура проверки гипотез о равенстве средних (математических ожиданий) двух независимых нормальных распределений с неизвестными дисперсиями и .

Относительно дисперсий и можно выдвинуть следующие два предположения:

1) Обе дисперсии неизвестны, но предполагается, что они равны между собой, т.е. =.

2) Обе дисперсии неизвестны и предполагается, что они не равны между собой, т.е. .

Ø В случае когда обе дисперсии неизвестны, но предполагается что они равны между собой, мы имеем дело с двумя оценками и одной и той же дисперсии =. в этом случае строится объединённая оценка:

,

S2 - это объединённая оценка дисперсии ==.

В математической статистике доказывается, что если нулевая гипотеза о равенстве математических ожиданий H0: mx=my выполняется, то величина t вычисляется по формуле:

где и - средние арифметические величины,

n1 – число наблюдений в первой выборке,

n2- число наблюдений во второй выборке,

S – выборочное стандартное отклонение,

.

Статистика t имеет распределение Стьюдента. Число степеней свободы определяется по формуле:

Эту t -статистику и используют в качестве критерия при проверке нулевой гипотезы о равенстве математических ожиданий. Схема проверки аналогична проверке при использовании Z- теста.

Ø В случае, когда дисперсии неизвестны и предполагается, что они не равны, используется аналог Z- теста с заменой дисперсий их оценками.

- это распределение близко распределению Стьюдента. Число степеней свободы вычисляется по следующей формуле:

В данном случае t -статистику, используемую для проверки нулевой гипотезы о равенстве средних величин при различных неизвестных дисперсиях, называют критерием Фишера-Беренса.

Для проверки гипотезы используется следующие режимы пакета анализа:

~ Режим работы «двухвыборочный t -тест с одинаковыми дисперсиями».

~ Режим работы «двухвыборочный t -тест с различными дисперсиями».

Данные режимы применяются для проверки гипотез о различии между средними двух нормальных распределений соответственно с неизвестными, но равными дисперсиями, и с неизвестными, но различными дисперсиями.

В диалоговых окнах данных режимов задаются следующие параметры:

* Интервал переменной 1: задаем диапазон с данными выборки х;

* Интервал переменной 2: задаем диапазон с данными выборки у;

* Гипотетическая разность: задаём значение ноль;

* Метки;

* Уровень значимости : 0,05;

* Параметры вывода на экран.

Пример.

Рассмотрим выборочные данные о расходе сырья при производстве продукции по старой и новой технологии.

Старая технология                          
Новая технология                          

Уровень значимости = 0,05

Требуется проверить гипотезу H0: mx=my, предположив, что соответствующие генеральные совокупности имеют нормальное распределение

1) с одинаковыми дисперсиями;

2) с различными дисперсиями.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: