Демонстрационный пример 4В

Рассмотрим задачу на применение Двухвыборочного F-теста для сравнения дисперсий двух генеральных совокупностей. Это может быть самостоятельной задачей, если мы оцениваем, например, точность двух приборов. Точность измерений будет одинаковой, если дисперсии равны. Кроме того F-тест используется перед проведением Двухвыборочного t-теста с одинаковыми дисперсиями.

Пусть необходимо оценить существенность различий в скорости оседания эритроцитов (СОЭ) двух групп больных для уровня значимости α = 0,01 по следующим данным:

X              
Y              

Для того, чтобы выбрать тест для оценки существенности различий, т.к. рассматриваются выборки не повторных испытаний, нам нужно оценить равенство дисперсий. В зависимости от того равны они или нет выбрать соответствующий t-тест. Поэтому сначала проведем F-тест.

Выдвигаем нулевую гипотезу Н0: о равенстве дисперсий при альтернативной гипотезе Н1: дисперсия первой группы больше дисперсии второй группы (одностороннее распределение, обычно здесь другие альтернативные гипотезы не используются) при уровне значимости α = 0,01.

Значения данных вносим в таблицу Excel в блоки А1:H1 и А2:H2. Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный F- тест для дисперсии и нажимаем Ок. На экран будет выведено окно (см. рис. 4.3)

Рис. 4.3

В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А10 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:

     
Двухвыборочный F-тест для дисперсии    
     
  X Y
Среднее   39,85714286
Дисперсия   3,476190476
Наблюдения    
df    
F 2,301369863  
P(F<=f) одностороннее 0,166943934  
F критическое одностороннее 8,466031431  
     

В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); df – k = n-1 (число степеней свободы); F – вычисленный параметр Фишера; P(F<= f)одностороннее – критический уровень значимости; F критическое одностороннее – табличное значение параметра Фишера для заданного уровня значимости 0,01. Нулевая гипотеза принимается при F<Fкритическое, в противном случае, при F>Fкритическое, принимается альтернативная гипотеза.

В нашем случае F = 2,3. Это значительно меньше Fкритическое = 8,47. Следовательно, дисперсии одинаковы для уровня значимости 0,01 (вероятность 99 %).

Теперь переходим ко второй части задачи о существенности различий в СОЭ. Проверяем нулевую гипотезу о равенстве математических ожиданий СОЭ Н0: а1 = а2 при альтернативной гипотезе, что они не равны Н1: а1 ≠ а2 (двустороннее распределение) для уровня значимости 0,01.

Так как мы установили равенство дисперсий двух рядов, то используем Двухвыборочный t-тест с одинаковыми дисперсиями.

Вызываем пакет анализа данных Сервис – Анализ данных…. Выбираем из списка Двухвыборочный t-тест с одинаковыми дисперсиями и нажимаем Ок. На экран будет выведено окно (см. рис. 4.4)

Рис. 4.4

В данном окне ввести Интервал переменной 1 блок А1:Н1 или выделить этот блок с помощью мыши. В Интервал переменной 2 ввести блок А2:Н2 или выделить этот блок с помощью мыши. В поле Гипотетическая средняя разность ввести ноль (т.к. нулевая гипотеза предполагает равенство математических ожиданий рядов). Поставить флажок Метки. Ввести в поле Альфа уровень значимости 0,01. В Параметрах вывода щелкнуть Выходной интервал и ввести в поле ячейку А22 (или выделить эту ячейку с помощью мыши), с которой будет начинаться вывод результата анализа. Нажимаем кнопку Ок. На лист Excel будет выведена следующая таблица:

Двухвыборочный t-тест с одинаковыми дисперсиями  
     
  X Y
Среднее   39,85714286
Дисперсия   3,476190476
Наблюдения    
Объединенная дисперсия 5,738095238  
Гипотетическая разность средних    
df    
t-статистика 5,578560025  
P(T<=t) одностороннее 6,00857E-05  
t критическое одностороннее 2,680990292  
P(T<=t) двухстороннее 0,000120171  
t критическое двухстороннее 3,054537956  

В данной таблице параметры обозначают следующее: Среднее – средние арифметические значения выборок; Дисперсия – дисперсии выборок; Наблюдения – число опытов (объем выборки); Объединенная дисперсия – пока не рассматриваем; Гипотетическая разность средних – гипотеза о равенстве математических ожиданий а12 = 0; df – k = n1+n2-2 (число степеней свободы); t-статистика – рассчитанный параметр Т; t-критическое одностороннее – табличный параметр при альтернативной гипотезе математическое ожидание одной ГС больше (или меньше) математического ожидания второй ГС; t-критическое двухстороннее – табличный параметр при альтернативной гипотезе математические ожидания двух ГС не равны; P(T<=t) одностороннее и P(T<=t) двухстороннее соответствующие критические уровни значимости.

Для рассмотренного примера Т = 5,58, а tтабл = 3,05. Так как Т>tтабл для уровня значимости 0,01, то это означает, что различие в СОЭ для двух групп больных существенно.

Примечание:

В случае неравных дисперсий следует выбрать Двухвыборочный t-тест с разными дисперсиями.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: