Проверка гипотезы о равенстве средних

Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо различаются. Существует три разновидности критерия: один – для связанных выборок, и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Если выборки не связаны, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же как и в случае сравнения дисперсий имеются 2 способа решения задачи., которые рассмотрим на примере.

ПРИМЕР 3. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформления упаковки.

до смены                          
после смены                        
                                                 

Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?

По условию р =0,99, a=0,01, выборки не связаны, критерий односторонний, т.к. нужно показать, что средние показателя, представленного второй выборкой, больше чем у первой. Вводим в ячейки А1-М1 и А2-L2 исходные данные. Т.к. выборки несвязаны, то предварительно сравниваем дисперсии (сделать это самостоятельно аналогично предыдущему примеру из п. 2 любым способом). В результате проверки дисперсии оказываются равными.

Первый способ решения задачи, как и в случае дисперсий, использовать стандартную функцию. Ею является ТТЕСТ(массив1;массив2;хвосты;тип), решающий задачу по t-критерию Стьюдента. В ячейке В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргументы функции:

- массив1, массив2 – исходные данные (ссылки на А1-М1 и А2-L2);

- хвосты – вид критерия: если 1 – односторонний критерий, если 2 – двусторонний (в нашем случае ставится единица);

- тип – тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями –2, для несвязанных выборок с неравными дисперсиями – 3 (выбираем 2).

Функция возвращает критическое значение уровня значимости, имеющего смысл ошибиться, приняв гипотезу о различии средних. Если критическое значение больше заданного, то средние нужно считать равными. Результат в нашем случае 0,0476828 больше заданного . Следовательно, смена производителем упаковки не привела к среднему увеличению продаж и изменения в количествах продаж, вероятнее всего, связано с какими-то случайными факторами.

Второй способ – использовать пакет «Анализ данных». Способ вызова и подключения его был описан в п.2. В зависимости от типа критерия выбирается один из трех: «Парный двухвыборочный t-тест для средних» – для связанных выборок, и «Двухвыборочный t-тест с одинаковыцми дисперсиями» или «Двухвыборочный t-тест с разными дисперсиями» - для несвязанных выборок. Вызовите тест с одинаковыми дисперсиями, в открывшемся окне в полях «Интервал переменной 1» и «Интервал переменной 2» вводят ссылки на данные (А1-М1 и А2-L2, соответственно), если имеются подписи данных, то ставят флажок у надписи «Метки» (у нас их нет, поэтому флажок не ставится). Далее вводят уровень значимости в поле «Альфа» - 0,01. Поле «Гипотетическая средняя разность» оставляют пустым. В разделе «Параметры вывода» ставят метку около «Выходной интервал» и поместив курсор в появившееся поле напротив надписи, щелкают левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. Нажав на «ОК» появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику, критические значения этих статистик и критические уровни значимости «P(T<=t) одностороннее» и «P(T<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае |-1,739215668| < 2,499873517, следовательно, среднее число продаж значимо не увеличилось. Следует отметить, что если взять уровень значимости a=0,05, то результаты исследования будут совсем иными.

Задание на самостоятельную работу

Задание 1. При производстве микросхем процессоров используются кристаллы кварца. Стандартом предусмотрено, чтобы у 50 % образцов не было обнаружено ни одного дефекта кристаллической структуры, у 15% - один дефект, у 13 % - 2 дефекта, у 12 % - 3 дефекта, у 10 % более 3 дефектов. При анализе выборочной партии оказалось, что из 1000 экземпляров распределение по дефектам следующее (вариант соответствует номеру ЭВМ):

Вариант 0 дефектов 1 дефект 2 дефекта 3 дефекта более 3
1.          
2.          
3.          
4.          
5.          
6.          
7.          
8.          
9.          
10.          
11.          
12.          
13.          
14.          
15.          

Можно ли с вероятностью 0,99 считать, что партия соответствует стандарту?

Задание 2. Четыре станка в цеху обрабатывают детали. Для проверки точности обработки. взяли выборки размеров деталей у каждого станка. Необходимо сравнить с помощью F-теста попарно точности обработки всех станков (рассмотреть пары 1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и сделать вывод, для каких станков точности обработки (дисперсии) равны, для каких нет. Взять уровень значимости .

Вар. Выборки размеров деталей
1, 5, 14 1 станок 29,1 26,2 30,7 33,8 33,6 35,2 23,4 29,3 33,3 26,7
2 станок 29,0 28,9 34,0 29,7 29,4 28,5 35,9 32,6 37,1 28,0
3 станок 25,7 27,5 25,4 28,9 29,9 30,1 29,0 36,6 24,8 27,8
4 станок 32,1 31,0 27,2 29,3 30,4 31,7 30,4 27,3 35,7 31,5
2, 6, 13 1 станок 36,6 34,3 33,9 30,3 30,0 31,4 29,9 26,8 24,7 32,5
2 станок 28,4 32,5 31,5 28,2 33,9 24,7 31,7 29,7 30,1 28,0
3 станок 33,1 30,4 33,4 29,6 27,7 33,2 28,3 31,6 31,6 29,1
4 станок 30,6 31,6 29,3 26,3 33,8 29,1 26,1 32,3 32,4 31,3
3, 7, 12 1 станок 34,1 35,1 30,7 30,4 35,6 29,9 28,0 32,7 30,0 33,1
2 станок 30,8 34,4 30,3 26,6 25,8 30,6 32,9 25,5 28,2 31,6
3 станок 30,7 30,6 30,0 26,3 30,7 30,4 32,3 27,8 31,8 30,7
4 станок 30,6 31,3 27,0 27,4 31,4 30,4 28,4 30,3 27,2 27,3
Вар. Выборки размеров деталей
4, 8, 11 1 станок 28,1 27,1 33,6 32,8 24,8 33,8 29,4 26,6 24,4 27,5
2 станок 31,8 27,1 32,6 34,3 27,8 29,1 26,0 34,1 33,1 30,6
3 станок 27,1 34,6 26,5 28,8 26,1 34,8 30,1 31,0 32,9 35,8
4 станок 28,1 32,6 27,5 29,7 29,3 34,6 26,0 27,2 29,5 26,8
9, 10, 15 1 станок 29,7 30,4 35,2 28,5 27,6 27,8 31,8 33,9 25,7 32,9
2 станок 30,0 33,0 27,0 32,3 33,7 26,5 31,2 24,7 30,2 33,0
3 станок 28,8 30,7 35,5 22,8 30,1 29,6 33,0 33,7 34,9 24,5
4 станок 25,0 31,3 30,6 32,0 29,5 32,5 34,0 35,7 26,1 31,9

Задание 3. Имеются данные о количествах продаж товара в двух городах. Проверить на уровне значимости 0,01 статистическую гипотезу о том, что среднее число продаж товара в городах различно.

Первый город (одинаково для всех вариантов)
                           
Вариант Второй город (по вариантам)
1.                        
2.                        
3.                        
4.                        
5.                        
6.                        
7.                        
8.                        
9.                        
10.                        
11.                        
12.                        
13.                        
14.                        
15.                        

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: