Используется для проверки предположения о том, что средние значения двух показателей, представленных выборками, значимо различаются. Существует три разновидности критерия: один – для связанных выборок, и два для несвязанных выборок (с одинаковыми и разными дисперсиями). Если выборки не связаны, то предварительно нужно проверить гипотезу о равенстве дисперсий, чтобы определить, какой из критериев использовать. Так же как и в случае сравнения дисперсий имеются 2 способа решения задачи., которые рассмотрим на примере.
ПРИМЕР 3. Имеются данные о средненедельных количествах продаж товара (тыс. шт.) до и после смены производителем оформления упаковки.
до смены | ||||||||||||||||||||||||
после смены | ||||||||||||||||||||||||
Можно ли с вероятностью 0,99 считать, что смена упаковки привела к среднему увеличению количества продаж?
|
|
По условию р =0,99, a=0,01, выборки не связаны, критерий односторонний, т.к. нужно показать, что средние показателя, представленного второй выборкой, больше чем у первой. Вводим в ячейки А1-М1 и А2-L2 исходные данные. Т.к. выборки несвязаны, то предварительно сравниваем дисперсии (сделать это самостоятельно аналогично предыдущему примеру из п. 2 любым способом). В результате проверки дисперсии оказываются равными.
Первый способ решения задачи, как и в случае дисперсий, использовать стандартную функцию. Ею является ТТЕСТ(массив1;массив2;хвосты;тип), решающий задачу по t-критерию Стьюдента. В ячейке В4 вводим подпись «t-критерий», а в соседнюю С4 функцию ТТЕСТ (категория «Статистические») Аргументы функции:
- массив1, массив2 – исходные данные (ссылки на А1-М1 и А2-L2);
- хвосты – вид критерия: если 1 – односторонний критерий, если 2 – двусторонний (в нашем случае ставится единица);
- тип – тип критерия: если выборки связаны, то 1, для несвязанных выборок с равными дисперсиями –2, для несвязанных выборок с неравными дисперсиями – 3 (выбираем 2).
Функция возвращает критическое значение уровня значимости, имеющего смысл ошибиться, приняв гипотезу о различии средних. Если критическое значение больше заданного, то средние нужно считать равными. Результат в нашем случае 0,0476828 больше заданного . Следовательно, смена производителем упаковки не привела к среднему увеличению продаж и изменения в количествах продаж, вероятнее всего, связано с какими-то случайными факторами.
Второй способ – использовать пакет «Анализ данных». Способ вызова и подключения его был описан в п.2. В зависимости от типа критерия выбирается один из трех: «Парный двухвыборочный t-тест для средних» – для связанных выборок, и «Двухвыборочный t-тест с одинаковыцми дисперсиями» или «Двухвыборочный t-тест с разными дисперсиями» - для несвязанных выборок. Вызовите тест с одинаковыми дисперсиями, в открывшемся окне в полях «Интервал переменной 1» и «Интервал переменной 2» вводят ссылки на данные (А1-М1 и А2-L2, соответственно), если имеются подписи данных, то ставят флажок у надписи «Метки» (у нас их нет, поэтому флажок не ставится). Далее вводят уровень значимости в поле «Альфа» - 0,01. Поле «Гипотетическая средняя разность» оставляют пустым. В разделе «Параметры вывода» ставят метку около «Выходной интервал» и поместив курсор в появившееся поле напротив надписи, щелкают левой кнопкой в ячейке В7. Вывод результата будет осуществляться начиная с этой ячейки. Нажав на «ОК» появляется таблица результата. Сдвиньте границу между столбцами В и С, С и D, D и Е, увеличив ширину столбцов В, С и D так, чтобы умещались все надписи. Процедура выводит основные характеристики выборок, t-статистику, критические значения этих статистик и критические уровни значимости «P(T<=t) одностороннее» и «P(T<=t) двухстороннее». Если по модулю t-статистика меньше критического, то средние показатели с заданной вероятностью равны. В нашем случае |-1,739215668| < 2,499873517, следовательно, среднее число продаж значимо не увеличилось. Следует отметить, что если взять уровень значимости a=0,05, то результаты исследования будут совсем иными.
|
|
Задание на самостоятельную работу
Задание 1. При производстве микросхем процессоров используются кристаллы кварца. Стандартом предусмотрено, чтобы у 50 % образцов не было обнаружено ни одного дефекта кристаллической структуры, у 15% - один дефект, у 13 % - 2 дефекта, у 12 % - 3 дефекта, у 10 % более 3 дефектов. При анализе выборочной партии оказалось, что из 1000 экземпляров распределение по дефектам следующее (вариант соответствует номеру ЭВМ):
Вариант | 0 дефектов | 1 дефект | 2 дефекта | 3 дефекта | более 3 |
1. | |||||
2. | |||||
3. | |||||
4. | |||||
5. | |||||
6. | |||||
7. | |||||
8. | |||||
9. | |||||
10. | |||||
11. | |||||
12. | |||||
13. | |||||
14. | |||||
15. |
Можно ли с вероятностью 0,99 считать, что партия соответствует стандарту?
Задание 2. Четыре станка в цеху обрабатывают детали. Для проверки точности обработки. взяли выборки размеров деталей у каждого станка. Необходимо сравнить с помощью F-теста попарно точности обработки всех станков (рассмотреть пары 1-2, 1-3, 1-4, 2-3, 2-4, 3-4) и сделать вывод, для каких станков точности обработки (дисперсии) равны, для каких нет. Взять уровень значимости .
Вар. | Выборки размеров деталей | ||||||||||
1, 5, 14 | 1 станок | 29,1 | 26,2 | 30,7 | 33,8 | 33,6 | 35,2 | 23,4 | 29,3 | 33,3 | 26,7 |
2 станок | 29,0 | 28,9 | 34,0 | 29,7 | 29,4 | 28,5 | 35,9 | 32,6 | 37,1 | 28,0 | |
3 станок | 25,7 | 27,5 | 25,4 | 28,9 | 29,9 | 30,1 | 29,0 | 36,6 | 24,8 | 27,8 | |
4 станок | 32,1 | 31,0 | 27,2 | 29,3 | 30,4 | 31,7 | 30,4 | 27,3 | 35,7 | 31,5 | |
2, 6, 13 | 1 станок | 36,6 | 34,3 | 33,9 | 30,3 | 30,0 | 31,4 | 29,9 | 26,8 | 24,7 | 32,5 |
2 станок | 28,4 | 32,5 | 31,5 | 28,2 | 33,9 | 24,7 | 31,7 | 29,7 | 30,1 | 28,0 | |
3 станок | 33,1 | 30,4 | 33,4 | 29,6 | 27,7 | 33,2 | 28,3 | 31,6 | 31,6 | 29,1 | |
4 станок | 30,6 | 31,6 | 29,3 | 26,3 | 33,8 | 29,1 | 26,1 | 32,3 | 32,4 | 31,3 | |
3, 7, 12 | 1 станок | 34,1 | 35,1 | 30,7 | 30,4 | 35,6 | 29,9 | 28,0 | 32,7 | 30,0 | 33,1 |
2 станок | 30,8 | 34,4 | 30,3 | 26,6 | 25,8 | 30,6 | 32,9 | 25,5 | 28,2 | 31,6 | |
3 станок | 30,7 | 30,6 | 30,0 | 26,3 | 30,7 | 30,4 | 32,3 | 27,8 | 31,8 | 30,7 | |
4 станок | 30,6 | 31,3 | 27,0 | 27,4 | 31,4 | 30,4 | 28,4 | 30,3 | 27,2 | 27,3 |
Вар. | Выборки размеров деталей | ||||||||||
4, 8, 11 | 1 станок | 28,1 | 27,1 | 33,6 | 32,8 | 24,8 | 33,8 | 29,4 | 26,6 | 24,4 | 27,5 |
2 станок | 31,8 | 27,1 | 32,6 | 34,3 | 27,8 | 29,1 | 26,0 | 34,1 | 33,1 | 30,6 | |
3 станок | 27,1 | 34,6 | 26,5 | 28,8 | 26,1 | 34,8 | 30,1 | 31,0 | 32,9 | 35,8 | |
4 станок | 28,1 | 32,6 | 27,5 | 29,7 | 29,3 | 34,6 | 26,0 | 27,2 | 29,5 | 26,8 | |
9, 10, 15 | 1 станок | 29,7 | 30,4 | 35,2 | 28,5 | 27,6 | 27,8 | 31,8 | 33,9 | 25,7 | 32,9 |
2 станок | 30,0 | 33,0 | 27,0 | 32,3 | 33,7 | 26,5 | 31,2 | 24,7 | 30,2 | 33,0 | |
3 станок | 28,8 | 30,7 | 35,5 | 22,8 | 30,1 | 29,6 | 33,0 | 33,7 | 34,9 | 24,5 | |
4 станок | 25,0 | 31,3 | 30,6 | 32,0 | 29,5 | 32,5 | 34,0 | 35,7 | 26,1 | 31,9 |
Задание 3. Имеются данные о количествах продаж товара в двух городах. Проверить на уровне значимости 0,01 статистическую гипотезу о том, что среднее число продаж товара в городах различно.
|
|
Первый город (одинаково для всех вариантов) | |||||||||||||
Вариант | Второй город (по вариантам) | ||||||||||||
1. | |||||||||||||
2. | |||||||||||||
3. | |||||||||||||
4. | |||||||||||||
5. | |||||||||||||
6. | |||||||||||||
7. | |||||||||||||
8. | |||||||||||||
9. | |||||||||||||
10. | |||||||||||||
11. | |||||||||||||
12. | |||||||||||||
13. | |||||||||||||
14. | |||||||||||||
15. |