Проверка статистических гипотез» гипотеза о равенстве дисперсий

 

Исследуются результаты обработки деталей на двух станках. Предполагается, что точность обработки одинакова, т.е., что дисперсии равны. Для проверки этой гипотезы проведены замеры 22 деталей на первом станке и 24 деталей на втором. Результаты представлены в первых трех столбцах на рис. 17.11а.

 

Результаты замеров

     
Станок 1 Станок 2
п/п    
1 12,05 12,36
2 12,08 12,45
3 12,33 12,48
4 12,34 12,56
5 12,75 12,63
6 12,32 12,25
7 12,12 12,54
8 12,05 12,35
9 12,08 12,54
10 12,33 12,33
11 12,08 12,85
12 12,75 12,42
13 12,05 12,47
14 12,08 12,41
15 12,33 12,34
16 12,05 12,51
17 12,08 12,45
18 12,31 12,24
19 12,34 12,55
20 12,42 12,32
21 12,42 12,44
22 12,12 12,41
23   12,38
24   12,51

 

Рис. 17.11а - Данные для расчета

 

Для проверки гипотезы о равенстве дисперсий выберите Данные/Анализ данных / Двухвыборочный F-тест. Введите в качестве значений переменной 1 результаты измерений на первом станке, переменной 2 — на втором; уровень значимости 0,05.

В полученной таблице с результатами, показанными на рис. 17.11 б, приводятся средние значения, дисперсии, количество наблюдений и степени свободы для каждой выборки, значение статистики Фишера (определяется как отношение дисперсий) и критическое значение (квантиль распределения Фишера) на заданном уровне значимости. Гипотеза о равенстве дисперсий принимается, если выборочное значение статистики Фишера попало в область принятия решения; в противном случае гипотеза отклоняется.

 

 

Рис. 17.11 б -  Результаты расчета

 

Сделайте вывод по полученным результатам.

Гипотеза о равенстве средних

Проверка этой гипотезы проводится по-разному в зависимости от того, принята или отклонена гипотеза о значимости дисперсий: используются двухвыборочные t-тесты с одинаковыми или неодинаковыми дисперсиями.

Проверьте гипотезу о равенстве средних для рассмотренного примера (Данные/Анализ данных / Двухвыборочный t- тест с одинаковыми (или неодинаковыми) дисперсиями). Введите данные по аналогии с двухвыборочным F-тестом.

В таблице с результатами расчета приводятся статистика Стьюдента и критические значения для одностороннего и двухстороннего критериев. Гипотеза о равенстве средних принимается, если выборочное значение статистики Стьюдента попало в область принятия решения, в противном случае гипотеза отклоняется.

Сделайте вывод по полученным результатам как для одностороннего, так и двухстороннего критериев.

Гипотеза о виде распределения

Смоделируйте нормально распределенную совокупность из 1000 элементов со средним значением 12 (  ) и стандартным отклонением 0,25 (  ). Сделайте случайную выборку 200 элементов из этой совокупности. Используя критерий хи-квадрат, проверим, действительно ли выборка сделана из нормально распределенной генеральной совокупности. В качестве точечных оценок математического ожидания и дисперсии примите соответствующие выборочные характеристики. Найдите их, используя инструмент Описательная статистика пакета Анализ данных.

С помощью инструмента Гистограмма найдите опытные частоты п. При использовании критерия хи-квадрат количество опытных значений в каждом интервале должно быть не менее пяти. Если в каком-то интервале их меньше, то интервалы объединяют. Например, если в промежутке от 4 до 6 оказалось три значения, а в промежутке от 6 до 8 — четыре, то вводится новый интервал от 4 до 8 с семью значениями. С учетом этого перестройте таблицу частот вручную. На рис. 17.12 в колонках «Карман» — «Частота» показаны данные, полученные автоматически, в колонках «Границы» — «Опытные частоты» данные пересчитаны частично вручную.

 

F G Н I / К L М
№ п/п Карман Частота Гра­ницы Опыт­ные частоты Норм расп Вероят­ности Расчетные частоты
1 11,350 1 11,350        
2 11,446 0 11,639 17 0,0972 0,0972 19,45
3 11,543 3 11,736 18 0,1788 0,0815 16,31
4 11,637 13 11,832 33 0,2938 0,1149 22,99
5 11,736 18 11,929 28 0,4345 0,1407 28,14
6 11,832 33 12,025 18 0,5842 0,1496 29,93
7 11,929 28 12,122 29 0,7224 0,1382 27,64
8 12,025 18 12,218 26 0,8333 0,1109 22,18
9 12,122 29 12,315 11 0,9107 0,0773 15,46
10 12,218 26 12,412 10 0,9575 0,0468 9,362
11 12,315 11 12,508 5 0,9821 0,0246 4,923
12 12,412 10 12,701 5 0,9978 0,0157 3,141
13 12,508 5          
14 12,605 2       ХИ2ТЕСТ 0,238
15 Еще 3       ХИ20БР 15,5

Рис.17.12 - Расчет критерия хи-квадрат

Расчетные частоты npi вычисляются через вероятности попадания нормально распределенной величины в соответствующий интервал:

где функция стандартного нормального распределения Ф() вычисляется с помощью встроенной статистической функции НОРМРАСП (x, среднее значение т, стандартное отклонение , интегральный). Аргументы этой функции (рис. 17.13): х — граница интервала, вводится адрес соответствующей ячейки; т (среднее) и  (стандартное отклонение) вводятся абсолютные адреса характеристик, полученных с помощью Описательной статистики; значение интегральный = 1 (истина), в противном случае (ложь) вычисляется не функция распределения, а его плотность. На рис. 10.28 вычисленные значения этой функции рассчитаны в колонке НОРМРАСП. Вероятности р. (колонка «Вероятности») вычисляются как разности между значениями НОРМРАСП в последующей и предыдущей строках. В последней колонке подсчитаны расчетные частоты npi(n = 200).

 

Рис. 17.13 - Функция НОРМРАСП

Для вычисления статистики хи-квадрат в Excel встроена функция ХИ2ТЕСТ(фактический интервал, ожидаемый интервал). В качестве фактического интервала вводятся опытные частоты, в качестве ожидаемого — расчетные (рис. 17.14).

Граница критической области — квантиль распределения хи-квадрат может быть найдена с помощью встроенной функции ХИ20БР (вероятность, степени свободы). Аргумент вероятность — это уровень значимости (а = 0,05), а степени свободы к — l — 1 определяются как количество интервалов (на рис. 27 к=11) за вычетом количества оцениваемых параметров (здесь — два: m и ) минус единица.

Гипотеза о нормальности распределения принимается, если выборочное значение статистики ХИ2ТЕСТ окажется меньше критического ХИ20БР.

 

 

Рис. 17.14 - Функция ХИ2ТЕСТ

 

Подобным образом может быть проверена гипотеза о виде любого распределения.

Дисперсионный анализ

В дисперсионном анализе исследуется влияние одного или нескольких качественных факторов на количественный резуль­тативный признак. Например, требуется оценить влияние квалификации наладчиков (фактор А) на рассеяние диаметров шариков. Замеры отклонения диаметра от номинала для каждого из пяти наладчиков проводились по 6 раз (табл.17.1):

 

Таблица 17.1

№ п/п АХ А2 A3 М А5
1 1,2 0,6 0,9 1,7 1
2 1,1 1,1 0,6 1,4 1,4
3 1 0,8 0,8 1,3 1,1
4 1,3. 0,7 1 1,6 0,9
5 1,1 0,7 1 1,2 1,2
6 0,8 0,9 1,1 1,3 1,5

 

 

Проверяется нулевая гипотеза о равенстве математических ожиданий отклонения для всех пяти наладчиков, т.е. предполагается, что квалификация наладчика не влияет на точность изготовления шариков.

Для проведения анализа воспользуйтесь инструментом Однофакторный дисперсионный анализ пакета Анализ данных. В качестве исходных данных введите таблицу замеров. Выводятся две таблицы. В первой таблице приводятся статистические характеристики для каждого наладчика, во второй (ANOVA) — результаты анализа, в частности, значение статистики Фишера (F) и граница критической области (F критическое). Если выборочное значение статистики оказалось меньше критического, гипотеза об отсутствии влияния квалификации наладчиков принимается.

Самостоятельно проведите дисперсионный анализ влияния технологии чистовой обработки на точность изготовления деталей по примеру 2.

Пример 2:

Оценить влияние технологии чистовой обработки (три вида технологий) на точность изготовления детали. При каждом виде технологии проводится по четыре замера отклонения размера детали от номинала (табл. 17.2).

 

Таблица 17.2

 

Вид технологии

Номер заказа 1 2 3
1 1 2 3
2 2 1 2
3 2 3 2
4 1 2 3

 

В пакете анализа имеются и инструменты для проведения двухфакторного дисперсионного анализа.

Задание (табл. 17.3)

Таблица  17.3

  В1 В2 В3 В4 В5 В6 В7 В8 В9 В10
 

задание 12

14 13 15 17 18 16 14 13 15 17
0,15 0,3 0,25 0,2 0,25 0,25 0,2 0,25 0,2 0,15

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: