Проверка статистических гипотез. Статистической гипотезой называется предположение относительно вида и параметров распределения случайной величины

 

Общие сведения.

 

Статистической гипотезой называется предположение относительно вида и параметров распределения случайной величины, которое можно проверить статистически, используя результаты наблюдений. При проверке гипотез подвергается испытанию некоторая основная (нулевая) гипотеза Н 0 в сравнении с одной или несколькими альтернативными (конкурирующими) гипотезами Н 1, Н 2, …, которые формируются или подразумеваются.

Под статистическим критерием (критерием проверки или значимости) понимают однозначно определенное правило, согласно которому устанавливаются условия принятия или непринятия гипотезы. При проверке статистической гипотезы всегда есть риск совершить одну из двух ошибок: отвергнуть верную гипотезу (ошибка первого рода) или принять ложную гипотезу (ошибка второго рода).

Вероятность ошибки первого рода зависит от принятого уровня значимости a, под которым понимают вероятность появления практически невозможных событий, т.е. таких событий, вероятность появления которых весьма мала. Обычно при решении задач надежности технологического оборудования принимают a = 0,05.

Вероятность ошибки второго рода зависит от уровня, характера проверяемой гипотезы, от способа проверки и ряда других причин, что затрудняет её оценку. Снижение уровня значимости приводит к увеличению вероятности ошибки второго рода, и поэтому единственным способом одновременного уменьшения ошибок обоих типов является увеличение объёма выборки.

Рассмотрим основные типы задач, решаемые с помощью статистических критериев.

 

Сравнение дисперсий.

 

Пусть имеются две независимые выборки n 1 и n 2, по которым определены статистические характеристики , , и . Требуется проверить можно ли считать сравниваемые выборочные дисперсии оценками одной и той же генеральной дисперсии.

Допустим, что первая выборка сделана из генеральной совокупности с дисперсией , а вторая - из генеральной совокупности с дисперсией . Нулевая гипотеза Н 0 состоит в том что . Для того, чтобы её отвергнуть, необходимо доказать значимость различий между и при выбранном уровне значимости a. Пусть , тогда альтернативной гипотезой Н 1 будет . Нулевую гипотезу обычно проверяют по критерию Фишера, для чего вычисляют величину и сравнивают её с критическим значением F a, которое находится по таблице (Приложение Ж). F a зависит от уровня значимости a и степеней свободы больше f 1 = n 1–1 и меньшей f 2 = n 2–1 дисперсий. Если , то различие между дисперсиями следует считать значимым, и нулевая гипотеза Н 0 () отвергается. При гипотеза принимается.

Пример 1.10. При изучении стабильности работы двух датчиков температуры получены две выборки объёмом n 1 = 8 и n 2 = 11 с выборочными дисперсиями и . Проверить гипотезу Н 0: .

Решение.

Вычислим величину

.

По таблице (Приложение Ж) для уровня значимости a = 0,05 и числа степеней свободы f 1 = 7 и f 2 = 10 находим F 0,05 = 3,14. Поскольку , то гипотеза Н 0 принимается, и поэтому разница дисперсий для обоих датчиков незначима. Это позволяет считать случайные погрешности обоих датчиков одинаковыми.

Для сравнения нескольких дисперсий , имеющих числа степеней свободы , используют критерий Бартлета, а при одинаковом объёме всех выборок критерий Кохрена.

 

Сравнение средних.

 

При рассмотрении вопросов надежности часто возникает необходимость сравнить два технологических процесса, агрегат или метода измерения. В этом случае обычно сравнивают средние значения.

Пусть заданы две выборки x 1, x 1, …, x n1 и y 1, y 1, …, y n2. Выдвигается нулевая гипотеза Н 0 о совпадении средних значений двух генеральных совокупностей, т.е. . При этом различают зависимые и независимые выборки.

Случай зависимых или связанных выборок имеет место, например, при измерении одних и тех же параметров двумя различными способами: механическим и электрическим, механическим и оптическим и т.д. Принимая объёмы выборок одинаковыми, т.е. n = n 1 = n 2, и вычисляя значения разностей для каждой пары измерений di = xi – yi, получим выборку новой случайной величины di объёмом n и статистическими параметрами

, .

Считая, что ряд значений di представляет собой выборку из нормально распределенной генеральной совокупности со средним значением M[d] = 0 и неизвестной дисперсией , вычисляется величина t, имеющая распределение Стьюдента с числом степеней свободы f = n -1:

Гипотеза Н 0 принимается, если величина t будет меньше табличного значения ta. При t > ta гипотеза отвергается, и средние значения двух выборок считаются различными с вероятностью b = 1- a.

В случае независимых выборок объемы выборок могут быть различными и для проверки нулевой гипотезы Н 0 вычисляется величина t, имеющая распределение Стьюдента с числом степеней свободы f = n 1+ n 2 - 2:

Если табличное значение ta для заданного уровня значимости a и числа степеней свободы f будет больше вычисленного значения t, то гипотеза принимается. При t > ta гипотеза о равенстве средних двух выборок отвергается. Если объём выборок одинаков, т.е. n = n 1 = n 2, то приведенная формула упрощается.

Пример 1.11. Сравнивается работа двух прессов. Среднемесячная выработка (n =25) на одном прессе составила т с дисперсией , на втором - т с дисперсией .

Решение.

Для числа степеней свободы f = n 1+ n 2 - 2 = 25+25-2 = 48 и уровня значимости a = 0,05 из таблицы (Приложение Ж) находим t0,05 @ 2.

Вычисляем значение t по формуле, которая с учетом равенства выборок n = n 1 = n 2 =25 принимает вид

Поскольку t > t00,5, то с вероятностью 95% разницу между выработками двух прессов следует признать значимой.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: