Классификация статистических гипотез

Нулевой гипотезой0) называют выдвинутое предположение. Альтернативными (конкурирующими) гипотезами (Н1) называют гипотезы, при которых Н0 не выполняется (нарушается).

Например, если нулевая гипотеза состоит в предположении, что математическое ожидание рас­пределения размера детали равно 10 мм, то конкурирующая гипотеза, в частности, может состоять в предположении, что ≠ 10 мм. Кратко это записы­вают так: H0: = 10 мм; Н1: ≠10 мм. В данном случае имеет место «двусторонняя»альтернативная гипотеза. Если же конкурирующая гипотеза состоит в предположении, что > 10 мм, или наоборот, что < 10 мм, то она является «односторонней»гипотезой.

Простой называют гипотезу, содержащую только одно предположение. Например, предыдущая гипоте­за Н0: = 10 мм - простая.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, гипоте­за: > 10 - сложная.

Пусть некоторая оценка вычислена по выборке объема N независимых наблюдений случайной величи­ны х. Предположим, что есть основания считать истинное значе­ние оцениваемого параметра Ф равным некоторой величине Фо. Если даже Ф = Фо, то выборочное значение не будет, по-види­мому, точно совпадать с Фо из-за выборочной изменчивости ста­тистики . Поэтому возникает следующий вопрос. Если принять гипотезу Ф = Фо, то насколько велико должно быть различие меж­ду и Фо, чтобы эту гипотезу следовало отвергнуть как ошибоч­ную? На этот вопрос можно ответить в статистическом смысле, рассматривая вероятность достижения некоторой заданной раз­ности между Ф и Фо на основе выборочного распределения пара­метра Ф. Если вероятность превышения этой разности Ф и за­данного уровня Фо мала, то этот уровень следует считать значи­мым и гипотезу Ф = Фо следует отвергнуть. Если вероятность пре­вышения данной разности не является малой, то наличие этой разности можно отнести за счет обычной статистической измен­чивости и гипотезу Ф = Фо можно считать правдоподобной.

«Статистическим критерием» называется правило, по которому принимается или отклоняется гипотеза. Области принятия и отклонения при проверке гипотез для случая, когда оценка параметра Ф распределена по нормальному закону, представлены на рис. 7.1. Интервал зна­чений Ф, при которых гипотезу следует отвергнуть, называют областью отклонения гипотезы или критической областью. Точки, которые разделяют критическую область и область при­нятия гипотезы, называются «критическими точками». Различают «одностороннюю» (правостороннюю или левостороннюю) и «двустороннюю» (рис. 7.1) критические области.

Рис. 7.1. Области принятия и отклонения при проверке гипотез: p(Ф) - плотность распределения оценки параметра Ф; Ф0 - истинное значение параметра Ф; Ф1-α/2 - нижний уровень оценки; Фα/2 - верхний уровень оценки; α - вероятность выхода оценки за пределы верхнего и нижнего уровней

Поскольку расчеты по определению «критических точек» производятся на основе «выборочного метода», то они всегда имеют вероятностный характер. То есть положение «критических точек» определяется неточно, в результате чего при проверке гипотезы возможны ошибки двух родов:

- «Ошибка первого рода» состоит в том, что нулевая гипотеза отвергается, когда она на самом деле верна. Вероятность допустить ошибку первого рода, выраженная в процентах или в долях целого, называется «уровнем значимостикритерия» (обозначают q или α, см. рис. 7.1, и выражают в долях единицы как целого или в %). Это значит,что с вероятностью P=1 - q (или 100% - q) гипотеза действительно верна. Обычно в инженерных расчетах используют q=5% или q=1% (иначе q=0,05 или q=0,01) в зависимости от степени значимости и необходимой безопасности изделия, для которого деталь предназначена.

«Ошибка второго рода» возникает в том случае, если гипотеза Н0 принимается, когда в действительности она не верна. Для того чтобы найти, какова вероятность допустить ошибку второго рода, необходимо задать определенную величину откло­нения истинного значения Ф от гипотетического значения пара­метра Фо, которое требуется определить. Предположим, напри­мер, что истинное значение параметра Ф в действительности рав­но Фо + d или Фо - d, как показано на рис. 7.2. Если, согласно гипотезе, Ф = Фо, а в действительности Ф = Фо ± d, то вероятность того, что Ф попадает в область принятия гипотезы, т.е. в интервал (Ф1 - α/2; Фα /2), составляет β. Это значит, что вероятность допустить ошибку второго рода при выявлении отклонения ±d от гипотети­ческого значения Фо равна β.

Рис. 7.2. Области принятия и отклонения, соответствующие ошибке вто­рого рода при проверке гипотезы, где d - смещение истинного значения параметра Фо

Анализ графика (рис. 7.2) показывает, что вероятность возникновения ошибки второго рода, в сущности, есть вероятность попадания в область принятия гипотезы при смещении истинного значения. Вероятность возникновения ошибки второго рода принято обозначать β и она выражается горизонтально заштрихованными площадями в области принятия гипотезы, см. рис. 7.2.

Применительно к проверке гипотез, относящихся к области попадания в доверительный интервал (см. главу 6), с ошибками первого и второго рода связывают следующие понятия:

- «риск поставщика» (годная партия продукции ошибочно забракована, в результате чего потери несёт её производитель - ошибка первого рода);

- «риск заказчика» (партия принята, но имеет брак и в результате её поставки потери несёт заказчик - ошибка второго рода).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: