Классификация статистических гипотез

Нулевой гипотезой (Н₀) называют выдвинутое предположение. Альтернативными (конкурирующими) гипотезами (Н₁) называют гипотезы, при которых Н₀ не выполняется (нарушается).

Например, если нулевая гипотеза состоит в предположении, что математическое ожидание распределения размера детали равно 10 мм, то конкурирующая гипотеза, в частности, может состоять в предположении, что ≠ 10 мм. Кратко это записывают так: H₀: = 10 мм; Н₁: ≠10 мм. В данном случае имеет место «двусторонняя»альтернативная гипотеза. Если же конкурирующая гипотеза состоит в предположении, что > 10 мм, или наоборот, что < 10 мм, то она является «односторонней»гипотезой.

Простой называют гипотезу, содержащую только одно предположение. Например, предыдущая гипотеза Н₀: = 10 мм - простая.

Сложной называют гипотезу, которая состоит из конечного или бесконечного числа простых гипотез. Например, гипотеза: > 10 - сложная.

Пусть некоторая оценка вычислена по выборке объема N независимых наблюдений случайной величины х. Предположим, что есть основания считать истинное значение оцениваемого параметра Ф равным некоторой величине Ф_о. Если даже Ф = Ф_о, то выборочное значение не будет, по-видимому, точно совпадать с Ф_о из-за выборочной изменчивости статистики . Поэтому возникает следующий вопрос. Если принять гипотезу Ф = Ф_о, то насколько велико должно быть различие между и Ф_о, чтобы эту гипотезу следовало отвергнуть как ошибочную? На этот вопрос можно ответить в статистическом смысле, рассматривая вероятность достижения некоторой заданной разности между Ф и Ф_о на основе выборочного распределения параметра Ф. Если вероятность превышения этой разности Ф и заданного уровня Ф_о мала, то этот уровень следует считать значимым и гипотезу Ф = Ф_о следует отвергнуть. Если вероятность превышения данной разности не является малой, то наличие этой разности можно отнести за счет обычной статистической изменчивости и гипотезу Ф = Ф_о можно считать правдоподобной.

«Статистическим критерием» называется правило, по которому принимается или отклоняется гипотеза. Области принятия и отклонения при проверке гипотез для случая, когда оценка параметра Ф распределена по нормальному закону, представлены на рис. 7.1. Интервал значений Ф, при которых гипотезу следует отвергнуть, называют областью отклонения гипотезы или критической областью. Точки, которые разделяют критическую область и область принятия гипотезы, называются «критическими точками». Различают «одностороннюю» (правостороннюю или левостороннюю) и «двустороннюю» (рис. 7.1) критические области.

Рис. 7.1. Области принятия и отклонения при проверке гипотез: p(Ф) - плотность распределения оценки параметра Ф; Ф₀ - истинное значение параметра Ф; Ф_1-_α_/2 - нижний уровень оценки; Ф_α_/2 - верхний уровень оценки; α - вероятность выхода оценки за пределы верхнего и нижнего уровней

Поскольку расчеты по определению «критических точек» производятся на основе «выборочного метода», то они всегда имеют вероятностный характер. То есть положение «критических точек» определяется неточно, в результате чего при проверке гипотезы возможны ошибки двух родов:

- «Ошибка первого рода» состоит в том, что нулевая гипотеза отвергается, когда она на самом деле верна. Вероятность допустить ошибку первого рода, выраженная в процентах или в долях целого, называется «уровнем значимостикритерия» (обозначают q или α, см. рис. 7.1, и выражают в долях единицы как целого или в %). Это значит,что с вероятностью P=1 - q (или 100% - q) гипотеза действительно верна. Обычно в инженерных расчетах используют q=5% или q=1% (иначе q=0,05 или q=0,01) в зависимости от степени значимости и необходимой безопасности изделия, для которого деталь предназначена.

«Ошибка второго рода» возникает в том случае, если гипотеза Н₀принимается, когда в действительности она не верна. Для того чтобы найти, какова вероятность допустить ошибку второго рода, необходимо задать определенную величину отклонения истинного значения Ф от гипотетического значения параметра Ф_о, которое требуется определить. Предположим, например, что истинное значение параметра Ф в действительности равно Ф_о + d или Ф_о - d, как показано на рис. 7.2. Если, согласно гипотезе, Ф = Ф_о, а в действительности Ф = Ф_о ± d, то вероятность того, что Ф попадает в область принятия гипотезы, т.е. в интервал (Ф_{1 -}_α_/2; Ф_α_/2), составляет β. Это значит, что вероятность допустить ошибку второго рода при выявлении отклонения ±d от гипотетического значения Ф_о равна β.

Рис. 7.2. Области принятия и отклонения, соответствующие ошибке второго рода при проверке гипотезы, где d - смещение истинного значения параметра Ф_о

Анализ графика (рис. 7.2) показывает, что вероятность возникновения ошибки второго рода, в сущности, есть вероятность попадания в область принятия гипотезы при смещении истинного значения. Вероятность возникновения ошибки второго рода принято обозначать β и она выражается горизонтально заштрихованными площадями в области принятия гипотезы, см. рис. 7.2.

Применительно к проверке гипотез, относящихся к области попадания в доверительный интервал (см. главу 6), с ошибками первого и второго рода связывают следующие понятия:

- «риск поставщика» (годная партия продукции ошибочно забракована, в результате чего потери несёт её производитель - ошибка первого рода);

- «риск заказчика» (партия принята, но имеет брак и в результате её поставки потери несёт заказчик - ошибка второго рода).

10 11 12 13 14 15 16

Подборка статей по вашей теме: