Статистическая гипотеза - это любое предположение, касающееся неизвестного закона распределения случайной величины или неизвестного значения параметра этого распределения, т.е. предположение о свойствах случайной величины. Гипотезу, подлежащую проверке, принято называть основной или нулевой (гипотеза Н0). Гипотезу, противопоставляемую выдвинутой нулевой гипотезе, называют альтернативной или конкурирующей (гипотеза Н1).
Для проверки статистических гипотез применяется система правил (статистических критериев), которая позволяет путем анализа выборок из генеральной совокупности принять или отвергнуть выдвинутую гипотезу. С помощью параметрических критериев проверяется гипотеза Н0 относительно значения θ0 параметра θ данного распределения, например гипотезы типа θ=θ0,θ≤θ0 или θ≥θ0. С помощью непараметрических критериев, так называемых критериев согласия, проверяют гипотезу Н0 о виде закона распределения.
Для формулировки критерия множество значений контролируемого параметра разделяется на критическую область — область отклонения гипотезы Н0 и дополнительную к ней область принятия гипотезы Н0. Если выборочное значение контролируемого параметра попадает в критическую область, гипотезу Н0 отвергают, в противном случае ее принимают.
|
|
Из-за случайности выборочных значений контролируемого параметра такое принятие гипотезы не является доказательством ее истинности, равно как и отклонение гипотезы еще не означает, что она ложна. Здесь возможны четыре случая:
- гипотеза Н0 верна и принимается согласно критерию;
- гипотеза Н0 неверна и отвергается согласно критерию;
- гипотеза Н0 верна, но отвергается согласно критерию (ошибка первого рода);
- гипотеза Н0 неверна, но принимается согласно критерию (ошибка второго рода).
Вероятность совершить ошибку первого рода принято обозначать через α и поэтому ее называют α- ошибкой. Причем вероятность α является уровнем значимости критерия. При выборочном приемочном контроле ошибка первого рода приводит к браковке партии продукции с допустимым уровнем несоответствий (так называемый риск производителя или поставщика), а при контроле производственного процесса - к необоснованному вмешательству в налаженный процесс производства (ложная тревога, излишнее управление).
Вероятность появления ошибки второго рода принято обозначать через β, это так называемая β -ошибка. При выборочном приемочном контроле ошибка второго рода приводит к принятию партии продукции с недопустимым уровнем несоответствий (риск потребителя или заказчика), а при контроле производства - к невмешательству в разлаженный производственный процесс (пропуск разладки, незамеченная разладка).
|
|
Вопрос о взаимосвязи вероятностей ошибок первого и второго рода и о том, влиянию каких параметров подвержены эти вероятности, рассмотрим на следующем простом примере.
Пусть при налаженном процессе значения контролируемого параметра подчиняются нормальному закону распределения с математическим ожиданием μ0 и дисперсией σ20, а в разлаженном режиме - нормальному закону с параметрами μ1 и σ20 , т.е. дисперсия в обоих режимах одинакова. Нулевой гипотезе Н0 соответствует μ = μ0, а единственно возможной альтернативной гипотезе Н1 соответствует μ =μ1
Для проверки, в каком состоянии находится процесс, берется безвозвратная выборка объемом п из потенциально бесконечной генеральной совокупности и рассчитывается выборочное среднее Хn, которое является несмещенной оценкой параметра μ. Плотности распределения Хn при верности гипотез Н0 и Н1 приведены на рис. 2.7. На этом рисунке точка μкр на оси абсцисс (причем μ0 0<μкр <μ1) разделяет область значений контролируемой величины Хn на критическую область [μкр, ∞] - область отклонения гипотезы Н0 и дополнительную к ней область принятия гипотезы Н0 [-∞, μкр ].
Из рис. 2.7 следует, что попадание Хn в критическую область оказывается возможным и при верности гипотезы Н0. При этом гипотеза Н0 ошибочно отвергается, т.е. происходит ошибка первого рода. Но также возможно попадание Хn в область принятия гипотезы Н0, когда эта гипотеза неверна. В этом случае ошибочно принимается гипотеза Н0 и совершается ошибка второго рода.
Рис. 2.7 Плотность нормального распределения