Проверка статистических гипотез. Проверка согласия опытного распределения с теоретическим

Статистическая гипотеза - это любое предположение, касающееся неизвестного закона распределения случайной величины или неизвестного значения параметра этого распределения, т.е. предположение о свойствах случайной величины. Гипотезу, подлежащую проверке, принято называть основной или нулевой (гипотеза Н₀). Гипотезу, противопоставляемую выдвинутой нулевой гипотезе, называют альтернативной или конкурирующей (гипотеза Н₁).

Для проверки статистических гипотез применяется система правил (статистических критериев), которая позволяет путем анализа выборок из генеральной совокупности принять или отвергнуть выдвинутую гипотезу. С помощью параметрических критериев проверяется гипотеза Н₀ относительно значения θ₀ параметра θ данного распределения, например гипотезы типа θ=θ₀,θ≤θ₀ или θ≥θ₀. С помощью непараметрических критериев, так называемых критериев согласия, проверяют гипотезу Н₀ о виде закона распределения.

Для формулировки критерия множество значений контролируемого параметра разделяется на критическую область — область отклонения гипотезы Н₀ и дополнительную к ней область принятия гипотезы Н₀. Если выборочное значение контролируемого параметра попадает в критическую область, гипотезу Н₀ отвергают, в противном случае ее принимают.

Из-за случайности выборочных значений контролируемого параметра такое принятие гипотезы не является доказательством ее истинности, равно как и отклонение гипотезы еще не означает, что она ложна. Здесь возможны четыре случая:

- гипотеза Н₀ верна и принимается согласно критерию;

- гипотеза Н₀ неверна и отвергается согласно критерию;

- гипотеза Н₀ верна, но отвергается согласно критерию (ошибка первого рода);

- гипотеза Н₀ неверна, но принимается согласно критерию (ошибка второго рода).

Вероятность совершить ошибку первого рода принято обозначать через α и поэтому ее называют α- ошибкой. Причем вероятность α является уровнем значимости критерия. При выборочном приемочном контроле ошибка первого рода приводит к браковке партии продукции с допустимым уровнем несоответствий (так называемый риск производителя или поставщика), а при контроле производственного процесса - к необоснованному вмешательству в налаженный процесс производства (ложная тревога, излишнее управление).

Вероятность появления ошибки второго рода принято обозначать через β, это так называемая β -ошибка. При выборочном приемочном контроле ошибка второго рода приводит к принятию партии продукции с недопустимым уровнем несоответствий (риск потребителя или заказчика), а при контроле производства - к невмешательству в разлаженный производственный процесс (пропуск разладки, незамеченная разладка).

Вопрос о взаимосвязи вероятностей ошибок первого и второго рода и о том, влиянию каких параметров подвержены эти вероятности, рассмотрим на следующем простом примере.

Пусть при налаженном процессе значения контролируемого параметра подчиняются нормальному закону распределения с математическим ожиданием μ₀ и дисперсией σ²₀, а в разлаженном режиме - нормальному закону с параметрами μ₁ и σ²₀ _, т.е. дисперсия в обоих режимах одинакова. Нулевой гипотезе Н₀ соответствует μ ₌μ₀, а единственно возможной альтернативной гипотезе Н₁ соответствует μ =μ₁

Для проверки, в каком состоянии находится процесс, берется безвозвратная выборка объемом п из потенциально бесконечной генеральной совокупности и рассчитывается выборочное среднее Х_n, которое является несмещенной оценкой параметра μ. Плотности распределения Х_n при верности гипотез Н₀ и Н₁ приведены на рис. 2.7. На этом рисунке точка μ_кр на оси абсцисс (причем μ₀ ₀<μ_кр <μ₁) разделяет область значений контролируемой величины Х_n на критическую область [μ_кр, ∞] - область отклонения гипотезы Н₀ и дополнительную к ней область принятия гипотезы Н₀ [-∞, μ_кр ].

Из рис. 2.7 следует, что попадание Х_n в критическую область оказывается возможным и при верности гипотезы Н₀. При этом гипотеза Н₀ ошибочно отвергается, т.е. происходит ошибка первого рода. Но также возможно попадание Х_n в область принятия гипотезы Н₀, когда эта гипотеза неверна. В этом случае ошибочно принимается гипотеза Н₀ и совершается ошибка второго рода.