Уровень значимости и мощность

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок. Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Вероятность ошибки первого рода называется уровнем значимости и обозначается α. Таким образом, α = P { U Ψ | H 0}, т.е. уровень значимости α – это вероятность события { U Ψ}, вычисленная в предположении, что верна нулевая гипотеза Н 0.

Уровень значимости однозначно определен, если Н 0 – простая гипотеза. Если же Н 0 – сложная гипотеза, то уровень значимости, вообще говоря, зависит от функции распределения результатов наблюдений, удовлетворяющей Н 0. Статистику критерия U обычно строят так, чтобы вероятность события { U Ψ} не зависела от того, какое именно распределение (из удовлетворяющих нулевой гипотезе Н 0) имеют результаты наблюдений. Для статистик критерия U общего вида под уровнем значимости понимают максимально возможную ошибку первого рода. Максимум (точнее, супремум) берется по всем возможным распределениям, удовлетворяющим нулевой гипотезе Н 0, т.е. α = sup P { U Ψ | H 0}.

Если критическая область имеет вид, указанный в формуле,
то P { U > C | H0} = α. Если С задано, то из последнего соотношения определяют α. Часто поступают по иному - задавая α (обычно α = 0,05, иногда α = 0,01 или α = 0,1, другие значения α используются гораздо реже), определяют С из уравнения (10), обозначая его Сα, и используют критическую область Ψ = { U > Cα } с заданным уровнем значимости α.

Вероятность ошибки второго рода есть P { U Ψ | H 1}. Обычно используют не эту вероятность, а ее дополнение до 1, т.е. P { U Ψ | H 1} = 1 - P { U Ψ | H 1}. Эта величина носит название мощности критерия. Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия – функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута. Функция мощности зависит от критической области Ψ и действительного распределения результатов наблюдений. В параметрической задаче проверки гипотез распределение результатов наблюдений задается параметром θ. В этом случае функция мощности обозначается М (Ψ,θ) и зависит от критической области Ψ и действительного значения исследуемого параметра θ. Если

Н 0: θ = θ0,

Н 1: θ = θ1, то

М (Ψ,θ0) = α,

М (Ψ,θ1) = 1 – β,

где α – вероятность ошибки первого рода, β - вероятность ошибки второго рода. В статистическом приемочном контроле α – риск изготовителя, β – риск потребителя. При статистическом регулировании технологического процесса α – риск излишней наладки, β – риск незамеченной разладки.

Функция мощности М (Ψ,θ) в случае одномерного параметра θ обычно достигает минимума, равного α, при θ = θ0, монотонно возрастает при удалении от θ0 и приближается к 1 при | θ - θ0 | → ∞.

В ряде вероятностно-статистических методов принятия решений используется оперативная характеристика L (Ψ,θ) - вероятность принятия нулевой гипотезы в зависимости от критической области Ψ и действительного значения исследуемого параметра θ. Ясно, что L (Ψ,θ) = 1 - М (Ψ,θ).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: