Статистическое решение и вероятность ошибки

В конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная – о ее наличии.

Чем меньше р -уровень, тем с большей уверенностью можно отклонить Н ₀ в пользу H ₁, тем самым, подтвердив исходную содержательную гипотезу. Но, всегда есть вероятность ошибки: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. Этот конфликт представим в табличной форме.

	H ₀ истинна	H ₁ истинна
Отклонить H₀	Неправильное решение,	Правильное решение,
ошибка I рода,	вероятность = 1 — β
вероятность = α	(мощность или
	чувствительность критерия)
Принять H ₀	Правильное решение,	Неправильное решение.
вероятность = 1 — α	ошибка II рода.
(доверительная вероятность)	вероятность = β

Вопрос в том, какую вероятность ошибки I рода α, считается допустимой: если р ‑уровень, полученный в процессе проверки гипотезы, меньше или равен α, исследователь отклоняет Н ₀, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). В этом случае вероятность ошибки известна, она меньше или равна α, точнее, равна р ‑уровню.

Если же p -уровень превышает α, то принимается Н ₀ и содержательная гипотеза не подтверждается. Но при этом вероятность ошибки II рода β ‑ того, что верна все же Н ₁, обычно остается неизвестной.

При этом, чем меньше величина α, тем больше риск допустить ошибку II рода – не обнаружить различия или связи, которые на самом деле существуют.

Величина (1- α) называется доверительной вероятностью; она задает доверительный интервал значений выборочной статистики. Если выборочное значение попадает в этот интервал, то гипотеза Н ₀ не отклоняется.

Вероятность (1- β) называется мощностью (чувствительностью) критерия. Она характеризует статистический критерий (метод, тест) с точки зрения его способности отклонять Н ₀, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестной.

Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины α, удовлетворяющее двум противоречивым требованиям.

Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н ₀.

Величина α должна быть достаточно велика, чтобы отклонить Н ₀ при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина α является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении α для статистического вывода:

· Для установленного значения α вероятность ошибки β уменьшается с ростом объема выборки.

· Вероятность ошибки β уменьшается при увеличении значения α.

Вопрос о величине α – вопрос о том, при каком же р ‑уровне исследователь может отклонить Н ₀ решается преимущественно исходя из неформальных соглашений.

Обычно для отклонения Н ₀ для небольших выборок (когда высока вероятность ошибки II рода) принимают уровень α ≤ 0,05.

Если объемы выборок около 100 и более объектов, то целесообразно принимать решение о наличии связи (различий) при α ≤ 0,01.

Традиционная интерпретация уровней значимости.

Уровень значимости	Решение	Возможный статистический вывод
p> 0,1	Принимается Н ₀	«Статистически достоверные различия не обнаружены»
p≤ 0,1	сомнения в истинности Н₀, неопределенность	«Различия обнаружены на уровне статистической тенденции»
р≤0,05	значимость, отклонение Н ₀	«Обнаружены статистически достоверные (значимые) различия»
р≤0,01	высокая значимость, отклонение Н ₀	«Различия обнаружены на высоком уровне статистической значимости»

3 4 5 6 7 8 9

Подборка статей по вашей теме: