В конечном итоге проверка статистической гипотезы должна заканчиваться принятием статистического решения о том, какая же гипотеза верна: нулевая — об отсутствии связи или альтернативная – о ее наличии.
Чем меньше р -уровень, тем с большей уверенностью можно отклонить Н 0 в пользу H 1, тем самым, подтвердив исходную содержательную гипотезу. Но, всегда есть вероятность ошибки: ведь исследование проведено на выборке, а вывод делается в отношении генеральной совокупности. Этот конфликт представим в табличной форме.
H 0 истинна | H 1 истинна | |
Отклонить H0 | Неправильное решение, | Правильное решение, |
ошибка I рода, | вероятность = 1 — β | |
вероятность = α | (мощность или | |
чувствительность критерия) | ||
Принять H 0 | Правильное решение, | Неправильное решение. |
вероятность = 1 — α | ошибка II рода. | |
(доверительная вероятность) | вероятность = β |
Вопрос в том, какую вероятность ошибки I рода α, считается допустимой: если р ‑уровень, полученный в процессе проверки гипотезы, меньше или равен α, исследователь отклоняет Н 0, и это, как правило, желательный для него результат (содержательная гипотеза подтверждается!). В этом случае вероятность ошибки известна, она меньше или равна α, точнее, равна р ‑уровню.
|
|
Если же p -уровень превышает α, то принимается Н 0 и содержательная гипотеза не подтверждается. Но при этом вероятность ошибки II рода β ‑ того, что верна все же Н 1, обычно остается неизвестной.
При этом, чем меньше величина α, тем больше риск допустить ошибку II рода – не обнаружить различия или связи, которые на самом деле существуют.
Величина (1- α) называется доверительной вероятностью; она задает доверительный интервал значений выборочной статистики. Если выборочное значение попадает в этот интервал, то гипотеза Н 0 не отклоняется.
Вероятность (1- β) называется мощностью (чувствительностью) критерия. Она характеризует статистический критерий (метод, тест) с точки зрения его способности отклонять Н 0, когда она не верна. Точное значение величины мощности критерия в большинстве случаев остается неизвестной.
Итак, основная проблема статистического вывода заключается в том, что заранее должно быть установлено оптимальное значение величины α, удовлетворяющее двум противоречивым требованиям.
Величина α должна быть достаточно мала, чтобы обеспечивать доверие к результатам исследования при отклонении Н 0.
Величина α должна быть достаточно велика, чтобы отклонить Н 0 при наличии связи (различий), не допуская ошибки II рода. Вопрос о том, какая же величина α является приемлемой, не имеет однозначного ответа. Есть лишь общие соображения, которыми можно руководствоваться при назначении α для статистического вывода:
|
|
· Для установленного значения α вероятность ошибки β уменьшается с ростом объема выборки.
· Вероятность ошибки β уменьшается при увеличении значения α.
Вопрос о величине α – вопрос о том, при каком же р ‑уровне исследователь может отклонить Н 0 решается преимущественно исходя из неформальных соглашений.
Обычно для отклонения Н 0 для небольших выборок (когда высока вероятность ошибки II рода) принимают уровень α ≤ 0,05.
Если объемы выборок около 100 и более объектов, то целесообразно принимать решение о наличии связи (различий) при α ≤ 0,01.
Традиционная интерпретация уровней значимости.
Уровень значимости | Решение | Возможный статистический вывод |
p> 0,1 | Принимается Н 0 | «Статистически достоверные различия не обнаружены» |
p≤ 0,1 | сомнения в истинности Н0, неопределенность | «Различия обнаружены на уровне статистической тенденции» |
р≤0,05 | значимость, отклонение Н 0 | «Обнаружены статистически достоверные (значимые) различия» |
р≤0,01 | высокая значимость, отклонение Н 0 | «Различия обнаружены на высоком уровне статистической значимости» |