Ошибки при проверке гипотез

Ошибки, допускаемые при проверке гипотез, удобно разделить на два типа: 1) отклонение гипотезы Н0, когда она верна, — ошибка первого рода; 2) принятие гипотезы Н0, когда в действительности верна какая-то другая гипотеза, — ошибка второго рода.

Вероятность ошибки первого рода обозначается . Величина называется уровнем значимости критерия, по которому проверяется справедливость гипотезы Н0.

Вероятность ошибки второго рода обозначается . Ее величина зависит от альтернативной гипотезы Н1 Рассмотрим для приведенного выше примера следующие две ситуации: 1) в действительности средняя агрессивность возросла на 3 единицы, 2) средняя агрессивность увеличилась на 30 единиц. Ясно, что для одних и тех же условий эксперимента и одинакового уровня значимости вероятность ошибки второго рода (принять гипотезу об отсутствии различия) для второй из альтернатив будет меньше.

Вероятности и удобно представить, как это сделано в табл. 6.1.

Таблица 6.1

Ошибки при проверке гипотез

  Решение
Принять Н0 Принять Н1
Справедлива Н0 Правильное с вероятностью 1 — Ошибочное с вероятностью а
Справедлива Н1 Ошибочное с вероятностью Правильное с вероятностью

Наглядным способом интерпретации ошибок является их графическое представление.

Предположим, что проверяется гипотеза Н0: о равенстве среднего значения генеральной совокупности заданной величине (известной, например, из предыдущих экспериментов).

Для этого берется выборка объема n, находится ее среднее арифметическое и по его величине судят о справедливости гипотезы Н0.

Распределение среднего арифметического при условии, что верна гипотеза Н0, будет . Это распределение чисто качественно представлено на рис. 6.1.

Распределение среднего арифметического при условии, что верна альтернативная гипотеза Н1: , буде уже другим — .

Будем считать, что гипотеза Н0 отвергается, если выборочное среднее арифметическое окажется больше некоторого значения Ккритич, т. е. , как показано на рис. 6.1.

 
 


Рис. 6.1. Ошибки первого и второго рода

Область непринятия гипотезы Н0 называется критической областью критерия. Она показана па рис. 6.1 наклонной штриховкой. Уровень значимости a будет соответствовать площади критической области.

Вероятность ошибки второго рода будет равна площади под кривой распределения , показанной на рис. 6.1. вертикальной штриховкой.

Величина называется мощностью критерия.

Следует особо подчеркнуть, что любая гипотеза должна формулироваться, а уровень значимости а задаваться исследователем, всегда до получения экспериментальных данных, по которым эта гипотеза будет проверяться.

При выборе уровня значимости a исследователь исходит из практических соображений, отвечая на вопрос: какую вероятность ошибки он считает допустимой для его конкретной задачи?

Обычно считают достаточным a= 0,05 (5%), иногда a=0,01, редко a=0,001.

Между стандартными статистическими критериями и стандартными доверительными интервалами существует тесная связь: если принимается гипотеза о том, что значение параметра (m,s) нормально распределенной генеральной совокупности равно фиксированному значению ( , ) с уровнем значимости , то это эквивалентно заданию 100(1 – )%-ного доверительного интервала для данного параметра нормального распределения. Поэтому оба подхода — доверительные интервалы и критерии значимости — в данном случае равноценны. Преимущество доверительных интервалов в том, что они дают представление об истинном значении параметра генеральной совокупности, а недостаток в том, что их трудно построить в более сложных случаях, например при анализе дисперсий (стандартных отклонений).


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: