Ошибки при проверке гипотез

Ошибки, допускаемые при проверке гипотез, удобно разделить на два типа: 1) отклонение гипотезы Н₀, когда она верна, — ошибка первого рода; 2) принятие гипотезы Н₀, когда в действительности верна какая-то другая гипотеза, — ошибка второго рода.

Вероятность ошибки первого рода обозначается . Величина называется уровнем значимости критерия, по которому проверяется справедливость гипотезы Н₀.

Вероятность ошибки второго рода обозначается . Ее величина зависит от альтернативной гипотезы Н₁ Рассмотрим для приведенного выше примера следующие две ситуации: 1) в действительности средняя агрессивность возросла на 3 единицы, 2) средняя агрессивность увеличилась на 30 единиц. Ясно, что для одних и тех же условий эксперимента и одинакового уровня значимости вероятность ошибки второго рода (принять гипотезу об отсутствии различия) для второй из альтернатив будет меньше.

Вероятности и удобно представить, как это сделано в табл. 6.1.

Таблица 6.1

Ошибки при проверке гипотез

	Решение
Принять Н₀	Принять Н₁
Справедлива Н₀	Правильное с вероятностью 1 —	Ошибочное с вероятностью а
Справедлива Н₁	Ошибочное с вероятностью	Правильное с вероятностью

Наглядным способом интерпретации ошибок является их графическое представление.

Предположим, что проверяется гипотеза Н₀: о равенстве среднего значения генеральной совокупности заданной величине (известной, например, из предыдущих экспериментов).

Для этого берется выборка объема n, находится ее среднее арифметическое и по его величине судят о справедливости гипотезы Н₀.

Распределение среднего арифметического при условии, что верна гипотеза Н₀, будет . Это распределение чисто качественно представлено на рис. 6.1.

Распределение среднего арифметического при условии, что верна альтернативная гипотеза Н₁: , буде уже другим — .

Будем считать, что гипотеза Н₀ отвергается, если выборочное среднее арифметическое окажется больше некоторого значения К_критич, т. е. , как показано на рис. 6.1.

Рис. 6.1. Ошибки первого и второго рода

Область непринятия гипотезы Н₀ называется критической областью критерия. Она показана па рис. 6.1 наклонной штриховкой. Уровень значимости a будет соответствовать площади критической области.

Вероятность ошибки второго рода будет равна площади под кривой распределения , показанной на рис. 6.1. вертикальной штриховкой.

Величина называется мощностью критерия.

Следует особо подчеркнуть, что любая гипотеза должна формулироваться, а уровень значимости а задаваться исследователем, всегда до получения экспериментальных данных, по которым эта гипотеза будет проверяться.

При выборе уровня значимости a исследователь исходит из практических соображений, отвечая на вопрос: какую вероятность ошибки он считает допустимой для его конкретной задачи?

Обычно считают достаточным a= 0,05 (5%), иногда a=0,01, редко a=0,001.

Между стандартными статистическими критериями и стандартными доверительными интервалами существует тесная связь: если принимается гипотеза о том, что значение параметра (m,s) нормально распределенной генеральной совокупности равно фиксированному значению (, ) с уровнем значимости , то это эквивалентно заданию 100(1 – )%-ного доверительного интервала для данного параметра нормального распределения. Поэтому оба подхода — доверительные интервалы и критерии значимости — в данном случае равноценны. Преимущество доверительных интервалов в том, что они дают представление об истинном значении параметра генеральной совокупности, а недостаток в том, что их трудно построить в более сложных случаях, например при анализе дисперсий (стандартных отклонений).

1 2 3 4 5 6

Подборка статей по вашей теме:

Никогда нельзя поворачиваться спиной к опасности и пытаться убежать от нее. Сделав это, вы удвоите опасность. Но если вы встретите опасность своевременно и бесстрашно, то уменьшите ее наполовину. © Черчилль ==> читать все изречения...

8412

8132