Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений). Примером статистических гипотез являются следующие высказывания: генеральная совокупность, о которой мы располагаем лишь выборочными сведениями, имеет нормальный закон распределения или генеральная средняя (математическое ожидание случайной величины) равна 5. Не располагая сведениями о всей генеральной совокупности, высказанную гипотезу сопоставляют, по определённым правилам, с выборочными сведениями, и делают вывод о том, можно принять гипотезу или нет. Процедура сопоставления высказанной гипотезы с выборочными данными называется проверкой гипотезы.
Рассмотрим этапы проверки гипотезы и используемые при этом понятия.
Этап 1. Располагая выборочными данными Х 1, Х 2, …, Хn и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Н 0, которую называют основной или нулевой, и гипотезу Н 1, конкурирующую с гипотезой Н 0.
|
|
Термин «конкурирующая» означает, что являются противоположными следующие два события:
- по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н 0;
- по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н 1.
Гипотезу Н 1 называют также альтернативной.
Например, если нулевая гипотеза такова: математическое ожидание равно 5, – то альтернативная гипотеза может быть следующей: математическое ожидание меньше 5, что записывается следующим образом:
Н0:М(Х) = 5; Н1:М(Х)< 5.
Этап 2. Задаются вероятностью α («альфа»), которую называют уровнем значимости. Поясним её смысл:
Решение о том, можно ли считать высказывание Н 0 справедливым для генеральной совокупности, принимается по выборочным данным, т.е. по ограниченному ряду наблюдений; следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов:
- отвергают гипотезу Н 0, или, иначе, принимают альтернативную гипотезу Н 1, тогда как на самом деле гипотеза Н 0 верна – это ошибка первого рода;
- принимают гипотезу Н 0, тогда как на самом деле высказывание Н 0 неверно, т.е верной является гипотеза Н 1 – это ошибка второго рода.
Так вот, уровень значимости α – это вероятность ошибки первого рода, т.е. α = (Н 1), (13)
где (Н 1) – вероятность того, что будет принята гипотеза Н 1, если на самом деле в генеральной совокупности верна гипотеза Н 0. Вероятность α задаётся заранее, разумеется, малым числом, поскольку это вероятность ошибочного заключения, при этом обычно используют некоторые стандартные значения: 0,05; 0,01; 0,005; 0,001. Например, α = 0,05 означает следующее: если гипотезу Н 0 проверять по каждой из 100 выборок одинакового объёма, то в среднем в 5 случаях из 100 мы совершим ошибку первого рода.
|
|
Вероятность ошибки второго рода обозначают β, т.е.
β = (Н 0), (14)
где (Н 0) – вероятность того, что будет принята гипотеза Н 0, если на самом деле верна гипотеза Н 1. Зная α, можно найти вероятность β. Сказанное иллюстрирует табл. 6.
Таблица 6.
Решение, принимаемое о гипотезе Н 0 по выборке Верна ли гипотеза Н 0 или нет? | Гипотеза отвергается, т.е принимается гипотеза Н 1 | Гипотеза Н 0 принимается |
Гипотеза Н 0 верна | Ошибка первого рода, её вероятность (Н 1) = α | Правильное решение, его вероятность (Н 0) = 1 – α |
Гипотеза Н 0 неверна, т.е. верна гипотеза Н 1 | Правильное решение, его вероятность (Н 1) = 1 – β | Ошибка второго рода, её вероятность (Н 0) = β |
Обратим внимание на то, что в результате проверки гипотезы относительно гипотезы Н 0 может быть принято и правильное решение. Существует правильное решение двух следующих видов:
- принимают гипотезу Н 0, тогда как и в действительности, в генеральной совокупности, она имеет место; вероятность этого решения (Н 0) = 1 – α;
- не принимают гипотезу (Н 0) = 1 – α (т.е. принимают гипотезу Н 1), тогда как на самом деле гипотеза Н 0 неверна (т.е. верна гипотеза Н 1); вероятность этого решения (Н 1) = 1 – β.
Этап 3. Находят величину φ такую, что:
- её значения зависят от выборочных данных Х 1, Х 2, …, Хn, т.е. для которой справедливо равенство φ = φ(Х 1, Х 2, …, Хn);
- её значения позволяют судить о «расхождении выборки с гипотезой Н 0»;
- и она, будучи величиной случайной в силу случайности выборки Х 1, Х 2, …, Хn, подчиняется при выполнении гипотезы Н 0 некоторому известному, затабулированному закону распределения.
Величину φ называют критерием.
Отметим, что в основе метода построения критерия лежит понятие функции правдоподобия.
Этап 4. Далее рассуждают так. Т.к. значения критерия позволяют судить о «расхождении выборки с гипотезой Н 0», то из области допустимых значений критерия φ следует выделить подобласть ω таких значений, которые свидетельствовали бы о существенном расхождении выборки с гипотезой Н 0, и, следовательно, о невозможности принять гипотезу Н 0. Подобласть ω называют критической областью. Допустим, что критическая область выделена. Тогда руководствуются следующим правилом: если вычисленное по выборке значение критерия φ попадает в критическую область, то гипотеза Н 0 отвергается и принимается гипотеза Н 1. При этом следует понимать, что такое решение может оказаться ошибочным: на самом деле гипотеза Н 0 может быть справедливой. Т.обр., ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна α. Отсюда вытекает следующее требование к критической области ω:
вероятность того, что критерий φ примет значение из критической области ω, должна быть равна заданному числу α, т.е.
Р (φ ω) = α. (15)
Однако критическая область равенством (15) определяется неоднозначно. Действительно, представив себе график функции плотности f φ(x) критерия φ, нетрудно понять, что на оси абсцисс существует бесчисленное множество областей-интервалов таких, что площади построенных на них криволинейных трапеций равны α, т.е. областей, удовлетворяющих требованию (15). Поэтому кроме требования (15) выдвигается следующее требование: критическая область ω должна быть расположена так, чтобы при заданной вероятности α ошибки первого рода вероятность β ошибки второго рода была минимальной.
Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и расположения критерия φ):
|
|
правосторонняя критическая область, состоящая из интервала (х крпр, α, +∞), где точка х крпр, α определяется из условия
Р (φ > х крпр, α) = α (16)
и называется правосторонней критической точкой, отвечающей уровню значимости α;
левосторонняя критическая область, состоящая из интервала (- ∞, х крлев, α), где точка х крлев, α определяется из условия
Р (φ < х крлев, α) = α (17)
и называется левосторонней критической точкой, отвечающей уровню значимости α;
двусторонняя критическая область, состоящая из следующих двух интервалов: ((- ∞, х крлев, α/2)
По значению критерия φ судят о «расхождении выборочных данных с гипотезой Н 0». Естественно, что гипотеза Н 0 должна быть отвергнута, если расхождения велики; именно этим объясняется включение в критическую область больших значений критерия φ (больше, чем критическая точка).
Включение же в ряде случаев в критическую область малых значений критерия φ (меньше, чем критическая точка) на первый взгляд противоречит смыслу этой величины. Однако не следует забывать, что φ – случайная величина (она зависит от результатов наблюдений Х 1, Х 2, …, Хn, которые случайны), поэтому маловероятно появление не только слишком больших, но и слишком малых её значений и их следует включить в критическую область.
Этап 5. В формулу критерия φ = φ(Х 1, Х 2, …, Хn) вместо Х 1, Х 2, …, Хn подставляют конкретные числа, полученные в результате наблюдений, и подсчитывают числовое значение φчис критерия.
Если φчис попадает в критическую область ω, то гипотеза Н 0 отвергается и принимается гипотеза Н 1. Поступая таким образом, следует понимать, что можно допустить ошибку с вероятностью α.
Если φчис не попадает в критическую область, гипотеза Н 0 не отвергается. Но это вовсе не означает, что Н 0 является единственно подходящей гипотезой: просто расхождение между выборочными данными и гипотезой Н 0 невелико, или, иначе, Н 0 не противоречит результатами наблюдений; однако таким же свойством наряду с Н 0 могут обладать и другие гипотезы.
|
|