Проверки гипотезы. Критерий согласия Пирсона

Под статистической гипотезой понимают всякое высказывание о генеральной совокупности (случайной величине), проверяемое по выборке (по результатам наблюдений). Примером статистических гипотез являются следующие высказывания: генеральная совокупность, о которой мы располагаем лишь выборочными сведениями, имеет нормальный закон распределения или генеральная средняя (математическое ожидание случайной величины) равна 5. Не располагая сведениями о всей генеральной совокупности, высказанную гипотезу сопоставляют, по определённым правилам, с выборочными сведениями, и делают вывод о том, можно принять гипотезу или нет. Процедура сопоставления высказанной гипотезы с выборочными данными называется проверкой гипотезы.

Рассмотрим этапы проверки гипотезы и используемые при этом понятия.

Этап 1. Располагая выборочными данными Х 1, Х 2, …, Хn и руководствуясь конкретными условиями рассматриваемой задачи, формулируют гипотезу Н 0, которую называют основной или нулевой, и гипотезу Н 1, конкурирующую с гипотезой Н 0.

Термин «конкурирующая» означает, что являются противоположными следующие два события:

- по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н 0;

- по выборке будет принято решение о справедливости для генеральной совокупности гипотезы Н 1.

Гипотезу Н 1 называют также альтернативной.

Например, если нулевая гипотеза такова: математическое ожидание равно 5, – то альтернативная гипотеза может быть следующей: математическое ожидание меньше 5, что записывается следующим образом:

Н0:М(Х) = 5; Н1:М(Х)< 5.

Этап 2. Задаются вероятностью α («альфа»), которую называют уровнем значимости. Поясним её смысл:

Решение о том, можно ли считать высказывание Н 0 справедливым для генеральной совокупности, принимается по выборочным данным, т.е. по ограниченному ряду наблюдений; следовательно, это решение может быть ошибочным. При этом может иметь место ошибка двух родов:

- отвергают гипотезу Н 0, или, иначе, принимают альтернативную гипотезу Н 1, тогда как на самом деле гипотеза Н 0 верна – это ошибка первого рода;

- принимают гипотезу Н 0, тогда как на самом деле высказывание Н 0 неверно, т.е верной является гипотеза Н 1 – это ошибка второго рода.

Так вот, уровень значимости α – это вероятность ошибки первого рода, т.е. α = (Н 1), (13)

где (Н 1) – вероятность того, что будет принята гипотеза Н 1, если на самом деле в генеральной совокупности верна гипотеза Н 0. Вероятность α задаётся заранее, разумеется, малым числом, поскольку это вероятность ошибочного заключения, при этом обычно используют некоторые стандартные значения: 0,05; 0,01; 0,005; 0,001. Например, α = 0,05 означает следующее: если гипотезу Н 0 проверять по каждой из 100 выборок одинакового объёма, то в среднем в 5 случаях из 100 мы совершим ошибку первого рода.

Вероятность ошибки второго рода обозначают β, т.е.

β = (Н 0), (14)

где (Н 0) – вероятность того, что будет принята гипотеза Н 0, если на самом деле верна гипотеза Н 1. Зная α, можно найти вероятность β. Сказанное иллюстрирует табл. 6.

Таблица 6.

Решение, принимаемое о гипотезе Н 0 по выборке Верна ли гипотеза Н 0 или нет? Гипотеза отвергается, т.е принимается гипотеза Н 1 Гипотеза Н 0 принимается
Гипотеза Н 0 верна Ошибка первого рода, её вероятность (Н 1) = α Правильное решение, его вероятность (Н 0) = 1 – α
Гипотеза Н 0 неверна, т.е. верна гипотеза Н 1 Правильное решение, его вероятность (Н 1) = 1 – β Ошибка второго рода, её вероятность (Н 0) = β

Обратим внимание на то, что в результате проверки гипотезы относительно гипотезы Н 0 может быть принято и правильное решение. Существует правильное решение двух следующих видов:

- принимают гипотезу Н 0, тогда как и в действительности, в генеральной совокупности, она имеет место; вероятность этого решения (Н 0) = 1 – α;

- не принимают гипотезу (Н 0) = 1 – α (т.е. принимают гипотезу Н 1), тогда как на самом деле гипотеза Н 0 неверна (т.е. верна гипотеза Н 1); вероятность этого решения (Н 1) = 1 – β.

Этап 3. Находят величину φ такую, что:

- её значения зависят от выборочных данных Х 1, Х 2, …, Хn, т.е. для которой справедливо равенство φ = φ(Х 1, Х 2, …, Хn);

- её значения позволяют судить о «расхождении выборки с гипотезой Н 0»;

- и она, будучи величиной случайной в силу случайности выборки Х 1, Х 2, …, Хn, подчиняется при выполнении гипотезы Н 0 некоторому известному, затабулированному закону распределения.

Величину φ называют критерием.

Отметим, что в основе метода построения критерия лежит понятие функции правдоподобия.

Этап 4. Далее рассуждают так. Т.к. значения критерия позволяют судить о «расхождении выборки с гипотезой Н 0», то из области допустимых значений критерия φ следует выделить подобласть ω таких значений, которые свидетельствовали бы о существенном расхождении выборки с гипотезой Н 0, и, следовательно, о невозможности принять гипотезу Н 0. Подобласть ω называют критической областью. Допустим, что критическая область выделена. Тогда руководствуются следующим правилом: если вычисленное по выборке значение критерия φ попадает в критическую область, то гипотеза Н 0 отвергается и принимается гипотеза Н 1. При этом следует понимать, что такое решение может оказаться ошибочным: на самом деле гипотеза Н 0 может быть справедливой. Т.обр., ориентируясь на критическую область, можно совершить ошибку первого рода, вероятность которой задана заранее и равна α. Отсюда вытекает следующее требование к критической области ω:

вероятность того, что критерий φ примет значение из критической области ω, должна быть равна заданному числу α, т.е.

Р ω) = α. (15)

Однако критическая область равенством (15) определяется неоднозначно. Действительно, представив себе график функции плотности f φ(x) критерия φ, нетрудно понять, что на оси абсцисс существует бесчисленное множество областей-интервалов таких, что площади построенных на них криволинейных трапеций равны α, т.е. областей, удовлетворяющих требованию (15). Поэтому кроме требования (15) выдвигается следующее требование: критическая область ω должна быть расположена так, чтобы при заданной вероятности α ошибки первого рода вероятность β ошибки второго рода была минимальной.

Возможны три вида расположения критической области (в зависимости от вида нулевой и альтернативной гипотез, вида и расположения критерия φ):

правосторонняя критическая область, состоящая из интервала (х крпр, α, +∞), где точка х крпр, α определяется из условия

Р (φ > х крпр, α) = α (16)

и называется правосторонней критической точкой, отвечающей уровню значимости α;

левосторонняя критическая область, состоящая из интервала (- ∞, х крлев, α), где точка х крлев, α определяется из условия

Р (φ < х крлев, α) = α (17)

и называется левосторонней критической точкой, отвечающей уровню значимости α;

двусторонняя критическая область, состоящая из следующих двух интервалов: ((- ∞, х крлев, α/2)

По значению критерия φ судят о «расхождении выборочных данных с гипотезой Н 0». Естественно, что гипотеза Н 0 должна быть отвергнута, если расхождения велики; именно этим объясняется включение в критическую область больших значений критерия φ (больше, чем критическая точка).

Включение же в ряде случаев в критическую область малых значений критерия φ (меньше, чем критическая точка) на первый взгляд противоречит смыслу этой величины. Однако не следует забывать, что φ – случайная величина (она зависит от результатов наблюдений Х 1, Х 2, …, Хn, которые случайны), поэтому маловероятно появление не только слишком больших, но и слишком малых её значений и их следует включить в критическую область.

Этап 5. В формулу критерия φ = φ(Х 1, Х 2, …, Хn) вместо Х 1, Х 2, …, Хn подставляют конкретные числа, полученные в результате наблюдений, и подсчитывают числовое значение φчис критерия.

Если φчис попадает в критическую область ω, то гипотеза Н 0 отвергается и принимается гипотеза Н 1. Поступая таким образом, следует понимать, что можно допустить ошибку с вероятностью α.

Если φчис не попадает в критическую область, гипотеза Н 0 не отвергается. Но это вовсе не означает, что Н 0 является единственно подходящей гипотезой: просто расхождение между выборочными данными и гипотезой Н 0 невелико, или, иначе, Н 0 не противоречит результатами наблюдений; однако таким же свойством наряду с Н 0 могут обладать и другие гипотезы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: