Процедура испытания гипотез

Для оценки доказательств выборки мы должны формулировать наши гипотезы так, чтобы можно было использовать известное вероятностное распределение. Такая исходная гипотеза называется нулевой гипотезой и обозначается Н0. Нулевая гипотеза всегда формулируется для утверждения того, что выборочная статистика согласуется с принятым параметром генеральной совокупности. Сформулировав нулевую гипотезу, мы исследуем выборку для того, чтобы увидеть, согласуется ли она с этой гипотезой. Заметим, что для обеспечения как можно большей объектив­ности важно, чтобы гипотеза формулировалась до того, как собираются данные. Весь спектр возможных результатов, обычно подразделяется на три категории:

1) доказательство согласуется с нулевой гипотезой;

2) доказательство не согласуется с нулевой гипотезой;

3) доказательство является неубедительным, поэтому требуется больше данных для принятия решения.

Если результат соответствует категории 1, то решением будет принятие нулевой гипотезы как наиболее верной. Предполагается, что различие между величиной выборочной статистики и параметром генеральной совокупности объясняется слу­чайной вариацией, свойственной выборочному исследованию.

Если результат соответствует категории 2, то решением будет отклонение нулевой гипотезы, как, вероятно, неверной. Предполагается, что различие между выборочной статистикой и параметром генеральной совокупности не объясняется случайной выборочной вариацией. В этом случае принято применять альтернативную гипотезу. Испытание гипотез не включает доказательство согласования выборки с альтеративной гипотезой. При применении альтернативной гипотезы, мы можем предположить, поскольку нулевая гипотеза оказалась неприемлемой, что взамен нулевой гипотезы следует использовать альтернативную гипотезу. Мы не приводим какое-либо статистическое доказательство правильности нашего предположения.

Альтернативная гипотеза обычно обозначается Hj, как и Hq, она должна быть сформулирована в самом начале исследования.

Например, машина изготавливает металлические диски. Она установлена так, что средний диаметр дисков равен 2,0 см. Выборка из партии дисков показала средний диаметр, равный 2,3 см.

Вопрос состоит в том, правильно ли все еще настроена машина?

Нулевая гипотеза предполагает, что машина настроена все еще правильно и выборочная средняя согласуется с выборкой, взятой из нормальной генеральной совокупности со средним значением, равным 2,0 см. Если при испытании гипотезы мы обнаруживаем, что данные выборки не согласуются с нулевой гипотезой, то тогда мы должны решить, какое примем альтернативное заклю­чение. Альтернативной гипотезой может быть просто предположение, что среднее значение генеральной совокупности не равняется 2,0 см, а также альтернативной гипотезой может быть предположение, что генеральная средняя больше, чем 2,0 см. Альтеранативная гипотеза определяет точные условия испытания нулевой гипотезы. Отмеченные две формулировки Н(можно записать следую­щим образом:


Гл. 6. Статистический вывод 2: испытание гипотез ________ 153

Случай 1:

Н0: ц = 2,0 см,

Н,: ц * 2,0 см. Случай 2:

Н0: ц = 2,0 см,

Н,: ц> 2,0 см.

Бели результат относится к категории 3, то никакое решение не может быть принято до тех пор, пока не будет получено больше данных,и испытание гипотезы будет проведено вновь. Однако следует отметить, что разграничение этих трех категорий проводится на субъективной основе лицом, принимающим решение. Какой бы результат ни был получен, мы никогда не можем определенно (на 100%) доказать или опровергнуть нулевую гипотезу. Все, что мы можем сделать,— это или признать то, что нулевая гипотеза почти наверняка верна, или, что правиль­ность нулевой гипотезы маловероятна.

Следующий пример поможет прояснить, почему это так.

Пример 6.1. Рассмотрим еще раз эксперимент с бросанием кости 102 раза. Выпало 20 "шестерок". Очевидно ли то, что на выпадении "шестерок" сказалось влияние какого-то неслучайного фактора?

Решение

Если кость без смещения, то число выпадения "шестерок" при 102 бросаниях подчиняется биномиальному распределению.

Нулевая гипотеза предполагает, что число "шестерок" биномиально распределено с р=1/6, то есть на выпадение "шестерок" не оказывается какого-либо воздействия.

Альтернативная гипотеза предполагает, что на кость было оказано влияние для более частого выпадения "шестерок" — число "шестерок" не подчиняется биноми­альному распределению с р=1/6.

Вероятность достижения г "шестерок" из 102 бросаний, если на кость не оказано влияние, находится следующим образом:

Р (г) = ,02СГ х (1/6)г х (5/б),02"г, г = 0, 1, 2, 3......... 102.

Поэтому вероятность наблюдаемого числа "шестерок" равна:

Р (г = 20) = 102С20 х (1/6)20 х (5/6)82 = 0,073,

т. е. это событие маловероятно.

Вероятность ожидаемого числа "шестерок" равна:

Р (г = 17) = ,02С,7 х (1/6)17 х (S/6)85 = 0,105,

что также маловеооятно.


154 Ч. 2. Анализ данных как составная часть принятия решений

Как же мы можем оценить, важна ли разница между этими вероятностями или нет? Необходимы стандартные критерии, на основе которых мы можем сравнить вероятности. Одним из таких критериев является общая вероятность всех исходов, которая равна 1, то есть:

Р (все возможные нсходы)=1.

Поскольку вероятность выпадения любой величины будет мала по сравнению с 1, то процедурой, используемой на практике является сравнение Р (20 или более "шестерок") с 1. Если Р (20 или более "шестерок") меньше 1, то мы утверждаем, что если нулевая гипотеза верна, это событие маловероятно. В этом случае мы не относим событие к статистической колеблемости или к случайности. Мы предпо­лагаем, что имеется причина, которая привела к такому результату. Мы не знаем, что это за причина, но самым резонным предположением является то, что на кость оказывается влияние. Следовательно, мы отклоняем нулевую гипотезу, поскольку нет оснований для ее подтверждения. Если Р(20 или более "шестерок") является не маленькой по сравнению с 1, то событие могло произойти случайно. Нулевая гипотеза не противоречит данным и, следовательно, не может быть отклонена. Этот результат не доказывает, что нулевая гипотеза верна; мы просто говорим, что нет оснований для ее отклонения.

Остается определить, что мы имеем в виду под малой вероятностью. Эта та отправная точка, на которую опирается лицо, принимающее решение, основываясь на уверенности, требуемой для данного решения. Лицо, принимающее решение, выбирает граничную величину для Р(20 или более "шестерок"). Если действительная величина вероятности больше, чем эта величина, то тогда нулевая гипотеза принимается. Если действительная вероятность меньше, чем принятая граничная величина, решением будет отклонение нулевой гипотезы. Лицо, принимающее решение, может выбрать любую граничную величину. Однако обычно используются следующие значения:

1. Граничная величина для вероятности р=0,05. Если вероятность меньше этого значения, то нулевая гипотеза может быть явно неверной. Мы не доверяем этой гипотезе и отклоняем ее.

2. Граничная величина для вероятности р**0,01. Если вероятность меньше этого значения, то более вероятно, что нулевая гипотеза неверна. Гипотеза подвергается серьезному сомнению и отклоняется.

3. Граничная величина для вероятности р=0,001. Если вероятность меньше этого значения, то нулевая гипотеза почти наверняка неверна и отклоняется.

Когда принимается решение, используется термин значимость. Например, если решение необходимо сделать на границе 0,05 и действительная вероятность меньше 0,05, то результат значим на уровне 5%. Это означает, что вероятность случайного получения выборочной статистики большей или равной наблюдаемой величины меньше 5%, следовательно, кулевая гипотеза находится под сомнением. Однако, если действительная вероятность больше 0,05, то результат не значим для уровня 5%. Вероятность случайного достижения выборочной статистики или большей величины больше чем 5%, и нет причины для отклонения нулевой гипотезы.

Следует подчеркнуть, что несостоятельность отклонения нулевой гипотезы не доказывает, что нулевая гипотеза верна. Существует много способов наблюде­ния за выборкой статистических критериев, которые могут быть рассчитаны.


Гл. 6. Статистический вывод 2: испытание гипотез ________ 155

Некоторые из этих статистик будут согласовываться с нулевой гипотезой, некоторые — нет. Одни тесты дадут подтверждение, другие — опровержение. Лицо, принимающее решения, должно оценить все доказательства и вынести свое личное суждение.

Вернемся к примеру с костью. Примем уровень значимости решения равным 5%. Следующим шагом будет расчет вероятности достижения 20 или более "шестерок". В результате мы получили Р (20 или более "шестерок")=0,2480. Теперь срав­ним Р (20 или более "шестерок") с граничной величиной 0,05. Р (20 или более "шестерок") больше 0,05, следовательно, можно сказать, что результат не сущест­венен на уровне 5%. Доказательство согласуется с нулевой гипотезой. У нас нет причины отклонить нулевую гипотезу. Вероятность достижения 20 или более "шестерок" при бросании правильной кости равняется примерно 25%. У нас нет оснований предполагать, что на кость оказывают влияние неслучайные факторы.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: