Общие понятия. Методика проверки

Проверка статистических гипотез.

Проверка статистических гипотез – одна из основных задач математической статистики. Разрабатываемые здесь процедуры позволяют принимать или отвергать статистические гипотезы, возникающие при обработке или интерпретации результатов наблюдений во многих практически важных разделах науки и производства, связанных со случайным экспериментом. Ниже будет рассмотрена основная методология проверки так называемых параметрических и непараметрических гипотез.

Статистической гипотезой называется любое предположение о той или иной характеристике генеральной совокупности, которое можно проверить на основе выборочных данных. Различают два класса задач, связанных с проверкой статистических гипотез: проверка гипотез о параметрах или числовых характеристиках распределения и проверка гипотез о законе распределения.

Параметрической называется гипотеза, для которой необходимы некоторые предположения о законе распределения генеральной совокупности (как правило, используется нормальность генерального). Для проверки непараметрических гипотез такие предположения не используются.

Остановимся более подробно на задачах первого класса. В этих задачах проверяются либо гипотезы о равенстве тех или иных характеристик распределения генеральной случайной величины фиксированным значениям (задача сравнения с эталоном), либо гипотезы о равенстве значений одной и той же характеристики в двух независимых генеральных.

Пусть генеральная распределена по закону, определяемому семейством функций распределения , где - скалярный или векторный параметр. Относительно параметра высказывается некоторая основная или проверяемая гипотеза . Все гипотезы, конкурирующие с основной, называются альтернативами (их может быть несколько). В простейшем случае рассматривается одна альтернатива из трех возможных вариантов, которые будут сформулированы позже.

Для проверки основной гипотезы необходимо построить такой статистический критерий, который позволит нам заключить, согласуется ли высказанное в предположение с тем, что наблюдается в выборке. Построение критерия определяется выбором подходящей меры расхождения между гипотетическим значением параметра (т.е. тем, которое устанавливается в гипотезе ) и эмпирическим значением , которое оценивается по выборке.

Обозначим эту меру . Так как данная мера должна строиться на основе выборочных данных, то является функцией от выборочного вектора (). Следовательно - статистика. Закон распределения этой статистики должен быть известен по крайней мере при условии и по возможности не зависеть от неизвестного параметра, но это не всегда возможно, поэтому различают простые и сложные гипотезы.

Определение. Гипотеза называется простой, если она полностью определяет закон распределения статистики . В противном случае гипотеза называется сложной.

Обозначим через множество возможных значений статистики . Множество может быть дискретным или непрерывным в зависимости от типа генеральной случайной величины. Если, например, генеральная нормальна, то будет представлять собой конечный или бесконечный интервал на действительной оси (в зависимости от конкретного вида статистики как функции выборочных значений). Будем рассматривать различные интервальные события, связанные со случайной величиной , например .

В методе проверки статистических гипотез на основе критериев значимости считается заданной заранее столь малое положительное число , что интервальные события указанного вида, происходящие с вероятностью , следует рассматривать как практически невозможные, если верна гипотеза . Число приэтом называется уровнем значимости критерия.

Пусть задано. Разобьем множество G на две непересекающихся подобласти: , где обозначены: - критическая область; - допустимая область. Потребуем, чтобы удовлетворяла уравнению:
/ (5.1.1)

Очевидно, что в этом случае будет автоматически выполнено равенство

Ясно, что выбор критической области только из одного условия (5.1.1) неоднозначен, поэтому нужны дополнительные условия, которые обсудим чуть позже.

Пусть разбивка на области и так или иначе произведена. Вычислим выборочное значение статистики, т.е.

В записи подчеркнуто, что выборочное значение вычисляется в предположении, что гипотеза верна. Отсюда следует, что статистика при условии должна быть полностью определена.

Сформулируем следующее решающее правило: если ZвыбÎ Þ – опровергается в пользу как не соответствующая опытным данным. Если же ZвыбÎ Þ следует принять на данном уровне значимости a.. Основа этого правила заключается в следующем. Мы сами задали столь малое a, чтобы событие имело гарантированно малую вероятность, если справедлива гипотеза . Поэтому, если для данной выборки это событие реализовалось, то следует считать, что расхождение между гипотетическим и выборочным значением превысило некоторый порог (стало «значимым») и необходимо отвергнуть .


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: