Общая методология проверки статистических гипотез

ТЕМА 8. ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ

ПЛАН:

1. Общая методология проверки статистических гипотез.

2. Гипотезы о генеральной средней.

3. Гипотезы о генеральной дисперсии.

4. Гипотеза о законе распределения генеральной совокупности.

 

Общая методология проверки статистических гипотез

Статистическая проверка гипотез тесно связана с теорией оценивания параметров распределений. В экономике, технике, естествознании, медицине, демографии и т. д. часто для выяснения того или иного случайного явления прибегают к высказыванию гипотез (предположений), которые можно проверить статистически, то есть опираясь на результаты наблюдений в случайной выборке.

Статистической гипотезой называют любое предположение о свойствах генеральной совокупности или виде неизвестного закона распределения случайной величины или значении его параметров.

Статистическую гипотезу, однозначно определяющую закон распределения, называют простой, в противном случае её называют сложной. Параметрическая гипотеза содержит некоторое утверждение относительного значения параметра распределения известного вида. В непараметрической гипотезе заключается утверждение о виде закона распределения генеральной совокупности

Например, статистической является гипотеза о том, что распределение производительности труда рабочих, выполняющих одинаковую работу в одинаковых организационно-технических условиях, имеет нормальный закон распределения, или статистической является также гипотеза о том, что средние размеры деталей, производимых на однотипных, параллельно работающих станках, не различаются между собой.

Статистическая проверка гипотез – процедура обоснованного сопоставления высказанной гипотезы с имеющимися выборочными данными, сопровождаемая количественной оценкой степени достоверности получаемого вывода.

Основные принципы проверки статистических гипотез состоят в следующем. Пусть F(X, θ) – закон распределения случайной величины X, зависящей от одного параметра θ. Предположим, что необходимо проверить гипотезу о том, что θ = θ0, где θ0 – определённое число. Назовём эту гипотезу нулевой (проверяемой) и обозначим её через H0.

Нулевой гипотезой H0 называют выдвинутую гипотезу, которую необходимо проверить. Конкурирующей (альтернативной) гипотезой H1 называют гипотезу, противоположную нулевой в логическом плане.

Таким образом, задача заключается в проверке гипотезы H0 относительно конкурирующей гипотезы H1 на основании выборки, состоящей из n независимых наблюдений X1, X2,..., Xn над случайной величиной X. Следовательно, всё возможное множество выборок объёмом n можно разделить на два непересекающихся подмножества (обозначим их через Q и W) таких, что проверяемая гипотеза H0 должна быть отвергнута, если наблюдаемая выборка попадает в подмножество W, и принята, если наблюдаемая выборка принадлежит подмножеству Q. Подмножество W называют критической областью (область отклонения нулевой гипотезы),  Q – областью допустимых значений (область принятия нулевой гипотезы).

Наиболее точные суждения относительно истинности выдвинутой гипотезы можно было бы сделать при исследовании всей генеральной совокупности. Однако это зачастую невозможно, и суждения об истинности или ложности гипотезы приходится делать на основании выборки ограниченного объёма. Вывод о принадлежности данной выборки к соответствующему подмножеству делают по статистическому критерию.

Статистическим критерием называют однозначно определённое правило, устанавливающее условия, при которых проверяемую гипотезу H0 следует либо отвергнуть, либо не отвергнуть.

Основой критерия является специально составленная выборочная функция (статистика) Q* = f(X1, X2,..., Xn), точное или приближённое распределение которой известно. В качестве статистических критериев обычно используют:

1) U-критерий, распределённый по нормальному критерию;

2) Т-критерий, распределённый по закону Стьюдента;

3) χ2-критерий, имеющий «χ-квадрат» распределение;

4) F-критерий, распределённый по закону Фишера – Снедекора;

5) Λ-критерий, распределённый по закону Колмогорова.

Основные правила проверки гипотезы состоят в том, что если наблюдаемое значение статистики критерия попадает в критическую область, то гипотезу отвергают, если же оно попадает в область допустимых значений, то гипотезу не отвергают (или принимают).

Такой принцип проверки гипотезы не даёт логического доказательства или опровержения нулевой гипотезы. Положительный результат статистической проверки исходной гипотезы вовсе не означает, что высказанная гипотеза является наилучшей (единственно подходящей): просто она не противоречит имеющимся в распоряжении выборочным данным, однако таким же свойством наряду с H0 могут обладать и другие подобные гипотезы. Так что даже статистически проверенную гипотезу следует расценивать не как раз и навсегда установленный, абсолютно верный факт, а лишь как достаточно правдоподобное, не противоречащее опытным данным утверждение.

При использовании этого принципа возможны четыре исхода:

− гипотеза H0 верна, и её принимают согласно критерия;

− гипотеза H0 неверна, и её отвергают согласно критерия;

− гипотеза H0 верна, но её отвергают согласно критерия, то есть допускается ошибка, которую принято называть ошибкой первого рода;

− гипотеза H0 неверна, но её принимают согласно критерия, то есть допускается ошибка второго рода.

Гипотеза H0 Принимается Отвергается
Верна Правильное решение Ошибка первого рода
Неверна Ошибка второго рода Правильное решение

Уровнем значимости (размер) критерия α = 1 – γ называют вероятность совершить ошибку первого рода, то есть вероятность отвергнуть нулевую гипотезу H0, когда она верна. Вероятность 1 – α не допустить ошибку первого рода, то есть принять нулевую гипотезу, когда она верна, называют оперативной характеристикой критерия.

Выбор величины уровня значимости α зависит от потерь, которые мы понесём в случае ошибочного отклонения верной гипотезы H0: чем весомее потери, тем меньшей выбирается величина α. Как правило, пользуются стандартными значениями уровня значимости α = 0,1; 0,05; 0,025; 0,01; 0,005; 0,001. Чаще всего принимают α = 0,05. Это означает, что в среднем в пяти случаях из ста мы будем ошибочно отвергать справедливую нулевую гипотезу при многократном использовании статистического критерия.

Мощностью критерия М = 1 – β называют вероятность того, что нулевая гипотеза H0 будет отвергнута, если верна конкурирующая гипотеза H1, то есть вероятность не допустить ошибку второго рода.

Вероятности ошибок первого и второго рода однозначно определяются выбором критической области. Желательно минимизировать значения обеих этих ошибок. Но при фиксированном объёме выборки уменьшение ошибки первого рода α ведёт к возрастанию вероятности ошибки второго рода β. Лишь при увеличении объёма выборки возможно одновременное уменьшение вероятностей α и β.

Обозначим через P(Q*∈W/H) вероятность попадания статистики критерия Q* в критическую область W, если верна соответствующая гипотеза H.

Тогда требования к критической области аналитически можно записать следующим образом:

где H0 – нулевая гипотеза;

H1 – конкурирующая гипотеза.

Второе условие выражает требование максимума мощности критерия.

Из этих условий следует, что критическую область нужно выбирать так, чтобы вероятность попадания в неё была бы минимальной (равной α), если верна нулевая гипотеза H0, и максимальной в противоположном случае.

В зависимости от содержания конкурирующей гипотезы H1 выбирают правостороннюю, левостороннюю или двустороннюю критические области.

Границы критической области при заданном уровне значимости α находят из соотношений:

– при правосторонней критической области:

P(Q* > Qкр) = α;

– при левосторонней критической области:

P(Q* < Qкр) = α;

– при двусторонней критической области:

P(Q* > Qкр.пр.) = α / 2;

P(Q* < Qкр.лев.) = α / 2,

где Qкр.лев. – левосторонняя, а Qкр.пр. – правосторонняя граница критической области.

Следует иметь ввиду, что статистические критерии не доказывают справедливости гипотезы, а лишь устанавливают на принятом уровне значимости её согласие или несогласие с результатом наблюдений. Принятие гипотезы следует расценивать не как раз и навсегда установленный, абсолютно верный содержащийся в ней факт, а лишь как достаточно правдоподобное, не противоречащее опыту утверждение.

Таким образом, общая процедура проверки статистической гипотезы включает в себя следующие этапы:

1). Выдвижение нулевой гипотезы H0.

2). Задание уровня значимости α статистического критерия.

3). Выбор статистического критерия Q* для проверки гипотезы H0 и определение по выборочным данным его расчётного значения.

4). Нахождение по специальным статистическим таблицам законов распределения критического значения выбранного статистического критерия Qкр.

5). Принятие или отклонение нулевой гипотезы в результате сравнения критического и расчётного значений статистического критерия. 

 

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: