Основные понятия

Проверка статистических гипотез

Большинство эконометрических моделей требует многократного улучшения и уточнения. Для этого необходимо проведение соответствующих расчетов, связанных с установлением выполнимости или невыполнимости тех или иных предпосылок, анализом качества найденных оценок, достоверностью полученных выводов. Поэтому знание основных принципов проверки гипотез является обязательным в эконометрике.

Во многих случаях необходимо знать закон распределения генеральной совокупности. Если закон распределения неизвестен, но есть основания предположить, что он имеет определенный вид, то выдвигают гипотезу: генеральная совокупность распределена по этому закону. Например, можно выдвинуть предположение, что доход населения, ежедневное количество покупателей в магазине, размер выпускаемых деталей имеют нормальный закон распределения.

Возможен случай, когда закон распределения известен, а его параметры нет. Если есть основания предположить, что неизвестный параметр q равен ожидаемому числу q0, то выдвигают гипотезу: q=q0. Например, можно выдвинуть предположение о величине среднего дохода населения, среднего ожидаемого дохода по акциям, о разбросе в доходах и т.д.

Под статистической гипотезой H понимают любое предположение о генеральной совокупности (случайной величине), проверяемое по выборке. Это может быть предположение о виде распределения генеральной совокупности, о равенстве двух выборочных дисперсий, о независимости выборок, об однородности выборок, т.е. что закон распределения не меняется от выборки к выборке и др.

Гипотеза называется простой, если она однозначно определяет какое-либо распределение или какой-либо параметр; в противном случае гипотеза называется сложной. Например, простой гипотезой является предположение о том, что случайная величина X распределена по стандартному нормальному закону N (0;1); если же высказывается предположение, что случайная величина X имеет нормальной распределение N (m;1), где a £ m £ b, то это сложная гипотеза.

Проверяемая гипотеза называется основной или нулевой гипотезой и обозначается символом H 0. Наряду с основной гипотезой рассматривают и противоречащую ей гипотезу, которую обычно называют конкурирующей или альтернативной гипотезой и обозначают символом H 1. Если основная гипотеза будет отвергнута, то имеет место альтернативная гипотеза. Например, если проверяется гипотеза о равенства параметра q некоторому заданному значению q0, т.е. H 0:q=q0, то в качестве альтернативной гипотезы можно рассмотреть одну из следующих гипотез: H 1:q>q0, H 2:q<q0, H 3:q¹q0, H 4:q=q1. Выбор альтернативной гипотезы определяется конкретной формулировкой задачи.

Выдвинутая гипотеза может быть правильной или неправильной, поэтому возникает необходимость ее проверки. Поскольку проверка осуществляется статистическими методами, то в связи с этим с определенной долей вероятности может быть принято неправильное решение. Здесь могут быть допущены ошибки двух видов. Ошибка первого рода состоит в том, что будет отвергнута правильная гипотеза. Вероятность ошибки первого рода обозначают буквой a, т.е.

.

Ошибка второго рода состоит в том, что будет принята неправильная гипотеза. Вероятность ошибки второго рода обозначают буквой b, т.е.

.

Последствия указанных ошибок неравнозначны. Первая приводит к более осторожному, консервативному решению, вторая – к неоправданному риску. Что лучше или хуже – зависит от конкретной постановки задачи и содержания нулевой гипотезы. Например, если H 0 состоит в признании продукции предприятия качественной и допущена ошибка первого рода, то будет забракована годная продукция. Допустив ошибку второго рода, мы отправим потребителю брак. Очевидно, последствия этой ошибки более серьезны с точки зрения имиджа фирмы и ее долгосрочных перспектив.

Исключить ошибки первого и второго рода невозможно в силу ограниченности выборки. Поэтому стремятся минимизировать потери от этих ошибок. Отметим, что одновременное уменьшение вероятностей данных ошибок невозможно, т.к. задачи их уменьшения являются конкурирующими. И снижение вероятности допустить одну из них влечет за собой увеличение вероятности допустить другую. В большинстве случаев единственный способ уменьшения обеих вероятностей состоит в увеличении объема выборки.

Правило, в соответствие с которым принимается или отклоняется основная гипотеза, называется статистическим критерием. Для этого подбирается такая случайная величина K, распределение которой точно или приближенно, известно и которая служит мерой расхождения между опытными и гипотетическими значениями.

Для проверки гипотезы по данным выборки вычисляют выборочное (или наблюдаемое) значение критерия K набл. Затем, в соответствии с распределением выбранного критерия, строится критическая область K крит. Это такая совокупность значений критерия, при которых нулевую гипотезу отвергают. Оставшуюся часть возможных значений называют областью принятия гипотезы. Если ориентироваться на критическую область, то можно совершить ошибку
1-го рода, вероятность которой задана заранее и равна a, называемой уровнем значимости гипотезы. Отсюда вытекает следующее требование к критической области K крит:

.

 
 

Уровень значимости a определяет "размер" критической области K крит. Однако ее положение на множестве значений критерия зависит от вида альтернативной гипотезы. Например, если проверяется нулевая гипотеза H 0:q=q0, а альтернативная гипотеза имеет вид H 1:q>q0, то критическая область будет состоять из интервала (K2, +¥), где точка K2 определяется из условия P (K>K2)=a (правосторонняя критическая область). Если альтернативная гипотеза имеет вид H 2:q<q0, то критическая область будет состоять из интервала (–¥;K1), где точка K1 определяется из условия P (K<K2)=a (левосторонняя критическая область). Если альтернативная гипотеза имеет вид H 3:q¹q0, то критическая область будет состоять из двух интервалов (–¥;K1) и (K2, +¥), где точки K1 и K2 определяются из условий: P (K>K2)=a/2 и P (K<K2)=a/2 (двухсторонняя критическая область).

Основной принцип проверки статистических гипотез можно сформулировать следующим образом. Если K набл попадает в критическую область, то гипотеза H 0 отвергается и принимается гипотеза H 1. Однако поступая таким образом, следует понимать, что здесь можно допустить ошибку 1-го рода с вероятностью a. Если K набл попадает в область принятия гипотезы – то нет оснований, чтобы отвергать нулевую гипотезу H 0. Но это вовсе не означает, что H 0 является единственно подходящей гипотезой: просто расхождения между выборочными данными и гипотезой H 0 невелико; однако таким же свойством могут обладать и другие гипотезы.

Мощностью критерия называется вероятность того, что нулевая гипотеза будет отвергнута, если верна альтернативная гипотеза; т.е. мощность критерия равна 1–b, где b – вероятность совершить ошибку 2-го рода. Пусть для проверки гипотезы принят определенный уровень значимости a и выборка имеет фиксированный объем. Поскольку в выборе критической области есть определенный произвол, то ее целесообразно строить так, чтобы мощность критерия была максимальной или чтобы вероятность ошибки 2-го рода была минимальной.

Критерии, используемые для проверки гипотез о параметрах распределения, называются критериями значимости. В частности, построение критической области аналогично построению доверительного интервала. Критерии, используемые для проверки согласия между выборочным распределением и гипотетическим теоретическим распределением, называются критериями согласия.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: