Проверка статистических гипотез

Постановка задачи о проверке статистической гипотезы

Статистическая гипотеза – всякое предположение о виде закона распределения исследуемой переменной или параметрах известного распределения.

Так, например, можно предположить (выдвинуть гипотезу), что изучаемая переменная X распределена по нормальному закону. В этой гипотезе речь идет о виде предполагаемого закона распределения. Достаточно типична и такая ситуация: закон распределения изучаемой переменной известен, но неизвестны параметры этого распределения. Тогда естественно выдвинуть гипотезу о том, что неизвестный параметр принадлежит, например, заданному интервалу.

Таким образом, статистические гипотезы подразделяются на две группы:

· гипотезы о виде закона распределения;

· гипотезы о параметрах известного закона распределения (параметрические гипотезы).

Выдвигаемую гипотезу называют нулевой (основной) и обозначают через . Наряду с выдвинутой гипотезой рассматривают и противоречащую ей гипотезу . Гипотезу, которая противоречит нулевой, называют конкурирующей (альтернативной) и обозначают через ( = ).

Выдвинутая гипотеза , как и всякое предположение, в действительности может быть либо верной, либо неверной; поэтому возникает необходимость ее проверки.

Исходным материалом для проверки выдвинутой гипотезы служат выборочные данные (выборка).

Задача проверки гипотезы описательно заключается в следующем: на заданном уровне значимости требуется установить, согласуется ли выдвинутая гипотеза с выборочными данными или противоречит им.

Уровень значимости – вероятность совершить ошибку первого рода ("степень риска"), т.е. вероятность ошибочно отвергнуть верную гипотезу. Уровень значимости назначается исследователем; наиболее часто принимают равным 0,05 (5%) или 0,01 (1%), что соответствует практически ничтожному риску, и тем самым обеспечивают высокую надежность правильного решения задачи.

Основные принципы и необходимые этапы проверки статистической гипотезы

Для проверки выдвинутой гипотезы используется статистический критерий (разрешающее правило), согласно которому на основании данных выборки принимается решение сохранить либо отвергнуть нулевую гипотезу .

В основе критерия лежит его статистика Z – специально подбираемая для выдвинутой гипотезы случайная величина, закон распределения которой достаточно хорошо изучен (имеется таблица квантилей этого распределения).

Обозначим через множество всех возможных значений статистики Z. Это множество разбивается на два непересекающихся подмножества и :

, ,

где – область допустимых значений статистики Z;

– критическая область статистики Z.

Точки, отделяющие от , называются критическими точками статистики Z. Вопрос построения критической области мы здесь рассматривать не будем, отметим лишь только, что .

По выборочным данным (выборке) вычисляется наблюдаемое значение статистики: .

Критерий (разрешающее правило) проверки выдвинутой гипотезы заключается в следующем:

1. Если , то гипотеза отвергается.

2. Если , то гипотеза сохраняется (т.е. она согласуется с выборочными данными).

Заметим, что отвергают гипотезу более решительно, чем принимают. Принимают гипотезу весьма осторожно. Дело в том, что в случае выдвинутая гипотеза еще не доказана (по данным одной ограниченной выборки). На практике для большей уверенности принятия гипотезы повторяют эксперимент, увеличив объем выборки, и еще раз проверяют гипотезу (может быть другими способами).

Итак, необходимыми этапами проверки статистической гипотезы являются:

· формирование выборки;

· выдвижение гипотез и ;

· назначение уровня значимости ;

· выбор подходящей статистики Z для проверки ;

· вычисление по выборке наблюдаемого значения статистики ;

· определение по таблице критических точек статистики Z и построение критической области ;

· принятие решения согласно критерию проверки гипотезы .

Проверка гипотезы о нормальном распределении генеральной совокупности. Критерий Колмогорова

Для изучаемой переменной Cвыдвигается статистическая гипотеза : C имеет нормальный закон распределения. Исходным материалом для проверки являются выборочные данные (выборка). На заданном уровне значимости требуется установить, согласуется ли выдвинутая гипотеза с выборочными данными или противоречит им.

Проверка гипотезы нормальности по критерию Колмогорова основана на сравнении между собой эмпирической функции распределения , полученной по данным выборки объема , и гипотетической (теоретической) функции распределения нормального закона. Близость между ними оценивается статистикой Колмогорова:

.

В качестве эмпирической функции распределения выбирается кумулятивная кривая; при этом предполагается, что выборка предварительно сгруппирована в интервальный статистический ряд, причем объем выборки ,число интервалов группировки .

Гипотетическая функция распределения имеет вид:

.

Практически значения эмпирической функции распределения вычисляются в узлах кумулятивной кривой, следовательно, статистика принимает вид

,

где – есть накопленная к концу -го интервала интервальная относительная частота; . Соответствующее значение гипотетической функции распределения приближенно может быть найдено по формуле

.

Здесь – функция распределения стандартного нормального закона , выражаемая формулой

.

Специальная таблица значений функции для положительных x приведена в прил. 1.[3] Для отрицательных значений аргумента x следует применять свойство: .

Описанные выше вычисления наблюдаемого значения статистики Колмогорова удобно организовывать в форме расчетной таблицы следующего вида:

При этом предполагается, что предварительно найдены выборочная средняя и "исправленное" среднее квадратическое отклонение .

Критическую точку статистики Колмогорова находим по специальной таблице.[4] В случае, если и , удобно использовать следующую формулу:

.

Критерий (разрешающее правило) проверки гипотезы нормальности состоит в следующем:

1. Если , то гипотеза сохраняется (т.е. она согласуется с данной выборкой).

2. Если же , то гипотеза отвергается (т.е. она противоречит данной выборке).

Последнее означает, что изучаемая переменная C не является нормально распределенной.

Пример Дан интервальный статистический ряд:

50–53 53–56 56–59 59–62 62–65 65–68
           

Требуется на заданном уровне значимости с помощью критерия Колмогорова проверить гипотезу о том, что данная выборка извлечена из нормально распределенной генеральной совокупности.

Здесь , , , , .

В соответствии с вышеизложенным составим расчетную таблицу

  50–53   0,02 0,02 –2,3790 0,0087 0,0113 0,0113  
  53–56   0,04 0,06 –1,4348 0,0764 –0,0164 0,0164  
  56–59   0,22 0,28 –0,4909 0,3121 –0,0321 0,0321 0,0321
  59–62   0,42 0,70 0,4531 0,6736 0,0264 0,0246  
  62–65   0,22 0,92 1,3971 0,9192 0,0008 0,0008  
  65–68   0,08 1,00 2,3411 0,9904 0,0096 0,0096  
  1,00

Таким образом, наблюдаемое значение статистики Колмогорова =0,0321.

Далее определяем критическую точку статистики Колмогорова:

.

Сравниваем и и применяем разрешающее правило . Так как < , то выдвинутая гипотеза сохраняется; откуда делаем статистический вывод о том, что данная выборка согласуется с предположением о нормальном распределении изучаемой переменной C.

Критерий согласия Пирсона (χ2)

проверки гипотезы о нормальном распределении

Рассмотрим классический статистический метод решения задачи, поставленной в предыдущем пункте.

Пусть сформирована выборка некоторого объема , проведена интервальная группировка и получен интервальный статистический ряд.

Условия применимости метода Пирсона следующие: все . Если в некоторых интервалах последнее требование не выполняется, то рекомендуется эти интервалы объединить с соседними.

Проверка гипотезы нормальности по критерию Пирсона так же основана на сравнении эмпирического и гипотетического распределений, точнее, на сравнении эмпирических и теоретических интервальных частот. Мера близости между ними оценивается следующей статистикой Пирсона:

,

где – интервальные (эмпирические) частоты;

– интервальные теоретические частоты;

– теоретические вероятности попадания переменной Cв -й интервалгруппировки, .

При этом теоретические вероятности рассчитываются в предположении нормальности распределения случайной величины C.

Стандартными в теории вероятностей преобразованиями устанавливается, что теоретические вероятности можно приближенно выразить следующей формулой:

,

где . Здесь есть плотность стандартного нормального стандартного распределения (0,1).

Специальная таблица значений функции для неотрицательных приведена в прил.2.[5]

Вычисления наблюдаемого значения статистики Пирсона удобно организовать в форме расчетной таблицы.

()2
1… m                    
n   n

В развернутых курсах математической статистики доказывается, что (при условии справедливости выдвинутой гипотезы ) статистика имеет классическое распределение Пирсона с степенями свободы.

По таблице квантилей распределения (табл.П5)[6] для заданного уровня значимости и числа степеней свободы определяем критическую точку - распределения в соответствии с равенством:

,

где (порядок квантили).

Критерий Пирсона (разрешимое правило) проверки гипотезы нормальности заключается в следующем:

1. Если , то гипотеза сохраняется (согласуется с данной выборкой).

2. Если же , то гипотеза решительно отвергается.

Пример. Используя условия примера п. 2.2.1.3, проверить гипотезу о нормальном распределении с помощью критерия .

Для вычисления заполняем расчетную таблицу:

  50–53 51,5   2,851 0,0069 0,0065 0,325 0,675 0,4556 1,4018
  53–56 54,5   1,907 0,0644 0,0608 3,040 –1,040 1,0816 0,3558
  56–59 57,5   0,963 0,2516 0,2375 11,875 –0,875 0,7656 0,0645
  59–62 60,5   0,019 0,3989 0,3766 18,830 2,170 4,7089 0,2501
  62–65 63,5   0,925 0,2589 0,2444 12,220 –1,220 1,4884 0,1218
  65–68 66,5   1,869 0,0694 0,0655 3,275 0,725 0,5256 0,1605
  0,9913 49,565 - 2,3545

Следовательно, наблюдаемое значение статистики Пирсона =2,355.

Далее определяем критическую точку статистики Пирсона при , –3=3,

.

Сравнивая и , обнаруживаем, что

.

В соответствии с разрешающим правилом критерия Пирсона заключаем, что выдвинутая гипотеза нормальности сохраняется, т.е. согласуется с данной выборкой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: