Понятие о критериях согласия

Проверяемую гипотезу обычно называют нулевой H0, правило, по которому гипотеза принимается или отвергается называется статистическим критерием.. Статистические критерии, служащие для проверки гипотез о виде законов распределения называются критериями согласия. Т.е. критерии согласия устанавливают, когда полученные в действительности расхождения между предполагаемыми теоретическим и опытным распределением:несущественно - случайные и когда существенно - неслучайные.

Рассмотрим случайную величину, которая характеризует вид или функцию расхождения между предполагаемым теоретическим и опытным распределением признака, тогда по имеющемуся опытному распределению, можно определить значение a, которое приняла случайная величина, если известен ее закон распределения, то не трудно найти вероятность того, что случайная величина примет значение не меньшее a. Если величина a получена как результат наблюдения случайной величины x, т.е. при распределении рассматриваемого признака, по предполагаемому теоретическому закону, то вероятность не должна быть малой. Если же вероятность оказалась малой, то это объясняется тем, что фактически полученному значение не случайной величины x, а какой-то другой с другим законом распределения, т.е. изучаемый признак распределен не по предполагаемому закону. Таким образом, в случае, когда не мала -расхождения между эмпирическими и теоретическими распределениями следует признать не существенным- случайным, а опытное и теоретическое распределение не противоречащими, т.е. согласующимися друг с другом.

Если вероятность мала, то расхождения между опытным и теоретическим распределениями существенны, объяснить их случайностью нельзя, а гипотезу о распределении признака по предполагаемому теоретическому закону следует считать не подтвердившейся, она не согласуется с опытными данными. Необходимо тщательно изучив опытные данные попытаться найти новый закон о качестве предполагаемого признака, который лучше, полнее бы отражал особенности опытного распределения, такие вероятности считаются малыми и их берут не превосходящими 0,1.

Критерии согласия Пирсона или критерии c2.

Пусть анализ опытных данных привел к выбору некоторого закона распределения, в качестве предполагаемого для рассматриваемого признака, а по опытным данным в результате n-наблюдений, найдены параметры (если они не были известны раннее). Обозначим через ni - эмпирические частоты случайной величины x.

n×Pi -теоретические частоты, представляющие произведение числа наблюдений n на вероятности Pi - рассчитанные по предполагаемому теоретическому распределению. Критерии согласия c2 за меру расхождения теоретического и эмпирического рядов частот принимают величину

;

c2 -величина, которую называют c2 распределение или распределение Пирсона. Она равна 0 лишь при совпадении всех эмпирических и теоретических частот, в остальных случаях отлична от 0 и тем больше, чем больше расхождение между указанными частотами. Доказано, что выбранная характеристика c2 или статистика при n®¥ имеет распределение Пирсона со степенями свободы

k=m-s- 1.

где m -число интервалов эмпирического распределения вариационного ряда или число групп.

s -число параметров теоретического распределения, определяемых по опытным данным, (например в случае нормального распределения число оцениваемых по выборке параметров равно 2).

Схема применения критерия сводится к следующему:

1. По опытным данным выбирают в качестве предполагаемого закон распределения признака и находят его параметры.

2. С помощью полученного распределения определяют теоретические частоты, соответствующие опытным частотам.

3. Малочисленные опытные частоты, если они есть, объединяют с соседними, затем по формуле определяют величину c2.

4. Определяют число степеней свободы k.

5. Из таблиц приложения для выбранного уровня значимости a находят критическое значение при числе степеней свободы равным k.

6. Формулируем вывод, руководствуясь общим принципом применения критериев согласия, а именно если вероятность >0,01, то имеющиеся расхождения между теоретическими и опытными частотами признаются не существенными.

Если фактически наблюдаемое значение больше критического, то H0 отвергается, если то гипотеза не противоречит опытным данным. Критерий c2 дает удовлетворительные результаты, если в каждом группировочном интервале достаточное число наблюдений ni.

Замечание: Если в каком-нибудь интервале число наблюдений <5, то имеет смысл объединить соседние интервалы с тем, чтобы в объединенных интервалах ni было не меньше 5. При этом при вычислении числа степеней свободы k в качестве m -берется соответственно уменьшенное число интервалов.

Пример

Получено следующее распределение 100 рабочих цеха по выработке в отчетном году

(в %-тах к предыдущему году).

Выработка в отчетном году(в %-тах к пред.) 94-104 104-114 114-124 124-134 134-144
Кол-во рабочих            

Проверить гипотезу о нормальном распределении.

n=100

k=10

c=119

i Интервал [xi;xi+1] Эмпирические частоты ni Вероятности Pi Теоретические частоты npi (ni-npi)2
  94-104 104-114 114-124 124-134 134-144   0,049 0,239 0,404 0,248 0,053 4,9 23,9 40,4 24,8 5,3 1,21 15,21 21,16 0,64 0,09 0,247 0,636 0,524 0,026 0,017
    0,993 99,3   1,45

m= 5; k= 5-2-1 = 2

-следовательно, гипотеза о нормальном распределении подтверждается


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: