Условимся называть статистической гипотезой всякое предположение о виде закона распределения некоторого признака генеральной совокупности.
Проверку правильности или неправильности выдвинутой гипотезы проводят статистическими методами с помощью критерия согласия. Под критерием согласия подразумевают совокупность условий, подтверждающих справедливость принятой гипотезы. В результате такой проверки может быть принято правильное или неправильное решение. Поэтому при оценке согласованности выдвинутой гипотезы возможны ошибки двух типов: если отклоняется правильная гипотеза и если принимается ложная гипотеза.
Ошибки первого типа относятся к ошибкам первого рода; ошибки второго типа – к ошибкам второго рода.
Вероятность ошибки первого рода обычно обозначают через α и называют уровнем значимости критерия согласия.
Вероятность ошибки второго рода обозначают через β. Величину (1 -β), т.е. вероятность того, что будет отвергнута ошибочная гипотеза, называют мощностью критерия.
|
|
Для проверки справедливости гипотезы о законе распределения случайной величины используют несколько критериев, различных по мощности и методу обработки исходных данных, из которых наиболее распространенными являются критерий Колмогорова и критерий χ2 (хи-квадрат) Пирсона. Первый используется в случае, когда параметры распределения известны до опыта и требуется после опыта проверить согласованность теоретического и экспериментального распределения, второй – при неизвестных параметрах распределения.
Для применения критерия χ2 при оценивании согласия теоретического и статистического распределений вариационный ряд эмпирических значений разбивают на k равных интервалов. Число значений ряда в интервале (эмпирическая частота) обозначают буквой ni. Зная границы каждого интервала и принятый закон распределения, можно найти вероятность попадания случайной величины в этот интервал рi. После этого из формулы находится теоретическая частота появления события . Для определения меры расхождения по критерию χ2 используют выражение:
(9.1) |
Полученное значение χ2 сравнивают с критическим значением этого критерия. Значение выбирают по таблице в зависимости от уровня значимости α и числа степеней свободы r=k-1-m, где k – это число интервалов, m – число параметров предполагаемого распределения.
Гипотезу о предполагаемом законе распределения считают справедливой при условии . Если , гипотезу отвергают.
Пример 9.1. По полученным в результате измерений данным (табл.9.1.) проверить гипотезу о нормальном распределении генеральной совокупности.
|
|
Таблица 9.1.
Номер интервала | Границы интервала | Частота | Середина интервала | Квадрат середины интервала | Разности | Границы | |||
i | ni | zi | Zi+1 | ||||||
1 | 4 | 6 | 15 | 5 | 25 | -8,63 | -6,63 | -1,84 | -1,41 |
2 | 6 | 8 | 26 | 7 | 49 | -6,63 | -4,63 | -1,41 | -0,99 |
3 | 8 | 10 | 25 | 9 | 81 | -4,63 | -2,63 | -0,99 | -0,56 |
4 | 10 | 12 | 30 | 11 | 121 | -2,63 | -0,63 | -0,56 | -0,13 |
5 | 12 | 14 | 26 | 13 | 169 | -0,63 | 1,37 | -0,13 | 0,29 |
6 | 14 | 16 | 21 | 15 | 225 | 1,37 | 3,37 | 0,29 | 0,72 |
7 | 16 | 18 | 24 | 17 | 289 | 3,37 | 5,37 | 0,72 | 1,14 |
8 | 18 | 20 | 20 | 19 | 361 | 5,37 | 7,37 | 1,14 | 1,57 |
9 | 20 | 22 | 13 | 21 | 441 | 7,37 | 9,37 | 1,57 | 1,99 |
Σ | n =200 |
Решение: Вычисляем среднее значение интервала и находим .Далее находим . Используя для выборочной дисперсии формулу , находим Dв =181,56-159,52=22,04. Отсюда .
Для того чтобы вычислить теоретические вероятности попадания случайных величин в интервалы (xi, xi+1), на основании таблиц функции Лапласа находим значения Ф(zi) и Ф(zi+1).
После этого составляем еще одну таблицу для расчета теоретических частот (табл.9.2)
Таблица 9.2
Номер интервала i | Границы | Ф(zi) | Ф(zi+1) | Pi= Ф(zi)- Ф(zi+1) |
| |
Zi | Zi+1 | |||||
1 | -1,84 | -1,41 | -0,4671 | -0,4207 | 0,0464 | 9,28 |
2 | -1,41 | -0,99 | -0,4207 | -0,3389 | 0,0818 | 16,36 |
3 | -0,99 | -0,56 | -0,3389 | -0,2123 | 0,1266 | 25,32 |
4 | -0,56 | -0,13 | -0,2123 | -0,0517 | 0,1606 | 32,12 |
5 | -0,13 | 0,29 | -0,0517 | 0,1141 | 0,1658 | 33,16 |
6 | 0,29 | 0,72 | 0,1141 | 0,2642 | 0,1501 | 30,02 |
7 | 0,72 | 1,14 | 0,2642 | 0,3729 | 0,1087 | 21,74 |
8 | 1,14 | 1,57 | 0,3729 | 0,4418 | 0,0689 | 13,78 |
9 | 1,57 | 1,99 | 0,4418 | 0,4767 | 0,0349 | 6,98 |
Составляем таблицу для определения (табл.9.3)
Таблица 9.3
i | ni | ||||
1 | 15 | 9,28 | 5,72 | 32,7 | 3,52 |
2 | 26 | 16,36 | 9,64 | 92,9 | 5,68 |
3 | 25 | 25,32 | -0,32 | 0,1 | 0 |
4 | 30 | 32,12 | -2,12 | 4,5 | 0,14 |
5 | 26 | 33,16 | -7,16 | 52,3 | 1,58 |
6 | 21 | 30,02 | -9,02 | 81,4 | 2,75 |
7 | 24 | 21,74 | 2,26 | 5,1 | 0,23 |
8 | 20 | 13,78 | 6,22 | 38,7 | 2,8 |
9 | 13 | 6,98 | 6,02 | 36,2 | 5,2 |
å | 21,9 |
Число степеней свободы r =9-3=6, по уровню значимости a=0,05 и r =6 из таблицы распределения c2 находим . Так как , то гипотеза отвергается, следовательно, требуется либо изменить вид закона, либо повторить опыты.