Распределение Пирсона

Распределение Пирсона имеет еще наименование - функция распределение). Особую известность ‑распределение получило из-за своей тесной связи с ‑критерием, который называется критерий согласия Пирсона. Критерий , основанный на ‑распределении широко применяется для проверки различных статистических гипотез.

Исследователь выдвигает гипотезу о теоретическом распределении случайной величины и вычисляет вероятность ее применимости. Если эта вероятность мала, то выдвинутая гипотеза отвергается, и исследователь должен выдвинуть другую гипотезу (либо пополнить статистический материал или сделать и то, и другое).

Критерий согласия  можно применять для проверки допущения о любом распределении и вычисляется он по формуле

                                  (2.8)

где  и  - эмпирические и теоретические частоты соответственно.

В учебниках по статистике приводятся специальные таблицы, по которым с помощью величины  определяется вероятность . По величине  судят о существенности или несущественности расхождения между эмпирическим и теоретическим (предполагаемым) распределениями. При >0,5 считается, эмпирическое и теоретическое распределения близки, при  совпадение удовлетворительное, при <0,2 – недостаточное.

Функция в Excel ХИ2РАСП рассчитывает вероятность . Синтаксис этой функции следующий:

ХИ2РАСП(x, степени_свободы),

где x – значение, для которого вычисляется ‑распределение;

степени_свободы – число степеней свободы.

Пример 2.5 Вещевая служба военного округа составляет заявку на поставку обмундирования для воинских частей. При этом делается предположение, что рост военнослужащих подчиняется нормальному закону распределения. Для проверки данного предположения было проведено исследование одной из типовых частей. Результаты этой проверки с необходимыми расчетами приведены в таблице 2.8.

Таблица 2.8

Рост, см

Число

Сере- дина интер- вала

(округл)

x

1

2

3

4

5

6

7

8

162

166

5

164

211,06

0,00323

6,47

6

0,17

166

170

33

168

110,84

0,01371

27,42

27

1,33

170

174

70

172

42,61

0,03665

73,30

73

0,12

174

178

132

176

6,39

0,06177

123,54

124

0,52

178

182

119

180

2,17

0,06565

131,29

131

1,10

182

186

87

184

29,94

0,04399

87,98

88

0,01

186

190

42

188

89,72

0,01859

37,18

37

0,68

190

194

12

192

181,49

0,00495

9,91

10

0,40

 

 

 

 

4,33

 

 

 

 

7

 

 

500

178,528

5,89

 

 

0,74

 

В столбцах 1 и 2 содержатся исходные данные задачи (диапазон роста военнослужащих в столбце 1 и их количество или частота для каждого диапазона в столбце 2). В конце столбца 2 получена общее количество обследованных военнослужащих =500.

В столбце 3 приведены середины интервалов роста военнослужащих. В конце столбца вычислена средняя арифметическая роста военнослужащих по формуле

,

т.е. числитель есть сумма произведений значений столбца 2 на столбец 3, что можно реализовать функцией Excel СУММПРОИЗВ.

В столбце 4 рассчитаны для каждого диапазона роста , а в конце столбца вычисляется стандартное отклонение роста военнослужащих по формуле

.

Для реализации этого вычисления в Excel используются функции КОРЕНЬ и СУММПРОИЗВ. В последнем случае это сумма произведений значений столбцов 2 и 4.

В столбце 5 вычислены значения функции плотности нормального распределения для каждого диапазона роста военнослужащих для чего используется функция

,

для вычисления которой удобнее использовать функцию Excel НОРМРАСП. Для ее использования в нее вносятся аргументы НОРМРАСП(; ; ; 0).

В столбце 6 рассчитаны теоретические частоты нормального распределения по формуле

.

Для нашего примера =4, это интервал роста военнослужащих, он одинаков для всех диапазонов (166-162 и т.д.).  берется из столбца 5.

В столбце 7 произведено округление теоретические частоты нормального распределения . Это можно выполнить с помощью функции ОКРУГЛ, где аргумент "количество цифр" (число десятичных знаков) сделать равным 0.

В столбце 8 вычислены промежуточные результаты. В конце этого столбца рассчитаны три параметра:

- значение критерия ;

- число степеней свободы , где n – число диапазонов (интервалов), на которые разбит рост; в нашем случае n =8. Для определения числа степеней свободы можно использовать функцию Excel СЧЕТ, которая подсчитывает количество чисел в списке, и из полученного результата вычесть 1;

- значение вероятности , которая вычисляется функцией ХИ2РАСП и куда подставляются полученные аргументы ХИ2РАСП(; k).

Итак, искомая вероятность =0,74>0,5, следовательно, гипотезу о том, что рост военнослужащих распределен по нормальному закону, можно считать правдоподобной.

Замечание. Вероятность  можно получить сразу после расчета значений  округленных (столбец 7). Для этого надо применить функцию ХИ2ТЕСТ, где в качестве аргументов указываются два массива – эмпирические и теоретические  (округленные) частоты или фактические и ожидаемые частоты. Функция будет иметь вид ХИ2ТЕСТ(; ). Результат получим тот же =0,74.

 


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: