Гистограмма распределения случайной величины

Гистограммой называется оценка плотности распределения вероятности. На практике наиболее часто используются два метода построения гисто­граммы: равноинтервальный и равновероятностный. Порядок построения гисто­граммы следующий.

1. Построить вариационный ряд, т.е. расположить выборочные значения в порядке возрастания: .

2. Вся область возможных значений разбивается на M непересе­кающихся и примыкающих друг к другу интервалов.

Из статистических соображений параметр M рекомендуется выбирать с помощью следующих соотношений:

(5.2)

(5.3)

где int(x) - целая часть числа x. Желательно, чтобы n без остатка делилось на M.

Введем обозначения параметров:

Ai, Bi - соответственно левая и правая границы i -го интервала (Ai +1= Bi);

hi = Bi - Ai - длина i -го интервала;

i - количество чисел в выборке, попадающих в i -тый интервал.

При использовании равноинтервального метода построения гистограммы параметры Ai, Bi, hi вычисляются следующим образом:

(5.4)

Если при подсчете значений какое-то число в выборке точно совпадает с границей между интервалами, то необходимо в счетчик обоих интервалов прибавить по 0,5.

В случае применения равновероятностного метода границы Ai, Bi выбираются таким образом, чтобы в каждый интервал попадало одинаковое количество выборочных значений:

i = = n / M. (5.5)

В этом случае

(5.6)

3. Вычисляется средняя плотность вероятности для каждого интервала по формуле

(5.7)

4. На графике провести две оси: x и f *(x).

5. На оси x отмечаются границы всех интервалов.

6. На каждом интервале строится прямоугольник с основанием hi и высотой . Полученная при этом ступенчатая линия называется гистограммой, график которой приблизительно выглядит так, как показано на рис. 5.1.

Замечания.

1. Суммарная площадь всех прямоугольников равна единице.

2. В равновероятностной гистограмме площади всех прямоугольников оди­на­ковы. По виду гистограммы можно судить о законе распределения случай­ной величины.

3. Перед построением гистограммы вычисленные значения Ai, Bi, hi, i, рекомендуем занести в табл. 5.1.

Таблица 5.1

i Ai Bi hi i
           
         
M          

Достоинства использования гистограммы: простота применения, наглядность.

Пример 5.1 Задана выборка случайной величины X: {4 3 3 5 2 4 3 4 4 5}. Построить график эмпирической функции распределения F *(x).

Решение. Вариационный ряд случайной величины имеет вид {2 3 3 3 4 4 4 4 5 5}. Затем выделяем полуинтервалы (-,2], (2,3], (3,4], (4,5], (5,+]. На полуинтервале (-,2] F *(x)=0/10=0. При 2< x 3 F *(x)=1/10=0,1.

Аналогично определяем значения F *(x) на остальных полуинтервалах:

.

График функции F *(x) приведен на рис. 5.2.

Замечание. В каждой точке оси x, соответствующим значениям xi функция F *(x) имеет скачок. В точке разрыва F *(x) непрерывна слева и принимает значение, выделенное знаком .

Пример 5.2. Вариационный ряд случайной величины x имеет вид:
-6,237 -6,229 -5,779 -5,139 -4,950 -4,919 -4,636 -4,560 -4,530 -4,526 -4,523 -4,511 -4,409 -4,336 -4,259 -4,055 -4,044 -4,006 -3,972 -3,944 -3,829 -3,794 -3,716 -3,542 -3,541 -3,431 -3,406 -3,384 -3,307 -3,181 -3,148 -3,124 -3,116 -2,892 -2,785 -2,734 -2,711 -2,637 -2,633 -2,428 -2,381 -2,339 -2,276 -2,222 -2,167 -2,111 -2,034 -1,958 -1,854 -1,803 -1,774 -1,755 -1,745 -1,713 -1,709 -1,566 -1,548 -1,480 -1,448 -1,353 -1,266 -1,229 -1,179 -1,130 -1,102 -1,060 -1,046 -1,035 -0,969 -0,960 -0,903 -0,885 -0,866 -0,865 -0,774 -0,721 -0,688 -0,673 -0,662 -0,626 -0,543 -0,445 -0,241 -0,174 -0,131 0,115 0,205 0,355 0,577 0,591 0,795 0,986 1,068 1,099 1,195 1,540 2,008 2,160 2,534 2,848

Построить гистограмму равноинтервальным и равновероятностным методами.

Решение. Объем выборки равен 100. Количество интервалов определяем по формуле (5.2):

Для равноинтервального метода построения параметры Ai, Bi, i, hi, рассчитаны по формулам (5.4-5.7) и приведены в табл. 5.2.

Таблица 5.2.

i Ai Bi i hi
  -6,237 -5,3345   0,9085 0,033
  -5,3345 -4,426   0,9085 0,099
  -4,426 -3,5175   0,9085 0,143
  -3,5175 -2,609   0,9085 0,154
  -2,609 -1,7005   0,9085 0,176
  1,7005 -0,792   0.9085 0,209
  -0,792 0,1165   0,9085 0,132
  0,1165 1,025   0,9085 0,066
  1,025 1,9335   0,9085 0.044
  1,9335 2,848   0,9085 0,044

Ниже приведены интервальная таблица и график гистограммы для равновероятностного метода. Таблица 5.3

i Ai Bi i hi
  -6,2370 -4,5245   1,7125 0.0584
  -4,5245 -3,8865   0,6380 0,1567
  -3,8865 -3,1645   0,7220 0,1385
  -3,1645 -2,4045   0,7600 0,1316
  -2,4045 -1,7885   0,6160 0,1623
  -1,7885 -1,3095   0,4790 0,2086
  -1,3085 -0,9319   0,3766 0,2655
  -0,9319 -0,5843   0,3476 0,2877
  -0,5843 0,6932   1,2775 0,0783
  0,6932 2,8480   2,1548 0,0464

Рис. 5.4 Равновероятностная гистограмма

ЗАДАЧИ

5.1. Построить эмпирическую функцию распределения по вариационному ряду из примера 5.2.

Построить эмпирическую функцию распределения по следующим выборкам.

5.2. {0,1 -1 0 2 4 -1 1 5}

5.3. {7 4 4 8 3,6 5 7}

5.4. {2 1,5 3 3 2 1,5 3}

5.5. Построить эмпирическую функцию распределения, а также гистограмму равноинтервальным и равновероятностным методами для выборки, заданной вариационным рядом:

2,60 2,62 2,74 2,76 3,17 3,18 3,29 3,35 3,40 3,42 3,46 3,54
3,68 4,06 4,07 4,09 4,15 4,23 4,24 4,28 4,30 4,43 4,46 4,68
4,77 5,19 5,22 5,45 5,51 5,57 5,59 5,64 5,66 5,67 5,73 5,76
5,88 6,11 6,13 6,23 6,55 6,70 7,30 7,62 7,72 7,80 7,91 7,94
7,97 8,00 8,10 8,47 8,63 8,80 8,84 8,97 9,01 9,02 9,20 9,22
9,41 9,57 9,65 9,92 9,98 10,02 10,07 10,16 10,24 10,27 10,38 10,62 10,63 10,73 10,96 10,98 10,99 11,00 11,01 11,01 11,11 11,23 11,35 11,56 11,58 11,73 11,77 11,99 12,10 12,13 12,18 12,24 12,53 12,57 12,96 12,98 13,04 13,22 13,35 13,45

5.6 Построить гистограмму распределения случайной величины равноинтервальным и равновероятностным методами по следующей выборке:
8,60 6,54 3,26 5,96 4,68 6,55 11,33 9,50 8,58 7,16 10.84 5,81
2,92 8.96 12,60 11,08 4,52 8,06 2,42 10,05 10,29 10,03 4,77 9,46
7,26 2,62 4,49 11,80 11,68 8,61 12,82 5,36 7,85 11,69 11,00 5,07
2,23 10,14 9,89 10,53 5,10 7,27 6,94 6,53 11,08 6,61 9,27 5,83
9,56 7,51 5,98 8,64 5,69 10,54 10,20 12,11 2,92 12,31 5,95 2,82
7,69 4,30 11,17 6,99 12,78 3,64 11,80 8,61 3,80 7,42 5,09 7,68
3,98 10,59 8,40 12,76 4,37 5,88 9,94 10,46 2,75 4,22 11,56 10,43
3,66 10,14 6,53 10,83 5,36 6,67 4,83 9,66 2,30 7,04 7,88 8,30
2,22 8,71 7,79 9,82

6. Точечные ОЦЕНКИ ПАРАМЕТРОВ И ЧИСЛОВЫХ ХАРАКТЕРИСТИК

Почти все распределения случайной величины зависят от одного и нескольких параметров. Например, плотность вероятности экспоненциального закона:

зависит от параметра.

Статистической оценкой параметра Q распределения называется при­бли­жен­ное значение параметра, вычисленное по результатам эксперимента (по выборке).

Статистические оценки делятся на точечные и интервальные. Точечной называется оценка, определяемая одним числом. Желательно, чтобы оценка была несмещенной, состоятельной и эффективной.

1. Оценка называется несмещенной, если M[ ] = Q. Несмещенность ­минимальное требование к оценкам.

2. Оценка называется состоятельной, если при увеличении числа n она сходится по вероятности к значению параметра Q:

где - любое положительное число. Несмещенная оценка является состоятельной, если

3. Несмещенная оценка является эффективной, если ее дисперсия минимальна по отношению к дисперсии любой другой оценки.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: