Гистограммой называется оценка плотности распределения вероятности. На практике наиболее часто используются два метода построения гистограммы: равноинтервальный и равновероятностный. Порядок построения гистограммы следующий.
1. Построить вариационный ряд, т.е. расположить выборочные значения в порядке возрастания: .
2. Вся область возможных значений разбивается на M непересекающихся и примыкающих друг к другу интервалов.
Из статистических соображений параметр M рекомендуется выбирать с помощью следующих соотношений:
(5.2)
(5.3)
где int(x) - целая часть числа x. Желательно, чтобы n без остатка делилось на M.
Введем обозначения параметров:
Ai, Bi - соответственно левая и правая границы i -го интервала (Ai +1= Bi);
hi = Bi - Ai - длина i -го интервала;
i - количество чисел в выборке, попадающих в i -тый интервал.
При использовании равноинтервального метода построения гистограммы параметры Ai, Bi, hi вычисляются следующим образом:
(5.4)
Если при подсчете значений какое-то число в выборке точно совпадает с границей между интервалами, то необходимо в счетчик обоих интервалов прибавить по 0,5.
|
|
В случае применения равновероятностного метода границы Ai, Bi выбираются таким образом, чтобы в каждый интервал попадало одинаковое количество выборочных значений:
i = = n / M. (5.5)
В этом случае
(5.6)
3. Вычисляется средняя плотность вероятности для каждого интервала по формуле
(5.7)
4. На графике провести две оси: x и f *(x).
5. На оси x отмечаются границы всех интервалов.
6. На каждом интервале строится прямоугольник с основанием hi и высотой . Полученная при этом ступенчатая линия называется гистограммой, график которой приблизительно выглядит так, как показано на рис. 5.1.
Замечания.
1. Суммарная площадь всех прямоугольников равна единице.
2. В равновероятностной гистограмме площади всех прямоугольников одинаковы. По виду гистограммы можно судить о законе распределения случайной величины.
3. Перед построением гистограммы вычисленные значения Ai, Bi, hi, i, рекомендуем занести в табл. 5.1.
Таблица 5.1
i | Ai | Bi | hi | i | |
M |
Достоинства использования гистограммы: простота применения, наглядность.
Пример 5.1 Задана выборка случайной величины X: {4 3 3 5 2 4 3 4 4 5}. Построить график эмпирической функции распределения F *(x).
Решение. Вариационный ряд случайной величины имеет вид {2 3 3 3 4 4 4 4 5 5}. Затем выделяем полуинтервалы (-,2], (2,3], (3,4], (4,5], (5,+]. На полуинтервале (-,2] F *(x)=0/10=0. При 2< x 3 F *(x)=1/10=0,1.
Аналогично определяем значения F *(x) на остальных полуинтервалах:
.
График функции F *(x) приведен на рис. 5.2.
|
|
Замечание. В каждой точке оси x, соответствующим значениям xi функция F *(x) имеет скачок. В точке разрыва F *(x) непрерывна слева и принимает значение, выделенное знаком .
Пример 5.2. Вариационный ряд случайной величины x имеет вид:
-6,237 -6,229 -5,779 -5,139 -4,950 -4,919 -4,636 -4,560 -4,530 -4,526 -4,523 -4,511 -4,409 -4,336 -4,259 -4,055 -4,044 -4,006 -3,972 -3,944 -3,829 -3,794 -3,716 -3,542 -3,541 -3,431 -3,406 -3,384 -3,307 -3,181 -3,148 -3,124 -3,116 -2,892 -2,785 -2,734 -2,711 -2,637 -2,633 -2,428 -2,381 -2,339 -2,276 -2,222 -2,167 -2,111 -2,034 -1,958 -1,854 -1,803 -1,774 -1,755 -1,745 -1,713 -1,709 -1,566 -1,548 -1,480 -1,448 -1,353 -1,266 -1,229 -1,179 -1,130 -1,102 -1,060 -1,046 -1,035 -0,969 -0,960 -0,903 -0,885 -0,866 -0,865 -0,774 -0,721 -0,688 -0,673 -0,662 -0,626 -0,543 -0,445 -0,241 -0,174 -0,131 0,115 0,205 0,355 0,577 0,591 0,795 0,986 1,068 1,099 1,195 1,540 2,008 2,160 2,534 2,848
Построить гистограмму равноинтервальным и равновероятностным методами.
Решение. Объем выборки равен 100. Количество интервалов определяем по формуле (5.2):
Для равноинтервального метода построения параметры Ai, Bi, i, hi, рассчитаны по формулам (5.4-5.7) и приведены в табл. 5.2.
Таблица 5.2.
i | Ai | Bi | i | hi | |
-6,237 | -5,3345 | 0,9085 | 0,033 | ||
-5,3345 | -4,426 | 0,9085 | 0,099 | ||
-4,426 | -3,5175 | 0,9085 | 0,143 | ||
-3,5175 | -2,609 | 0,9085 | 0,154 | ||
-2,609 | -1,7005 | 0,9085 | 0,176 | ||
1,7005 | -0,792 | 0.9085 | 0,209 | ||
-0,792 | 0,1165 | 0,9085 | 0,132 | ||
0,1165 | 1,025 | 0,9085 | 0,066 | ||
1,025 | 1,9335 | 0,9085 | 0.044 | ||
1,9335 | 2,848 | 0,9085 | 0,044 |
Ниже приведены интервальная таблица и график гистограммы для равновероятностного метода. Таблица 5.3
i | Ai | Bi | i | hi | |
-6,2370 | -4,5245 | 1,7125 | 0.0584 | ||
-4,5245 | -3,8865 | 0,6380 | 0,1567 | ||
-3,8865 | -3,1645 | 0,7220 | 0,1385 | ||
-3,1645 | -2,4045 | 0,7600 | 0,1316 | ||
-2,4045 | -1,7885 | 0,6160 | 0,1623 | ||
-1,7885 | -1,3095 | 0,4790 | 0,2086 | ||
-1,3085 | -0,9319 | 0,3766 | 0,2655 | ||
-0,9319 | -0,5843 | 0,3476 | 0,2877 | ||
-0,5843 | 0,6932 | 1,2775 | 0,0783 | ||
0,6932 | 2,8480 | 2,1548 | 0,0464 |
Рис. 5.4 Равновероятностная гистограмма
ЗАДАЧИ
5.1. Построить эмпирическую функцию распределения по вариационному ряду из примера 5.2.
Построить эмпирическую функцию распределения по следующим выборкам.
5.2. {0,1 -1 0 2 4 -1 1 5}
5.3. {7 4 4 8 3,6 5 7}
5.4. {2 1,5 3 3 2 1,5 3}
5.5. Построить эмпирическую функцию распределения, а также гистограмму равноинтервальным и равновероятностным методами для выборки, заданной вариационным рядом:
2,60 2,62 2,74 2,76 3,17 3,18 3,29 3,35 3,40 3,42 3,46 3,54
3,68 4,06 4,07 4,09 4,15 4,23 4,24 4,28 4,30 4,43 4,46 4,68
4,77 5,19 5,22 5,45 5,51 5,57 5,59 5,64 5,66 5,67 5,73 5,76
5,88 6,11 6,13 6,23 6,55 6,70 7,30 7,62 7,72 7,80 7,91 7,94
7,97 8,00 8,10 8,47 8,63 8,80 8,84 8,97 9,01 9,02 9,20 9,22
9,41 9,57 9,65 9,92 9,98 10,02 10,07 10,16 10,24 10,27 10,38 10,62 10,63 10,73 10,96 10,98 10,99 11,00 11,01 11,01 11,11 11,23 11,35 11,56 11,58 11,73 11,77 11,99 12,10 12,13 12,18 12,24 12,53 12,57 12,96 12,98 13,04 13,22 13,35 13,45
5.6 Построить гистограмму распределения случайной величины равноинтервальным и равновероятностным методами по следующей выборке:
8,60 6,54 3,26 5,96 4,68 6,55 11,33 9,50 8,58 7,16 10.84 5,81
2,92 8.96 12,60 11,08 4,52 8,06 2,42 10,05 10,29 10,03 4,77 9,46
7,26 2,62 4,49 11,80 11,68 8,61 12,82 5,36 7,85 11,69 11,00 5,07
2,23 10,14 9,89 10,53 5,10 7,27 6,94 6,53 11,08 6,61 9,27 5,83
9,56 7,51 5,98 8,64 5,69 10,54 10,20 12,11 2,92 12,31 5,95 2,82
7,69 4,30 11,17 6,99 12,78 3,64 11,80 8,61 3,80 7,42 5,09 7,68
3,98 10,59 8,40 12,76 4,37 5,88 9,94 10,46 2,75 4,22 11,56 10,43
3,66 10,14 6,53 10,83 5,36 6,67 4,83 9,66 2,30 7,04 7,88 8,30
2,22 8,71 7,79 9,82
6. Точечные ОЦЕНКИ ПАРАМЕТРОВ И ЧИСЛОВЫХ ХАРАКТЕРИСТИК
Почти все распределения случайной величины зависят от одного и нескольких параметров. Например, плотность вероятности экспоненциального закона:
зависит от параметра.
Статистической оценкой параметра Q распределения называется приближенное значение параметра, вычисленное по результатам эксперимента (по выборке).
Статистические оценки делятся на точечные и интервальные. Точечной называется оценка, определяемая одним числом. Желательно, чтобы оценка была несмещенной, состоятельной и эффективной.
1. Оценка называется несмещенной, если M[ ] = Q. Несмещенность минимальное требование к оценкам.
2. Оценка называется состоятельной, если при увеличении числа n она сходится по вероятности к значению параметра Q:
где - любое положительное число. Несмещенная оценка является состоятельной, если
3. Несмещенная оценка является эффективной, если ее дисперсия минимальна по отношению к дисперсии любой другой оценки.
|
|