При систематизации данных выборочных обследований используются статистические дискретные и интервальные ряды распределения.
2.1. Статистическое дискретное распределение. Полигон
Пусть из генеральной совокупности извлечена выборка, причем x1 наблюдалось n1 раз, x2 - n2 раз, xk -nk раз и
- объем выборки.
Наблюдаемые значения xi – варианты, последовательность вариант, записанная в возрастающем порядке – вариационный ряд. Число наблюдений варианты ni называют частотой, а ее отношение к объему выборки – относительной частотой
.
Определение. Статистическим (эмпирическим) распределением выборки называют последовательность вариант xi и соответствующих им частот ni или относительных частот wi.
Статистическое распределение выборки удобно представлять в форме таблицы распределения частот, называемой статистическим дискретным рядом распределения:
| x1 | x2 | … | xm |
| n1 | n2 | … | nm |
При этом сумма всех частот равна объему выборки: 
или в виде таблицы распределения относительных частот:
| x1 | x2 | ... | xm |
| w1 | w2 | ... | wm |
(сумма всех относительных частот равна единице
)
Пример 1. При измерениях в однородных группах обследуемых получены следующие выборки: 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72, 74 (частота пульса). Составить по этим результатам статистический ряд распределения частот и относительных частот.
Решение. 1) Статистический ряд распределения частот:
| xi | |||||
| ni |
2) Объем выборки: n=2+4+8+2+4=20. Найдем относительные частоты, для чего разделим частоты на объем выборки
. Напишем распределение относительных частот:
| xi | |||||
| wi | 0.1 | 0.2 | 0.4 | 0.1 | 0.2 |
Контроль:
.
Полигоном частот называют ломаную, отрезки, которой соединяют точки с координатами
. Для построения полигона частот на оси абсцисс откладывают варианты х2, а на оси ординат – соответствующие им частоты ni.
Полигоном относительных частот называют ломаную, отрезки, которой соединяют точки с координатами
. Для построения полигона относительных частот на оси абсцисс откладывают варианты хi, а на оси ординат соответствующие им частоты wi.
Пример 2. Построим полигон частот и полигон относительных частот по данным примера 1.
2.2. Статистический интервальный ряд распределения. Гистограмма
Статистическим дискретным рядом (или эмпирической функцией распределения) обычно пользуются в том случае, когда отличных друг от друга вариант в выборке не слишком много, или тогда, когда дискретность по тем или иным причинам существенна для исследователя. Если же интересующий нас признак генеральной совокупности Х распределен непрерывно или его дискретность нецелесообразно (или невозможно) учитывать, то варианты группируются в интервалы.
Часто разбиение на интервалы и группировку осуществляют с равным шагом разбиения. При этом можно пользоваться следующими рекомендациями по выборке:
·
- размах выборки;
·
- шаг разбиения (ширина интервала), где k – число интервалов;
·
- формула Старджеса для определения числа интервалов, n – объем выборки;
·
;
Полученную группировку удобно представить в форме частотной таблицы, которая носит название статистический интервальный ряд распределения:
| Интервалы группировки | [h0;h1) | [h1;h2) | ... | [hk-2;hk-1) | [hk-1;hk) |
| Частоты | n1 | n2 | ... | nk-1 | nk |
Аналогическую таблицу можно образовать, заменяя частоты ni относительными частотами:
| Интервалы группировки | [h0;h1) | [h1;h2) | ... | [hk-2;hk-1) | [hk-1;hk) |
| Относительные частоты | w1 | w2 | ... | wk-1 | wk |
Наиболее информативной графической формой частот является специальный график, называемый гистограммой частот.
Гистограмма частот - ступенчатая фигура, состоящая из прямоугольников, основаниями которых
служат частичные интервалы длиною h, а высоты равны отношению
(плотность частоты).
Для построения гистограммы частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии
.
Площадь i-го частичного прямоугольника равна
- сумме частот вариант i-го интервала; следовательно, площадь гистограммы частот равна сумме всех частот, т.е. объему выборки.
Гистограммой относительных частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длиною h, а высоты равны отношению
(плотность относительной частоты).
Для построения гистограммы относительных частот на оси абсцисс откладывают частичные интервалы, а над ними проводят отрезки, параллельные оси абсцисс на расстоянии
. Площадь i-го частичного прямоугольника равна
- относительной частоте вариант, попавших в i-й интервал. Следовательно, площадь гистограммы относительных частот равна сумме всех относительных частот, т.е. единице.
Выборочная медиана – это середина вариационного ряда, значение, расположенное на одинаковом расстоянии от левой и правой границы выборки.
Выборочная мода – это наиболее вероятное, т.е. чаще всего встречающееся, значение в выборке.
Пример 3. Из очень большой партии деталей извлечена случайная выборка объема 50; интересующий нас признак Х - размеры деталей, измеренные с точностью до 1см, представлен следующим вариационным рядом: 12, 14, 13, 15, 18, 20, 21, 22, 22, 11, 13, 14, 17, 19, 16, 17, 15, 20, 19, 21, 20, 15, 17, 14, 18, 12, 12, 15, 18, 18, 21, 22, 21, 20, 21, 15, 19, 19, 19, 18, 21, 14, 15, 17, 16, 14, 13, 13, 12, 11. Найти статистический интервальный ряд распределения, построить гистограмму частот и относительных частот.
Решение. 1)
, т.е. k = 7;
| Интервалы группировки | 11-12,6 | 12,6-14,2 | 14,2-15,8 | 15,8-17,4 | 17,4-19 | 19-20,6 | 20,6-22 |
| Частоты ni | |||||||
| Относительные частоты wi | 0,12 | 0,18 | 0,12 | 0,12 | 0,12 | 0,16 | 0,18 |
2) 
3) Гистограммы частот и относительных частот:
