Интервальная группировка и представление выборочных данных

Если объем выборки достаточно большой (n 50), то описанная выше группировка выборочных данных и соответствующие графические представления становятся трудно обозримыми. Поэтому нужно проводить интервальную группировку.

Интервальный статистический ряд и полигон интервальных частот. Интервальный выборочный ряд распределения и полигон интервальных относительных частот

Разобьем весь диапазон наблюдаемых значений вариант (отрезок ) на m интервалов равной длины (h – шаг):

; ; ; .

Обозначим через – середину (центр) i -го интервала:

.

Обозначим через – количество вариант, попадающих в -й интервал , при этом каждая варианта считается столько раз, сколько она наблюдалась. Если варианта совпадает с правым концом рассматриваемого интервала, то ее относят к следующему интервалу.

Величины назовем интервальными частотами; очевидно, . Величины – интервальными относительными частотами; .

Интервальным статистическим рядом является таблица вида:

Графическое изображение таблицы называется полигоном интервальных частот.

Интервальный выборочный ряд распределения – это таблица следующего вида:

Графическое представление таблицы есть полигон интервальных относительных частот.

Гистограмма частот и гистограмма относительных частот

Предположим, что выполнена интервальная группировка и получены интервальный статистический ряд и интервальный выборочный ряд распределения. На каждом из интервалов одинаковой длины h, как на основании, построим прямоугольник, площадь которого , т.е. высота которого равна . В результате получим ступенчатую фигуру, которая и называется гистограммой частот (рис.4.).

Если же на каждом интервале как на основании построить прямоугольник с площадью (т.е. с высотой ), то полученная в результате этого ступенчатая фигура будет называться гистограммой относительных частот (рисунок 5).

 
 

Рисунок 4 - Гистограмма частот

 
 

Рисунок 5 - Гистограмма относительных частот

Гистограмма относительных частот дает приближенное представление о кривой распределения признака C(т.е. о графике плотности распределения ).

Кумулятивная кривая

Для каждого интервала группировки вычислим соответствующую накопленную интервальную относительную частоту , т.е. сумму интервальных относительных частот в интервалах, лежащих слева от , и в данном рассматриваемом интервале .

 
 

Кумулятивной кривой называется ломаная линия с вершинами в точках ; , где – правый конец -го интервала группировки. (рис.6.)

Рисунок 6 - Кумулятивная кривая

Заметим, что кумулятивная кривая является подходящим приближенным представлением для графика функции распределения изучаемого признака C.

В заключение отметим, что число интервалов группировки m обычно выбирается от 6 до 20. Имеются компьютерные статистические программы, которые позволяют автоматизировать процесс составления таблиц и построения графиков.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: