Сгруппированный и интервальный статистические ряды

Итак, пусть для исследования свойств случайной величины (с.в.) X получена выборка объема n { x 1, x 2,…, xn }.

Последовательность выборочных значений х 1, х 2,…, хn, записанных в порядке их появления, представляет собой исходный статистический материал и называется простым статистическим рядом.

Для компактного, удобного и наглядного представления имеющихся статистических данных необходимо произвести их первичную обработку.

Запишем все элементы выборки в порядке неубывания и обозначим члены такой последовательности , : , где

, .

Каждый элемент называется порядковой статистикой (вариантой), а последовательность

называется вариационным рядом, соответствующим имеющейся выборке.

Если изучается дискретная случайная величина, число возможных значений которой не велико (n < 10), то для каждого из отличающихся друг от друга наблюденных значений (обозначим их ) подсчитываются частоты mi и относительные частоты (частости) mi / n появления этих значений в выборке.

Результаты вычислений заносятся в таблицу 1, которая называется сгруппированным статистическим рядом.

Таблица 1Сгруппированный статистический ряд

Наблюденные значения k £ n  
Частоты  
Относительные частоты

Если изучается непрерывная случайная величина либо дискретная случайная величина, число возможных значений которой достаточно велико (n > 10), то диапазон [ x min(n); x max(n)] всех наблюденных значений разбивается на k разрядов длины h, и подсчитываются числа выборочных данных, попавших в каждый из разрядов. Результаты расчетов заносятся в таблицу 2, которая называется интервальным статистическим рядом.

Таблица 2Интервальный статистический ряд

Границы интервалов  
Среднее значение интервала  
Частоты
Относительные частоты

Для определения границ интервалов можно воспользоваться следующей методикой:

1 Вычислить размах варьирования выборочных значений: R = x max x min, где x min и x max соответственно минимальное и максимальное значения вариационного ряда.

2 Определить длину шага разбиения , где k – число разрядов разбиения. Для примерной ориентации в выборе значения k можно воспользоваться формулой Стерджесса: (), где n – объем выборки. Выбор количества разрядов существенно зависит от объема выборки n. При больших n величину R, полученную по формуле Стерджесса, следует воспринимать как оценку снизу для R (для упрощения последующих расчетов полученное значение h может быть округлено в бóльшую или меньшую сторону).

3 Определить границы интервалов разбиения: C 1 = x min h /2, C 2 = C 1 + h, C 3 = C 2 + h, и т. д. Процесс разбиения продолжается до тех пор, пока максимальный элемент выборки не попадет в интервал. Среднее значение каждого частичного интервала можно определить как среднее арифметическое его границ.

Элементы выборки, попавшие на границы разрядов разбиения, могут быть приписаны к какому-то одному из этих интервалов (например, к правому, как это сделано в таблице 2), либо частоты этих значений могут быть разделены поровну между двумя соседними интервалами.

Для графического представления сгруппированного статистического ряда обычно используется столбцовая диаграмма (рисунок 1), которая представляет собой последовательность вертикальных отрезков длины mi / n, отложенных от оси абсцисс в точках с координатами .

Для графического изображения интервального статистического ряда чаще всего используется гистограмма относительных частот (рисунок 2). При построении гистограммы на оси абсцисс необходимо отложить границы интервалов выборочных значений [ Ci,; Ci +1) () и на каждом из этих интервалов, как на основании, построить прямоугольники, площади которых равны mi / n, тогда высоты прямоугольников равны mi /(nhi). Площадь всей гистограммы, очевидно, равна 1.

Рисунок 1 – Столбцовая диаграмма Рисунок 2 – Гистограмма относительных частот

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: