Вариационные ряды
Лекция 12.
План:
1. Вариационные ряды.
2. Числовые характеристики вариационного ряда.
Выборочные данные используются для анализа всей генеральной совокупности, но для этого требуется представить их в виде, удобном для обработки. Экономические данные, записанные в порядке их регистрации, обычно труднообозримы и неудобны для дальнейшего анализа. Задачей статистического описания данных является получение такого их представления, которое позволяет наглядно выявить их вероятностные характеристики. Для этого применяются различные формы упорядочивания данных — по возрастанию, по совпадающим значениям, по интервалам и т.п. Обычно для решения проблемы наглядности и удобства обработки изучаемой совокупности используют вариационные ряды.
Значения изучаемого признака или показателя, характеризующие некоторое явление, при переходе от одной единицы объекта статистического наблюдения к другой в выборочной совокупности изменяются или варьируют, поэтому в статистике различные значения признака называют вариантами. Например, если изучаемым признаком является успеваемость студентов, то вариантами показателя успеваемости будут оценки студентов: 2 (неудовлетворительно), 3 (удовлетворительно), 4 (хорошо) и 5 (отлично).
|
|
С целью упорядочивания и формализации задачи исследования статистических данных их помещают в вариационный ряд. Варианты обычно обозначаются малыми латинскими буквами х, у, z.
Упорядоченный в порядке возрастания или убывания ряд значений признака (вариантов) с соответствующими им весами называется вариационным рядом (рядом распределения).
Порядковый номер варианта (значения признака) называется его рангом: х1 — 1-й вариант (1-е значение признака), х2 — 2-й вариант (2-е значение признака), хi — i-й вариант (i-е значение признака). Значения признака (варианты) обычно обозначаются: х1, х2, х3,..., хп.
Весами вариантов называют соответствующие им частоты или частости.
Определение 12.2.
Под частотой варианта понимают величину mi, которая указывает, сколько раз встречается этот вариант (значение признака) в рассматриваемой статистической совокупности.
Например, если 10 студентов имеют по экзамену оценку пять, то частота варианта х4= 5 будет иметь значение т 4 = 10.
Сумма частот всех вариантов рассматриваемого вариационного ряда равна объему исследуемой совокупности:
(12.1)
где n — объем исследуемой выборочной совокупности;
k — количество значений признака (вариантов);
mi — частота варианта.
Определение 12.3.
Частостью или относительной частотой называют величину ωi, которая показывает какая часть единиц совокупности имеет этот вариант.
|
|
Частость рассчитывается как отношение частоты варианта к сумме всех частот ряда:
(12.2)
Очевидно, что сумма всех частостей равна 1:
(12.3)
Различают дискретные и интервальные вариационные ряды.
Определение 12.4.
Дискретные вариационные ряды строят обычно в том случае, если значения изучаемого признака могут отличаться друг от друга не менее чем на некоторою конечную величину. В дискретных вариационных рядах задаются точечные значения признака.
Общий вид дискретного вариационного ряда указан в таблице 12.1, где i = 1, 2,..., k.
Таблица 12.1
Значения признака (xi) | x1 | x2 | … | xk |
Частоты (mi) | m1 | m2 | … | mk |
Например, оценки, полученные на экзаменах студентами, могут принимать дискретные значения: 2, 3, 4, 5 и отличаться на один балл, поэтому ряд оценок будет дискретным. Если же мы будем исследовать средний бал студента за все годы обучения, то изучаемый признак средняя оценка может принимать различные значения в интервале [2; 5]. Средний бал одного студента будет 4,562, а другого 4,569, то есть отличаться на очень малую величину. В этом случае для исследования признака используют интервальные вариационные ряды.
Графически дискретные вариационные ряды изображаются в виде полигона распределения частот или частостей. По оси абсцисс откладывают значения вариантов ряда, а по оси ординат — соответствующие частоты или частости. На пересечении значений признака и соответствующих им частот (частостей) откладываются точки, которые, в свою очередь, соединяются отрезками. Получающаяся таким образом ломаная называется полигоном распределения частот (частостей).
Определение 12.5.
Интервальные вариационные ряды содержат не конкретные значения вариантов изучаемого признака, а интервалы, в которые попадают эти значения, если они могут отличаться друг от друга на сколь угодно малую величину.
Общий вид интервального вариационного ряда показан в таблице 12.2, где i = 1,2,..., i.
Таблица 12.2
Значения признака | a1 – a2 | a2 – a3 | … | a2 – a3 |
Частоты (mi) | m1 | m2 | … | mi |
В интервальных вариационных рядах в каждом интервале выделяют верхнюю и нижнюю границы интервала.
Определение 12.6.
Разность между верхней и нижней границами интервала называют интервальной разностью, или длиной (величиной) интервала.
В общем виде интервальная разность ki рассчитывается по формуле:
Если интервал включает в себя обе границы, то его называют закрытым. Первый и последний интервалы могут быть открытыми, т.е. иметь только одну границу.
Например, имеются данные о средней заработной плате работников в области в тыс. руб., которые помещены в интервальный вариационный ряд в таблице 12.3:
Таблица 12.3
Заработная плата | До 3 | 3-5 | 5-7 | 7-9 | 9-11 | Более 11 |
Число работников |
В этом вариационном ряде первый и последний интервалы открыты. В процессе обработки данных открытые интервалы приходится условно закрывать. Для этого обычно величину первого интервала принимают равной величине второго, а величину последнего — величине предпоследнего, то есть рядом стоящего. Закрыв интервалы, получим следующий ряд, который будет равновеликим с интервальной разностью 2 тыс. руб. (таблица 12.4.):
Таблица 12.4
Заработная плата | 1-3 | 3-5 | 5-7 | 7-9 | 9-11 | 11-13 |
Число работников |
Графически дискретные вариационные ряды изображаются в виде гистограммы, или столбчатой диаграммы распределения частот или частостей. При построении гистограммы по оси абсцисс откладываются значения изучаемого признака (границы интервалов), а по оси у — соответствующие частоты или частости, в том случае, если интервалы одинаковой величины.
|
|
Построим гистограмму частот по данным таблицы 12.3, используя мастер диаграмм в MS Excel.
В интервальном вариационном ряде могут встречаются интервалы разной длины. Если интервалы в вариационном ряде имеют одинаковую длину (интервальную разность),
их называют равновеликими, в противном случае — неравновеликими. Если интервалы имеют разную величину, то при построении гистограммы по оси ординат необходимо откладывать значения абсолютной или относительной плотности распределения.
Определение 12.7.
Абсолютная плотность i-го интервала f(а)i определяется как отношение частоты интервала mi к его длине ki.
(12.4)
Определение 12.8.
Относительная плотность i-го интервала f(o)i определяется как отношение частости интервала
(12.5)
В процессе построения интервального вариационного ряда необходимо определить оптимальную величину интервальной разности. Для этого используют формулу Стэрджесса:
(12.6)
где п — число единиц совокупности,
— наименьшее и наибольшее значения вариантов ряда.
Для характеристики вариационного ряда наряду с частотами и частостями используются накопленные частоты и частости.