Тема 3
Задача 2.2
Задача 2.1
Непрерывныйпризнак в пределах вариации может принимать любые значения, отличающиеся друг от друга на сколь угодно малую величину (например, выработка, возраст и др.). Как правило, при построении вариационных рядов по непрерывному признаку последний указывается в виде интервалов «от и до» и ряд называется интервальным.
ПОСТРОЕНИЕ РЯДОВ РАСПРЕДЕЛЕНИЯ (вариационных).
Тема 2
СВОДКА И ГРУППИРОВКА СТАТИСТИЧЕСКИХ ДАННЫХ:
Сводка является в торым этапом статистического исследования. Её суть состоит в обработке первичных материалов наблюдения в целях получения итоговых или упорядоченных определенным образом числовых характеристик той или иной изучаемой совокупности. Основным и важнейшим моментом сводки является группировка, т.е. объединение статистических данных в однородные по определенным признакам группы.
Группировки помогают изучать структуру совокупности, взаимосвязь между явлениями.
|
|
Для изучения структуры той или иной совокупности строят ряды распределения, характеризующие распределение единиц совокупности по одному признаку.
Ряд распределения - самая простая группировка изучаемой совокупности.
Распределение единиц совокупности по количественному признаку называют вариационным рядом.
Признак может быть дискретным или непрерывным.
Дискретным называется признак, который может принимать определенные значения из конечного набора таких значений, выражаемых только целыми числами (например, объём производства в шт., количество работников в организации и пр.).
Открытые интервалы (крайние группы) – указана только одна граница, закрытые – обе границы.
Отдельные значения группировочного признака называются вариантами (обозначаются хi), а числа, показывающие, сколько раз встречается то или иное значение признака, — частотами, если они выражены абсолютными величинами (обозначаются т или f), либо частостями, если это относительные величины (обозначаются wi ).
Рассмотрим построение дискретного ряда на примере.
Пусть имеются следующие данные о тарифных разрядах 50 рабочих одного из цехов завода:
Чтобы показать распределение рабочих по тарифному разряду, построим вариационный ряд, для чего выпишем все значения признака (тарифного разряда) в порядке возрастания и подсчитаем число рабочих в каждой группе:
Это дискретный вариационный ряд, у которого вариантами являются значения тарифного разряда, а частотами — число рабочих.
Численность рабочих можно выразить также в долях, тогда последние именуются частостями и обозначаются как
|
|
Естественно
Относительные численности (частости) выражают и в процентах. Тогда
Для построения интервального ряда с равными интервалами воспользуемся следующими данными о стоимости основных фондов, млн руб. (непрерывный признак), у 50 предприятий:
9,4 | 8,0 | 6,3 | 10,0 | 15,0 | 8,2 | 7,3 | 9,2 | 5,8 | 8,7 |
5,2 | 13,2 | 8,1 | 7,5 | 11,8 | 14,6 | 8,5 | 7,8 | 10,5 | 6,0 |
5,1 | 6,8 | 8,3 | 7,7 | 7,9 | 9,0 | 10,1 | 8,0 | 12,0 | 14,0 |
8,2 | 9,8 | 13,5 | 12,4 | 5,5 | 7,9 | 9,2 | 10,8 | 12,1 | 12,4 |
12,9 | 12,6 | 6,7 | 9,7 | 8,3 | 10,8 | 15,0 | 7,0 | 13,0 | 9,5 |
Чтобы показать распределение предприятий по стоимости основных фондов, сначала решим вопрос о количестве групп, которые мы хотим выделить. Предположим, решено выделить пять групп заводов. Чтобы определить величину интервала в группе, найдем разность между максимальным и минимальным значениями признака и разделим ее на число выделяемых групп (к). Если обозначить величину интервала через h, то в нашем примере
Выделим теперь группы с интервалом 2 млн руб. и подсчитаем число заводов в каждой группе (частоту):
Стоимость | Число заводов | Накопленная |
основных фондов, | (частота/) | (кумулятивная) |
млн руб. | частота F | |
5-7 | ||
7-9 | ||
9-11 | ||
11-13 | ||
13-15 | ||
Всего | - |
Это интервальный вариационный ряд с равными интервалами. При такой записи непрерывного признака, когда одна и та же величина встречается дважды (как верхняя граница одного интервала и как нижняя граница другого интервала), единица, обладающая этим значением, обычно относится к той группе, где эта величина выступает в роли верхней границы. Так, в нашем примере завод со стоимостью основных фондов 9 млн руб. отнесен ко второй группе (а не к третьей).
Кроме обычных частот в вариационном ряду можно рассчитать нарастающим итогом накопленные (кумулятивные) частоты (Fi}) или частости (pi), по которым строится суждение о том, какое число единиц в совокупности обладает значением признака «не более» или «не менее» определенного. Так, в нашем примере можно сказать, что 25 заводов из 50, т.е. половина, имеют основные фонды, стоимость которых не превышает 9 млн руб.
В рассмотренном примере это составило бы |
Если вопрос о количестве выделяемых групп, а, следовательно, и о величине интервала вызывает сомнение, то рекомендуется использовать формулу Стерджесса, предусматривающую выделение оптимального числа групп (К = 1 + 3,322 1 g N) при заданной численности совокупности (N):
т.е. можно было выделить семь групп заводов (6,644 = 7) с равными интервалами А= 1,5 млн руб.
Во многих случаях, когда размах вариации группировочного признака (xmax - xmin) велик или образование групп с равными интервалами нецелесообразно, вариационные ряды строятся с неравными интервалами, как, например, в приводимой ниже таблице (графы 1 и 2).
Распределение населения РФ по среднедушевому денежному доходу в месяц за I полугодие 2006г.
Среднедушевой доход в месяц, тыс. руб. | Численность населения, % к итогу | Плотность распределения | Накопленные (кумулятивные) частости Pi |
До 1,5 | 2,5 | 2,5 | 2,5 |
1,5-2,5 | 7,4 | 7,4 | 9,9 |
2,5-3,5 | 10,2 | 10,2 | 20,1 |
3,5-4,5 | 10,6 | 10,6 | 30,7 |
4,5-6,0 | 14,5 | 9,7 | 45,2 |
6,0-8,0 8,0-12,0 Свыше 12,0 | 15,1 18,5 21,2 | 7,6 4,6 5,3 | 60,3 78,8 100,0 |
Итого | 100,0 | - | - |
Ряды распределения (вариационные ряды) могут быть построены по самым различным объектам. Так, объектом распределения могут служить и временные периоды (месяцы, годы), и территориальные единицы.