Группировка статистических данных

В результате проведения статистического наблюдения получают данные о признаках каждой обследованной единицы статистической совокупности. Однако эти массивы данных, содержащие подробные сведения о каждой единице совокупности, собирают не для того, чтобы получить характеристики каждой из них, а с целью изучить совокупность в целом, выявить ее характерные группы и закономерности. Для этого необходимо обобщить и систематизировать сведения, полученные в ходе статистического наблюдения.

Единицы статистической совокупности отличаются друг от друга как качественными, так и количественными признаками. В связи с этим отдельные единицы совокупности, сходные по своему виду, размеру, отношению к другим частям совокупности и т.д., необходимо объединить в обособленные группы. Разбиение совокупности на однородные виды, классы выполняют в ходе группировки.

Группировка – это процесс образования однородных групп на основе расчленения статистической совокупности на части или объединение изучаемых единиц в частные совокупности по существенным для них признакам.

Признаки, на основе которых получена группировка, называются группировочными.

Выбор группировочных признаков имеет огромное значение. В основу группировки должны быть положены наиболее важные, существенные признаки. Их выбор определяется как качественной особенностью изучаемых процессов и явлений, так и целями исследования. Выделение наиболее типичных черт, которые присущи некоторым единицам совокупности, позволяет получить качественно однородные группы. В таких группах легче обнаружить закономерности изменения и развития явления, более наглядна реакция на те факторы, которые влияют на изменение его состояния.

Анализируя экономическую и социальную жизнь общества, выделяют и изучают отдельные типы явлений. Такого рода группировки называются типологическими. Важнейшим их содержанием является выделение из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные (деление населения на такие группы, как молодежь, лица среднего возраста и др.). Пороговые значения количественных признаков, отделяющие одну группу от другой, изменяются во времени и пространстве.

Структурные группировки – выделенные типы явления с помощью типологической группировки могут изучаться с точки зрения их структуры и состава (работники торговли по профессии, возрасту, образованию).

При анализе явлений часто используют пространственные группировки, созданные по географическому признаку, в основу положены существующее административно-территориальное деление, природно-климатические зоны, части света и т. д. Сгруппированные таким образом данные представляют важность для анализа явлений в пределах отдельных территорий и для сопоставления одних и тех же явлений на различных территориях.

Для исследования зависимости между явлениями используют аналитические группировки. С помощью таких группировок можно изучать взаимосвязи между двумя и более отдельными признаками исследуемого явления (предприятия определенной отрасли по уровню производительности туда для выявления е влияния на производительность продукции).

Каждая единица исследуемой совокупности обладает рядом свойств, или признаков. Отдельные значения, которые может принимать тот или иной варьирующий признак, называются вариантами.

По характеру вариантов признаки делятся на атрибутивные и количественные. Признак называется атрибутивным, если его варианты не выражаются числами, и количественным, если его варианты выражаются в виде чисел.

При группировке по атрибутивному признаку число групп определяется количеством соответствующих наименований, если число этих наименований не очень велико. Если признак имеет большое количество разновидностей, то ряд наименований объединяется в одну группу.

При группировке по количественному признаку число групп определяется в зависимости от характера изменения признака. Если признак меняется дискретно, то есть может принимать только некоторые значения, то число групп должно соответствовать количеству значений признака (тарифный разряд рабочих).

При непрерывном изменении признак принимает любые значения (возраст рабочих, их заработная плата), поэтому группы ограничиваются значениями признака в интервале.

Интервалом называется разница между максимальным и минимальным значением в каждой группе. Интервалы бывают трех видов:

- Равные – если нужно охарактеризовать количественные различия в величине признака внутри групп одинакового качества. Длина интервала определяется по формуле:

, где – максимальное значение признака в совокупности;

– минимальное значение признака в совокупности

k – число групп.

Число групп может быть задано (на основе опыта предыдущих исследований), а можно воспользоваться формулой Стерджесса для определения оптимального числа групп

, где N – число единиц совокупности.

Нижняя граница интервала всегда берется включительно, а верхняя – исключительно.

- Неравные (постепенно увеличивающиеся) – часто применяются в аналитических группировках. Выбирают так, чтобы число единиц в образованных группах было приблизительно одинаковым;

- Специализированные – используют в типологических группировках: границы устанавливают там, где начинается переход от одного качества к другому.

Используются два вида интервалов: закрытые и открытые. Закрытыми называютсяинтервалы, у которых указаны обе границы, открытыми – интервалы с одной границей (верхней у первого интервала и нижней у последнего интервала).

Результаты сводки и группировки материалов наблюдения, как правило, представляют в виде статистических таблиц. Статистическая таблица – это форма наиболее краткого и рационального изложения цифровых данных об изучаемой статистической совокупности. Статистические таблицы очень наглядны. Каждая статистическая таблица содержит подлежащие и сказуемое. Подлежащее показывает о каком явлении идет речь, оно представляет собой группы и подгруппы, которые характеризуются рядом показателей. Сказуемое – это показатели, с помощью которых изучается объект, то есть подлежащее. Подлежащее таблицы обычно составляет название ее строк, а сказуемое – название колонок.

Если в сказуемом групповой таблицы только одна графа, то такая таблица называется рядом распределения. При группировке ряда по количественному признаку получаются вариационные ряды, то есть сказуемое показывает число единиц изучаемой совокупности в каждой группе. Вариационные ряды бывают дискретные и интервальные (непрерывные).

Вариационные ряды состоят из двух элементов: варианты и частоты.

Варианта (x) – отдельное значение варьирующего признака, которое она принимает в ряду распределения.

Частотами (абсолютными частотами) (f) – называются численности отдельных вариант или каждой группы вариационного ряда.

Частоты, выраженные в долях единицы или в процентах к итогу, называются частостями (относительными частотами) (w).

Выполняются основные соотношения:

.

Пример. 1. Дана выборка о тарифном разряде работников предприятия: 1, 5, 3, 4, 5, 3, 4, 4, 1, 2, 2,, 5, 5, 3, 4, 1, 2, 1, 3, 3, 1, 1, 5 … и т. д. Построить дискретный вариационный ряд.

Варианта (xi) Частота (fi) Относительная частота (wi)
    0,17
    0,26
    0,29
    0,22
    0,06
Итого:    

к = 5 – число групп, N = 100 – объем выборки (число единиц совокупности).

Пример. 2. Распределение работников коммерческого банка по размеру месячной заработной платы характеризуется следующими данными (тыс. руб.):

2, 3, 4, 2, 7, 4, 3, 4, 5, 10, 8, 7, 6, 1, 2, 3, 5, 10, 8, 7, 5, 6, 1, 6, 5, 8, 11, 8, 5, 3, 2, 3, 7, 5, 3, 2, 10, 2, 8, 7, 2, 7, 11, 5, 4, 3, 2, 2, 4, 5, 7, 8, 9, 10, 11, 1, 3, 8, 10, 11, 8, 7, 6, 5, 4, 3, 8, 7, 2, 7…. и т.д. Построить вариационный ряд с равными интервалами, выделив 5 групп.

Интервал [ xi; xi+1) Середина интервала (xi*) Частота (fi) Относительная частота (wi)
[1; 3)     17/110
[3; 5)     20/110
[5; 7)     31/110
[7; 9)     26/110
[9; 11]     16/110
Итого:      

xmin = 1, xmax = 11, N = 110 - объем выборки, k = 5 – число интервалов, h = (11 - 1) / 5 = 2 – длина интервала.

Интервальный ряд распределения изображают графически в виде гистограммы. На оси х откладывают отрезки, равные длине интервала. На этих отрезках, как на основаниях строят прямоугольники, высота которых пропорциональна частоте или частости. Площадь всей гистограммы численно равна сумме частот или численности единиц совокупности (если на оси ординат отложены частоты).

Дискретный вариационный ряд изображают в виде полигона. На координатной плоскости ставятся точки с координатами (xi, fi), а затем полученные точки соединяются отрезками прямой.

Полигон и гистограмма частот для рассмотренных примеров представлены на рисунках 1 и 2.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: