Группировка статистических данных

Группировка - это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка - это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.

Устойчивое разграничение объектов выражается классификацией. Классификация - это стандарт, в котором каждая атрибутивная запись может быть отнесена лишь к одной группе или подгруппе. Классификация основывается на самых существенных признаках, которые меняются очень мало (например, классификация отраслей народного хозяйства, классификация основных фондов и т. д.). Таким образом, классификация - это узаконенная, общепринятая, нормативная группировка.

Метод группировки основывается на двух категориях - группировочном признаке и интервале.

Группировочный признак - это признак, по которому происходит объединение отдельных единиц совокупности в однородные группы. Классификация и группировка должны производиться на основании вполне объективных и легко распознаваемых признаков.

Интервал очерчивает количественные границы групп. Как правило, он представляет собой промежуток между максимальными и минимальными значениями признака в группе.

Интервалы бывают:

а) равные, когда разность между максимальным и минимальным значениями в каждом из интервалов одинакова;

б) неравные, когда, например, ширина интервала постепенно увеличивается, а верхний интервал часто не закрывается вовсе;

в) открытые, когда имеется только либо верхняя, либо нижняя

граница;

г) закрытые, когда имеются и нижняя, и верхняя границы.

При непрерывном характере вариации группировочного признака, когда в определенных пределах признак может принимать значение (целое или дробное), весь диапазон изменения признака также разбивается на интервалы.

Неравные интервалы применяются при группировках, которые охватывают массу единиц совокупности с неравномерными и значительными колебаниями признака.

Статистические группировки и классификации преследуют цели выделения качественно однородных совокупностей, изучения структуры совокупности, исследования существующих зависимостей. Каждой из этих целей соответствует особый вид группировки: типологичекая, структурная, аналитическая (факторная).

Типологическая группировка решает задачу выявления и характеристики социально-экономических типов (частных подсовокупностей).

Структурная дает возможность описать составные части совокупности или строение типов, а также проанализировать структурные сдвиги.

Аналитическая (факторная) группировка позволяет оценивать связи между взаимодействующими признаками.

В зависимости от числа положенных в их основание признаков различают простые и многомерные группировки.

Группировка, выполненная по одному признаку, называется простой.

Многомерная группировка производится по двум и более признакам.

По отношениям между признаками выделяют иерархические и неиерархические группировки. Иерархические группировки выполняются по двум и более признакам, при этом значения второго признака определяются областью значений первого.

Неиерархические группировки строятся, когда строгой зависимости значений второго признака от первого не существует.

Среди простых группировок особо выделяют ряды распределения.

Ряд распределения - это группировка, в которой для характеристики групп (упорядоченно расположенных по значению признака) применяется один показатель - численность группы.

Ряды, построенные по атрибутивному признаку, называются атрибутивными рядами распределения.

Ряды распределения, построенные по количественному признаку, называются вариационными рядами.

По очередности обработки информации группировки бывают первичные (составленные на основе первичных данных) и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.

Относительно временного критерия группировки бывают статические, дающие характеристику совокупности на определенный момент времени или за определенный период, и динамические - это группировки, показывающие переходы единиц из одних групп в другие (а также вход и выход из совокупности).

При проведении группировки решается ряд задач:

1) выделение группировочного признака;

2) определение числа групп и величины интервалов;

3) при наличии нескольких группировочных признаков описание того, как они комбинируются между собой;

4) установление показателей, которыми должны характеризоваться группы, т.е сказуемого группировки.

Рассмотрим методологические вопросы построения различных видов группировок.

Типологическая группировка может строиться для разных целей и по различным критериям. Задача выделения типов из общей совокупности решается сравнительно просто только в тех случаях, когда различия очевидны и устойчивы и могут быть описаны одним или несколькими признаками. Однако на практике это бывает редко. Принадлежность группируемых объектов к общей совокупности приводит обычно к появлению у них некоторых общих особенностей, маскирующих различия между типами. Кроме того, недостаточно четкое обособление отдельных типов друг от друга в действительности, множественность признаков описания объекта и ряд других обстоятельств еще более усложняют группировку. Поэтому задача проведения качественной типологической группировки совокупности весьма сложна.

По способу формирования типологических групп различают:

1) способ последовательных разбиений, заключающийся в формировании таких групп, все объекты которых имеют одинаковые значения классификационных признаков;

2) способ многомерной классификации. В этом случае объекты, образующие группы, могут иметь различные значения классификационных признаков.

При использовании методов комбинационной группировки классификация осуществляется путем последовательного логического деления совокупности по отдельным признакам. Очередность этапов здесь такова:

1) наметка типов;

2) выбор группировочного признака (признаков);

3) определение числа групп и величины интервалов;

4) сведение выделенных групп в типы;

5) характеристика типов с помощью системы показателей.

Наметка типов производится с помощью теоретического качественного анализа. Предварительно намечают столько типов, сколько их может быть в данной совокупности теоретически (хотя фактически возможно меньшее их число).

При выборе группировочного признака необходимо учитывать два условия. Во-первых, типологическая группировка должна выполняться только по существенным признакам. Во-вторых, при необходимости для характеристики разных типов выбираются различные признаки, т. е. осуществляется специализация признака.

На предварительном этапе количество комбинированных групп определяется произведением где число градаций i-го группировочного признака.

В случае количественного группировочного признака необходимо определять величину интервалов. Интервалы задают критические точки перехода одного качества в другое. При построении типологической группировки интервалы должны быть неравными и специализированными. Специализация интервалов означает, что разным значениям одного признака соответствуют разные значения другого.

Полученные комбинированные группы в итоге чисто технически объединяются в типы. Критерием оптимальности выполненной типологической группировки может служить максимум межгрупповой дисперсии интересующего исследователя признака:

Если результат не устраивает исследователя, то группировку следует повторить, задавая для каждого признака меньшее число групп.

Если группировка оказывается приемлемой, то для характеристики типов разрабатывается система показателей, среди которых обязательно должны быть характеристика численности типов - веса либо частоты - и интегральные показатели, рассчитанные в виде средних, удельных весов, соотношений, показателей динамики и т. д.

Структурная группировка применяется для характеристики структуры и структурных сдвигов. При проведении структурной группировки решаются следующие вопросы.

1. Выбор группировочного признака. В данном случае в качестве такового может выступать как существенный, так и несущественный признак.

2. Определение числа групп и величины интервала. Здесь необходимо учитывать несколько условий:

а) число групп детерминируется уровнем колеблемости группировочного признака. Чем значительнее вариация признака, тем больше при прочих равных условиях должно быть групп;

б) число групп должно отражать реальную структуру изучаемой совокупности;

в) не допускается выделение пустых групп. Если проблема Пустых групп все же возникает, при проведении структурных группировок используют неравные интервалы.

Для нахождения числа групп служит формула

lg N,

где количество элементов совокупности.

В случае равных интервалов величина интервала может быть определена как

i =

или

=

3. Определение системы показателей для характеристики групп. Обязателен показатель численности групп. Он может быть представлен либо частотой (количеством единиц в каждой группе), либо частотностью (удельным весом каждой группы).

Аналитическая (факторная) группировка предназначена для установления тесноты связи между взаимодействующими признаками - факторным и результативным. Она позволяет выявить наличие и направление связи, а также измерить ее тесноту и силу. Методологическими вопросами построения факторной группировки являются выбор группировочного признака, определение числа групп и величины интервала, выбор системы показателей для характеристики групп. Чаще всего в качестве группировочного принимают факторный признак, выделенный на основе априорного анализа. Интервалы в аналитической группировке берутся преимущественно равные либо равнонаполненные (группы с приблизительно одинаковой частотой). Величина интервала рассчитывается так же, как при построении структурной группировки. Среди показателей групп обязательным является среднее значение результативного показателя по каждой группе.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: