Статистические данные, собранные в результате наблюдения, в своем первоначальном виде труднообозримы и без предварительной их подготовки не пригодны для проведения углубленного анализа.
Большую роль в разработке статистических данных играют современные классификаторы технико-экономической и социальной информации. Начиная с 2003 года по постановлению правительства России Госкомстат (с 2004г – Росстат) ведет большую работу по разработке классификаторов и их гармонизации с международными аналогами.
Классификаторы – это важнейший инструмент систематизации, упорядочения и сопоставимости данных. Их использование позволяет получить стандартные группировки в статистических отчетах, статистических формах, в средствах электронной обработки, а также в выходных статистических материалах и публикациях.
В России в настоящее время разработаны классификаторы, которые позволяют по единой методике сгруппировать информацию и охарактеризовать структуру национальной экономики, природных и трудовых ресурсов, административно-территориальное деление страны, виды производимых товаров и услуг и ряда других экономических и социальных объектов и их свойств.
Сводка как процедура сжатия, уплотнения и упорядочения информации является обязательным этапом исследования любого уровня. Основной прием сводки – группировка.
Группировка – разбиение или разделение статистической совокупности на отдельные группы по одному или нескольким признакам.
Признак, положенный в основу группировки – группировочный признак.
Если группировка единиц совокупности проводится по одному признаку, она называется простой или монотетической, если по двум или нескольким признакам – комбинационной.
Исходя из сложности социально-экономических явлений, предпочтения следовало бы отдать комбинационным группировкам. Однако чем больше используется группировочных признаков, тем менее обозрима и информативна получаемая группировка. Чрезмерная детализация информации может также привести к пустым или малонаполненным группам.
Использование группировок решает следующие основные задачи:
- выделение и описание объективно существующих типов и групп;
- изучение структуры совокупности и оценка структурных сдвигов;
- изучение связей и зависимостей между признаками.
Этим задачам соответствует три вида группировок.
Первая задача решается с помощью типологической группировки.
Таблица1
Группировка занятого населения Санкт-Петербурга по формам собственности
Формы собственности | 1991 год | 2001 год | ||
тыс. чел | занято в эк-ке, в % | тыс. чел | занято в эк-ке, в % | |
А | ||||
Всего занято в экономике | ||||
На государственных и муниципальных предприятиях и организациях | 78,4 | 38,7 | ||
В частном секторе | 2,5 | 42,9 | ||
В общественных организациях | 1,8 | 1,0 | ||
На совместных предприятиях | 0,8 | 2,3 | ||
На предприятиях и организациях смешанной формы собственности | 16,7 | 15,1 |
Группировочный признак – форма собственности. Результаты группировки – число занятых (в графах 1, 3). Результат группировки представлен абсолютным показателем.
Типологическая группировка регионов РФ по объему оборота в розничной торговле в расчете на одного предпринимателя (по данным выборочного исследования, август 2004г):
Оборот розничной торговли на одного предпринимателя, тыс. руб. | Число регионов |
До 100 | |
101 – 150 | |
151 – 200 | |
201 – 250 | |
251 – 300 | |
Свыше 300 |
Вторая задача решается с использование структурной группировки. Структурная группировка, как привило, строится на базе типологической, но с использованием относительных показателей. То есть рассчитывается доля каждой группы в общем объеме совокупности (структурная группировка приведена в Таблице1 в графах А, 2, 4).
При наличии структурной группировки за ряд лет может быть изучена динамика структуры, то есть структурные сдвиги.
Третья задача решается с использованием аналитической группировки. Аналитическая группировка строится на основе факторного признака, то есть признака, под влиянием которого изменяется другой признак, называемый результативным или результатом. По группам, сформированным на основе признака-фактора, рассчитывается средняя величина признака-результата. Изучение параллельных изменений этих признаков позволяет выдвигать гипотезу о наличии или отсутствии связи между признаками.
Оценка здоровья на протяжении жизненного пути индивида.
Возраст, лет | Средний % имеющихся хронических заболеваний |
До 10 | 4,5 |
11 – 20 | 11,4 |
21 – 30 | 18,9 |
31 – 40 | 29,2 |
41 – 50 | 43,8 |
51 – 60 | 56,5 |
60 и выше | 62,4 |
Факторный признак – возраст. Признак-результат – хроническое заболевание.
Построение группировок предполагает решения следующих задач:
1. выбор группировочного признака. Выбор зависит от конкретных целей и задач исследования.
2. определение числа групп. На число групп оказывает влияние объем совокупности и тип группировочного признака. Если признак атрибутивный, то число групп соответствует числу объективно существующих типов в изучаемой совокупности (см Таблицу1). Если в качестве группировочного признака используется количественный дискретный признак, то число групп соответствует числу градаций этого признака. Основная проблема с определением числа групп связана с количественными непрерывными признаками. В этом случае число групп определяют по формуле Стерджесса:
K = 1 + 3.322 lgN, где
K- число выделяемых групп,
N – объем статистической совокупности.
Эта формула дает хорошие результаты при условии больших совокупностей, при N>100.
Определение числа групп обеспечивается интуицией, профессиональным опытом или результатами предыдущих аналогичных исследований.
3. После определения числа групп рассчитывают группировочный интервал
, где
h – группировочный интервал,
K – число групп,
xmax, xmin – максимальное и минимальное значение признака совокупности.
Пример:
xmax = 1200, xmin = 200, K = 5
200 - 400
400 - 600
600 - 800 - 5 групп
800 – 1000
1000 – 1200
Интервал группировки, помимо равного, может быть:
- прогрессивно возрастающим;
- прогрессивно убывающим;
- специализированным.
Это зависит от характера группировочного признака, степени вариации, целей исследования.