Сводка и группировка данных

Статистические данные, собранные в результате наблюдения, в своем первоначальном виде труднообозримы и без предварительной их подготовки не пригодны для проведения углубленного анализа.

Большую роль в разработке статистических данных играют современные классификаторы технико-экономической и социальной информации. Начиная с 2003 года по постановлению правительства России Госкомстат (с 2004г – Росстат) ведет большую работу по разработке классификаторов и их гармонизации с международными аналогами.

Классификаторы – это важнейший инструмент систематизации, упорядочения и сопоставимости данных. Их использование позволяет получить стандартные группировки в статистических отчетах, статистических формах, в средствах электронной обработки, а также в выходных статистических материалах и публикациях.

В России в настоящее время разработаны классификаторы, которые позволяют по единой методике сгруппировать информацию и охарактеризовать структуру национальной экономики, природных и трудовых ресурсов, административно-территориальное деление страны, виды производимых товаров и услуг и ряда других экономических и социальных объектов и их свойств.

Сводка как процедура сжатия, уплотнения и упорядочения информации является обязательным этапом исследования любого уровня. Основной прием сводки – группировка.

Группировка – разбиение или разделение статистической совокупности на отдельные группы по одному или нескольким признакам.

Признак, положенный в основу группировки – группировочный признак.

Если группировка единиц совокупности проводится по одному признаку, она называется простой или монотетической, если по двум или нескольким признакам – комбинационной.

Исходя из сложности социально-экономических явлений, предпочтения следовало бы отдать комбинационным группировкам. Однако чем больше используется группировочных признаков, тем менее обозрима и информативна получаемая группировка. Чрезмерная детализация информации может также привести к пустым или малонаполненным группам.

Использование группировок решает следующие основные задачи:

- выделение и описание объективно существующих типов и групп;

- изучение структуры совокупности и оценка структурных сдвигов;

- изучение связей и зависимостей между признаками.

Этим задачам соответствует три вида группировок.

Первая задача решается с помощью типологической группировки.

Таблица1

Группировка занятого населения Санкт-Петербурга по формам собственности

Формы собственности 1991 год 2001 год
тыс. чел занято в эк-ке, в % тыс. чел занято в эк-ке, в %
А        
Всего занято в экономике        
На государственных и муниципальных предприятиях и организациях   78,4   38,7
В частном секторе   2,5   42,9
В общественных организациях   1,8   1,0
На совместных предприятиях   0,8   2,3
На предприятиях и организациях смешанной формы собственности   16,7   15,1

Группировочный признак – форма собственности. Результаты группировки – число занятых (в графах 1, 3). Результат группировки представлен абсолютным показателем.

Типологическая группировка регионов РФ по объему оборота в розничной торговле в расчете на одного предпринимателя (по данным выборочного исследования, август 2004г):

Оборот розничной торговли на одного предпринимателя, тыс. руб. Число регионов
До 100  
101 – 150  
151 – 200  
201 – 250  
251 – 300  
Свыше 300  

Вторая задача решается с использование структурной группировки. Структурная группировка, как привило, строится на базе типологической, но с использованием относительных показателей. То есть рассчитывается доля каждой группы в общем объеме совокупности (структурная группировка приведена в Таблице1 в графах А, 2, 4).

При наличии структурной группировки за ряд лет может быть изучена динамика структуры, то есть структурные сдвиги.

Третья задача решается с использованием аналитической группировки. Аналитическая группировка строится на основе факторного признака, то есть признака, под влиянием которого изменяется другой признак, называемый результативным или результатом. По группам, сформированным на основе признака-фактора, рассчитывается средняя величина признака-результата. Изучение параллельных изменений этих признаков позволяет выдвигать гипотезу о наличии или отсутствии связи между признаками.

Оценка здоровья на протяжении жизненного пути индивида.

Возраст, лет Средний % имеющихся хронических заболеваний
До 10 4,5
11 – 20 11,4
21 – 30 18,9
31 – 40 29,2
41 – 50 43,8
51 – 60 56,5
60 и выше 62,4

Факторный признак – возраст. Признак-результат – хроническое заболевание.

Построение группировок предполагает решения следующих задач:

1. выбор группировочного признака. Выбор зависит от конкретных целей и задач исследования.

2. определение числа групп. На число групп оказывает влияние объем совокупности и тип группировочного признака. Если признак атрибутивный, то число групп соответствует числу объективно существующих типов в изучаемой совокупности (см Таблицу1). Если в качестве группировочного признака используется количественный дискретный признак, то число групп соответствует числу градаций этого признака. Основная проблема с определением числа групп связана с количественными непрерывными признаками. В этом случае число групп определяют по формуле Стерджесса:

K = 1 + 3.322 lgN, где

K- число выделяемых групп,

N – объем статистической совокупности.

Эта формула дает хорошие результаты при условии больших совокупностей, при N>100.

Определение числа групп обеспечивается интуицией, профессиональным опытом или результатами предыдущих аналогичных исследований.

3. После определения числа групп рассчитывают группировочный интервал

, где

h – группировочный интервал,

K – число групп,

xmax, xmin – максимальное и минимальное значение признака совокупности.

Пример:

xmax = 1200, xmin = 200, K = 5

 
 


200 - 400

400 - 600

600 - 800 - 5 групп

800 – 1000

1000 – 1200

Интервал группировки, помимо равного, может быть:

- прогрессивно возрастающим;

- прогрессивно убывающим;

- специализированным.

Это зависит от характера группировочного признака, степени вариации, целей исследования.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: