1. Выбор группировочного признака – признака, по которому производится разбиение совокупности на отдельные группы. В качестве признака необходимо использовать существенные обоснованные признаки. Группировочный признак – это основание (свойство объекта) для разделения объектов на группы.
Признаки различаются:
· по форме выражения (атрибутивные и количественные);
· по характеру колебания (альтернативные «да», «нет»; множественные);
· по роли во взаимосвязи явлений (результативные – могут меняться в зависимости от ситуации и целей анализа; факторные – воздействующие на другие признаки).
2. Определение количества групп. Если в основание группировки положен атрибутивный признак, то количество групп будет столько, сколько существует градаций (уровней) данного признака. Если основание группировки – количественный признак, то при определении количества групп в каждом конкретном случае следует исходить не только из степени колеблемости признака, но и из особенностей объекта и цели исследования.
Если совокупность состоит из большого числа единиц и распределение единиц по группировочному признаку близко к нормальному, для определения количества групп (m) используют формулу Стерджесса:
m = 1+3,322·lg N, (2.1)
где N – численность единиц совокупности.
Таблица 2.4 - Номограмма по формуле Стерджесса
N | 15¸24 | 25¸44 | 45¸89 | 90¸179 | 180¸359 | 360¸719 | 720¸1489 |
m |
3. Определение интервала группировки. Интервал – это значение варьирующего признака, лежащее в определенных границах.
Если вариация признака происходит в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами:
, (2.2)
где h – величина интервала;
xmax, xmin – максимальное и минимальное значения группировочного признака в совокупности;
m – число групп.
Величина интервала округляется до ближайшего целого числа, или же кратного 10, 50, 100.
Возможны и другие варианты определения интервала группировки.
Интервалы могут быть двух видов:
· закрытыми, когда у интервала указаны обе границы;
· открытыми, когда у первого интервала указана верхняя граница, а у последнего – нижняя (например, в таблице 2.3, 1-я группа населения по размеру среднедушевого дохода – до 1000 руб.; последняя – 10000 и более).
Возможно построение вторичных группировок. Основные задачи, вторичной группировки:
· приведение данных к сопоставимым результатам;
· укрупнение интервалов;
· долевая перегруппировка (образование новых групп с меньшими интервалами).