При построении статистических группировок прежде всего, следует выбрать группировочный признак, затем определить число групп, на которые нужно разбить изучаемую совокупность, и зафиксировать границы интервалов группировки. В завершении необходимо для каждой группировки найти конкретные показатели или их систему, которые должны характеризовать выделенные группы.
Группировочный признак – это основание, по которому проводится разбивка единиц совокупности на отдельные группы.
В основании группировки могут быть положены как количественные, так и качественные (атрибутивные) признаки.
Количественные признаки обычно имеют числовое выражение (н -р: Объем выпускаемой продукции, возраст человека, доход семьи и т.д.)
Атрибутивные признаки дают качественную характеристику единицы совокупности (н-р: пол, семейное положение, форма собственности, отрасль).
Число групп зависит от задач исследования и вида показателя, положенного в основание группировки, от объема совокупности (числа единиц) исследуемого объекта, от вариативности группировочного признака. В каждом конкретном случае при определении числа групп следует исходить не только из степени вариации признака. Важно учитывать особенности объекта, цели и задачи исследования.
Для определения числа групп можно воспользоваться формулой Стерджесса:
n= 1+ 3,322 х lg N?
где n - число групп;
N – число единиц совокупности;
Lg N – десятичный логарифм от N.
После того, как установлено число групп, определяется интервал группировки.
Интервал группировки – это интервал значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы или одну из них.
Нижняя граница интервала – наименьшее значение признака в интервале.
Верхняя граница интервала - наибольшее значение признака в интервале.
Ширина интервала – разность между верхней и нижней границами.
Интервалы группировки в зависимости от ширины бывают равные и неравные.
Неравные делятся на:
- Прогрессивно убывающие
- Произвольные
- Специализированные.
При построении группировки с равными интервалами, величину равного интервала определяют по формуле:
R X max – X min
h = ------------- = -------------, где
n n
X max, X min – соответственно максимальное и минимальное значения признака в совокупности;
n – число групп.
h - Шаг интервала.
Интервалы группировок могут быть закрытыми, открытыми, произвольными.
Закрытыми – называют такие, в которых указана верхняя и нижняя границы.
Открытые интервалы имеют только одну границу (верхнюю – у первого, нижнюю – у последнего) н-р:(до 200, 200-300 …, 400 и более).
Произвольные – где интервалы не бывают ни прогрессивно - убывающими, ни прогрессивно – возрастающими (как правило, по уровню рентабельности, прибыльности).