Группировочный признак при анализе выбирается из условия выполнения цели группировки.
Так, если есть статистические данные о промышленных предприятиях отрасли, то можно в качестве группировочного признака выбрать такие величины:
· число рабочих на предприятии;
· число всех работающих;
· мощность энергоустановок;
· объем выпуска продукции;
· стоимость ОПФ и т.д.
Таким образом, по каждому из этих признаков, множество предприятий отрасли можно разбить на группы.
При построении интервальных группировок вопросы о числе групп и величине интервала в группе решаются на основе теоретического (качественного) анализа сущности изучаемого явления, цели исследования и характера изменения признака. Интервалы не должны быть слишком широкими, так как иначе в один интервал попадут качественно различные элементы. В то же время они не должны быть слишком узкими, так как в этом случае число единиц в группе может оказаться незначительным и характеристики группы не будут типичными.
|
|
При построении группировки с равными интервалами величину интервала групп определяют по формуле
,
где - максимальное значение признака в совокупности; - минимальное значение признака в совокупности; m - число групп (устанавливается исследователем).
При выборе числа групп необходимо учитывать следующее:
1) в каждую группу должно попасть достаточно большое число единиц;
2) число единиц в группах не должно резко отличаться друг от друга, то есть должно быть примерно одного порядка;
3) число групп должно быть 4 - 6 и зависит, как правило, от числа наблюдений.
Число групп может быть определено по формуле Стэрджесса:
,
где N – число единиц совокупности.
Группировки с неравными интервалами целесообразно применять в тех случаях, когда исходные статистические данные разнятся на весьма значительную величину, т.е. когда слишком велик размах вариации в исходной совокупности (в этом случае возникает проблема пустых групп).
Группировки с неравными интервалами подразделяют на:
1) группировки с прогрессивно возрастающими или убывающими интервалами (по арифметической либо геометрической прогрессии). Например, по численности работающих промышленные предприятия могут быть разбиты на следующие группы с арифметически возрастающими величинами интервалов: до 100 человек, 100-200, 200-300, 300-500, 500—1000, 1000 и более человек. Это объясняется тем, что изменение количества работающих на 50-100 человек имеет существенное значение для мелких предприятий, а для крупных — не имеет;
2) группировки с равнонаполненными группами (численность каждой группы примерно одна и та же). Равномерное распределение единиц совокупности по группам обеспечивает статистическую устойчивость характеристик, рассчитанных для отдельных групп.