На втором этапестатистического исследования первичные данные, собранные в процессе статистического наблюдения, систематизируют и получают сводные характеристики объекта в целом при помощи обобщающих показателей. Этот процесс называют сводкой.
По глубине и точности обработки материала различают сводку простую и сложную. Простая сводка – это операция по подсчету общих итогов по совокупности наблюдаемых элементов. Например, для получения общей численности студентов вузов России достаточно сложить данные о численности студентов всех вузов. Сложная сводка – это комплекс операций, включающих группировку наблюдаемых элементов, подсчет итогов по каждой группе и по всему объекту и представление результатов в виде статистических таблиц.
Важнейшим элементом сводки является группировка – расчленение элементов совокупности на однородные по определенным признакам группы.
Признак,на основе которого осуществляется группировка,называется группировочным или основанием группировки. Группировка, выполняемая по одному признаку, называется простой, а по нескольким признакам – сложной или комбинированной. Группировочные признаки бывают атрибутивными и количественными. Атрибутивные признаки регистрируются в виде текстовой записи, например, профессия рабочих, социальная группа населения. Количественные признаки имеют цифровое выражение (размер дохода, стаж работы).
|
|
При группировке по атрибутивному признакучисло групп определяется количеством соответствующих наименований. Для обоснованного объединения их в группы разрабатывается классификация. Например, классификация отраслей экономики, автотранспортных предприятий по целевому назначению (грузовые, автобусные, таксомоторные и др.).
При группировке по количественному признакучисло групп определяется в зависимости от характера изменения признака и задач исследования. Если количественный признак меняется дискретно, то число групп должно соответствовать количеству значений признака. При непрерывномизменении признака ограничиваются его значениями в интервале. Интервал – эторазница между максимальным и минимальным значениями признака в группе. Используются три вида интервалов: равные, неравные и специализированные.
Равныеинтервалы в группировке используются тогда, когда изменение количественного признака внутри совокупности происходит равномерно. Величина равного интервала исчисляется по формуле:
(1.1)
где наибольшее и наименьшее значения признака в изучаемой совокупности,
– число групп, величину интервала округляют до целого (всегда большего) числа.
|
|
Для подсчета числа групп используется формула Стерджесса:
, (1.2)
где – число элементов (объём) совокупности.
Неравныеинтервалы применяются в случае неравномерной вариации значений признака. Величины интервалов могут меняться по арифметической или геометрической прогрессии.
В случае, когда изменение количественного признака приводит к появлению нового качества, граница интервала должна устанавливаться там, где происходит переход от одного качества в другое. Это достигается использованием специализированных интервалов.
Интервалы группировок могут быть закрытыми и открытыми. Закрытыми называются интервалы, у которых имеются верхняя и нижняя границы. Открытые интервалы имеют только одну границу – верхнюю или нижнюю. Например, интервалы: до 35, 35 – 45, 45 и более.