Сводка и группировка данных статистического наблюдения

Собранный в процессе статистического наблюдения материал представляет собой разрозненные первичные сведения об отдельных единицах изучаемого явления. В таком виде материал еще не характеризует явление в целом: не дает представление ни о величине (численности) явления, ни о его составе, ни о размере характерных признаков, ни о существе связей этого явления с другими явлениями и т.д. Указанные сведения нельзя получить непосредственно из наблюдения. Они могут быть выявлены лишь в процессе обработки материалов наблюдения. Началом такой обработки и служит сводка и группировка данных наблюдения.

Основным и важнейшим моментом сводки является группировка, т.е. расчленение статистической совокупности на группы и подгруппы по определенным существенным признакам. Выбор группировочного признака – один из самых сложных вопросов теории группировок. После выбора группировочного признака определяется число групп, если оно не указано в условии задания. Определяя число групп, нужно иметь в виду, что в каждую группу должно попасть такое число единиц совокупности, на основании которого можно делать обоснованные выводы.

В результате группировки единиц совокупности по какому-либо варьирующему признаку получают ряды распределения.

Статистическим рядом распределения называют упорядоченное распределение единиц совокупности на группы по изучаемому признаку. В нем различают следующие элементы: варианты () и частоты () или частости ().

Вариантами называют отдельные значения группировочного признака, которые он принимает в ряду распределения. Числа, которые показывают сколько раз (как часто) встречается в ряду распределения то или иное значение варианты, называют частотами. Частость – это относительный показатель структуры совокупности, т.е. он характеризует долю частот отдельных вариант в общей сумме частот. Сумма всех частостей равна единице. Частости могут выражаться и в процентах, тогда сумма всех частостей равна 100 %.

Ряды распределения могут быть построены как по количественному признаку, так и по атрибутивному (не имеющего количественного значения: профессия, пол, отрасль и т.д.). В соответствии с этим ряды делятся на вариационные и атрибутивные. Вариационные ряды могут быть дискретными и интервальными.

Дискретный ряд распределения – это ряд, в котором варианты выражены одним конечным числом (например, группировка рабочих по разряду).

Интервальный ряд – это ряд, в котором значения признака выражены в виде интервала (например, группировка рабочих по уровню заработной платы, стажа).

Интервалом называется разность между максимальным и минимальным значением признака в каждой группе. Причем, интервалы бывают равные (если совокупность более или менее однородная), неравные (если разброс значений признака в совокупности большой), открытые (если нет начального или конечного значения признака в первой или последней группах) и закрытые.

Если строится интервальный ряд с равными интервалами и количество групп оговаривается исследованием, то величина интервала определяется следующим образом:

,

где - величина интервала;

- максимальное значение признака в совокупности;

- минимальное значение признака;

- количество принятых групп.

Если принимаются неравные интервалы, то следует, чтобы частоты по группам распределялись более менее равномерно.

Результаты группировки оформляются в виде статистической таблицы. Надо уметь правильно построить таблицу и проанализировать ее содержание.

При группировке по одному признаку строятся так называемые групповые таблицы (простой ряд распределения), а при группировке по нескольким признакам – комбинационные таблицы (комбинационное распределение).

Например, группировку рабочих по разряду можно представить в виде следующей таблицы:

Группировка рабочих по разряду () Число рабочих ()
   
   
   
   
   
   
Итого:  

Группировку рабочих по заработной плате и разряду можно показать с помощью комбинационного распределения:

Группировка рабочих по зарплате, у.е.   500-   520-   540-   560-   580-   Итого
Группировка рабочих по разряду            
             
             
             
             
             
             
Итого:            

Причем, при построении комбинационного распределения следует количество групп по факториальному признаку брать больше, чем по результативному признаку.




double arrow
Сейчас читают про: