Метод группировки

Группировка – это расчленение совокупности данных на группы с целью изучения структуры этой совокупности или взаимосвязей между ее компонентами. В процессе группировки единицы совокупности распределяются по группам в соответствии с избранным группировочным признаком по следующему принципу: различие между единицами, отнесенными к одной группе, должно быть меньше, чем различие между единицами, отнесенными к разным группам.

Технические проблемы при проведении такого рода исследования заключаются в определении количества групп и в выборе интервала группировки (интервалом называют диапазон значений, относимых в одну группу). Существуют два основных подхода к их решению.

Первый подход предполагает деление совокупности данных на группы с равными интервалами значений. Этот метод используется наиболее часто, так как он лишен субъективизма при выборе границ интервалов. При определении количества групп k и длины интервала i можно пользоваться формулой Стерджеса:

k = 1 + 3,32 lgN;

i = ,

где N – число наблюдений;

xmax – максимальное значение признака в совокупности;

xmin – минимальное значение признака в совокупности;

xmax – xminразмах вариации.

Одно из правил при составлении группировки состоит в следующем: не должно быть пустых или малозаполненных групп. Иными словами, формула Стерджеса дает лишь ориентировочные значения интервала группировки; при принятии окончательного решения, как правило, значения округляются или незначительно меняются.

Формула Стерджеса применяется, когда на параметры группировки не накладывается каких-либо ограничений. Возможен и вариант, когда аналитик задает количество групп. В этом случае длина интервала группировки определяется, исходя из заданного числа групп.

Согласно второму подходу, интервалы группировки можно выбрать и неравными (возрастающими или убывающими). Этот подход обычно применяется при большой неравномерности распределения признака по всему интервалу его изменения. При выборе размера интервала группировки руководствуются здравым смыслом и логикой, опираясь при этом на распределения прошлых периодов и традиционно сложившиеся подходы в группировке. При использовании этого подхода интервалы часто выбирают таким образом, чтобы группы были равнозаполненными.

Кроме того, должно быть задано правило, по которому однозначно можно было бы определить, в какую группу отнесены пограничные значения (в предыдущую или в следующую).

В общем случае процесс группировки данных включает несколько этапов:

– выбор группировочного признака (или признаков);

– упорядочивание совокупности данных по этому признаку;

– определение (тем или иным способом) количества групп;

– определение интервала группировки и границ групп;

– разнесение данных по группам;

– расчет среднего значения показателя в группе, расчет удельного веса групп и прочие способы работы с группировкой.

Если для группировки выбрано несколько группировочных признаков, описанный процесс повторяется по каждому признаку.

По степени сложности различают простые группировки (по одному признаку) и комбинированные (по двум и более признакам).

По содержанию различают типологические, структурные и аналитические группировки. В экономическом анализе используются в основном структурные и аналитические группировки.

Структурные группировки используются для изучения внутреннего строения совокупности, для определения соотношения между отдельными ее частями, для определения значимости отдельных составляющих и их вклада в общую совокупность. Структурная группировка оформляется, как правило, в виде таблицы, в подлежащем которой находится группировочный признак, а в сказуемом – показатели, характеризующие структуру совокупности. Такими показателями являются доли (или удельные веса) отдельных групп в общем объеме совокупности. Примером составления структурной группировки может служить, например, разбиение студентов курса на неуспевающих, троечников, хорошистов и отличников с определением процентного вклада каждой группы в общую численность студентов курса (табл. 4.13).

По результатам группировки видно, что отличники составляют меньшинство: удельный вес этой группы – наименьший по сравнению с остальными. На втором месте по процентному вкладу в общий итог – неуспевающие студенты. Хорошисты в структуре потока по успеваемости занимают третье место, а наиболее многочисленная группа – троечники: удельный вес этой группы – наибольший и составляет почти 45 % от общей численности. Таким образом, троечники – наиболее значимая группа студентов на данном потоке, именно она определяет «лицо» потока, на уровень этой группы вынуждены ориентироваться преподаватели в подаче учебного материала.

Таблица 4.13


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: