Собранный в процессе статистического наблюдения материал нуждается в определенной обработке, сведении разрозненных данных воедино. Научно организованная обработка материалов наблюдения (по заранее разработанной программе), включающая кроме обязательного контроля собранных данных систематизацию, группировку материалов, составление таблиц, получение итогов и производственных показателей (средних, относительных величин), называется в статистике сводкой.
Группировка – это разбиение совокупности на группы, однородные по какому-либо признаку. С точки зрения отдельных единиц совокупности группировка – это объединение отдельных единиц совокупности в группы, однородные по каким-либо признакам.
По очередности обработки информации группировки бывают первичные (составленные на основе первичных данных) и вторичные, являющиеся результатом перегруппировки ранее уже сгруппированного материала.
Построение первичной группировки начинается с определения состава группировочных признаков. Далее решается вопрос о количестве групп, на которое необходимо разбить исследуемую совокупность. Число групп зависит от задач исследования и вида показателя, положенного в основу группировки, численности совокупности, степени вариации признака.
Определить число групп можно математическим способом с помощью формулы Стерджесса:
m = 1 + 3,322 * lg N
где m – число групп;
N – число единиц совокупности.
Однако данная формула дает хорошие результаты, если совокупность состоит из большого числа единиц и распределение единиц по признаку, положенному в основу группировки, близко к нормальному закону.
Далее определяется интервал – значение варьирующего признака, лежащее в определенных границах (интервал имеет верхнюю и нижнюю границы). Величина равного интервала находится по формуле:
где Xmax и Xmin – максимальное и минимальное значение признака.
Затем определяются границы интервалов в группах, производится отбор признаков для характеристики групп, как правило обязательным признаком является численность групп. Далее приступают к процессу группировки.
Рассмотрим пример решения задачи:
Пример 1. Произвести анализ 30 самых надежных среди малых и средних коммерческих банков одного из регионов (на 01.01.09 г.), применяя метод группировок.
Таб. 1 Основные показатели деятельности коммерческих банков
одного из регионов на 01.01.09 (цифры условные) (тыс. руб.)
№ банка | Капитал | Работающие активы | Уставной капитал |
20 710 | 11 706 | 2 351(1) | |
19 942 | 19 850 | 17 469 (3) | |
9 273 | 2 556 | 2 626 (1) | |
59 256 | 43 587 | 2 100 (1) | |
24 654 | 29 007 | 23 100 (4) | |
47 719 | 98 468 | 18 684 (4) | |
24 236 | 25 595 | 5 265 (1) | |
7 782 | 6 154 | 2 227 (1) | |
38 290 | 79 794 | 6 799 (1) | |
10 276 | 10 099 | 3 484 (1) | |
35 662 | 30 005 | 13 594 (3) | |
20 702 | 21 165 | 8 973 (2) | |
8 153 | 16 663 | 2 245 (1) | |
10 215 | 9 115 | 9 063 (2) | |
23 459 | 31 717 | 3 572 (1) | |
55 848 | 54 435 | 7 401 (2) | |
10 344 | 21 430 | 4 266 (1) | |
16 651 | 41 119 | 5 121 (1) | |
15 762 | 29 771 | 9 998 (2) | |
6 753 | 10 857 | 2 973 (1) | |
22 421 | 53 445 | 3 415 (1) | |
13 614 | 22 625 | 4 778 (1) | |
9 870 | 11 744 | 5 029 (1) | |
24 019 | 27 333 | 6 110 (1) | |
22 969 | 70 229 | 5 961 (1) | |
75 076 | 124 204 | 17 218 (3) | |
56 200 | 90 367 | 20 454 (4) | |
60 653 | 101 714 | 10 700 (2) | |
14 813 | 18 245 | 2 950 (1) | |
41 514 | 127 732 | 12 092 (2) |
Решение:
В качестве группировочного признака возьмем уставный капитал (так как именно он характеризует размер банка). Образуем четыре группы банков с равными интервалами.
Величину интервала определим по формуле:
Определим границы групп: 1 группа: 2100 – 7350 (2100+5250)
2 группа: 7350 – 12600 (7350+5250)
3 группа: 12600 – 17850 (12600+5250)
4 группа: 17850 – 23100(17850+5250).
После того, как определен группировочный признак – уставный капитал, задано число групп – 4 и определены границы самих групп необходимо отобрать показатели, которые будут характеризовать группы, и определить их величины по каждой группе. В нашем случае показателями, характеризующими банки, являются - работающие активы, капитал, уставной капитал.
Далее необходимо определить номер группы для каждого банка (проставим номер группы рядом с уставным капиталом каждого банка – смотри таб.1 в графе «уставной капитал» цифры в скобках). Теперь посчитаем количество банков в каждой группе и занесем в составленную таблицу (см. таб. 2).
Показатели, характеризующие банки разносятся по указанным группам и подсчитываются итоги по каждой из них. Результаты заносятся в таблицу и определяются общие итоги по совокупности единиц наблюдения по каждому показателю.
Таб. 2 Группировка банков по величине уставного капитала
№ | Группы по величине уставного капитала, тыс. руб. | Количество банков | Работающие активы, тыс. руб. | Капитал, тыс. руб. | Уставной капитал, тыс. руб. |
2100 – 7350 | 504 898 | 342 889 | 71 272 | ||
7350 – 12600 | 343 932 | 204 694 | 58 227 | ||
12600 – 17850 | 174 059 | 130 680 | 48 281 | ||
17850 - 23100 | 217 842 | 128 573 | 62 238 | ||
Итого | 1 240 731 | 806 836 | 240 018 |
Вывод: Построив типологическую группировку, по ее результатам можно сделать вывод, что наибольшее число банков в совокупности – восемнадцать из тридцати, имеют уставной капитал менее 7350 тыс. руб. В третьей и четвертой группах с наибольшим размером уставного капитала равное количество банков и т.д.
Теперь построим структурную группировку:
Используя данные таб.2 и формулу относительного показателя структуры:
для каждой группы из табл.2 определим ОПС, т.е. показатели структуры.
Например: найдем долю банков 1-ой группы в совокупности. Для этого делим количество банков первой группы на общее количество банков в совокупности: 18/30=0,6*100%=60% - доля банков первой группы составляет 60 % от общего объема совокупности. Далее аналогично находим долю банков 2-ой группы: 6/30=0,2*100%=20% - доля банков второй группы составляет 20% от общего объема совокупности и далее аналогично расчитываем все остальные показатели. Результаты расчетов представляем в табл.3
Таб. 3 Структурная группировка
№ | Группы по величине уставного капитала, тыс. руб. | Количество банков, % | Работающие активы, % | Капитал, % | Уставной капитал, % |
2100 – 7350 | 40,7 | 42,5 | 29,7 | ||
7350 – 12600 | 27,7 | 25,4 | 24,3 | ||
12600 – 17850 | 14,0 | 16,2 | 20,1 | ||
17850 - 23100 | 17,6 | 15,9 | 25,9 | ||
Итого | 100,0 | 100,0 | 100,0 |
Вывод: из таблицы видно, что в основном преобладают малые банки – 60 %, на долю которых приходится 42,5 % всего капитала и т.д.
Более конкретный анализ взаимосвязи показателей можно сделать на основании аналитической группировки.
Для этого определим среднее значение показателей работающих активов и капитала на 1 банк в каждой группе:
Показатель, характеризующий конкретную группу делим на количество банков в группе. Например: если взять первую группу – работающие активы в целом по группе составляют 504 898 тыс. руб. Делим это значение на количество банков первой группы – на 18. Получаем: 504 898:18 = 28 050 тыс. руб. – получили показатель работающих активов в среднем на один банк по первой группе. И так далее…
Построим аналитическую группировку:
Табл. 4 Аналитическая группировка
№ | Группы по величине уставного капитала, тыс. руб. | Количество банков | Работающие активы, тыс. руб. | Капитал, тыс. руб. | ||
всего | В среднем на 1 банк | всего | В среднем на 1 банк | |||
2100 – 7350 | 504 898 | 28 050 | 342 889 | 19 049 | ||
7350 – 12600 | 343 932 | 57 322 | 204 694 | 34 116 | ||
12600 – 17850 | 174 059 | 58 020 | 130 680 | 43 560 | ||
17850 - 23100 | 217 842 | 72 614 | 128 573 | 42 858 | ||
Итого | 1 240 731 | - | 806 836 | - | ||
В среднем на 1 банк | - | - | 41 358 | - | 26 895 |
Вывод: из полученных показателей видим, что величины капитала и работающих активов прямо взаимозависимы, т.е. чем крупнее банк, тем эффективнее управление работающими активами, тем больше его капитал.
Вторичная группировка – операция по образованию новых групп на основе ранее осуществленной группировки.
Применяют два способа образования новых групп. Первым, наиболее простым и распространенным способом является изменение (чаще укрупнение) первоначальных интервалов.
Второй способ получил название долевой перегруппировки и состоит в образовании новых групп на основе закрепления за каждой группой определенной доли единиц совокупности.
Пример 2. Пусть необходимо построить вторичную группировку, произведя перегруппировку данных, образовав новые группы с интервалами до 500 руб., 500 – 1000 руб., 1000 – 2000 руб., 2000 – 3000 руб., 3000 руб. и более по данным о распределении персонала строительной фирмы по уровню дохода.
Таб. 5 Распределение работников строительной
фирмы по уровню дохода (данные условные)
№ группы | Группы работников по уровню дохода, руб. | Число работников, чел. |
До 400 | ||
400 – 1000 | ||
1000 – 1800 | ||
1800 – 3000 | ||
3000 – 4000 | ||
4000 и более | ||
Итого |
Решение:
Проведем перегруппировку в соответствии с заданными интервалами и составим таблицу после перегруппировки:
Табл. 6
№ группы | Группы работников по уровню дохода, руб. | Число работников, чел. |
До 500 | ||
500 – 1000 | ||
1000 – 2000 | ||
2000 – 3000 | ||
3000 и более | ||
Итого |
В первую новую группу войдет полостью первая группа сотрудников и часть второй группы. Чтобы образовать группу до 500 руб. необходимо от интервала второй группы взять 100 руб. Величина интервала этой группы составит 600 руб. Следовательно, необходимо взять от нее 1/6 (100:600) часть.
Аналогичную же часть во вновь образуемую новую группу надо взять и от численности работников, т.е. 20*1/6 = 3 человека. Тогда в первую группу попадут 16 + 3 = 19 человек.
Вторую новую группу образуют работники второй группы за вычетом отнесенных к первой группе: 20 – 3 = 17 человек.
Во вновь образованную третью группу войдут все работники третьей группы и часть работников четвертой. Для определения этой части от интервала 1800÷3000 (ширина интервала равна 1200 руб.) нужно добавить к предыдущему 200 руб.(чтобы верхняя граница интервала была равна 2000 руб.). Следовательно, необходимо взять часть интервала равную 200:1200, т.е. 1/6 часть. В этой группе 74 человека значит, надо взять 74*1/6 = 12 человек. В третью новую группу войдет 44+12=56 человек.
Во вновь образованную четвертую группу войдет 74 – 12=62 человека, оставшихся от прежней четвертой группы.
Пятую, вновь образованную группу составят работающие пятой и шестой прежних групп: 37 +9 =46 человек.
Полученные данные по результатам перегруппировки внесем в таблицу:
Табл. 7 Вторичная группировка работников
строительной фирмы по уровню дохода
№ группы | Группы работников по уровню дохода, руб. | Число работников, чел. |
До 500 | 16 + 3=19 | |
500 – 1000 | 20 – 3 =17 | |
1000 – 2000 | 44 + 12=56 | |
2000 – 3000 | 74 – 12=62 | |
3000 и более | 37 + 9=46 | |
Итого |
Задачи для самостоятельного решения:
Задача 1.
По представленным в таблице основным показателям деятельности крупнейших банков одной из областей России (данные условные), постройте группировку коммерческих банков по величине собственного капитала, выделив четыре группы с равными интервалами. Рассчитайте по каждой группе сумму активов, собственный капитал, привлеченные ресурсы, балансовую прибыль. Результаты группировки представьте в табличной форме и сформулируйте выводы (тыс. руб.).
№ | Сумма активов | Собствен-ный капитал | Привлечен-ные ресурсы | Балансо-вая прибыль | Объем вложений в гос. ценные бумаги | Ссудная задолжен-ность |
654,6 | 12,0 | 27,1 | 8,1 | 3,5 | 30,8 | |
636,9 | 70,4 | 56,3 | 9,5 | 12,6 | 25,7 | |
629,0 | 41,0 | 95,7 | 38,4 | 13,3 | 26,4 | |
619,6 | 120,8 | 44,8 | 38,4 | 4,4 | 25,3 | |
616,4 | 49,4 | 108,7 | 13,4 | 15,0 | 20,9 | |
614,4 | 50,3 | 108,1 | 30,1 | 19,1 | 47,3 | |
608,6 | 70,0 | 76,1 | 37,8 | 19,2 | 43,7 | |
601,1 | 52,4 | 26,3 | 41,1 | 3,7 | 29,1 | |
600,2 | 42,0 | 46,0 | 9,3 | 5,2 | 56,1 | |
600,0 | 27,3 | 24,4 | 39,3 | 13,1 | 24,9 | |
592,9 | 72,0 | 65,5 | 8,6 | 16,7 | 39,6 | |
591,7 | 22,4 | 76,0 | 40,5 | 7,5 | 59,6 | |
585,5 | 39,3 | 106,9 | 45,3 | 6,7 | 44,9 | |
578,6 | 70,0 | 89,5 | 8,4 | 11,2 | 32,2 | |
577,5 | 22,9 | 84,0 | 12,8 | 19,3 | 45,1 | |
553,7 | 119,3 | 89,4 | 44,7 | 19,4 | 24,5 | |
543,6 | 49,6 | 93,8 | 8,8 | 5,7 | 31,1 | |
542,0 | 88,6 | 26,7 | 32,2 | 7,8 | 37,1 | |
517,0 | 43,7 | 108,1 | 20,3 | 8,3 | 23,1 | |
516,7 | 90,5 | 25,2 | 12,2 | 9,7 | 15,8 |
Задача 2.
Постройте структурную группировку банков по величине балансовой прибыли для характеристики структуры совокупности коммерческих банков, перечисленных в задаче 1.
Задача 3.
Постройте аналитическую группировку коммерческих банков, перечисленных в задании 1, по величине балансовой прибыли, выделив пять групп. Рассчитайте по каждой группе два-три показателя, взаимосвязанных с балансовой прибылью. Результаты группировки изложите в табличной форме и сделайте выводы о взаимосвязи показателей.
Задача 4.
Постройте комбинационную группировку коммерческих банков, перечисленных в задании 1, …
Задача 5.
Определите виды рядов распределения постройте их графики:
А) Распределение студентов факультета по полу
Группы студентов по полу | Число студентов, чел. | Удельный вес в общей численности студентов, % |
Женщины | 83,3 | |
Мужчины | 16,7 | |
Всего | 100,0 |
Б) Распределение семей города по числу детей
Число детей в семье, чел. | Число семей, ед. | Удельный вес, % к итогу |
60,0 | ||
30,0 | ||
10,0 | ||
Итого | 100,0 |
В) Распределение работников строительной фирмы по уровню дохода в январе 2010 г.
Группы работников, по уровню дохода, руб. | Число работников, чел. | Удельный вес, % к итогу |
До 15 000 | 52,2 | |
15 000 – 17 500 | 26,1 | |
17 500 – 20 000 | 13,0 | |
20 000 и более | 8,7 | |
Итого | 100,0 |
Задача 6.
Имеются следующие данные о распределении промышленных предприятий 2 регионов по численности занятого на них промышленно-производственного персонала (ППП):
Регион 1 | Регион 2 | ||||
Группы предприятий по численности работающих, Чел | Число предпри-ятий, % | Чис лен-ность ППП, % | Группы предприятий по численности работающих, чел. | Число предприятий, % | Числен-ность ППП, % |
До 100 | До 300 | ||||
101-500 | 301-600 | ||||
501-1000 | 601-1000 | ||||
1001-2000 | 1001-2000 | ||||
2001-5000 | 2001-4000 | ||||
5001-10000 | 4001-10000 | ||||
Итого | Итого |
Постройте вторичную группировку данных о распределении предприятий, пересчитав данные:
1) региона 2 в соответствии с группировкой региона 1;
2) региона 1 в соответствии с группировкой региона 2;
3) регионов 1 и 2, образовав следующие группы предприятий по численности ППП: до 500, 501-1000, 1001-2000, 2001-3000, 3001-4000, 4001-5000, 5001-10000.
Задача 7.
Известны следующие данные о результатах сдачи абитуриентами ЕГЭ:
Постройте: 1) ряд распределения абитуриентов по результатам сдачи ими ЕГЭ, выделив 4 группы с равными интервалами; 2) ряд, делящий абитуриентов на поступивших и не поступивших в ВУЗ, учитывая, что проходной балл составил 150 баллов; 3) укажите, каким видом ряда распределения является каждый из них; 4) укажите, по какому группировочному признаку построен каждый из этих рядов.
Задача 8.
Имеются следующие данные об успеваемости 20 студентов группы по теории статистики в летнюю сессию: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3, 3. Постройте:
1) ряд распределения студентов по баллам оценок, полученным в сессию;
2) ряд распределения студентов по уровню успеваемости, выделив в нем 2 группы: неуспевающие (2 балла) и успевающие (3 балла и выше);
3) укажите, каким видом ряда распределения является каждый из них.