В результате статистических наблюдений собирается обширный числовой материал, который необходимо систематизировать, обобщить. Для этого проводят сводку, и как составную ее часть – группировку.
Эта работа состоит из трех этапов:
1. систематизация данных и их группировка
2. уточнение системы показателей
3. исчисление системы показателей и их уточнение Группировка решает три задачи:
- выделяет социально – экономические типы;
- изучает структуру однотипных совокупностей;
- находит и изучает существенные связи и зависимости между признаками, явлениями, исследованиями.
Задачи определяют три вида или типа группировки: а) типологическая
б) структурная
в) аналитическая
По степени сложности изучаемого явления и задач анализа, группировки могут быть простыми (по одному группировочному признаку) и сложными (по двум и более признакам). Группировочный признак – это признак, по которому единицы исследования объекта разбиваются на однородные группы.
Типологическая группировка – это группировка совокупности на классы, социально- экономические типы, однородные группы.
В зависимости от конкретных условий группировочные признаки должны видоизменятся, т. е. должны быть специализированы при выделении одного и того же типа в различных условиях. Так, например, в трудоемких отраслях в качестве группировочного признака целесообразно использовать численность работников; но для фондоемких отраслей – стоимость производственных фондов; для энергоемких – количество потребленной электроэнергии. Использование одного признака, характеризующего лишь одну сторону в развитии явления, может привести к искажению действительности группировки по качественным и количественным признакам.
Если признак количественный, то в типологической группировке число интервалов должно соответствовать числу предварительно намеченных частных совокупностей. Границы интервалов подбирают и устанавливают таким образом, что переход через них означает переход к иному типу.
Структурная группировка – расчленение однородных совокупных единиц по долям признака, выраженного в процентах.
Аналитическая группировка – как правило проводится по количественному показателю и позволяет установить связи и зависимости между явлениями и признаками.
В аналитической группировке 2 вида признаков:
1. Факторный – тот признак, который оказывает влияние на изменение других признаков.
2. Результативный – сам изменяется под влиянием факторных.
Аналитическая группировка устанавливает:
· наличие связей признаков;
· их направление;
· их достоверность;
Важным является определение интервала группировки. При группировке по количественному признаку число групп зависит от задачи исследования и колеблемости группированного признака.
Число групп может быть определено 2 способами:
1. Экспериментально-исследовательский;
2. Использованием формулы Стерджесса.
Х max- X min
i = =
1 + 3,322lg N
Х max- X min 1 + 1,44ln N
(1)
N – число единиц изучаемой совокупности
Хmax, Хmin - наибольшее и наименьшее значение группированного признака;
i – величина интервала группировки;
n – 1+3,322lg N – округленное до целого, дает число групп, N должно быть много больше 50; а группировочный признак должен подчиняться нормальному закону распределения.
Интервалы группировок бывают: равные, неравные; открытые и закрытые.
Например: 0-5 5-10 10-15………..95-100 - равный, закрытый.
неравный.
10-20 20-30 30-40 30-45 45-52 - закрытый,
до 10 10-15 15-28 свыше 28 - неравный, открытый.
Открытые интервалы могут быть только на концах. Независимо от вида, группировка не допускает групп, где число элементов равно 0 или 1.
Если при расчете имеются такие группы, то:
1. можно сделать открытый интервал в конце совокупности
2. отбросить единицы наблюдения, которые отличаются от основной массы.
В результате первичной группировки устанавливаются связи между различными показателями. Например, зависимость уровня рентабельности от производительности труда.
Предварительный анализ связей необходимо проверять на достоверность одним из критериев: Стьюдента (Госсет),
Фишера
(F -критерий), χ2 (хи) и т.д.
Рассмотрим на конкретном примере использование F - критерия
Задача: При подготовке механизаторов использовались две формы обучения в районе ПТУ и ученичество. В совокупности механизаторов из 100 человек была установлена производительность труда и число работников с такой производительностью.
Введем обозначение: хi– производительность труда;
fi - число механизаторов по всем видам производительности труда.
Таблица 1 - Анализ зависимости производительности труда от формы подготовки механизаторов в районе
Группы | хi | fi | Xi*fi | x-xобщ | (х-хобщ)2*fi |
ПТУ | -5,5 | ||||
-3,5 | 134,75 | ||||
-2,5 | 37,5 | ||||
-1,5 | 33,75 | ||||
Итого и в среднем | 10,5 | Х | Х | ||
Ученичество | 0,4 | 2,72 | |||
1,4 | 31,36 | ||||
2,4 | 80,64 | ||||
4,4 | 251,86 | ||||
Итого и в среднем | 15,5 | Х | Х |
x = 420 = 10,5 ед / час
1 40
- средняя производительность при
подготовке в ПТУ;
x = 930 = 15,5 ед / час - средняя производительность при
2 60
подготовке ученичества;
хобщ =
= 13,5 ед / час.
Общую вариацию оценим через дисперсию:
Ơ2общ =
å (xi - хобщ) 2 * fi
å fi
= 803
= 8,03 ед / час
Общая дисперсия отражает вариацию производительности труда за счет фактора (способа обучения) и за счет случайных факторов, не учитываемых в анализе.
Вариация, обусловленная формой подготовки механизаторов будет отражена в факторной (межгрупповой) дисперсии.
2 м. г. =
S(X i - Xооб.)
* f i (погруппам) =
S f i
2 2
(10,5 - 13,5) * 40 + (15,5 - 13,5) * 60 = 6,0 ед / час
Остаточная дисперсия отражает долю вариации производительности труда за счет неучтенных факторов:
Ơ2ост = Ơ2общ - Ơ2мг.=8,03-6,0=2,03 ед/час
или Ơ2ост=
å 2
* fi 1
, где
å fi
Ơi2 – дисперсия, вычисленная внутри каждой группы
Ơ12 =
å (xi - x 1)
* fi 1
= 88
= 2,2 ед / час
|
2 60
o 2 ост =
2,2 * 40 + +1,9 * 60
40 + 60
= 2,03 ед / час
Для характеристики достоверности влияния формы подготовки на производительность используют F - критерий. Введем понятие - число степеней свободы:
К1 = υ1 = m – 1 m = 2
число групп
К2 = υ2 = n – m n = 100
объем изучаемой совокупности υ1= межгрупповое число свободы
υ2= остаточное число степеней свободы
1. F =
У 2 * 2
1 - У 2 1
2.F =
м. г. 2
|
ост. 1
|
3.F =
S факт.
S 2 остат.
Si – средняя дисперсия (т.е. приходящаяся на 1 степень свободы)
м. г. = 2 - 1 = 1
тогда S2фак =
2 м. г.
=
o м. г.
6,0
= 6,0
2,03
o ост
= 100 - 2 = 98
тогда Sост =
9,8
» 0,0207
По таблицам Фишера находим критическое значение и сравниваем его с расчетным.
Строка определяет значение υост., а столбец υм.г, в нашем случае Fтабл=3,98.
Проблема оценки влияния анализируемого фактора на результат с помощью показаний тесноты связи:
2
У = м. г.
o общ.
У – эмпирическое корреляционное отношение;
У2 – эмпирический коэффициент выражен в процентах. У=0,8644; У2=0,74742=74,72%
У – отражает силу связи;
У2 – показывает, что производительность труда на 74,72% зависит от способа подготовки и на 25,28% от неучтенных факторов.
Если 0 ≤ У ≤ 0,3 связь слабая;
0,3 ≤ У ≤ 0,7 средняя;
0,7 ≤ У ≤ 1 сильная. В нашем случае связь сильная.