Статистическая группировка

В результате статистических наблюдений собирается обширный числовой материал, который необходимо систематизировать, обобщить. Для этого проводят сводку, и как составную ее часть – группировку.

Эта работа состоит из трех этапов:

1. систематизация данных и их группировка

2. уточнение системы показателей

3. исчисление системы показателей и их уточнение Группировка решает три задачи:

- выделяет социально – экономические типы;


- изучает структуру однотипных совокупностей;

- находит и изучает существенные связи и зависимости между признаками, явлениями, исследованиями.

Задачи определяют три вида или типа группировки: а) типологическая

б) структурная

в) аналитическая

По степени сложности изучаемого явления и задач анализа, группировки могут быть простыми (по одному группировочному признаку) и сложными (по двум и более признакам). Группировочный признак – это признак, по которому единицы исследования объекта разбиваются на однородные группы.

Типологическая группировка – это группировка совокупности на классы, социально- экономические типы, однородные группы.

В зависимости от конкретных условий группировочные признаки должны видоизменятся, т. е. должны быть специализированы при выделении одного и того же типа в различных условиях. Так, например, в трудоемких отраслях в качестве группировочного признака целесообразно использовать численность работников; но для фондоемких отраслей – стоимость производственных фондов; для энергоемких – количество потребленной электроэнергии. Использование одного признака, характеризующего лишь одну сторону в развитии явления, может привести к искажению действительности группировки по качественным и количественным признакам.

Если признак количественный, то в типологической группировке число интервалов должно соответствовать числу предварительно намеченных частных совокупностей. Границы интервалов подбирают и устанавливают таким образом, что переход через них означает переход к иному типу.

Структурная группировка – расчленение однородных совокупных единиц по долям признака, выраженного в процентах.


Аналитическая группировка – как правило проводится по количественному показателю и позволяет установить связи и зависимости между явлениями и признаками.

В аналитической группировке 2 вида признаков:

1. Факторный – тот признак, который оказывает влияние на изменение других признаков.

2. Результативный – сам изменяется под влиянием факторных.

Аналитическая группировка устанавливает:

· наличие связей признаков;

· их направление;

· их достоверность;

Важным является определение интервала группировки. При группировке по количественному признаку число групп зависит от задачи исследования и колеблемости группированного признака.

Число групп может быть определено 2 способами:

1. Экспериментально-исследовательский;

2. Использованием формулы Стерджесса.


Х max- X min

i = =

1 + 3,322lg N


Х max- X min 1 + 1,44ln N


(1)


N – число единиц изучаемой совокупности

Хmax, Хmin - наибольшее и наименьшее значение группированного признака;

i – величина интервала группировки;

n – 1+3,322lg N – округленное до целого, дает число групп, N должно быть много больше 50; а группировочный признак должен подчиняться нормальному закону распределения.

Интервалы группировок бывают: равные, неравные; открытые и закрытые.

Например: 0-5 5-10 10-15………..95-100 - равный, закрытый.


неравный.


10-20 20-30 30-40 30-45 45-52 - закрытый,


до 10 10-15 15-28 свыше 28 - неравный, открытый.


Открытые интервалы могут быть только на концах. Независимо от вида, группировка не допускает групп, где число элементов равно 0 или 1.

Если при расчете имеются такие группы, то:

1. можно сделать открытый интервал в конце совокупности

2. отбросить единицы наблюдения, которые отличаются от основной массы.

В результате первичной группировки устанавливаются связи между различными показателями. Например, зависимость уровня рентабельности от производительности труда.

Предварительный анализ связей необходимо проверять на достоверность одним из критериев: Стьюдента (Госсет),

Фишера

(F -критерий), χ2 (хи) и т.д.

Рассмотрим на конкретном примере использование F - критерия

Задача: При подготовке механизаторов использовались две формы обучения в районе ПТУ и ученичество. В совокупности механизаторов из 100 человек была установлена производительность труда и число работников с такой производительностью.

Введем обозначение: хi– производительность труда;

fi - число механизаторов по всем видам производительности труда.

Таблица 1 - Анализ зависимости производительности труда от формы подготовки механизаторов в районе

Группы хi fi Xi*fi x-xобщ (х-хобщ)2*fi
  ПТУ       -5,5  
      -3,5 134,75
      -2,5 37,5
      -1,5 33,75
Итого и в среднем 10,5     Х Х
  Ученичество       0,4 2,72
      1,4 31,36
      2,4 80,64
      4,4 251,86
Итого и в среднем 15,5     Х Х


x = 420 = 10,5 ед / час

1 40


- средняя производительность при


подготовке в ПТУ;

x = 930 = 15,5 ед / час - средняя производительность при

2 60

подготовке ученичества;


хобщ =



= 13,5 ед / час.


Общую вариацию оценим через дисперсию:


Ơ2общ =


å (xi - хобщ) 2 * fi

å fi


= 803


= 8,03 ед / час


Общая дисперсия отражает вариацию производительности труда за счет фактора (способа обучения) и за счет случайных факторов, не учитываемых в анализе.

Вариация, обусловленная формой подготовки механизаторов будет отражена в факторной (межгрупповой) дисперсии.


2 м. г. =


S(X i - Xооб.)


* f i (погруппам) =


S f i

2 2

(10,5 - 13,5) * 40 + (15,5 - 13,5) * 60 = 6,0 ед / час

Остаточная дисперсия отражает долю вариации производительности труда за счет неучтенных факторов:

Ơ2ост = Ơ2общ - Ơ2мг.=8,03-6,0=2,03 ед/час


или Ơ2ост=


å  2


* fi 1


, где


å fi

Ơi2 – дисперсия, вычисленная внутри каждой группы


Ơ12 =


å (xi - x 1)

 
å fi 1


* fi 1


= 88


= 2,2 ед / час


2 = 115 = 1,9 ед / час

2 60


o 2 ост =


2,2 * 40 + +1,9 * 60

40 + 60


= 2,03 ед / час


Для характеристики достоверности влияния формы подготовки на производительность используют F - критерий. Введем понятие - число степеней свободы:

К1 = υ1 = m – 1 m = 2

число групп

К2 = υ2 = n – m n = 100

объем изучаемой совокупности υ1= межгрупповое число свободы

υ2= остаточное число степеней свободы


1. F =


У 2 * 2


1 - У 2 1


2.F =


 м. г. 2

*


 ост. 1

, где
2


3.F =


S факт.


S 2 остат.

Si – средняя дисперсия (т.е. приходящаяся на 1 степень свободы)

 м. г. = 2 - 1 = 1


тогда S2фак =


2 м. г.

=

o м. г.


6,0


= 6,0

2,03


o ост


= 100 - 2 = 98


тогда Sост =


9,8


» 0,0207


По таблицам Фишера находим критическое значение и сравниваем его с расчетным.


Строка определяет значение υост., а столбец υм.г, в нашем случае Fтабл=3,98.

Проблема оценки влияния анализируемого фактора на результат с помощью показаний тесноты связи:

2

У =  м. г.

o общ.

У – эмпирическое корреляционное отношение;

У2 – эмпирический коэффициент выражен в процентах. У=0,8644; У2=0,74742=74,72%

У – отражает силу связи;

У2 – показывает, что производительность труда на 74,72% зависит от способа подготовки и на 25,28% от неучтенных факторов.

Если 0 ≤ У ≤ 0,3 связь слабая;

0,3 ≤ У ≤ 0,7 средняя;

0,7 ≤ У ≤ 1 сильная. В нашем случае связь сильная.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: