Влияние некоторых факторов, определяющих вариацию признаков, можно установить с помощью группировок, образовав более однородные совокупности единиц наблюдения с меньшей вариацией.
Сила влияния группировочного фактора оценивается на основе сравнения дисперсий результативного признака в выделенных группах и общей дисперсией, вычисленной до группировки.
Если исследуемую совокупность разделить на группы по факторному признаку, то для этих групп рассчитываются такие виды дисперсий: общая, межгрупповая и внутригрупповая.
Дисперсионный анализ групп включает:
1. Вычисление общей дисперсии результативного признака до группировки.
;
.
2. Разделение единиц наблюдения исследуемой совокупности на группы i=1,2…n по факторному признаку.
3. Вычисление средних и дисперсий в каждой группе:
;
.
4. Вычисление межгрупповой дисперсии:
.
Межгрупповая дисперсия отражает вариацию, возникающую под влиянием факторного признака, положенного в основу группировки. Она характеризует колеблемость групповых средних относительно общей средней.
5. Вычисление внутригрупповой дисперсии (средней величины групповых дисперсий):
.
Внутригрупповая дисперсия характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием не учитываемых факторов и не зависит от признака, положенного в основу группировки.
6. Контрольная проверка:
– правило сложения дисперсий
7. Анализ качества группировок
и
.
В этом случае фактор, положенный в основу группировки, выбран правильно, вариация результативного признака в группах существенно уменьшилась.
8. Корреляционное отношение показывает тесноту связи между факторным и результативным признаками.

При качественной группировке
, т.к.
.
при
имеет место очень сильное влияние группировочного признака;
при
имеет место сильное влияние;
при
имеет место слабое влияние;
при
влияние отсутствует.
Пример. Распределение численности по уровню ЗП в цехе № 1
| Дневная ЗП рабочих, д.ед. | число рабочих цеха №1, чел. (f1j) | xj, д.ед. | xj*f1j |
|
| 8-10 | 2 | 9 | 18 | 91,13 |
| 10-12 | 3 | 11 | 33 | 67,69 |
| 12-14 | 5 | 13 | 65 | 37,81 |
| 14-16 | 11 | 15 | 165 | 6,19 |
| 16-18 | 10 | 17 | 170 | 15,63 |
| 18-20 | 5 | 19 | 95 | 52,81 |
| 20-22 | 4 | 21 | 84 | 110,25 |
| Итого | 40 | - | 630 | 381,5 |
1) средняя ЗП в цехе №1:
д.ед.
2) групповая дисперсия в цехе №1:

Распределение численности по уровню ЗП в цехе № 2
| Дневная ЗП рабочих, д.ед. | число рабочих цеха №2, чел. (f2j) | xj, д.ед. | xj*f2j |
|
| 8-10 | 6 | 9 | 54 | 158,69 |
| 10-12 | 5 | 11 | 55 | 49,39 |
| 12-14 | 6 | 13 | 78 | 7,84 |
| 14-16 | 9 | 15 | 135 | 6,61 |
| 16-18 | 3 | 17 | 51 | 24,49 |
| 18-20 | 2 | 19 | 38 | 47,18 |
| 20-22 | 4 | 21 | 84 | 188,08 |
| Итого | 35 | - | 495 | 482,29 |
3) средняя ЗП в цехе №2:
д.ед.
4) групповая дисперсия в цехе №2:

Распределение численности по уровню ЗП на предприятии
| Дневная ЗП рабочих, д.ед. | общее число рабочих, чел. (fj общ) | xj, д.ед. | xj*fj общ |
|
| 8-10 | 8 | 9 | 72 | 288,00 |
| 10-12 | 8 | 11 | 88 | 128,00 |
| 12-14 | 11 | 13 | 143 | 44,00 |
| 14-16 | 20 | 15 | 300 | 0,00 |
| 16-18 | 13 | 17 | 221 | 52,00 |
| 18-20 | 7 | 19 | 133 | 112,00 |
| 20-22 | 8 | 21 | 168 | 288,00 |
| Итого | 75 | - | 1125 | 912,00 |
5) общая средняя ЗП:
д.ед.
6) общая дисперсия:

7) средняя групповых дисперсий: 
8) межгрупповая дисперсия:
.
9) Правило сложения дисперсий: 
10) Корреляционное отношение: 
– влияние факторного признака отсутствует.
Тема 5. Выборочное наблюдение в статистике
Выборочное наблюдение – основной вид не сплошного наблюдения. При выборочном наблюдении характеристика всей совокупности единиц даётся по некоторой их части, отобранной в случайном порядке.
Область применения:
- аудиторские проверки первичных финансовых документов;
- контроль качества продукции;
- изучение использования рабочего времени, работы оборудования.
Метод выборочного наблюдения имеет как преимущества, так и недостатки.
Преимущества:
- быстрота осуществления при небольших затратах;
- достаточная представительность (репрезентативность) при соблюдении определенных требований.
Недостатки:
- возможность возникновения трудно установимой ошибки;
- недостаточная надёжность метода.
Способ устранения ошибок – дублирование наблюдений.
Основные понятия выборочного наблюдения:
Вся совокупность изучаемых единиц N является генеральной совокупностью.
В выборочную совокупность отбирают n единиц.
Доля выборки - n/N (при
=0,1 имеем выборку 10%)
При обследовании единиц генеральной совокупности выборочным методом обычно решаются задачи:
1) охарактеризовать среднее значение наблюдаемого признака в генеральной совокупности;
2) охарактеризовать долю единиц, обладающих некоторым признаком А в генеральной совокупности;
3) определить необходимую численность выборочной совокупности.
Задача 1. Охарактеризовать среднее значение наблюдаемого признака в генеральной совокупности
Уровень изучаемого признака генеральной совокупности определяется генеральной средней
. По результатам обработки выборочного статистического ряда получают выборочную среднюю
.
Мерой соответствия
и
является ошибка выборочной средней по отношению к генеральной средней:
или
.
Предельная ошибка выборочной средней:

t = 1 при Р(t) = 0,683;
t = 2 при Р(t) = 0,954;
t = 3 при Р(t) = 0,997.
Простая ошибка выборочной средней зависит от способа отбора единиц в выборочную совокупность (повторный или бесповторный).
Повторный отбор – единица после регистрации возвращается в генеральную совокупность и в результате случайного отбора может быть обследована вновь.
Бесповторный отбор – единица после регистрации не возвращается в генеральную совокупность.
1) при повторном отборе
,
2) при бесповторном отборе
.
Задача 2. Охарактеризовать долю единиц, обладающих некоторым признаком А в генеральной совокупности
Доля единиц, обладающих некоторым признаком A, в генеральнойсовокупности называется генеральной долей
.
Доля единиц, обладающих некоторым признаком А, в выборочной совокупности называется выборочной долей
.
Мерой соответствия
и р является ошибка доли выборки по отношению к доле в генеральной совокупности
.
Предельная ошибка 
Простая ошибка доли выборки:
1) при повторном отборе
,
2) при бесповторном отборе
.
где
– доля единиц, не обладающих признаком А;
– дисперсия альтернативного признака.
Задача 3. Определить необходимую численность выборочной совокупности
Задано 
Принимается постоянной
.
Определить n необх
1) при определении генеральной средней.
Бесповторный отбор:
; Повторный отбор:
;
2)при определении генеральной доли.
Бесповторный отбор:
Повторный отбор:
;
Пример:
Дано распределение работников предприятия по уровню ЗП по данным 10%-го случайного бесповторного выборочного обследования
| ЗП, д.ед. | Число рабочих, чел. |
| 100-120 | 18 |
| 120-140 | 11 |
| 140-160 | 18 |
| 160-180 | 24 |
| 180-200 | 15 |
| 200-220 | 14 |
| Итого: | 100 |
![]() |
Рис. Гистограмма распределения работников предприятия по уровню заработной платы
1) определить размер средней ЗП предприятия (с вероятностью 0,683)


Расчетная таблица для определения дисперсии
| хj | fj | |xj-xcp| | (xj-xcp)2 | (xj-xcp)2*fj |
| 110 | 18 | 49,8 | 2480,04 | 44640,72 |
| 130 | 11 | 29,8 | 888,04 | 9768,44 |
| 150 | 18 | 9,8 | 96,04 | 1728,72 |
| 170 | 24 | 10,2 | 104,04 | 2496,96 |
| 190 | 15 | 30,2 | 912,04 | 13680,6 |
| 210 | 14 | 50,2 | 2520,04 | 35280,56 |
| Итого: | 100 | 107596 |

Доверительный интервал генеральной средней:

2) Определить долю рабочих, имеющих ЗП на уровне средней и выше (с вероятностью 0,997)
nA=24+15+14=53; pA=53/100=0,53; q=1–0,53=0,47.
P(t)=0,997 ® t=3
Доверительный интервал генеральной доли:

3) необходимая численность выборки при определении средней ЗП в случае, если ошибка не будет превышать 5 д.ед. с вероятностью 0,954.
Dх=5; P(t)=0,954 ® t=2.
чел.
nдоп=147-100=47 чел.
4) необходимая численность выборки при определении доли единиц, обладающих признаком А, в случае, если ошибка не будет превышать 5% с вероятностью 0,954.
Dр=0,05; P(t)=0,954 ® t=2.
чел.
nдоп=286-100=186 чел.
Средняя заработная плата всех работников предприятия (генеральной совокупности - 1000 чел.) с вероятностью 0,683 составит в пределах от 156,7 д.ед. до 162,9 д.ед. Причем, доля работников предприятия, получающих заработную плату на уровне средней и выше, находится в пределах от 32% до 62%. Для снижения ошибки выборки при определении генеральной средней и генеральной доли необходимо увеличить число выборочной совокупности на 47 чел. и 186 чел. соответственно.







