Влияние некоторых факторов, определяющих вариацию признаков, можно установить с помощью группировок, образовав более однородные совокупности единиц наблюдения с меньшей вариацией.
Сила влияния группировочного фактора оценивается на основе сравнения дисперсий результативного признака в выделенных группах и общей дисперсией, вычисленной до группировки.
Если исследуемую совокупность разделить на группы по факторному признаку, то для этих групп рассчитываются такие виды дисперсий: общая, межгрупповая и внутригрупповая.
Дисперсионный анализ групп включает:
1. Вычисление общей дисперсии результативного признака до группировки.
; .
2. Разделение единиц наблюдения исследуемой совокупности на группы i=1,2…n по факторному признаку.
3. Вычисление средних и дисперсий в каждой группе:
; .
4. Вычисление межгрупповой дисперсии:
.
Межгрупповая дисперсия отражает вариацию, возникающую под влиянием факторного признака, положенного в основу группировки. Она характеризует колеблемость групповых средних относительно общей средней.
|
|
5. Вычисление внутригрупповой дисперсии (средней величины групповых дисперсий):
.
Внутригрупповая дисперсия характеризует случайную вариацию в каждой отдельной группе. Эта вариация возникает под влиянием не учитываемых факторов и не зависит от признака, положенного в основу группировки.
6. Контрольная проверка:
– правило сложения дисперсий
7. Анализ качества группировок
и .
В этом случае фактор, положенный в основу группировки, выбран правильно, вариация результативного признака в группах существенно уменьшилась.
8. Корреляционное отношение показывает тесноту связи между факторным и результативным признаками.
При качественной группировке , т.к. .
при имеет место очень сильное влияние группировочного признака;
при имеет место сильное влияние;
при имеет место слабое влияние;
при влияние отсутствует.
Пример. Распределение численности по уровню ЗП в цехе № 1
Дневная ЗП рабочих, д.ед. | число рабочих цеха №1, чел. (f1j) | xj, д.ед. | xj*f1j | |
8-10 | 2 | 9 | 18 | 91,13 |
10-12 | 3 | 11 | 33 | 67,69 |
12-14 | 5 | 13 | 65 | 37,81 |
14-16 | 11 | 15 | 165 | 6,19 |
16-18 | 10 | 17 | 170 | 15,63 |
18-20 | 5 | 19 | 95 | 52,81 |
20-22 | 4 | 21 | 84 | 110,25 |
Итого | 40 | - | 630 | 381,5 |
1) средняя ЗП в цехе №1:
д.ед.
2) групповая дисперсия в цехе №1:
Распределение численности по уровню ЗП в цехе № 2
Дневная ЗП рабочих, д.ед. | число рабочих цеха №2, чел. (f2j) | xj, д.ед. | xj*f2j | |
8-10 | 6 | 9 | 54 | 158,69 |
10-12 | 5 | 11 | 55 | 49,39 |
12-14 | 6 | 13 | 78 | 7,84 |
14-16 | 9 | 15 | 135 | 6,61 |
16-18 | 3 | 17 | 51 | 24,49 |
18-20 | 2 | 19 | 38 | 47,18 |
20-22 | 4 | 21 | 84 | 188,08 |
Итого | 35 | - | 495 | 482,29 |
3) средняя ЗП в цехе №2:
|
|
д.ед.
4) групповая дисперсия в цехе №2:
Распределение численности по уровню ЗП на предприятии
Дневная ЗП рабочих, д.ед. | общее число рабочих, чел. (fj общ) | xj, д.ед. | xj*fj общ | |
8-10 | 8 | 9 | 72 | 288,00 |
10-12 | 8 | 11 | 88 | 128,00 |
12-14 | 11 | 13 | 143 | 44,00 |
14-16 | 20 | 15 | 300 | 0,00 |
16-18 | 13 | 17 | 221 | 52,00 |
18-20 | 7 | 19 | 133 | 112,00 |
20-22 | 8 | 21 | 168 | 288,00 |
Итого | 75 | - | 1125 | 912,00 |
5) общая средняя ЗП:
д.ед.
6) общая дисперсия:
7) средняя групповых дисперсий:
8) межгрупповая дисперсия:
.
9) Правило сложения дисперсий:
10) Корреляционное отношение:
– влияние факторного признака отсутствует.
Тема 5. Выборочное наблюдение в статистике
Выборочное наблюдение – основной вид не сплошного наблюдения. При выборочном наблюдении характеристика всей совокупности единиц даётся по некоторой их части, отобранной в случайном порядке.
Область применения:
- аудиторские проверки первичных финансовых документов;
- контроль качества продукции;
- изучение использования рабочего времени, работы оборудования.
Метод выборочного наблюдения имеет как преимущества, так и недостатки.
Преимущества:
- быстрота осуществления при небольших затратах;
- достаточная представительность (репрезентативность) при соблюдении определенных требований.
Недостатки:
- возможность возникновения трудно установимой ошибки;
- недостаточная надёжность метода.
Способ устранения ошибок – дублирование наблюдений.
Основные понятия выборочного наблюдения:
Вся совокупность изучаемых единиц N является генеральной совокупностью.
В выборочную совокупность отбирают n единиц.
Доля выборки - n/N (при =0,1 имеем выборку 10%)
При обследовании единиц генеральной совокупности выборочным методом обычно решаются задачи:
1) охарактеризовать среднее значение наблюдаемого признака в генеральной совокупности;
2) охарактеризовать долю единиц, обладающих некоторым признаком А в генеральной совокупности;
3) определить необходимую численность выборочной совокупности.
Задача 1. Охарактеризовать среднее значение наблюдаемого признака в генеральной совокупности
Уровень изучаемого признака генеральной совокупности определяется генеральной средней . По результатам обработки выборочного статистического ряда получают выборочную среднюю .
Мерой соответствия и является ошибка выборочной средней по отношению к генеральной средней: или .
Предельная ошибка выборочной средней:
t = 1 при Р(t) = 0,683;
t = 2 при Р(t) = 0,954;
t = 3 при Р(t) = 0,997.
Простая ошибка выборочной средней зависит от способа отбора единиц в выборочную совокупность (повторный или бесповторный).
Повторный отбор – единица после регистрации возвращается в генеральную совокупность и в результате случайного отбора может быть обследована вновь.
Бесповторный отбор – единица после регистрации не возвращается в генеральную совокупность.
1) при повторном отборе
,
2) при бесповторном отборе
.
Задача 2. Охарактеризовать долю единиц, обладающих некоторым признаком А в генеральной совокупности
Доля единиц, обладающих некоторым признаком A, в генеральнойсовокупности называется генеральной долей .
Доля единиц, обладающих некоторым признаком А, в выборочной совокупности называется выборочной долей .
Мерой соответствия и р является ошибка доли выборки по отношению к доле в генеральной совокупности .
Предельная ошибка
Простая ошибка доли выборки:
1) при повторном отборе
,
2) при бесповторном отборе
.
где – доля единиц, не обладающих признаком А;
– дисперсия альтернативного признака.
Задача 3. Определить необходимую численность выборочной совокупности
Задано
Принимается постоянной .
Определить n необх
|
|
1) при определении генеральной средней.
Бесповторный отбор: ; Повторный отбор: ;
2)при определении генеральной доли.
Бесповторный отбор: Повторный отбор: ;
Пример:
Дано распределение работников предприятия по уровню ЗП по данным 10%-го случайного бесповторного выборочного обследования
ЗП, д.ед. | Число рабочих, чел. |
100-120 | 18 |
120-140 | 11 |
140-160 | 18 |
160-180 | 24 |
180-200 | 15 |
200-220 | 14 |
Итого: | 100 |
Рис. Гистограмма распределения работников предприятия по уровню заработной платы
1) определить размер средней ЗП предприятия (с вероятностью 0,683)
Расчетная таблица для определения дисперсии
хj | fj | |xj-xcp| | (xj-xcp)2 | (xj-xcp)2*fj |
110 | 18 | 49,8 | 2480,04 | 44640,72 |
130 | 11 | 29,8 | 888,04 | 9768,44 |
150 | 18 | 9,8 | 96,04 | 1728,72 |
170 | 24 | 10,2 | 104,04 | 2496,96 |
190 | 15 | 30,2 | 912,04 | 13680,6 |
210 | 14 | 50,2 | 2520,04 | 35280,56 |
Итого: | 100 | 107596 |
Доверительный интервал генеральной средней:
2) Определить долю рабочих, имеющих ЗП на уровне средней и выше (с вероятностью 0,997)
nA=24+15+14=53; pA=53/100=0,53; q=1–0,53=0,47.
P(t)=0,997 ® t=3
Доверительный интервал генеральной доли:
3) необходимая численность выборки при определении средней ЗП в случае, если ошибка не будет превышать 5 д.ед. с вероятностью 0,954.
Dх=5; P(t)=0,954 ® t=2.
чел.
nдоп=147-100=47 чел.
4) необходимая численность выборки при определении доли единиц, обладающих признаком А, в случае, если ошибка не будет превышать 5% с вероятностью 0,954.
Dр=0,05; P(t)=0,954 ® t=2.
чел.
nдоп=286-100=186 чел.
Средняя заработная плата всех работников предприятия (генеральной совокупности - 1000 чел.) с вероятностью 0,683 составит в пределах от 156,7 д.ед. до 162,9 д.ед. Причем, доля работников предприятия, получающих заработную плату на уровне средней и выше, находится в пределах от 32% до 62%. Для снижения ошибки выборки при определении генеральной средней и генеральной доли необходимо увеличить число выборочной совокупности на 47 чел. и 186 чел. соответственно.