Статистические распределения; числовые характеристики в случае сгруппированных статистических данных

Вариационным рядом называется последовательность наблюдаемых значений xi признака X (i=1,2,…,n), расположенных в неубывающем порядке: . Каждое значение x вариационного ряда называется вариантой.

Для характеристики центра распределения (среднего значения) применяется средняя арифметическая:

– расчет простой средней арифметической.

()

; () – средняя арифметическая для сгруппированных данных.

– варианты значений признака;

– частота повторения данного варианта;

Для характеристики размера вариации используется показатель вариации – среднее квадратическое отклонение () и дисперсия ().

; ()

Формула для расчета дисперсии может быть преобразована: , т.е. дисперсия равна средней из квадратов индивидуальных значений признака минус квадрат средней величины.

Влияние фактора, определяющего колеблемость индивидуальных значений (вариант) признака, можно определить при помощи метода группировок. При этом, кроме общей средней по всей совокупности исчисляются средние по отдельным группам, когда единицы изучаемой совокупности подразделяются на однородные группы по признаку-фактору и три показателя дисперсии:

общая дисперсия;

межгрупповая дисперсия;

средняя внутригрупповая дисперсия.

Величина общей дисперсии () характеризует вариацию признака под влиянием всех факторов и определяется по формуле

,

где – общая средняя арифметическая для всей изучаемой совокупности.

Межгрупповая дисперсия (дисперсия групповых средних ) отражает различия в величине изучаемого признака положенного в основу группировки

,

– средняя по отдельной группе;

– число единиц в определенной группе.

Средняя внутригрупповая дисперсия () – характеризует случайную вариацию, возникающую под влиянием других, неучтенных факторов и не зависит от условия положенного в основу группировки.

; или

где – дисперсия по отдельной группе .

Указанные дисперсии взаимосвязаны между собой

.

Опираясь на это правило можно определить, какая часть (доля) общей дисперсии складывается под влиянием признака-фактора, положенного в основу группировки.

Для характеристики однородности совокупности наиболее часто применяется коэффициент вариации

.

Совокупность считается однородной, если коэффициент вариации не превышает 33% (для распределений близких к нормальному).

Задача 3.

По каждой из трех профессий ( – порядковый номер профессии: 1 – адвокат; 2 – следователь; 3 – судья) имеются соответствующие данные о числе специалистов профессии (, чел.), о средней заработной плате (, руб.), а также о внутригрупповой дисперсии заработной платы (, руб.2). статистические данные за месяц приведены в таблице.

, чел , руб. , руб.2
       
       
       

Требуется:

1. Определить общую дисперсию заработной платы

2. Оценить однородность совокупности по уровню месячной заработной платы.

3. Определить, на сколько процентов дисперсия в размере заработной платы обусловлена различиями и влиянием других причин.

Решение.

Поскольку по условию задачи не заданы индивидуальные значения переменной "заработная плата", а даны значения средней по каждой группе, общую дисперсию вычисляем по формуле

;

– межгрупповая дисперсия

.

Для расчета межгрупповой дисперсии необходимо подсчитать – общую среднюю арифметическую всей переменой "заработная плата".

для сгруппированных данных

(руб.)

.

– общая дисперсия заработной платы.

2) Однородность совокупности по уровню месячной заработной платы

; .

Вывод: , совокупность считается однородной.

3) Процент дисперсии, обусловленный различиями в заработной плате (фактор группировки данных) .

Процент дисперсии, обусловленный другими случайными причинами

.

Вывод:

Полученный результат показывает, что дисперсия или (% дисперсии) – на 86,22% обусловлены различиями в профессии, и только на 13,78% – другими случайными причинами.

Тема 4.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: