Дисперсия альтернативного качественного признака

I i

X - A x - A

I i

X - A (x - A)

Расчет дисперсии, ее свойства

Средняя величина или величина, ее заменяющая

Абсолютный показатель вариации

V = ------------------------------------------------------------------- * 100%.

(например, медиана)

Соответственно коэффициент осцилляции отражает колеблемость крайних значений признака вокруг средней:

R

Ko = ------------ * 100 %.

-- (7.2.5)

x

Относительное линейное отклонение:

Л

Kл = ------------ * 100 %.

-- (7.2.6)

x

Коэффициент вариации является наиболее распространенным показателем и используется для оценки типичности средних величин:

s

V = ------------ * 100 %.

-- (7.2.7)

x

Если V больше 0,4 (40%), то это говорит о большой колеблемости признака в изучаемой совокупности.

Пример. Сравним вариацию двух признаков:

  -- x s -- V = s / x * 100%
Заработная плата рабочих-сдельщиков, руб. в сутки       10 %
% выполнения суточной нормы выработки       16,4 %

Вариация выполнения норм выработки выше, чем вариация заработной платы, хотя можно ожидать примерного их равенства. Возможно, это объясняется стремлением администрации уравнять заработки рабочих.

Помимо основной формулы расчета дисперсии применяется упрощенный способ ее вычисления.

1 способ – среднее из квадратов минус квадрат среднего.

__ _2 å x2 * f å x * f

s2 = x2 - x = -------------- - (---------------) 2 .

å f å f

(7.3.1)

2 способ -- способ моментов, основанный на свойствах дисперсии.

Свойства дисперсии:

n если каждое значение x уменьшить или увеличить на одно и то же число, то s2 не меняется;

n если каждое значение x уменьшить или увеличить в i число раз, то s2 уменьшится или увеличится в i2 число раз.

å (--------) 2 * f å ---------- * f

s2 = [ ------------------------- - (----------------------) 2 ] * i2;

å f å f

(7.3.2)

s2 = [ m2 - m1 2 ] * i2 ,

å (-------) * f å (--------) 2 * f

где m1 = ------------------------; m2 = -----------------------;

å f å f

m1 - момент I порядка;

m2 - момент II порядка.

3 способ -- меры вариации для сгруппированных данных.

Для сгруппированных данных можно выделить три дисперсии:

n общая s2 ;

n межгрупповая d2 ;

n внутригрупповая s2i.

Общая дисперсия измеряет вариацию признака во всей совокупности под влиянием всех факторов.

__

å (xi - x) 2 * fi

s2= ------------------------. (7.3.4)

å fi

Внутригрупповая дисперсия измеряет вариацию признака внутри каждой группы.

__

å (xi - xi) 2 * fi

s2i= ------------------------.

å fi. (7.3.5)

__

Средняя дисперсия из внутригрупповых s2i рассчитывается по формуле средней арифметической взвешенной:

___ å s2i* fi

s2i= --------------------. (7.3.6)

å fi

Этот показатель характеризует влияние на результативный признак всех прочих факторов за исключением признака, положенного в основу группировки.

Межгрупповая дисперсия измеряет вариацию, обусловленную признаком, положенным в основу группировки.

__ __

å (xi - xо) 2 * fi

d2 = ------------------------,

å fi (7.3.7)

_

где xi – средняя по отдельным группам;

_

xо средняя общая по всей совокупности.

Правило сложения дисперсий гласит: ___

s2 = d2 + s2i. (7.3.8)

С помощью закона сложения дисперсий можно оценить удельное значение фактора, лежащего в основе группировки, во всей совокупности факторов, воздействующих на результативный признак.

Осуществляется это с помощью коэффициента детерминации и эмпирического корреляционного отношения.

Коэффициент детерминации рассчитывается как отношение

d2

D = ------.

s2 (7.3.9)

Эмпирическое корреляционное отношение рассчитывается по формуле:

___

h = ÖD, (7.3.10)

где h = до 0,3 -- слабая связь;

h = от 0,3 до 0,7 -- средняя степень связи;

h = свыше 0,7 -- высокая степень связи.

В статистике наряду с показателями вариации количественного признака определяются показатели вариации альтернативного признака (то есть признака, которым обладают одни единицы совокупности и не обладают другие).

Доля вариантов, обладающих изучаемым признаком, обозначается p, а не обладающих – q. Кроме того, наличие признака будем обозначать 1, а его отсутствие – 0. Следовательно, p + q = 1.

__ å xi * fi 1 * p + 0 * q

X = ------------- = -------------------- = p;

å fi p + q (7.4.1)

__

å (xi - x) 2 * fi (1 - p)2 * p + (0 - p)2 * q

s2p= ------------------------ = -------------------------------------- = p * q.

å fi p + q (7.4.2)

Пример: Все население – 10 000 чел., в том числе женщины – 6 000 чел.

6 000 4 000

p = --------- = 0,6; q = ---------- = 0,4;

10 000 10 000

___ ____

s2p= p * q = 0,6 * 0,4 = 0,24; s =Ö s2 = Ö 0,24 = 0,49.

Вопросы для самопроверки:

Ø Что такое вариация признака?

Ø Что такое размах вариации и его недостаток как показателя колеблемости признака?

Ø Как вычисляется среднее линейное отклонение и каков недостаток этого показателя?

Ø Расскажите о дисперсии и способах ее расчета.

Ø Среднее квадратическое отклонение и его преимущества перед средним линейным отклонением.

Ø Значение коэффициента вариации как относительного показателя колеблемости признака.

Ø Взаимосвязь показателей вариации.

Ø Правило сложения дисперсий. Экономический смысл общей, межгрупповой и внутригрупповой дисперсий.

Ø Расчет и экономический смысл коэффициента детерминации и эмпирического корреляционного отношения.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow