double arrow
Взаимосвязь показателей вариации. В нормальном ряду распределения между показателями вариации имеются следующие примерные соотношения:

В нормальном ряду распределения между показателями вариации имеются следующие примерные соотношения:

5.3. Основные свойства дисперсии

1) Если все значения признака уменьшить или увеличить на какое-то постоянное число а, то дисперсия не изменится.

2) Если все значения признака уменьшить или увеличить в К раз, то дисперсия изменится в К2 раз.

3) Сумма квадратов отклонений индивидуальных значений признака x от их средней меньше суммы квадратов отклонений индивидуальных значений признака от любого числа а, при условии, что

.

4) Дисперсия признака равна разности между средним квадратом значения признака и квадратом их средней:

.

Дисперсия альтернативного признака

В ряде случаев возникает необходимость измерить вариацию альтернативного признака, то есть такого, который может принимать только два значения. Обозначив отсутствие интересующего нас признака через 0, его наличие через 1, долю единиц, обладающих данным признаком - черезр, не обладающих — через q, дисперсию этого признака можно определить как

Например, если 64% работников предприятия имеют высшее образование р, то дисперсия будет равна:

.

5.4. Правило сложения дисперсий

На вариацию признака влияют различные причины и факторы, которые делятся на случайные и систематические. Поэтому и вариация может быть случайной, вызванной действием случайных причин и систематической, обусловленной воздействием постоянных причин и факторов. В связи с этим возникает необходимость в определении случайной систематической составляющей и её роли в общей вариации. Общую дисперсию мы уже рассматривали. Она характеризует общую вариацию признака под влиянием всех условий, всех причин, вызывающих эту вариацию и исчисляется по формуле:




Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой. Вариация, обусловленная фактором, положенным в основание группировки, называется межгрупповой вариацией. Размеры ее определяются при помощи дисперсии групповых средних или межгрупповой дисперсии, которая характеризует колеблемость групповых или частных средних около их общей средней:

,

где - средняя по каждой отдельной группе; - средняя по всей совокупности; n - число единиц совокупности; f - частоты или веса.

Таким образом, межгрупповая дисперсия (дисперсия групповых средних) равна средней арифметической из квадратов отклонений частных средних от общей средней. Она характеризует систематическую вариацию, которая возникает под влиянием фактора, признака, положенного в основание группировки.



Для определения влияния случайных факторов и их роли в общей вариации определяют дисперсию в пределах каждой группы, т.е. внутригрупповую дисперсию, а затем исреднюю из внутригрупповых дисперсий:

где x - индивидуальные значения признака; - групповые или частные средние:

В математической статистике доказано, что общая дисперсия признака равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий

Это правило называетсяправилом сложения дисперсий.

5.5. Ряды распределения и их моделирование

а) Моменты распределения

Одной из важных задач анализов рядов распределения является выявление закономерности распределения, определение ее характера и количественного выражения. Эта задача решается при помощи показателей, характеризующих форму, тип распределения.

Кроме рассмотренных выше важной характеристикой рядов распределения являются моменты распределения.

Моментом распределенияк) называется средняя арифметическая из отклонений значений признака x от некоторой постоянной величины а в степеник:

Величина копределяет порядок момента. В зависимости от величины а различают начальные, центральные и условные моменты (табл. 5.2)


Таблица 5.2

Значение моментов распределения

Величина Название момента Обозначение момента Величина момента  
      к=0 к=1 к=2
    начальный   М      
    центральный   m       σ
а   условный М

Условные моменты используются для определения дисперсий высоких степеней. Практически используются моменты первых четырех порядков. Если в качестве весов взять не частоты, а вероятности, то получим теоретические моменты распределения.

б) Кривые распределения

Для обобщенной характеристики особенностей формы распределения применяются кривые распределения, которые выражают закономерность распределения единиц совокупности по величине варьирующего признака.

Эмпирическая кривая - это фактическая кривая, полученная по данным наблюдения, в которой отражаются как общие, так и случайные условия, определяющие распределение (кривая 1, рис.5.3)

Теоретическая кривая распределения - это кривая, выражающая функциональную связь между изменением варьирующего признака и изменением частот и характеризующая определенный тип распределения (кривая 2, рис.5.3).

По форме кривые распределения бывают симметричными и асимметричными. В зависимости от того, какая ветвь кривой вытянута, различаютправостороннюю асимметрию илевостороннюю асимметрию (рис.5.1). Кривые распределения также могут иметь различную островершинность (рис.5.2).

Для характеристики степени асимметрии кривой используют коэффициент асимметрии, который представляет собой отношение центрального момента третьего порядка к среднему квадратическому отклонению в кубе

.

Если А >0, то асимметрия правосторонняя, а еслиА<0, то асимметрия левосторонняя, в симметричном распределении - А=0. Кроме этого коэффициента для характеристики асимметрии применяют и соотношение между и модой или медианой по отношению к среднеквадратическому отклонению

.

Он менее точен по сравнению с коэффициентом асимметрии и применяется реже.

Для характеристики островершинности кривой распределения применяют коэффициент эксцесса, который равен отношению центрального момента четвертого порядка к дисперсии в квадрате

.

В нормальном распределенииЕ=3, поэтому, еслиЕ>3, то эксцесс выше нормального (островершинная кривая), Е<3, эксцесс ниже нормального (плосковершинная кривая).

в) Моделирование рядов распределения

Все рассмотренные выше показатели характеризуют отдельные свойства совокупности. Общую характеристику ряда распределения можно представить аналитически, в виде функции, характеризующей зависимость между изменениями признака и частотами. Если имеется эмпирический ряд распределения, то необходимо найти функцию распределения, т. е. подобрать такую теоретическую кривую, которая наиболее полно бы раскрывала закономерность распределения. Нахождение функции кривой распределения называется моделированием.

Для аппроксимации (выравнивания) эмпирических кривых распределения в статистике часто пользуются нормальным распределением, функция которого

,

где F(x) - интегральная функция распределения; t - нормированное отклонение; e - основание натуральных логарифмов.

 
 

Теоретическое распределение вероятностей и частот дает представление о форме, типе распределения, о закономерности, свойственной изучаемому явлению.

>Ме>Мо =Ме=Мо <Ме<Мо

Правосторонняя Симметричная Левосторонняя

Асимметрия кривая асимметрия

Рис.5.1. Типы кривых распределения (по асимметрии)

 
 

Рис. 5.2. Типы кривых распределения (по островершинности)

Эмпирическое и теоретическое распределение рабочих по степени выполнения норм приведено в табл.5.3 и на рис.5.3.

Таблица 5.3

Распределение рабочих по степени выполнения норм выработки

Группы рабочих по степени выполнения норм,% Число рабочих (эмпирические частоты) (f) Теоретические частоты (f’)
до 100
100-110
110-120
120-130
130-140
140-150
150 и выше
Итого:

г) критерии согласия

Для оценки близости эмпирического и теоретического распределения используются специальные показатели, которые называются критериями согласия. Критерии согласия как правило тем или иным способом оценивают степень расхождения между эмпирическими и теоретическими частотами.

Наиболее часто используется критерий, который называетсяхи-квадрат Пирсона и рассчитывается

,

где f’-теоретические частоты, f-эмпирические частоты.

Чем меньше значение, тем лучше теоретическое распределение отражает реальное положение в совокупности и наоборот. Если =0, то расхождение между fи f’ отсутствует.

Для проверки согласия с помощью рассчитанное значениесравнивают с табличным и при условии< можно с определенной вероятностью сказать, что расхождение теоретического и эмпирического распределения случайно, и наоборот.

Также применяется и критерий согласия Колмогорова , который равен

,

где D - максимальная разность накопленных частот (без учета знака), n - объем совокупности.

Вычислив фактический критерий , по специальной таблице находят вероятность достижения критерием этого значения. Если вероятность значительна, то расхождение между эмпирическим и теоретическим распределением можно считать случайным.

В явлениях общественной жизни асимметричные распределения встречаются гораздо чаще, чем симметричные. Некоторые асимметричные распределения могут быть приведены к симметричному путем преобразования признака Х, например логарифмированием. В этом случае распределение называется логарифмически нормальным. Такое преобразование производится, как правило, для сильно асимметричных распределений.






Сейчас читают про: