double arrow

Правило сложения дисперсий

3

Вариация признака обусловлена различными факторами, некоторые из этих факторов можно выделить, если статистическую совокупность разбить на группы по какому-либо признаку. Тогда, наряду с изучением вариации признака по всей совокупности в целом, становится возможным изучить вариацию для каждой из составляющих ее группы, а также и между этими группами. В простейшем случае, когда совокупность расчленена на группы по одному фактору, изучение вариации достигается посредством исчисления и анализа трех видов дисперсией: общей дисперсии, межгрупповой дисперсии и внутригрупповой дисперсии.

Общая дисперсия () измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака от общей средней и может быть вычислена как простая средняя иливзвешенная средняя соответственно по формулам:

; (5.18)

(5.19)

Межгрупповая дисперсия характеризует систематическую вариацию результативного порядка, обусловленную влиянием признака - фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней , обозначается греческой буквой (дельта малая в квадрате) и исчисляется по формуле:

, (5.20)

где - численность единиц в группе.

Внутригрупповая (частная) дисперсия () отражает случайную вариацию, т.е. часть вариации, обусловленную влиянием неучтенных факторов и не зависящую от признака - фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы от средней арифметической этой группы (групповой средней) и может быть исчислена как простая средняя или как взвешенная средняя соответственно по формулам:

; (5.21)

. (5.22)

На основании внутригрупповой дисперсии по каждой группе, т.е. на основании можно определить общую среднюю из внутригрупповых дисперсий () :

. (5.23)

Между общей дисперсией , средней из внутригрупповых и межгрупповой дисперсиями существует определенное соотношение, которое называется правилом сложения дисперсий. Согласно этому правилу общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий:

. (5.24)

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью - неизвестную, а также оценить удельное значение фактора, лежащего в основе группировки, во всей совокупности факторов, воздействующих на результативный признак .

Рассмотрим вычисление этих дисперсий и покажем справедливость соотношения (5.24) на следующем примере.

Например, пусть при изучении влияния квалификации (тарифного разряда ) рабочих на уровень производительности труда в цехе были получены такие данные ( табл.5.10 ):





Таблица 5.10

Распределение рабочих по выработке изделий за час работы, шт.

  1 ГРУППА - рабочие 4-го разряда 2 ГРУППА - рабочие 5-го разряда
  № п/п Изготовлено изделий,           Изготовлено изделий,        
-3 -1
-1 -1     -1 -2    
     

Исчислим: 1)групповые дисперсии; 2)среднюю из внутригрупповых дисперсий; 3)межгрупповую дисперсию; 4)общую дисперсию; 5)проверим правило сложения дисперсий.

В этом примере данные группируются по квалификации (тарифному разряду) рабочих, являющейся факторным признаком .

Результативный признак варьирует как под влиянием систематического фактора - квалификации (межгрупповая вариация), так и других неучтенных, случайных факторов (внутригрупповая вариация). Задача заключается в измерении этих вариаций с помощью общей, межгрупповой и внутригрупповых дисперсий.

1.Для расчета групповых дисперсий исчислим средние по каждой группе и общую среднюю выработку:

по 1 группе:

по П группе:

по двум группам: .

Расчет дисперсий по группам представлен в таблице. Подставив полученные значения в формулу (5.21), получим внутригрупповые дисперсии:

по 1 группе: ;

по П группе: .

Внутригрупповая дисперсия показывает величину вариации, вызванной всеми возможными факторами, (техническое состояние оборудования, обеспеченность инструментами и материалами, возраст рабочих, интенсивность труда и т.д.), кроме различий в квалификационном разряде (внутри группы все рабочие имеют одну квалификацию).



2.Рассчитаем среднюю из внутригрупповых дисперсий ():

Средняя из внутригрупповых дисперсий, очевидно, также отражает вариацию, обусловленную всеми факторами, кроме квалификации рабочих, но в среднем по всей совокупности.

3.Исчислим межгрупповую дисперсию:

Межгрупповая дисперсия характеризует вариацию групповых средних, обусловленную различиями групп по квалификационному разряду.

4.Исчислим общую дисперсию по формуле (5.18) :

Общая дисперсия отражает суммарное влияние всех возможных факторов на общую вариацию количества деталей, изготавливаемых за час всеми рабочими 4 и 5 разряда.

5.Суммирование средней из групповых дисперсий и межгрупповой дает величину, равную общей дисперсии :

.

Очевидно, чем больше вклад межгрупповой дисперсии в общую дисперсию, тем, по-видимому, сильнее влияние группировочного признака (квалификационного разряда) на величину изучаемого признака (количества изготавливаемых деталей).

Поэтому в статистическом анализе широко используется показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации. Называется онэмпирическим коэффициентом детерминации и обозначается греческой буквой ( эта в квадрате ):

(5.25)

Эмпирический коэффициент детерминации показывает, долю вариации результативного признака у под влиянием факторного признака . Остальная же часть общей вариации у обуславливается вариацией прочих факторов. При отсутствии связи коэффициент детерминации равен нулю, а при функциональной связи - единице.

В нашем примере : или 66,6%.

Это означает, что на 66,6% вариация производительности труда рабочих обусловлена различиями в их квалификации, и на 33,4% - влиянием прочих факторов.

Корень квадратный из эмпирического коэффициента детерминации носит названиеэмпирического корреляционного отношения :

(5.26)

которое показывает тесноту связи между признаком группировочным и результативным.

Эмпирическое корреляционное отношение , как и , может принимать значения от 0 до 1.

Если связь отсутствует, то корреляционное отношение равно 0, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, что группировочный признак никак не влияет на образование общей вариации.

Если связь функциональная, то корреляционное отношение будет равно 1. В этом случае дисперсия групповых средних равна общей дисперсии ( ), т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака.

Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Для качественной оценки тесноты связи на основе показателя эмпирического корреляционного отношения можно воспользоваться следующей таблицей Чэддока :

Таблица 5.11

Величина 0,1-0,3 0,3-0,5 0,5-0,7 0,7-0,9 0,9-0,99
Сила связи слабая умеренная заметная тесная весьма тесная

В нашем примере , что свидетельствует о тесной связи между квалификацией рабочих и производительностью их труда.

Заказать ✍️ написание учебной работы
Поможем с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой
3

Сейчас читают про:
Поможем в написании
> Курсовые, контрольные, дипломные и другие работы со скидкой до 25%
3 569 лучших специалисов, готовы оказать помощь 24/7