Использование дисперсии в изучении взаимосвязи между явлениями

Если совокупность разбита на группы в результате проведения аналитической группировки, то для оценки влияния факторного признака (группировочного) на результативный можно разложить показатель дисперсии на отдельные составляющие:

1. Общая дисперсия: . Этот показатель отражает вариацию изучаемого признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.

2. Межгрупповая дисперсия:

где - среднее значение признака в каждой группе, образованной по величине группировочного признака. Межгрупповая дисперсия отражает вариацию результативного показателя за счет вариации фактора, положенного в основу группировки.

3. Внутригрупповая дисперсия Этот показатель будет характеризовать вариацию результативного показателя за счет вариации всех прочих факторов (кроме фактора, положенного в основу группировки). Внутригрупповых дисперсий столько - сколько выделено групп. По совокупности в целом для оценки указанных факторов рассчитывается средняя из внутригрупповых дисперсий

Между общей дисперсией, межгрупповой и средней из внутригрупповых дисперсий существует определенное соотношение, которое называется правилом сложения дисперсий:

Итак, общая вариация изучаемого признака может быть представлена как сумма двух составляющих: 1) вариации за счет фактора, положенного в основу группировки; 2) вариации, обусловленной влиянием прочих (случайных) факторов. Сопоставляя межгрупповую и общую дисперсию можно получить показатели тесноты связи:

1) коэффициент детерминации

Этот показатель показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака;

2) эмпирическое корреляционное отношение

Показывает влияние признака, положенного в основание группировки, на вариацию результативного признака. Оно колеблется в пределах от 0 до 1. Если η = 0, то группировочный признак не оказывает влияния на результативный, если η = 1, то результативный признак изменяется только в зависимости от признака положенного в основание группировки, а влияние прочих факторных признаков равно нулю.

Исчислим показатели дисперсии на основе следующих данных:

Таблица 21

Распределение рабочих по стажу работы

Группы рабочих по стажу работы Число рабочих Индивидуальная среднечасовая выработка продукции одного рабочего, ед.
До 5 лет Свыше 5 лет   2; 2; 3; 3; 4 2; 2; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4

Рассчитаем средние значения выработки:

o по всем рабочим ед.;

o по первой группе ед.;

o по второй группе ед.

Предстоит выяснить, связано ли различие между средним уровнем выработки по группам со стажем работы рабочих.

Исчислим показатель межгрупповой дисперсии, который отразит вариацию выработки рабочих, обусловленную стажем работы:

Внутригрупповые дисперсии, показывающие вариацию выработки за счет всех других факторов, составили:

Средняя из внутригрупповых дисперсий

Общую дисперсию, отражающую вариацию выработки рабочих под влиянием всех факторов, исчислим по правилу сложения дисперсий: σ2 = 0,0675 + 0,520 = 0,5875.

Рассчитаем показатели тесноты связи:

1) Коэффициент детерминации

Это значит, что вариация среднечасовой выработки рабочих обусловлена вариацией стажа лишь на 11,5 % (следовательно, 88,5 % этой вариации вызвано факторами, которые не учитывались при аналитической группировке).

2) Эмпирическое корреляционное отношение η = Значение этого показателя говорит о наличии умеренной (ближе к слабой) связи между стажем работы и среднечасовой выработкой.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: