Если совокупность разбита на группы в результате проведения аналитической группировки, то для оценки влияния факторного признака (группировочного) на результативный можно разложить показатель дисперсии на отдельные составляющие:
1. Общая дисперсия: . Этот показатель отражает вариацию изучаемого признака как результат влияния всех факторов, определяющих индивидуальные различия единиц совокупности.
2. Межгрупповая дисперсия:
где - среднее значение признака в каждой группе, образованной по величине группировочного признака. Межгрупповая дисперсия отражает вариацию результативного показателя за счет вариации фактора, положенного в основу группировки.
3. Внутригрупповая дисперсия Этот показатель будет характеризовать вариацию результативного показателя за счет вариации всех прочих факторов (кроме фактора, положенного в основу группировки). Внутригрупповых дисперсий столько - сколько выделено групп. По совокупности в целом для оценки указанных факторов рассчитывается средняя из внутригрупповых дисперсий
|
|
Между общей дисперсией, межгрупповой и средней из внутригрупповых дисперсий существует определенное соотношение, которое называется правилом сложения дисперсий:
Итак, общая вариация изучаемого признака может быть представлена как сумма двух составляющих: 1) вариации за счет фактора, положенного в основу группировки; 2) вариации, обусловленной влиянием прочих (случайных) факторов. Сопоставляя межгрупповую и общую дисперсию можно получить показатели тесноты связи:
1) коэффициент детерминации
Этот показатель показывает долю (удельный вес) общей вариации изучаемого признака, обусловленную вариацией группировочного признака;
2) эмпирическое корреляционное отношение
Показывает влияние признака, положенного в основание группировки, на вариацию результативного признака. Оно колеблется в пределах от 0 до 1. Если η = 0, то группировочный признак не оказывает влияния на результативный, если η = 1, то результативный признак изменяется только в зависимости от признака положенного в основание группировки, а влияние прочих факторных признаков равно нулю.
Исчислим показатели дисперсии на основе следующих данных:
Таблица 21
Распределение рабочих по стажу работы
Группы рабочих по стажу работы | Число рабочих | Индивидуальная среднечасовая выработка продукции одного рабочего, ед. |
До 5 лет Свыше 5 лет | 2; 2; 3; 3; 4 2; 2; 3; 3; 3; 3; 3; 4; 4; 4; 4; 4; 4; 4; 4 |
Рассчитаем средние значения выработки:
o по всем рабочим ед.;
o по первой группе ед.;
o по второй группе ед.
Предстоит выяснить, связано ли различие между средним уровнем выработки по группам со стажем работы рабочих.
|
|
Исчислим показатель межгрупповой дисперсии, который отразит вариацию выработки рабочих, обусловленную стажем работы:
Внутригрупповые дисперсии, показывающие вариацию выработки за счет всех других факторов, составили:
Средняя из внутригрупповых дисперсий
Общую дисперсию, отражающую вариацию выработки рабочих под влиянием всех факторов, исчислим по правилу сложения дисперсий: σ2 = 0,0675 + 0,520 = 0,5875.
Рассчитаем показатели тесноты связи:
1) Коэффициент детерминации
Это значит, что вариация среднечасовой выработки рабочих обусловлена вариацией стажа лишь на 11,5 % (следовательно, 88,5 % этой вариации вызвано факторами, которые не учитывались при аналитической группировке).
2) Эмпирическое корреляционное отношение η = Значение этого показателя говорит о наличии умеренной (ближе к слабой) связи между стажем работы и среднечасовой выработкой.