Показатели вариации

Вариация – это изменение (колеблемость) значений признака внутри изучаемой статистической совокупности. Значения признака варьируют под воздействием различных факторов, условий. Чем разнообразнее условия, влияющие на размер признака, тем больше его вариация. Часто возникает необходимость количественно оценить степень вариации. Например, это важно при оценке надежности средних величин в изучаемой совокупности, надежности результатов выборочных статистических наблюдений.

Для измерения размера вариации в статистике используются абсолютные и относительные показатели вариации. К абсолютным показателям относятся:

· размах вариации;

· среднее линейное отклонение;

· дисперсия признака;

· среднее квадратическое отклонение.

К относительным показателям относятся:

· коэффициент осцилляции;

· относительное линейное отклонение;

· коэффициент вариации.

Размах вариации – разность между максимальным и минимальным значениями признака в изучаемой совокупности:

где – максимальное значение признака;

– минимальное значение признака.

Размах вариации измеряется в тех же единицах, что и значения признака. Имеет существенный недостаток, так как при расчете учитываются только крайние значения, но не учитывается колеблемость остальных значений признака.

Среднее линейное отклонение - это средняя величина из отклонений индивидуальных значений признака от среднего значения. Показывает, на сколько значений в среднем признак отклоняется от своего среднего значения. Измеряется в тех же единицах, что и значения признака.

Если совокупность не сгруппирована в вариационный ряд распределения, а представляет собой простой ряд чисел, то среднее линейное отклонение рассчитывается по формуле средней арифметической простой из модулей индивидуальных отклонений:

где – среднее линейное отклонение;

х – индивидуальные значения признака;

– модуль отклонения индивидуального значения признака от среднего значения;

– среднее значение признака;

n – количество значений признака.

Если совокупность сгруппирована и представляет собой вариационный ряд, то среднее линейное отклонение рассчитывается по формуле

где ∑f – сумма частот появления признака.

Дисперсия признака – это средний квадрат отклонений индивидуальных значений признака от средней величины.

Если совокупность не сгруппирована, дисперсия рассчитывается по формуле

Для вариационного ряда:

Среднее квадратическое отклонение – это корень квадратный из средней величины суммы квадратов отклонений индивидуальных значений признака от их средней величины. По-другому, это корень квадратный из значения дисперсии. Показывает то же, что и среднее линейное отклонение: на сколько значений в среднем признак отклоняется от своего среднего значения. Измеряется в тех же единицах, что и значения признака.

Если совокупность не сгруппирована:

Для вариационного ряда:

Все абсолютные показатели вариации измеряются в абсолютных единицах, и это затрудняет сравнение степени вариации различных совокупностей, в которых представлены разнородные объекты. Например, изучены группировки предприятий области по размерам объема производства в нескольких отраслях. Вариацию таких группировок не имеет смысла сравнивать по абсолютным показателям, так как каждая отрасль имеет отличный от других объем произведенной продукции. Естественно, что крупная отрасль будет иметь несравнимо большие показатели вариации по сравнению с малыми отраслями. Более того, нельзя переносить абсолютные характеристики вариации одного региона на все другие территории. Для обеспечения сравнимости разнородных совокупностей применяются относительные показатели, которые выражаются в процентах. Относительные показатели характеризуют степень колеблемости совокупности.

Коэффициент осцилляции – это отношение размаха вариации к среднему значению признака:

где R – размах вариации.

Относительное линейное отклонение (линейный коэффициент вариации)– это отношение среднего линейного отклонения к среднему значению признака:

где – среднее линейное отклонение.

Коэффициент вариации – это отношение среднего квадратического отклонения к среднему значению признака:

где σ – среднее квадратическое отклонение.

Когда коэффициент вариации не превышает 40%, принято считать, что полученные средние характеристики достаточно надежно характеризуют совокупность по варьирующему признаку. Если более 40% - ненадежно, то есть индивидуальные значения признака существенно отличаются от среднего значения признака.

Мы рассмотрели основные показатели вариации, но надо иметь ввиду, что есть и другие показатели, которые здесь не приведены. Далее приведем несколько примеров расчета.

Пример 24

Из коллектива рабочих цеха произвольно выбраны 7 человек, изучена их часовая выработка деталей. Рассчитать показатели вариации.

Таблица 21 – Часовая выработка рабочих

Номер работника Выработка, дет./час (х) _ x – x _ │x – x │ _ │x – x │ 2
         
    -7,3 7,3 53,29
    -6,3 6,3 39,69
    -3,3 3,3 10,89
    -0,3 0,3 0,09
    1,7 1,7 2,89
    6,7 6,7 44,89
    8,7 8,7 75,69
Итого   34,3 227,43

Это – простой ряд чисел, в котором данные не сгруппированы, частот нет. Промежуточные расчеты приведены в таблице.

Решение:

1) Среднее значение выработки рассчитывается по формуле (5) – средней арифметической простой:

= 149 / 7 = 21,3 дет.

2) Размах вариации рассчитывается по формуле (14):

R = 30 – 14 = 16 дет.

3) Среднее линейное отклонение рассчитывается по формуле (15):

= 34,3 / 7 = 4,9 дет.

4) Дисперсия рассчитывается по формуле (17):

σ2 = 227,43 / 7 = 32,49

5) Среднее квадратическое отклонение рассчитывается по формуле (19):

6) Коэффициент осцилляции рассчитывается по формуле (21):

VR = 16 / 21,3 = 0,751 или 75,1%

7) Линейный коэффициент вариации рассчитывается по формуле (22):

Vd = 4,9 / 21,3 = 0,230 или 23,0%

8) Коэффициент вариации рассчитывается по формуле (23):

V = 5,7 / 21,3 = 0,268 или 26,8%.

Данная совокупность характеризуется следующим образом. В среднем один рабочий изготовил за час 21,3 детали. Коэффициент осцилляции имеет большое значение – 75,1%, то есть границы совокупности довольно разбросаны. Выработка каждого рабочего отличается от средней выработки в среднем на 4,9 (5,7) деталей, или на 23,0% (26,8%). Несмотря на большой коэффициент осцилляции, коэффициент вариации меньше 40%, что говорит о достаточной надежности среднего значения выработки. Это значение можно использовать для оценки средней выработки всех работников цеха.

Пример 25

Из всех организаций отрасли произвольно выбраны 20 организаций, и изучено количество случаев травматизма на производстве. Рассчитать показатели вариации.

Таблица 22 – Статистика травматизма в отрасли (цифры условные)

Кол-во случаев, ед. (x) Кол-во организаций (f)   x*f _ │x – x│ _ │x – x │*f _ │x – x│2 _ │x – x │2*f
      -1,9 1,9 3,61 3,61
      -0,9 4,5 0,81 4,05
      0,1 0,8 0,01 0,08
      1,1 3,3 1,21 3,63
      2,1 4,2 4,41 8,82
      3,1 3,1 9,61 9,61
Итого     17,8 29,8

Это – дискретный вариационный ряд распределения, данные сгруппированы. Значения признака – количество случаев травматизма, частоты – количество организаций. Промежуточные расчеты приведены в таблице 22.

Решение:

1) Среднее значение выработки рассчитывается по формуле (6) – средней арифметической взвешенной:

= 38 / 20 = 1,9 ед.

2) Размах вариации рассчитывается по формуле (14):

R = 5 – 0 = 5 ед.

3) Среднее линейное отклонение рассчитывается по формуле (16):

d = 17,8 / 20 = 0,89 ед.

4) Дисперсия рассчитывается по формуле (18):

σ 2 = 29,8 / 20 = 1,49 ед.

5) Среднее квадратическое отклонение рассчитывается по формуле (20):

6) Коэффициент осцилляции рассчитывается по формуле (21):

VR = 5 / 1,9 = 2,632 или 263,2%

7) Линейный коэффициент вариации рассчитывается по формуле (22):

Vd = 0,89 / 1,9 = 0,468 или 46,8%

8) Коэффициент вариации рассчитывается по формуле (23):

V = 1,22 / 1,9 = 0,642 или 64,2%.

Данная совокупность характеризуется большой разбросанностью значений признака. В среднем количество случаев травматизма на каждом предприятии сильно отклоняется от среднего, гораздо более 40%. Поэтому можно предположить, что средний уровень травматизма в данной выборке не может быть принят для характеристики уровня травматизма во всей отрасли. Следует взять более многочисленную выборку и повторить исследование.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: