Дисперсия представляет собой величину, показывающую сумму квадратов отклонений вариантов изучаемого признака от средней.
Дисперсия может так же, как и средняя арифметическая, рассчитываться по простой и взвешенной формуле. Простая формула используется, когда данные наблюдения не сведены в вариационный ряд либо все частоты равны единице или одинаковы и имеет вид:
(12.11)
где хi — i -е значение признака;
— средняя арифметическая признака;
п — объем ряда (число наблюдений, число значений признака).
Взвешенная дисперсия вычисляется по формуле 12.12:
(12.12)
где хi — i -е значение признака;
— средняя арифметическая признака;
mi — частота i -го значения признака;
п — число значений признака (вариантов).
Если весами вариационного ряда являются частости вариантов, то расчет взвешенной дисперсии можно производить по формуле (12.13):
(12.13)
где ω i — частость i -го значения признака;
— средняя арифметическая признака;
п — число вариантов.
Дисперсия характеризует отклонение от средней в квадратных единицах измерения признака, что не всегда удобно, поэтому чаще используют для характеристики колеблемости признака такой показатель, как среднее квадрати-ческое отклонение, которое измеряется в тех же единицах, что и изучаемый признак.
|
|
Среднее квадратическое отклонение рассчитывается по формуле:
(12.14)
Наиболее точно оценивается колеблемость с помощью коэффициента вариации. Этот показатель измеряется в процентах и позволяет оценить, на сколько процентов колеблется изучаемый признак около среднего значения. Коэффициент вариации рассчитывается по формуле:
(12.15)
Принято считать, что если коэффициент вариации больше 35%, то изучаемая статистическая совокупность является неоднородной, и колеблемость признака высока. Следовательно, использование средней арифметической для ее характеристики неверно — средняя арифметическая не типична для изучаемой совокупности. В таком случае необходимо использовать моду или медиану для характеристики наиболее типичного значения варианта признака рассматриваемой совокупности.