Показатели вариации вычисляются следующим образом.
Среднее значение ‑ средняя арифметическая простая:
где n ‑ объем выборки.
Мода - значение признака, встречающееся чаще всего. Для нахождения моды необходимо расположить все исходные данные в порядке возрастания. Повторяющиеся значения записывают столько раз, сколько они попадаются в исходном массиве. Затем нужно выбрать значение с максимальной частотой, оно и будет модой.
Вариационный ряд может иметь несколько мод.
Медиана ‑ центральное значение упорядоченного вариационного ряда, делящего его на две равные части таким образом, что половина единиц совокупности имеет значения признака меньше, чем медиана, а половина – больше, чем медиана.
Для определения медианы используется построенный ранее ряд значений признака, отсортированных по величине.
Затем находят номер медианы:
где n – объем совокупности.
Значение признака, имеющее в упорядоченном вариационном ряду такой номер, и будет медианой:
Если совокупность содержит четное число значений варьирующего признака, то номер медианы будет дробным числом. В таком случае за медиану условно принимают среднее из двух серединных значений, так как в ряду нет члена, который делил бы совокупность на две равные по объему группы:
|
|
.
Например, если объем исследуемой совокупности n = 20, то номер медианы
Тогда медианой будет среднее из двух значений признака, стоящих в упорядоченном ряду под номерами 10 и 11:
Размах вариации ‑ разность между максимальным и минимальным значениями признака в совокупности:
.
Среднее линейное отклонение (d) является обобщающей мерой вариации индивидуальных значений признака от средней арифметической величины. Она дает абсолютную меру вариации.
Поскольку алгебраическая сумма отклонений то в расчетах данного показателя используются модули т.е. среднее линейное отклонение представляет собой среднюю из модулей отклонений индивидуальных значений признака от средней величины и определяется по формулам.
Среднее квадратическое отклонение () представляет собой корень второй степени из среднего квадрата отклонений отдельных значений признака от их средней.
Формула расчета следующая:
Среднее квадратическое отклонение, как и среднее линейное отклонение, показывает, насколько в среднем отклоняются конкретные варианты признака от его среднего значения.
Квадрат среднего квадратического отклонения называется дисперсией (). Дисперсию используют не только для оценки вариации, но и при измерении взаимосвязей, для проверки статистических гипотез.
Она вычисляется по формуле
|
|
Рассчитать дисперсию можно также по преобразованной формуле
где ‑ средний квадрат значений признака в совокупности, ‑ квадрат среднего значения признака в совокупности:
;
При расчете дисперсии по этой формуле исключается дополнительная процедура по расчету отклонений индивидуальных значений признака от его средней величины, за счет этого уменьшается ошибка, связанная с округлением значений промежуточных вычислений.
Размах вариации, среднее линейное отклонение и среднее квадратическое отклонение являются величинами именованными, т.е. имеют ту же единицу измерения, что и изучаемый признак. Дисперсия имеет в качестве единицы измерения квадрат исходной величины.
Среднее квадратическое отклонение по величине всегда больше среднего линейного отклонения.
Соотношение зависит от наличия в совокупности резких отклонений и может служить индикатором «засоренности» совокупности нетипичными, выделяющимися из основной массы единицами, для нормального распределения это соотношение равно 1,25.
Для оценки интенсивности вариации, а также для сравнения ее величины в разных совокупностях или по разным признакам используют относительные показатели вариации, которые рассчитываются как отношение абсолютных показателей вариации к средней величине признака.
Наиболее часто на практике применяют коэффициент вариации (), который представляет собой относительное квадратическое отклонение:
По величине коэффициента вариации можно судить об интенсивности вариации признака, а следовательно, и об однородности состава изучаемой совокупности. Чем больше величина коэффициента вариации, тем больше разброс значений признака вокруг средней, тем больше неоднородность совокупности. Существует шкала определения степени однородности совокупности в зависимости от значений коэффициента вариации.
Коэффициент вариации (%) | Степень однородности совокупности |
до 30 | Однородная |
30-60 | Средняя |
60 и более | Неоднородная |
Для вычислений заполняется вспомогательная таблица:
Таблица 2
Расчет показателей вариации
№ | |||
… | |||
n | |||
S |