Цель: Освоить расчет средних величин и вариации для анализа данных судебной статистики.
Задачи: 1. Рассчитать средний срок лишения свободы по составам преступлений в целом по всем статьям УК РФ, каждой статье и частям УК РФ задания.
2. Аналогично рассчитать моду и медиану срока лишения свободы.
3. Рассчитать дисперсию срока лишения свободы по каждой статье УК РФ задания.
4. Вычислить коэффициент вариации и сделать вывод относительно однородности статистической совокупности.
Необ х одимые краткие сведения из теории [11]
Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Средние величины бывают простые и взвешенные.
Средняя арифметическая простая – самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:
,
где x1,x2, …,xn – индивидуальные значения признака (варианты), а N – число единиц совокупности.
Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность (частоту).
|
|
В этом случае сложение всех значений количественного признака заменяется умножением варианты значения на ее соответствующую частоту (количество встречающихся вариантов).
Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:
,
где x1,x2, …,xn – значения вариант признака; f1, f2, …, fn– соответствующие им частоты или N – общее количество единиц.
Замечание. Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х'i, после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, где вместо xi используется х'i.
Медиана (Ме) – это величина, которая соответствует варианту, находящемуся в середине ранжированного ряда. Таким образом, медиана – это тот вариант (значение признака) ранжированного ряда, по обе стороны от которого в данном ряду должно находиться равное число единиц совокупности.
Для нахождения медианы сначала необходимо определить ее порядковый номер в ранжированном ряду по формуле:
где N – объем ряда (число единиц совокупности).
Если ряд состоит из нечетного числа членов, то медиана равна варианте с номером NMe. Если же ряд состоит из четного числа членов, то медиана определяется как среднее арифметическое двух смежных вариант, расположенных в середине.
|
|
В интервальном вариационном ряду сначала указывают интервал, в котором будет находиться медиана. Его называют медианным. Это первый интервал, накопленная частота которого превышает половину объема интервального вариационного ряда. Затем численное значение медианы определяется по формуле:
где:
xМе – нижняя граница медианного интервала
i – величина медианного интервала (разность максимальной и минимальной границ интервала «от-до»);
SМе-1 – накопленная частота интервалов, которые предшествуют медианному (сумма значений в графах таблицы до графы, соответствующей медианному интервалу);
fМе – частота медианного интервала (число в статистической таблице в медианном интервале)
Модой (Мо) называют значение признака, которое наиболее часто встречается у единиц совокупности. К моде прибегают для выявления величины признака, имеющей наибольшее распространение. Для дискретного ряда модой будет являться вариант с наибольшей частотой. Для определения моды интервального ряда сначала определяют модальный интервал (интервал, имеющий наибольшую частоту). В пределах этого интервала будет находиться значение признака, которое может являться модой. Его значение находят по формуле:
где xMo – нижняя граница модального интервала;
i – величина модального интервала (разность максимальной и минимальной границ интервала «от-до»);
fМо – частота модального интервала; fМо-1 – частота интервала, предшествующего модальному; fМо+1 – частота интервала, следующего за модальным.
Показатели вариации используются для установления типичности средней величины, т. е. насколько точно характеризует средняя данную совокупность по определенному признаку.
К основным показателям вариации относятся следующие:
1) дисперсия;
2) среднее квадратическое отклонение;
3) коэффициент вариации.
Дисперсия определяется как средняя из отклонений вариант от средней величины, возведенных в квадрат.
На практике для вычисления дисперсии лучше использовать следующие формулы:
Для простой дисперсии
.