Средняя величина - это обобщающий показатель, который характеризует качественно однородную совокупность по определенному количественному признаку. Например, средний возраст лиц, осужденных за кражу.
Средние величины бывают простые и взвешенные. Взвешенными средними называют величины, которые учитывают, что некоторые варианты значений признака могут иметь различную численность, в связи, с чем каждый вариант приходится умножать на соответствующую численность. Иными словами, «весами» выступают числа единиц совокупности в разных группах, т.е. каждый вариант «взвешивают» по своей частоте. Частоту называют статистическим весом.
Средняя арифметическая простая – самый распространенный вид средней. Она равна сумме отдельных значений признака, деленной на общее число этих значений:
,
где x1,x2, …,xN – индивидуальные значения варьирующего признака (варианты), а N – число единиц совокупности.
Средняя арифметическая взвешенная применяется в тех случаях, когда данные представлены в виде рядов распределения или группировок. Она вычисляется как сумма произведений вариантов на соответствующие им частоты, деленная на сумму частот всех вариантов:
|
|
,
где xi – значение i–й варианты признака; fi – частота i–й варианты.
Таким образом, каждое значение варианты взвешивается по своей частоте, поэтому частоты иногда называют статистическими весами.
Замечание. Если вычисление средней величины производят по данным, сгруппированным в виде интервальных рядов распределения, то сначала надо определить серединные значения каждого интервала х'i, после чего рассчитать среднюю величину по формуле средней арифметической взвешенной, где вместо xi используется х'i.
Вариация – это различия в значениях какого-либо признака у разных единиц данной совокупности в один и тот же период или момент времени. Она возникает в результате того, что индивидуальные значения признака складываются под совокупным влиянием разнообразных факторов (условий), которые по-разному сочетаются в каждом отдельном случае. Показатели вариации используются для установления типичности средней величины, т. е. насколько точно характеризует средняя данную совокупность по определенному признаку.
К основным показателям вариации относятся следующие:
1) дисперсия;
2) среднее квадратическое отклонение;
3) коэффициент вариации.
Дисперсия определяется как средняя из отклонений, возведенных в квадрат.
Простая дисперсия для не сгруппированных данных:
.
Взвешенная дисперсия для вариационного ряда:
Замечание. На практике для вычисления дисперсии лучше использовать следующие формулы:
|
|
Для простой дисперсии
.
Для взвешенной дисперсии
Среднее квадратическое отклонение - это корень квадратный из дисперсии:
Среднее квадратическое отклонение является мерилом надежности средней. Чем меньше среднее квадратическое отклонение, тем, однороднее совокупность и тем лучше средняя арифметическая отражает собой всю совокупность.
Коэффициент вариации – выраженное в процентах отношение среднего квадратического отклонения к средней арифметической:
Коэффициент вариации используют не только для сравнительной оценки вариации разных признаков или одного и того же признака в различных совокупностях, но и для характеристики однородности совокупности. Статистическая совокупность считается количественно однородной, если коэффициент вариации не превышает 33 % (для распределений, близких к нормальному распределению).
Порядок работы
1 Открыть новый файл в приложении MS Excel и сохранить файл, указав в имени файла свою фамилию. Создать в Excel таблицу 5 и добавить к ней справа 4 столбца: «Дисперсия срока лишения свободы», «Медиана срока лишения свободы», «Мода срока лишения свободы», «Среднее квадратическое отклонение» и «Коэффициент вариации».
2. Рассчитайте общее число осужденных по всем графам (просуммируйте).
3. Определите середину интервала по всем показателям сроков лишения свободы и укажите ее по графам в строке «Середина интервала» (в первой группе «до1 года» не указана нижняя граница, за нее принимается 2 месяца или 1/6 года).
4. Введите формулу средней взвешенной после знака «=» в строку формул (сумму произведений числа осужденных по соответствующей категории на середину интервала срока лишения свободы разделить на общее число осужденных к лишению свободы этой категории тяжести). Протяните формулу по всем строкам – для всех категорий и общего числа осужденных (не забудьте зафиксировать адреса ячеек, ссылающиеся на середины интервалов знаком $).
5. Найдите медианный интервал для категории числа осужденных «небольшой тяжести». Рассчитайте медиану, введя в первую свободную ячейку столбца «Медиана срока лишения свободы» после знака «=» формулу для вычисления медианы интервального вариационного ряда. Аналогично найдите медиану для остальных категорий осужденных и общего числа осужденных.
Формула исчисления медианы для интервального вариационного ряда имеет следующий вид:
Ме = ХМе + iМе * (∑f/2 - SМе-1)/fМе,
Где ХМе - начальное значение медианного интервала;
iМе - величина медианного интервала;
∑f - сумма частот ряда (численность ряда);
SМе-1 - сумма накопленных частот в интервалах, предшествующих медианному;
fМе - частота медианного интервала.
6. Найдите модальный интервал для категории числа осужденных «небольшой тяжести». Рассчитайте моду, введя в первую свободную ячейку столбца «Мода срока лишения свободы» после знака «=» формулу для вычисления моды интервального вариационного ряда. Аналогично найдите моду для остальных категорий осужденных и общего числа осужденных.
Для расчета определенного значения модальной величины признака, заключенного в интервале, применяют формулу:
Мо = ХМо + iМо *(fМо - fМо-1)/((fМо - fМо-1) + (fМо - fМо+1)),
Где ХМо - минимальная граница модального интервала;
iМо - величина модального интервала;
fМо - частота модального интервала;
fМо-1 - частота интервала, предшествующего модальному;
fМо+1 - частота интервала, следующего за модальным.
7. Введите формулу взвешенной дисперсии после знака «=» в строку формул. При этом лучше использовать формулу, приведенную в замечании, взяв средний срок лишения свободы , вычисленный на четвертом этапе работы. Протяните формулу по всем строкам – для всех категорий и общего числа осужденных (не забудьте зафиксировать адреса ячеек, ссылающиеся на середины интервалов знаком $).
|
|
8. Найдите среднее квадратическое отклонение σ для каждой категории осужденных и общего числа осужденных, введя в первую свободную ячейку столбца «Среднее квадратическое отклонение» после знака «=» формулу для его вычисления.
9. Найдите коэффициент вариации для каждой категории осужденных и общего числа осужденных, введя в первую свободную ячейку столбца «Коэффициент вариации» после знака «=» формулу для его вычисления.
10. Сделайте вывод об однородности статистических совокупностей, используя полученные значения коэффициента вариации.
11. Постройте диаграмму с графиками, отражающими распределение числа осужденных за преступления различной степени тяжести по срокам лишения свободы.
12. Исключите из расчетов число осужденных, которым были назначены в итоговом наказании сроки лишения свободы, превышающие верхний предел по тяжести, предусмотренный ст. 15 УК РФ (в редакции, соответствующей 2008 году). Произведите в дополнительных столбцах пересчет рассчитанных средних значений и показателей вариации, Сравните полученные результаты.