Медиана, квартили, децили

Медиана - это значение признака, которое делит статистическую совокупность на две равные части: половина единиц совокупности имеет значения признака не меньше медианы, другая половина - значения признака не больше медианы.

Значения изучаемого признака всех единиц статистической совокупности можно расположить в порядке возрастания (или убывания). В этом случае мы получим ранжированный ряд. Если число единиц совокупности нечетное, то значение признака, находящееся в середине ранжированного ряда, будет являться медианой. Если число единиц совокупности четное, то медианой будет средняя величина из двух значений признака, находящихся в середине ряда.

Пример 8.5. Имеются следующие данные о результатах сдачи экзамена по статистике в студенческой группе:

Таблица 8.2. Данные о результатах сдачи экзамена по статистике в студенческой группе

Номер студента 1 2 3 4 5 6 7 8 9 10 11
Оценка по статистике 3 4 2 3 4 4 4 3 4 5 5

Представим их в виде ранжированного ряда:

Таблица 8.3.

Номер студента 3 1 4 8 2 5 6 7 9 10 11
Оценка по статистике 2 3 3 3 4 4 4 4 4 5 5

Как видим, в ранжированном ряду оценки расположились следующим образом: сначала записана одна неудовлетворительная оценка (ее получил студент, имеющий в ведомости номер 3), затем три оценки "удовлетворительно", пять оценок "хорошо" и две оценки "отлично". В середине ранжированного ряда, имеющего нечетное число членов, стоит оценка "4", которую получил студент, записанный в ведомости под номером 5. Следовательно, оценка "4 (хорошо)" является медианой для данного ряда распределения. Пять студентов получили оценки 4 и ниже (2, 3, 3, 3, 4), другие пять студентов - 4 и выше (4, 4, 4, 5, 5).

Пример 8.6. Имеются данные о цене антоновских яблок в шести магазинах города. Представим их сразу в виде ранжированного ряда:

Таблица 8.4.

Название магазина "Огонек" "Маяк" "Заря" "Татьяна" "Ночной" "Любимый"
Цена яблок, руб. за кг 40 41 42 44 44 45

В середине ранжированного ряда находятся цены двух магазинов, причем они разные. Медиана определяется как средняя величина из этих значений признака. Она равна 43 руб. [(42 + 44): 2 = 43].

Таким образом, в 50% магазинов города яблоки продаются по цене не выше 43 руб. за килограмм, а в других 50% магазинов - по цене не ниже 43 руб.

Квартили (Q) делят ранжированный ряд на четыре равные части: первый квартиль (Q1) включает значения признака, не превышающие 25% единиц совокупности, второй квартиль (Q2) - совпадает с медианой (Ме), третий квартиль (Q3) - значения признака, не превышающие 75% единиц совокупности (рис. 8.3).


Рис. 8.3. Деление ранжированного ряда на четыре равные части

Децили (D) делят ранжированный ряд на десять равных частей: первым децилем (D1) является значение признака, которое не превышает 10% единиц совокупности, вторым (D2) - 20%, третьим (D3) - 30% и т.д. При этом пятый дециль (D5) совпадает с медианой и вторым квартилем (Q2) (рис. 8.4).


Рис. 8.4. Деление ранжированного ряда на десять равных частей

Медиана, квартили и децили относятся к группе квантилей. Квантили - это показатели, которые делят вариационные ряды на определенное количество равных частей. Среди них, помимо названных, также имеются квантили, которые делят ряд на пять равных частей, перцентили - на сто и т.д.

Структурные показатели не зависят от того, имеются ли в статистической совокупности аномальные (резко выделяющиеся) наблюдения. И если средняя величина при их наличии теряет свою практическую значимость, то информативность медианы наоборот усиливается - она начинает выполнять функции средней, т.д. характеризовать центр совокупности.

Способы расчета рассматриваемых структурных показателей зависят от вида вариационного ряда. Рассмотрим их подробнее.




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: