Медианой в статистике называется варианта, расположенная в середине упорядоченного ряда данных, и которая делит статистическую совокупность на две равные части так, что у одной половины значения меньше медианы, а у другой половины – больше её. Для определения медианы необходимо построить ранжированный ряд, т.е. ряд в порядке возрастания или убывания индивидуальных значений признака.
В дискретном упорядоченном ряду с нечётным числом членов медианой будет варианта, расположенная в центре ряда.
Например: Стаж пяти рабочих составил 2, 4, 7, 9 и 10 лет. В таком ряду медиана-7 лет, т.е. Ме=7 лет
Если дискретный упорядоченный ряд состоит из чётного числа членов, то медианой будет средняя арифметическая из двух смежных вариант, стоящих в центре ряда.
Например: Стаж работы шести рабочих составил 1, 3, 4, 5, 10 и 11лет. В этом ряду имеются две варианты, стоящие в центре ряда. Это варианты 4 и 5. Средняя арифметическая из этих значений и будет медианой ряда
Чтобы определить медиану для сгруппированных данных, необходимо считать накопленные частоты.
|
|
Например: По имеющимся данным определим медиану размера обуви
Размер обуви | Количество проданных пар | Сумма накопленных частот |
8+19=27 | ||
27+34=61 | ||
61+108=169 | ||
- | ||
- | ||
- | ||
- | ||
Итого |
Для определения медианы надо подсчитать сумму накопленных частот ряда. Наращивание итога продолжается до получения накопленной суммы частот, превышающей половину суммы частот ряда. В нашем примере сумма частот составила 300, её половина – 150. Накопленная сумма частот получилась равной 169. Варианта, соответствующая этой сумме, т.е. 37 и есть медиана ряда.
Если же сумма накопленных частот против одной из вариант равна точно половине суммы частот ряда, то медиана определяется как средняя арифметическая этой варианты и последующей.
Например: По имеющимся данным определим медиану заработной платы рабочих
Месячная заработная плата, тыс.руб. | Число рабочих, чел. | Сумма накопленных частот |
14,0 | ||
14,2 | 2+6=8 | |
16,0 | 8+12=20 | |
16,8 | - | |
18,0 | - | |
Итого: | - |
Медиана будет равна:
Медиана интервального вариационного ряда распределения определяется по формуле:
Где ХМе – нижняя граница медианного интервала;
hMe – величина медианного интервала;
∑f - сумма частот ряда;
fМе – частота медианного интервала;
Например: По имеющимся данным о распределении предприятий по численности промышленно – производственного персонала рассчитать медиану в интервальном вариационном ряду
Группы предприятий по численности ППП, чел. | Число предприятий | Сумма накопленных частот |
100-200 | ||
200-300 | 1+3=4 | |
300-400 | 4+7=11 | |
400-500 | 11+30=41 | |
500-600 | - | |
600-700 | - | |
700-800 | ||
Итого: |
Определим, прежде всего, медианный интервал. В данном примере сумма накопленных частот, превышающих половину суммы всех значений ряда, соответствует интервалу 400-500.Это и есть медианный интервал, т.е. интервал, в котором находится медиана ряда. Определим её значение
|
|
Если же сумма накопленных частот против одного из интервалов равна точно половине суммы частот ряда, то медиана определяется по формуле:
где n – число единиц в совокупности.
Например: По имеющимся данным о распределении предприятий по численности промышленно – производственного персонала рассчитать медиану в интервальном вариационном ряду
Группы предприятий по численности ППП, чел. | Число предприятий | Сумма накопленных частот |
100-200 | ||
200-300 | 1+3=4 | |
300-400 | 4+6=10 | |
400-500 | 10+30=40 | |
500-600 | 40+20=60 | |
600-700 | - | |
700-800 | ||
Итого: |
чел
Моду и медиану в интервальном ряду можно определить графически:
моду в дискретных рядах - по полигону распределения, моду в интервальных рядах - по гистограмме распределения, а медиану - по кумуляте.
Мода интервального ряда распределения определяется по гистограмме распределения определяют следующим образом. Для этого выбирается самый высокий прямоугольник, который является в данном случае модальным. Затем правую вершину модального прямоугольника соединяем с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс. Абсцисса точки пересечения этих прямых и будет модой распределения.
Медиана рассчитывается по кумуляте. Для её определения из точки на шкале накопленных частот (частостей), соответствующей 50%, проводится прямая, параллельная оси абсцисс, до пересечения с кумулятой. Затем из точки пересечения указанной прямой с кумулятой опускается перпендикуляр на ось абсцисс. Абсцисса точки пересечения является медианой.
Кроме моды и медианы в вариантных рядах могут быть определены и другие структурные характеристики – квантили. Квантили предназначены для более глубокого изучения структуры ряда распределения.
Квантиль – это значение признака, занимающее определенное место в упорядоченной по данному признаку совокупности. Различают следующие виды квантилей:
- квартили – значения признака, делящие упорядоченную совокупность на четыре равные части;
- децили – значения признака, делящие упорядоченную совокупность на десять равных частей;
- перцентели - значения признака, делящие упорядоченную совокупность на сто равных частей.
Таким образом, для характеристики положения центра ряда распределения можно использовать 3 показателя: среднее значение признака, мода, медиана. При выборе вида и формы конкретного показателя центра распределения необходимо исходить из следующих рекомендаций:
- для устойчивых социально-экономических процессов в качестве показателя центра используют среднюю арифметическую. Такие процессы характеризуются симметричными распределениями, в которых ;
- для неустойчивых процессов положение центра распределения характеризуется с помощью Mo или Me. Для асимметричных процессов предпочтительной характеристикой центра распределения является медиана, поскольку занимает положение между средней арифметической и модой.