double arrow

Мода и медиана



Модой называется величина признака (варианта), которая чаще всего встречается в данной совокупности. В вариационном ряду это будет варианта, имеющая наибольшую частоту.

Медиана – это варианта, расположенная в середине упорядоченного вариационного ряда. Медиана делит ряд пополам, по обе стороны от нее находится одинаковое количество единиц совокупности.

Мода используется для характеристики наиболее часто встречающегося признака в совокупности (наиболее распространенная должность в организации, наиболее распространенный размер обуви и т.д.) Иными словами мода характеризует типичность явления.

Медиана показывает количественную границу значения варьирующего признака, которую достигла половина членов совокупности. Например, средняя заработная плата наемных работников в целом по экономике Казахстана составляла 49754 тенге, в тоже время половина работающих получали заработную плату не более 43505 тенге, т.е у половины занятых наемным трудом заработная плата была меньше средней не менее чем в полтора раза!

Два ряда распределения могут иметь заметно различающиеся средние величины некоторого признака и в то же время одинаковое медианное значение. Отсюда, медиана, как и мода, также характеризует типичность признака.




Нахождение моды и медианы в дискретном вариационном ряду.

Рассмотрим распределение семей в некотором населенном пункте по количеству детей

Группа семей по числу детей Число семей
Итого

Модой в этом примере будет семья, имеющая двоих детей, так как этому значению варианты соответствует наибольшее число семей.

Если распределение равномерное, где все варианты встречаются одинаково част, то говорят, что ряд не имеет моды, или, иначе, что все варианты одинаково модальны.

Могут быть случаи, когда две варианты встречаются одинаково часто. Тогда говорят, что распределение бимодально. Для нахождения медианы необходимо сумму частот разделить пополам и к полученному результату прибавить 0,5. В нашем случае это будет 101 варианта (201/2+ 0,5). Данная варианта находится в группе семей с двумя детьми, т.е. медианой будет семья, имеющая двух детей.

Если в ряду имеется четное количество частот (например, 200), то номер медианной варианты будет дробным (для 200 будет 200,5). В этом случае медиана находится между 100 и 101 вариантами, а ее значение будет равно средней из значений этих двух вариант.



Расчет моды в интервальном вариационном ряду. В моде и медиане не погашаются индивидуальные отклонения. Они всегда соответствуют определенной варианте. Если имеются все значения признака, то не требуется проводить расчеты для определения моды и медианы. Однако в интервальном вариационном ряду для нахождения приближенного значения моды и медианы в пределах определенного интервала прибегают к расчетам.

Ряд распределения рабочих по заработной плате

Группа рабочих по зарплате, тенге Число рабочих
36000-38000
38000-40000
40000-42000
42000-44000
44000-46000
46000-48000
Итого

Модальным интервалом здесь является интервал, где варианта лежит в пределах от 44-до 46 тыс. тенге, поскольку наибольшее количество рабочих имеют заработную плату именно в этих пределах. Для расчета определенного значения модальной величины признака, заключенного в этом интервале, применяют такую формулу:

Минимальная граница модального интервала (в примере 44000);

Частота интервала, предшествующего модальному (115);

Частота модального интервала (180);

Частота интервала, следующего за модальным (45)

Рассчитаем значение моды для нашего примера:

Мо= 34000+ 2000* (180- 115)/ [(180-115)+(180-45)]=34000+2000* 65/200= 34000+2000*0?325= 34650 тенге.

Смысл формулы заключается в том, что величину той части модального интервала, которую нужно добавить к его минимальной границе, определяют в зависимости от величины частот предшествующего и последующего интервалов. В данном случае к 34000 прибавляем 650, т.е. меньше половины интервала (2000), потому что частота предшествующего интервала (115) больше частоты последующего интервала(45).

Расчет медианы в интервальном вариационном ряду. Для исчисления медианы сначала необходимо определить интервал, в котором она находится (медианный интервал). Это интервал, кумулятивная частота которого будет превышать половину суммы частот. Половина частот в нашем случае равна 250(500/2). Суммируя последовательно частоты в ряду, мы превысим середину суммы частот на четвертом интервале (10+ 50+100+115= 275), т.е. медианным у нас будет интервал 32000-34000 тенге. До этого интервала сумма частот составила 160. Для получения медианы необходимо прибавить еще 90 единиц (250-160).

При определении медианы предполагают, что значение единиц в границах распределяется равномерно. Следовательно, если 115 единиц, находящихся в этом интервале, распределяется равномерно в интервале, равном 2000, то 90 единицам будет соответствовать следующая его величина:

2000*90/115+1560

Прибавив полученную величину к минимальной границе медианного интервала, получим искомое значение медианы:

Ме= 32000+1560= 33560 тенге.

Формула для исчисления медианы для интервального вариационного ряда будет иметь вид: Ме= ХМе +IМе *(∑f/2-S Ме-1) / fМе

Где ХМе- начальное значение медианного интервала;

IМе- величина медианного интервала;

(∑f – сумма частот ряда(численность ряда);

S Ме-1 – сумма накопленных частот в интервалах, предшествующих медианному;

fМе- частота медианного интервала.

Рассчитаем медиану для нашего случая:

Ме= 32000+2000- (500/2_ 160)/115= 33560 тенге.

Таким образом, для нашего примера средняя арифметическая равна 33160, мода – 34650, медиана – 33560 тенге. Соотношение этих трех величин указывает направление и степень ассиметрии распределения.

Квартили и децили. Дополнительно к медиане для характеристики структуры вариационного ряда исчисляют квартили, делящие ряд по сумме частот на четыре равные части, и децили, которые делят ряд по сумме частот на 4 равные части, и децили, которые делят ряд по сумме на 10 равных частей.

Второй квартиль равен медиане, а первый и третий исчисляются аналогично расчету медианы, только вместо медианного интервала берется для первого квартиля интервал, в котором находится варианта, отсекающая ¼ численности частот, а для третьего квартиля – варианта, отсекающая ¾ численности частот. Рассчитаем для нашего примера первый и третий квартили:

Q1= Хq1+iq1*(∑f/4-S q1-1)/fq1= 30000+2000*(125-60)/100= 31300 тенге.

Четвертая часть частот составляет 125(500/4) и находится в интервале 30000-32000. Следовательно, Хо1= 30000. Сумма накопленных частот до данного интервала равна 60(S q1-1), частота этого интервала - 100(fq1). Полученное значение первого квартиля означает, что у трех четвертей рабочих заработная плата составляет 31300 тенге и выше (или у одной четверти рабочих она не превышает 31300 тенге). Рассчитаем третий квартиль: Q3= Хq3+iq3*(∑3f/4-S q3-1)/fq3 = 34000+2000* (375-275)/100= 35110 тенге.

Следовательно, заработная плата каждого четвертого рабочего превышает 35110 тенге (или у трех четвертей рабочих она не превышает 35110 тенге).

Основные правила применения средних в статистике.

Общие требования. Средние должны относится к явлениям одного и того же вида и базироваться на массовом обобщении фактов. Только тогда они отражают сущность явления и на их значение не оказывают влияние случайные факторы. Это требование в статистике связывает средние с законом больших чисел.

Второе требование к средним в статистике заключается в качественной однородности совокупности. Из этого следует, что нельзя применять средние к такой совокупности, отдельные части которой подчинены различным закона развития в отношении осредняемого признака. Качественно однородные совокупности выделяются с помощью метода группировки.

Общие и групповые средние. Даже в пределах однородной совокупности количественные различия могут носить не случайный, а систематический характер. Поэтому наряду с общей средней всей совокупности вычисляются групповые средние. Например, динамика урожайности сельскохозяйственной культуры может показывать тенденцию ее снижения. Однако она может быть обусловлена различиями почвенно-климатических и других условий в разных регионах. Группируя районы страны по этим признакам, можно обнаружить, что динамика средней урожайности в отдельных районах либо не изменяется, либо возрастает, а уменьшение общей средней в целом по стране обусловлено ростом удельного веса районов с более низкой урожайностью в общем объеме производства этой сельскохозяйственной культуры. То есть динамика групповых средних более полно отразила закономерность изменения урожайности, а динамика общей средней показывает лишь ее общий результат.

Средние величины и ряды распределения. Метод средних, дополненный рядами распределения, становится значительно богаче для анализа закономерностей. Средние в статистике следует применять на основе и в органическом единстве с методом группировок. Метод группировок позволяет отграничить качественно однородные совокупности для применения средних характеристик, дополнить общую среднюю групповыми средними, дополнить средние характеристики рядами распределения. Часто за общими, сравнительно благополучными средними скрываются показатели плохой работы на отдельных предприятиях, тяжелой ситуации в отдельных социально-демографических группах населения. Не видны и положительные результаты. Поэтому общие средние дополняются групповыми средними, а групповые средние дополняются минимальными и максимальными показателями в группах. То есть должны изучаться и индивидуальные величины. Отсутствие каких-либо качественных ограничений в расчете средних приводит к тому, что они нередко исчисляются в отрыве от сущности явлений. Так, в среднем доходы населения могут расти. В то же время может расти неравенство в их распределении, а число бедных, имеющих доходы ниже прожиточного минимума, не уменьшатся.

Средние в статистике следует применять на основе и в органическом единстве с методом группировок. Метод группировок позволяет отграничить качественно однородные совокупности для использования средних характеристик. Группировки позволяют избежать применения фиктивных средних и сделать более глубокий анализ с помощью групповых средних.



Сейчас читают про: