Медиана - это значение признака у единицы совокупности, делящей ранжированный ряд пополам (или стоящей в середине ранжированного ряда)

 

Для нахождения медианы в дискретном ряду строится ряд накопленных частот.

Разряд Число рабочих Накопленная частота
1 2 3 4 5 6 5 8 18 16 11 9 5 5+8=13 13+18=31 31+16=47 47+11=58 58+9=67
Итого 67  

В данной совокупности, состоящей из 67 единиц, в середине ранжированного ряда будет находиться 34-й рабочий . Рабочих с 1, 2, 3 разрядом насчитывается 31. Эта величина меньше порядкового номера медианы. Накопленная частота для 4 разряда - 47, т. е. превышает порядковый номер медианы. Отсюда следует, что рабочий, имеющий порядковый номер 34 принадлежит к 4-й тарифной группе. Следовательно, медиана в нашем примере - четвертый разряд.

 

Для нахождения медианы в интервальном ряду используют формулу:

где   Ме  - медиана;

   Х0 - нижняя граница медианного интервала (накопленная частота которого содержит единицу, стоящую в середине ряда);

   hMe - величина медианного интервала

  Σf - сумма частот ряда (численность совокупностей);

 SMe-1 - накопленная частота предмедианного интервала (предшествующего медианному);

 fMe - частота медианного интервала.

Пример: Распределение рабочих по стажу работы характеризуется следующими данными.

Стаж работы, лет Число рабочих, чел. Накопленные частоты
до 2 4 4
2-4 23 4+23=27
4-6 20 27+20=47
6-8 35 47+35=82
8-10 11 82+11=93
10 и более 7 93+7=100
Итого 100  

Определим медианный интервал. Им считается тот, до ко­торого сумма накопленных частот меньше половины всей чис­ленности ряда, а с прибавлением его численности - больше половины. Подсчитаем накопленные итоги частот: 4, 27, 47, 82, 93,100. Середина накопленных частот - 100/2 = 50. Сумма первых трех меньше половины (47 < 50), а если прибавить 35 - больше половины численности совокупности (82 > 50). Следовательно, медианным является интервал 6-8. Оп­ределим медиану:

5. Обобщение изученного материала.

Далеко не всегда имеет смысл вычислять все характеристики, т.к. во многих ситуациях какая-то характеристика может не иметь никакого содержательного смысла.

Рассмотрим задачу:

На колледжной спартакиаде проводится несколько квалификационных забегов на 100 метров, по результатам которых в финал выходит ровно половина от числа всех участников. Перед вами результаты всех спортсменов. Какой результат позволяет пройти в финал?

15,5; 16,8; 21,8; 18,4; 16,2; 32,3; 19,9; 15,5; 14,7; 19,8; 20,5; 15,4.

Проранжируем ряд:

14,7; 15,4; 15,5; 15,5; 16,2; 16,8; 18,4; 19,8; 19,9; 20,5; 21,8; 32,3.

Найдите все три характеристики.

Какая характеристика, по-вашему, самая подходящая?

Здесь для ответа на вопрос нужно определить медиану: . Спортсменов, которые имеют результат выше найденного, будет как раз половина от числа всех участников. А вот результат выше среднего арифметического, которое равно: , еще не позволяет рассчитывать на выход в финал: в списке есть спортсмен с результатом 18,4, который не попадает в финал. Мода этого ряда равна Мо=15,5 и дает слишком завышенную оценку для «среднего результата».

Приведем пример, когда мода содержит больше полезной информации.

Пример: Перед нами ранжированный ряд, представляющий данные о времени дорожно-транспортных происшествий на улицах города в течение одних суток (в виде ч:мин):

0:15, 0:55, 1:20, 3:20, 4:10, 6:30, 7:15, 7:45, 8:40, 9:05, 9:20, 9:40, 10:15, 11:30, 12:10, 12:15, 13:10, 13:50, 14:10, 14:20, 14:25, 15:20, 15:45, 16:20, 16:25, 17:05, 17:30, 17:45, 17:55, 18:05, 18:15, 18:45, 18:50, 19:45, 19:55, 20:30, 20:40, 21:30, 21:45, 22:10, 22:35.

Как и для любого ряда, в данном случае мы можем найти среднее арифметическое – оно равно 13:33. Однако вряд ли имеет какой-то смысл утверждение типа «аварии на улицах города происходят в среднем в 13 часов 33 минуты». В то же время, если сгруппировать данные этого ряда в интервалы, можно найти такой временной интервал, когда происходит наибольшее количество ДТП (такую характеристику называют интервальной модой). Получив такую характеристику, соответствующие службы должны серьезно проанализировать, почему именно в этот временной интервал происходит наибольшее количество происшествий, и попытаться устранить их причины.

Немного юмора (высказывания о статистике):

Статистика: наука, занимающаяся изготовлением недостоверных фактов из достоверных цифр (Эван Эсари) 

Статистика может доказать что угодно, даже правду (Ноэл Мойнихан)

Статистика - это наука о том, сколько всего приходится на каждого человека, если бы все делились справедливо.
(Константин Мелихан)

Статистики как судебные психиатры - они могут подтвердить правоту обеих сторон (Фиорелло Да Тардиа)

Не принимай на веру того, что говорит статистика, пока тщательно не изучишь, о чем она умалчивает (Уильям Уотт)

Статистика, пожалуй, это самая божественная из наук. Ведь она переводит любое событие из разряда случайного в разряд закономерного

В жизни, как правило, преуспевает больше других тот, кто располагает лучшей информацией (Бенджамин Дизраэли)

Для политиков статистика - меч, для бюрократов - щит.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: