Квантили
Квантили - величины, разделяющие совокупность на определенной количество равных по численности элементов частей. Наиболее известные – медиана, квартили, децили, перцентили.
1) Самый известный квантиль – медиана, делящая совокупность на две равные части. Кроме медианы часто используются квартили, делящие ранжированный ряд на 4 равные части, децили -10 частей и перцентили — на 100 частей.
Медиана для дискретного ряда.
Для определения медианы в дискретном ряду сначала порядковый номер медианы по формуле: , а затем о пределяют, какое значение признака обладает накопленной частотой, равной номеру медианы.
Если ряд содержит четное число элементов, то номер медианы будет нецелым числом и медиана будет равна средней из двух значений признака, находящихся в середине. Номер первого из этих признаков – целая часть номера медианы, для второго - номер медианы, округленный до целого числа.
Медиана для интервального ряда
При вычислении медианы для интервального вариационного ряда сначала определяют медианный интервал, в пределах которого находится медиана.
|
|
Для этого:
1) определяется номер медианы по формуле: ,
2) затем по накопленной частоте определяется интервал, в который входит элемент с таким номером,
3) затем — значение медианы по формуле:
где:
- — искомая медиана
- — нижняя граница интервала, который содержит медиану
- i — ширина интервала (верхняя граница интервала – нижняя граница)
- — сумма частот или число элементов в группе
- - накопленная частота интервала, предшествующего медианному
- — частота медианного интервала
Пример. Найти моду и медиану для интервального ряда.
Возрастные группы | Число студентов | Сумма накопленных частот ΣS |
До 20 лет | 346 | 346 |
20 — 25 | 872 | 1218 |
25 — 30 | 1054 | 2272 |
30 — 35 | 781 | 3053 |
35 — 40 | 212 | 3265 |
40 — 45 | 121 | 3386 |
45 лет и более | 76 | 3462 |
Итого | 3462 |
Решение:
1) Определим моду
В данном примере модальный интервал находится в пределах возрастной группы 25-30 лет, так как на этот интервал приходится наибольшая частота (1054).
Рассчитаем величину моды:
Это значит, что модальный возраст студентов равен 27 годам.
2) Определим медиану.
Медианный интервал находится в возрастной группе 25-30 лет, так как в пределах этого интервала расположена варианта, которая делит совокупность на две равные части (Σfi/2 = 3462/2 = 1731). Далее подставляем в формулу необходимые числовые данные и получаем значение медианы:
Это значит, что одна половина студентов имеет возраст до 27,4 года, а другая свыше 27,4 года.
2) Квартили
Квартили представляют собой значение признака, делящее ранжированную совокупность на четыре равные по количеству элементов части.
|
|
Различают квартиль первого порядка (нижний квартиль) , квартиль третьего порядка (верхний квартиль) . Первый (нижний) квартиль отсекает от совокупности ¼ часть единиц с минимальными значениями, а третий (верхний) отсекает ¼ часть единиц с максимальными значениями, второй квартиль является медианой. Второй квартиль делит совокупность на две равные части и является медианой.
Для расчёта квартилей можно поделить вариационный ряд медианой на две равные части, а затем в каждой из них найти медиану.
К примеру, если выборка состоит из 6 элементов, тогда за начальную квартиль выборки принимается второй элемент, а за нижнюю квартиль пятый элемент.
1 квартиль | 2 квартиль |
медиана
В случае, если вариационный ряд состоит к примеру, из 9 элементов, тогда за верхнюю квартиль принимают арифм. среднее 2-го и 3-го элеметов, а за нижнюю арифм. среднее 7-го и 8-го элементов.
медиана |
1 квартиль 3 квартиль
Расчет квартилей для дискретного ряда:
Расчет квартилей для дискретного ряда:
1. В дискретном ряду сначала определяют номера (позиции) квартилей:
позиция 1-го квартиля
позиция 3-го квартиля
2. Если номер квартиля – целое число, то значение квартиля будет равно величине элемента ряда, которое обладает накопленной частотой равной номеру квартиля. Например, номер квартиля равен 20, его значение будет равно значению признака с S =20 (накопленной частотой равной 20).
Если номер квартиля – нецелое число, то квартилем будет условное число между двумя наблюдениями. Значением квартиля будет сумма, состоящая из значения элемента, для которого накопленная частота равна целому значению номера квартиля, и указанной части (нецелая часть номера квартиля) разности между значением этого элемента и значением следующего элемента.
Например, если номер квартиля равна 20,25, квартиль попадает между 20-м и 21-м наблюдениями, и его значение будет равно значению 20-го наблюдения плюс 1/4 (0,25) разности между значением 20-го и 21-го наблюдений.
Расчет квартилей для интервального ряда:
Для расчета квартилей для интервального ряда:
1) Определяем номер квартиля,
2) Определяем квартильный интервал,
3) Рассчитываем квартиль по формуле:
Где:
- нижняя граница интервала, содержащего первый квартиль. Интервал определяется по накопленной частоте интервалов
- нижняя граница интервала, содержащего третий квартиль. Интервал определяется по накопленной частоте интервалов
- ширина интервала
- накопленная частота интервала, предшествующего интервалу, содержащему первый квартиль
- накопленная частота интервала, предшествующего интервалу, содержащему третий квартиль
- частота интервала, содержащего первый квартиль
- частота интервала, содержащего третий квартиль