Определение процентилей

P -й процентиль представляет собой точку, ниже которой лежит P процентов оценок.

Перед началом вычисления любого процентиля в группе оценок надо упорядочить эти оценки по возрастанию либо сгруппировать данные. Вычисление любого процентиля упростится, если построить распределение накопленных частот. Накопленные частоты к любой заданной оценке представляют собой суммарное количество частот на этой оценке или ниже ее. Они приведены в последнем столбце таблицы 3.1.

Найдем, например, Р 40, т.е. точку, ниже которой лежат 40 % из 38 оценок, полученных учащимися. Вычисление Р 40 можно выполнить за 6 шагов.

Шаг 1. Найти 40 % от n = 38 (0,4*38 = 15,2).

Шаг 2. Определить фактическую нижнюю границу L разряда оценок, содержащего 15,2-ю оценку снизу. Так как 14 человек имеют оценки 74 или меньше, а 18 – оценки 79 или меньше, то частота 15,2 лежит в интервале разрядов оценок 75–79, который имеет фактическую нижнюю границу 74,5.

Допустим, что четыре частоты в интервале разрядов оценок распределены равномерно. Тогда каждая частота займет 1/4 часть. Определить, на какие части рассекает интервал 15,2 оценка, – значит решить задачу интерполяции внутри интервала. Это реализуют шаги 3, 4 и 5.

Шаг 3. Вычесть накопленную к L частоту (cum. f) из 0,4n (L = 74,5, cum. f = 14), следовательно, 0,4 ncum. f = 15,2 – 14 = 1,2. На 3 шаге определяется, сколько частот (1,2) в интервале 75–79 лежит ниже 0,4n.

Шаг 4. Разделить результат 3-го шага на частоту (f = 4) в интервале, содержащем накопленную частоту 0,4 n.

.

4-й шаг – это определение той доли интервала разрядов оценок, которая лежит под накопленной частотой 0,4n. В интервале 75–79 находится 4 частоты, а 1,2/4 = 0,3-ю часть интервала занимают первые 1,2 частоты.

Шаг 5. Умножить результат 4-го шага на ширину (W = 5) разряда оценок:

0,3*5 = 1,5.

Шаг 6. Прибавить результат 5-го шага к L:

Р 40 = 74,5 + 1,5 = 76.

Шаги с 1-го по 6-й можно выразить одной формулой

                              Рx = ,                                (3.1)

где L – фактическая нижняя граница интервала оценок, содержащего x*n -ю частоту снизу, cum. f – накопленная к L частота; f – частота интервала, содержащего частоту x*n; W – ширина любого интервала оценок.

Покажем теперь применение формулы (3.1) на примере определения Р70 по данным таблицы 3.1. Оценка x*n = 0,70*38 = 26,6-я оценка – лежит в интервале 90-94, который имеет фактическую нижнюю границу 89,5. Разность между x*n и накопленной к 89,5 частотой составляет 26,6 – 25. Учитывая, что частота в интервале, включающем 26,6-ю оценку, равна 3, а ширина интервала равна 5, получаем

Таким образом, 70 % учащихся получили оценку ниже 92,2. Это утверждение нельзя считать абсолютно точным. В процедуру определения процентилей ошибки вошли по двум причинам.

Во-первых, оценка выставляется с точностью до одного балла (а не 0,5 или 0,1). Во-вторых, предполагалось, что частоты внутри каждого интервала оценок были равномерно распределены по всему интервалу. Но эти ошибки несущественны.

Хотя дробные процентили для дискретных переменных (например, количество детей в классе) и не вяжутся с общепринятым смыслом, они все же полезны и находят широкое применение, несмотря на то, что невозможно найти класс с 27,31 ученика.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: