Интервал группировки определяет границы значений варьирующего признака, лежащих в пределах определенной группы. Каждый интервал имеет свою длину (ширину), верхнюю и нижнюю границы или хотя бы одну из них.
Нижней границей интервала называется наименьшее значение признака в интервале. Верхней границей интервала называется наибольшее значение признака в интервале. Нижней границей первого интервала берется, как правило, наименьшее значение признака в совокупности единиц наблюдения.
Верхняя граница последнего интервала не может быть меньше наибольшего значения признака в совокупности единиц наблюдения.
Шириной интервала называется разность между верхней и нижней границами.
Интервалы группировки в зависимости от их ширины бывают равные и неравные. Последние делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные и специализированные.
Если вариация признака проявляется в сравнительно узких границах и распределение носит равномерный характер, то строят группировку с равными интервалами. Ширина равного интервала (h) определяется по формуле
|
|
где Xmax, Xmin— максимальное и минимальное значения признака в совокупности; n— число групп.
Полученную по формуле величину округляют, и она будет являться шагом интервала.
Существуют следующие правила определения шага интервала.
Если ширина интервала, рассчитанная по формуле выше, представляет собой величину, которая имеет один знак до запятой, то в этом случае полученные значения целесообразно округлить до десятых и использовать их в качестве шага интервала.
Если рассчитанная величина интервала имеет две значащие цифры до запятой и несколько после запятой, то это значение целесообразно округлить до целого числа.
В случае, когда рассчитанная величина интервала представляет собой трехзначное число, то эту величину следует округлить до ближайшего числа, кратного 10.
Если размах вариации признака в совокупности велик и значения признака варьируют неравномерно, то надо использовать группировку с неравными интервалами.
Решение вопроса о выборе равных или неравных интервалов зависит от числа единиц совокупности, попавших в каждую выделенную группу, т.е. от степени заполнения интервалов.
Интервалы группировок могут быть закрытыми и открытыми. Закрытыми называются интервалы, в которых указаны верхняя и нижняя границы.
Открытыми называются интервалы, у которых указана только одна граница: верхняя — у первого, нижняя — у последнего.
При группировке единиц совокупности по количественному признак у границы интервалов могут быть обозначены по-разному в зависимости от того, является ли этот признак непрерывным или дискретным.
|
|
Если основанием группировки служит непрерывный признак, то одно и то же значение признака выступает и верхней и нижней границами двух смежных интервалов.
Если в основании группировки лежит дискретный признак, то нижняя граница i-го интервала равна верхней границе (i-1)-го интервала, увеличенной на 1.
В ряде случаев для решения поставленных задач простая группировка (в основе построения лежит один группировочный признак) является недостаточной. В этих случаях переходят к построению группировок исследуемой совокупности по двум и более существенным признакам во взаимосвязи — комбинационной группировке.