Условия применения рядов с равными интервалами

До этого мы изучали только правила построения интервальных рядов с равными интервалами. В то же время, очень часто при анализе реальных данных приходится строить вариационные ряды с неравными интервалами. Количество групп определяется в каждом случае индивидуально, в зависимости от изучаемой совокупности.

Для оценки качества группировки данных (качества разбиения на интервалы) могут быть использованы эмпирическое корреляционное отношение и график плотности распределения единиц признака (полигон распределения частот и гистограмма).

Первоначально строят интервальный ряд с равными интервалами и анализируют возможность его применения. Применение равных интервалов возможно, если вариация признака (разница между максимальным и минимальным значением) не очень сильная и распределение является равномерным (все группы достаточно наполнены, линия полигона частот не имеет резких перепадов и зигзагов).

Если же эти условия не соблюдаются, то тогда нужно строить интервальные ряды с неравными интервалами. Неравные интервалы делятся на прогрессивно возрастающие, прогрессивно убывающие, произвольные, равночастотные и специализированные.

Приблизительно число интервалов m можно оценить исходя только из объема выборки n по формуле Стерджесса или по таблице:

Объем выборки, n 25-40 40-60 60-100 100-200 Больше 200
Число интервалов, k 5-6 6-8 7-10 8-12 10-15

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: