Для анализа и интерпретации количественных данных необходимо их обобщить.
Первый этап представления – это упорядочивание данных по величине от максимальной до минимальной. Такое представление называют несгруппированным рядом.
К характеристикам распределения, описывающим количественно его структуру и строение, относятся:
•характеристики положения;
•рассеивания;
•асимметрии и эксцесса.
К характеристикам положения относятся следующие оценки центральной тенденции:
1. Мода (Мо),
2. медиана (Ме),
3. квантили
4. среднее арифметическое (M).
мода (Мо) - такая величина признака, которая встречается чаще всего в изучаемом ряду, в совокупности.
При расчете моды может возникнуть несколько ситуаций:
1.Два значения признака, стоящие рядом, встречаются одинаково часто. В этом случае мода равна среднему арифметическому этих двух значений. Например, в следующем ряду данных: 12, 13, 14, 14, 14, 16, 16, 16, 18, 19
Мо= (14+16)/2= 15.
2.Два значения, встречаются также одинаково часто, но не стоят рядом. В этом случае говорят, что ряд данных имеет две моды, т.е. он бимодальный.
3.Если все значения данных встречаются одинаково часто, то говорят, что ряд не имеет
моды.
медиана (Ме) – это такое значение признака, которое делит ряд пополам.
При нечетном числе элементов в ряду данных, медиана равна центральному члену ряда, а при четном среднему арифметическому двух центральных значений ряда.
Среднее арифметическое значение признака, вычисленное для какой-либогруппы, интерпретируется как значение наиболее типичного для этой группы человека. Однако бывают случаи, когда подобная интерпретация несостоятельна (в случае, если существует большая разница между минимальным и максимальным значениями признака).
Квантиль – это такое значение признака, которое делит распределение в заданной пропорции: слева 0,5%, справа 99,5%; слева 2,5%, справа 97,5% и т.п.
Обычно выделяют следующие разновидности квантилей:
1)Квартили Q1, Q2, Q3 – они делят распределение на четыре части по 25% в каждой;
2)Квинтили К1, К2, К3, К4 – они делят распределение на пять частей по 20% в каждой;
3)Децили D1,...,D9, их девять, и они делят распределение на десять частей по 10% в каждой;
4)Процентили P1, Р2...,Р99, их девяносто девять, и они делят распределение на сто частей по 1% в каждой части.
Характеристики рассеивания
Существует несколько способов оценки степени разброса или рассеивания данных.
Основными характеристиками рассеивания являются:
1. размах (R),
2. дисперсия (D),
3. среднеквадратическое (стандартное) отклонение(σ – сигма),
4. коэффициент вариации(V).
размах – это разность между максимальным и минимальным значениями признака: R = xmax – xmin.
Дисперсия показывает разброс значений признака относительно своего среднего арифметического значения, то есть насколько плотно значения признака группируются вокруг среднего арифметического
- чем больше разброс, тем сильнее варьируются результаты испытуемых в данной группе, тем больше индивидуальные различия между испытуемыми
- чем меньше разброс, тем однороднее выборка.
среднеквадратическое (стандартное) отклонение(σ – сигма) - (сигма= корень из дисперсии) - этот показатель разброса данных соразмерен первоначальному признаку.
Коэффициент вариации не имеет размерности, что позволяет сравнивать вариативность случайных величин, имеющих различную природу.