Представление количественных данных

Для анализа и интерпретации количественных данных необходимо их обобщить.

Первый этап представления – это упорядочивание данных по величине от максимальной до минимальной. Такое представление называют несгруппированным рядом.

К характеристикам распределения, описывающим количественно его структуру и строение, относятся:

•характеристики положения;

•рассеивания;

•асимметрии и эксцесса.

К характеристикам положения относятся следующие оценки центральной тенденции:

1. Мода (Мо),

2. медиана (Ме),

3. квантили

4. среднее арифметическое (M).

мода (Мо) - такая величина признака, которая встречается чаще всего в изучаемом ряду, в совокупности.

При расчете моды может возникнуть несколько ситуаций:

1.Два значения признака, стоящие рядом, встречаются одинаково часто. В этом случае мода равна среднему арифметическому этих двух значений. Например, в следующем ряду данных: 12, 13, 14, 14, 14, 16, 16, 16, 18, 19

Мо= (14+16)/2= 15.

2.Два значения, встречаются также одинаково часто, но не стоят рядом. В этом случае говорят, что ряд данных имеет две моды, т.е. он бимодальный.

3.Если все значения данных встречаются одинаково часто, то говорят, что ряд не имеет

моды.

медиана (Ме) – это такое значение признака, которое делит ряд пополам.

При нечетном числе элементов в ряду данных, медиана равна центральному члену ряда, а при четном среднему арифметическому двух центральных значений ряда.

Среднее арифметическое значение признака, вычисленное для какой-либогруппы, интерпретируется как значение наиболее типичного для этой группы человека. Однако бывают случаи, когда подобная интерпретация несостоятельна (в случае, если существует большая разница между минимальным и максимальным значениями признака).

Квантиль – это такое значение признака, которое делит распределение в заданной пропорции: слева 0,5%, справа 99,5%; слева 2,5%, справа 97,5% и т.п.

Обычно выделяют следующие разновидности квантилей:

1)Квартили Q1, Q2, Q3 – они делят распределение на четыре части по 25% в каждой;

2)Квинтили К1, К2, К3, К4 – они делят распределение на пять частей по 20% в каждой;

3)Децили D1,...,D9, их девять, и они делят распределение на десять частей по 10% в каждой;

4)Процентили P1, Р2...,Р99, их девяносто девять, и они делят распределение на сто частей по 1% в каждой части.

Характеристики рассеивания

Существует несколько способов оценки степени разброса или рассеивания данных.

Основными характеристиками рассеивания являются:

1. размах (R),

2. дисперсия (D),

3. среднеквадратическое (стандартное) отклонение(σ – сигма),

4. коэффициент вариации(V).

размах – это разность между максимальным и минимальным значениями признака: R = xmax – xmin.

Дисперсия показывает разброс значений признака относительно своего среднего арифметического значения, то есть насколько плотно значения признака группируются вокруг среднего арифметического

- чем больше разброс, тем сильнее варьируются результаты испытуемых в данной группе, тем больше индивидуальные различия между испытуемыми

- чем меньше разброс, тем однороднее выборка.

среднеквадратическое (стандартное) отклонение(σ – сигма) - (сигма= корень из дисперсии) - этот показатель разброса данных соразмерен первоначальному признаку.

Коэффициент вариации не имеет размерности, что позволяет сравнивать вариативность случайных величин, имеющих различную природу.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: