Меры центральной тенденции

Описательные статистики.

Правила ранжирования.

Типы данных.

Данные – это основные элементы, подлежащие классифицированию или разбитые на категории с целью обработки. Выделяют три типа данных.

1. Номинативные данные: категориальные (качественные) данные, представляющие собой особые свойства элементов выборки. Например, цвет глаз у испытуемых. Эти данные нельзя измерить, но можно оценить частоту их встречаемости. Если возможны только два значения номинативных параметров (например, выполнил тест – не выполнил тест), то такие данные называют бинарными.

2. Ранговые данные, соответствующие местам этих элементов в последовательности, полученной при их расположении в возрастающем порядке. Их можно представить в виде порядковой шкалы.

3. Метрические данные: количественные данные, получаемые при измерениях и выраженные в соответствующих единицах (кг, IQ, тестовые баллы и т.д.). Их можно распределить на шкале интервалов или отношений.

Использование порядковой шкалы позволяет присваивать ранги объектам по какому-либо признаку. Таким образом, метрические значения переводят в ранговые. При этом фиксируются различия в степени выраженности свойств. В процессе ранжирования следует придерживаться двух правил.

Правило порядка ранжирования. Надо решить, кто получает первый ранг: объект с самой большей степенью выраженности какого-либо качества или наоборот. Чаще всего это абсолютно безразлично и не отражается на конечном результате. Традиционно принято первый ранг приписывать объектам с большей степенью выраженности качества (большему значению – меньший ранг). Например, чемпиону присуждают первое место, а не наоборот. Хотя и здесь если бы был принят обратный порядок, то конечные статистические выводы от этого не изменились бы.

Правило связанных рангов. Объектам с одинаковой выраженностью свойств приписывается один и тот же ранг. Этот ранг представляет собой среднее значение тех рангов, которые они получили бы, если бы не были равны.

Наиболее часто в статистике используют три меры центральной тенденции распределения: мода, среднее арифметическое и медиана.

Мода – это наиболее часто встречающееся значение в ряду данных. Например, в следующем массиве: {2, 3, 5, 1, 4, 5, 6, 5, 2} модой будет являться значение 5, обозначается следующим образом: Мо=5. Если выборка содержит две моды, то распределение называется бимодальным. Таким примером может служить массив { 3, 3, 5, 1, 4, 5, 6, 5, 3 } (Мо1=5, Мо2=3). Если все значения выборки встречаются одинаково часто, то моды у распределения нет.

Бимодальное или полимодальное (содержащее более двух мод) распределения могут рассматриваться как признак неоднородности выборки.

Среднее арифметическое значение – это отношение суммы всех значений данных к числу слагаемых. Среднее арифметическое часто обозначается как, число слагаемых буквой n или N, а индивидуальные значения показателя – символом xi.

.

В качестве примера можно рассмотреть массив: {8, 9, 11, 12, 12, 13, 14, 17, 19, 19, 20, 20}. = (8+9+11+2*12+13+14+17+2*19+2*20)/12 = 14,5.

Если в ряду данных присутствуют числа со знаком «минус», то суммирование производится с учетом этих знаков.

Медиана разбивает выборку на две равные части. Для определения медианы необходимо сначала упорядочить данные. Например, для определения значения медианы в массиве {8, 11, 12, 20, 12, 13, 9, 15, 19, 17, 19} необходимо этот массив упорядочить (произвести сортировку по возрастанию): {8, 9, 11, 12, 12, 13, 15, 17, 19, 19, 20}. Медиана будет равна 13, обозначается следующим образом: Ме=13. Если количество данных в выборке четное, то медиана равна среднему арифметическому показателю между двумя центральными значениями. Например, если добавить в последнюю выборку значение 20 и упорядоченный массив примет следующий вид: {8, 9, 11, 12, 12, 13, 15, 17, 19, 19, 20, 20}, то медиана будет равна 14. В подобном случае медиана не может соответствовать ни одному из значений выборки. Медиана может принимать и дробные значения. Например, если мы в последнем примере 15 (одно из двух центральных значений) заменим на 14, то массив примет вид {8, 9, 11, 12, 12, 13, 14, 17, 19, 19, 20,20} и медиана будет равна 13,5.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: