double arrow

Меры центральной тенденции

Мера центральной тенденции (Central Tendency) — это число, характеризующее выборку по уровню выраженности измеренного признака.

Существуют три способа определения центральной тенденции, каждому из которых соответствует своя мера: мода, медиана и выборочное среднее.

Мода (Mode) — наиболее часто встречающееся значение в ряду данных. Моде, или модальному интервалу признака, соответствует наибольший подъем (вершина) графика распределения частот. Если график распределения частот имеет одну вершину, то такое распределение называется унимодальным.

Среди 8 значений признака (3, 7, 3, 5, 7, 8, 7, 6) мода Мо =7 как наиболее часто встречающееся значение.

Когда два соседних значения встречаются одинаково часто и чаще, чем любое другое значение, мода есть среднее этих двух значений.

Распределение может иметь и не одну моду. Когда все значения встречаются одинаково часто, принято считать, что такое распределение не имеет моды.

Бимодальное распределение имеет на графике распределения две вершины, даже если частоты для двух вершин не строго равны. В последнем случае выделяют большую и меньшую моду. Во всей группе может быть и несколько локальных вершин распределения частот. Тогда выделяют наибольшую моду и локальные моды.

Бимодальное, полимодальное распределение может рассматриваться как признак неоднородности выборки. Например, механическое слияние двух классов с неодинаковым уровнем интеллекта.

Еще раз отметим, что мода — это значение признака, а не его частота.

Медиана (Median) — это такое значение признака, которое делит упорядоченное (ранжированное) множество данных пополам так, что одна половина всех значений оказывается меньше медианы, а другая — больше. Таким образом, первым шагом при определении медианы является упорядочивание (ранжирование) всех значений по возрастанию или убыванию. Далее медиана определяется следующим образом:

• если данные содержат нечетное число значений (8, 9,10,13,15), то медиана есть центральное значение, т. е. Md = 10;

• если данные содержат четное число значений (5, 8, 9, 11), то медиана есть точка, лежащая посередине между двумя центральными значениями, т. е. Md= (8+9)/2= 8,5.

Среднее (Mean) (Мх — выборочное среднее, среднее арифметическое) — определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений.

Наиболее очевидной и часто используемой мерой центральной тенденции является среднее значение. Но его использование ограничивается тем, что на величину среднего влияет каждое отдельное значение. Если какое-нибудь значение в группе увеличится на с, то среднее увеличится на c/N. Таким образом, среднее значение весьма чувствительно к выбросам — экстремально малым или большим значениям переменной.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



Сейчас читают про: