Моду находят согласно правилам

Основные понятия

Для экспериментальных данных, полученных по выборке, можно вычислить ряд числовых характеристик (мер).

Мода

Мода — числовое значение, которое встречается в выборке наиболее часто. Мода обозначается иногда как Мо.

Например, в ряду значении (2 6 6 8 9 9 9 10) модой является 9, потому что 9 встречается чаше любого другого числа.

Мода представляет собой наиболее часто встречающееся значение (в данном примере это 9) а не частоту встречаемости этого значения (в данном примере равную 3).

Моду находят согласно правилам

1. В случае, когда все значения в выборке встречаются одинаково часто, принято считать, что этот выборочный ряд не имеет моды.

Например, 556677 — в этой выборке моды нет.

2. Когда два соседних (смежных) значения имеют одинаковую частоту и их частота больше частот любых других значений, мода вычисляется как среднее арифметическое этих двух значении.

Например, в выборке 1 2 2 2 5 5 5 6 частоты рядом расположенных значении 2 и 5 совпадают и равняются 3. Эта частота больше чем частота других значении 1 и 6 (у которых она равна 1).

Следовательно, модой этого ряда будет величина .

3) Если два несмежных (не соседних) значения в выборке имеют равные частоты которые больше частот любого другого значения, то выделяют две моды. Например, в ряду 10 11 11 11 12 13 14 14 14 17 модами являются значения 11 и 14. В таком случае говорят, что выборка является бимодальной.

Могут существовать и так называемые мультимодальные распределения, имеющие более двух вершин (мод)

4)Если мода оценивается по множеству сгруппированных данных, то для нахождения моды необходимо определить группу с наибольшей частотой признака. Эта группа называется модальной группой.

Медиана

Медиана — обозначается Ме и определяется как величина по отношению к которой по крайней мере 50% выборочных значении меньше нее и по крайней мере 50% — больше.

Медиана — это значение которое делит упорядоченное множество данных пополам.

Задача 1. Найдем медиану выборки 9 3 5 8 4 11 13

Решение Сначала упорядочим выборку по величинам входящих в нее значении. Получим, 3 4 5 8 9 11 13. Поскольку в выборке семь элементов, четвертый по порядку элемент будет иметь значение большее чем первые три и меньшее чем последние три. Таким образом, медианой будет четвертый элемент — 8

Задача 2. Найдем медиану выборки 20, 9, 13, 1, 4, 11.

Упорядочим выборку 1, 4, 9, 11, 13, 20 Поскольку здесь имеется четное число элементов, то существует две «середины» — 9 и 13 В этом случае медиана определяется как среднее арифметическое этих значений

Среднее арифметическое

Среднее арифметическое ряда из n числовых значений подсчитывается как

Чтобы показать обманчивость этого показателя, приведём известный пример: в одном купе вагона поместилась бабушка 60 лет с четырьмя внуками: один – 4 года, двое – по 5 лет и один – 6 лет. Среднее арифметическое возраста всех пассажиров этого купе 80/5 = 16. В другом купе расположилась компания молодежи: двое – 15-ти летних, один – 16-летний и двое – 17-летних. Средний возраст пассажиров этого купе так же равен 80/5 = 16. Таким образом, по средним арифметическим пассажиры этих купе не отличаются. Но если обратиться к показателю стандартного отклонения, то окажется, что средний разброс относительно среднего возраста в первом случае окажется 24,6, а во втором случае 1.

Кроме того, среднее оказывается достаточно чувствительным к очень маленьким или очень большим величинам, отличающимся от основных значений измеренных характеристик. Пусть 9 человек имеют доход от 4500 до 5200 тыс долларов в месяц. Величина их среднего дохода равняется 4900 долларов Если же к этой группе добавить человека имеющего доход в 20000 тыс долларов в месяц, то средняя всей группы сместится и окажется равной 6410 долларов, хотя никто из всей выборки (кроме одного человека) реально не получает такой суммы.

Понятно что аналогичное смещение, но в противоположную сторону можно получить и в том случае, если добавить в эту группу человека с очень маленьким годовым доходом.

Разброс выборки

Разброс (размахом) выборки – разность между максимальной и минимальной величинами данного конкретного вариационного ряда. Обозначается буквой R.

Размах = максимальное значение - минимальное значение

Понятно, что чем сильнее варьирует измеряемый признак, тем больше величина R, и наоборот.

Однако может случиться так, что у двух выборочных рядов и средние, и размах совпадают, однако характер варьирования этих рядов будет различный Например, даны две выборки

Дисперсия

Дисперсия представляет собой наиболее часто использующуюся меру рассеяния случайной величины (переменной).

Дисперсия – среднее арифметическое квадратов отклонений значений переменной от ее среднего значения


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: