Для более полной характеристики изучаемой совокупности данных в целом и закономерностей, присущих ей, используют числовые характеристики выборки (или описательные статистики).
Все числовые характеристики подразделяют на два вида: характеристики центральной тенденции и характеристики рассеяния. Характеристики центральной тенденции определяют положение центра эмпирического распределения. К ним относятся среднее арифметическое, мода, медиана. Характеристики рассеяния характеризуют уровень вариации (изменения) значений признака около центра эмпирического распределения. К ним относятся размах вариации, дисперсия, стандартное отклонение, коэффициент вариации.
Среднее арифметическое (или выборочное среднее) – это значение признака,сумма отклонений от которого всех выборочных значений признака равна нулю. 1). Для дискретного вариационного ряда: (1) 2). Для интервального вариационного ряда: (2) Обозначения: – среднее арифметическое; n – объем выборки; k – число вариант или интервалов группировки; xi – варианта выборки; ni – частота варианты; – середина интервала; – частота интервала. |
Отклонение от среднего: d = - М
|
|
В нашем примере выборочное среднее равно
(4х4+5х1+6х5+7х2+8х3): 15 = 89: 15 = 5, 93» 6.
Медиана (Me) соответствует центральному значению в последовательном ряду всех полученных значений Медиана – это варианта, приходящаяся на середину упорядоченного статистического ряда. 1). При нечетном n медианой является варианта с номером , при четном n медиана равна среднему арифметическому вариант с номерами и . 2). Медианный интервал – интервал группировки, в котором накопленная частота впервые окажется больше . Для интервального вариационного ряда: (3) Обозначения: – медиана; n – объем выборки; h – ширина интервалов; – нижняя граница медианного интервала; nm – частота медианного интервала; nm- 1 – накопленная частота интервала, предшествующего медианному. |
В нашем примере, чтобы найти медиану, выпишем все значения в порядке возрастания: 4 4 4 4 5 6 6 o 6 6 7 7 8 8 8. В середине этого ряда стоит число 6, оно и является медианой этого ряда.
Мода – это варианта, наиболее часто встречающаяся в выборке. В выборке может быть несколько мод. Модальный интервал – интервал группировки, имеющий наибольшую частоту. Для интервального вариационного ряда: (4) Обозначения: – мода; n – объем выборки; h – ширина интервалов; – нижняя граница модального интервала; nm – частота модального интервала; nm- 1 – частота интервала, предшествующего модальному; nm+ 1 – частота интервала, следующего за модальным. |
В нашем примере модой является значение 6, так как оно имеет наибольшую частоту.
|
|
Мода используется редко и главным образом для того, чтобы дать общее представление о распределении. В некоторых случаях у распределения могут быть две моды; тогда говорят о бимодальном распределении. Такая картина указывает на то, что в данном совокупности имеются две относительно самостоятельные группы.
Выборочная дисперсия – это среднее арифметическое квадратов отклонений значений признака от их среднего арифметического. 1). Для дискретного вариационного ряда: (5) 2). Для интервального вариационного ряда: (6) Обозначения: D – дисперсия; n – объем выборки; k – числоо вариант или интервалов группировки; – варианта; – частота варианты; – среднее арифметическое; – середина интервала; – частота интервала; – среднее арифметическое. |
Для нахождения выборочной дисперсии составим следующую таблицу:
xi | ni | xi - М | (xi – М)2 | (xi – М)2 · ni |
4-6=-2 | (-2)2 =4 | 4 · 4 = 16 | ||
5-6=-1 | (-1)2 =1 | 1 · 1 =1 | ||
0 · 5 = 0 | ||||
Σ |
D = 29: (15 – 1) = 2,07
Стандартное отклонение (среднее квадратическое отклонение): (7) Размах (разброс) вариации: R = x max – x min (8) Коэффициент вариации: (9) |
Тогда = 1,44, V = 1,44: 5,93 = 0,24, R = 8 – 4 = 4.
Стандартное отклонение (оно в нашем случае равно 1,44), позволяет сказать, что большая часть результатов располагается в промежутке (М х – σ; М х + σ), в нашем случае это промежуток (4,49; 7,37). В нашей выборке в этот промежуток попадают 8 значений из 15.