п. 3 Дополнительные числовые характеристики выборки

Для сравнения меры рассеяния значений признаков около выборочной средней в разных выборках служит коэффициент вариации. Наиболее распространены следующие коэффициенты:

- коэффициент вариации по среднему линейному отклонению

, (14)

- коэффициент вариации по среднему квадратичному отклонению

. (15)

Особо часто употребляется последний коэффициент, и поэтому именно его иногда называют коэффициентом вариации без добавления показателя.

Таким образом, будем считать, что к оэффициентом вариации v называется отношение выборочного среднего квадратичного отклонения к выборочной средней, выраженное в процентах:

. (16)

Простейшей мерой рассеяния случайной величины является размах выборки.

Размах выборки R это разность между наибольшим и наименьшим значениями выборки:

. (17)

Выражения

, (18)

, (19)

называются r -тым центральным и начальным моментами соответственно. Заметим, что , .

Асимметрией выборки называется число

. (20)

Эксцессом выборки называется число

. (21)

Асимметрия и эксцесс являются характеристиками отклонения эмпирического (опытного) распределения от нормального распределения. Говорят, что асимметрия эмпирического распределения положительна (отрицательна), если его главная часть, т.е. максимум, концентрируется с левой (правой) стороны от нормального распределения (см. Рисунок 1).

Если же максимум эмпирического распределения расположен выше (ниже), чем у нормального, то говорят, что эмпирическое распределение имеет положительный (отрицательный) эксцесс.

Если в генеральной совокупности рассматриваются одновременно два признака X и Y, например рост и масса человека в данной группе людей, то для характеристики их взаимосвязи вводится понятие ковариации cov(X,Y):

, (22)

здесь x i, y i – отдельные значения в соответствующих выборках.

Преобразуем формулу (22):

,

где - выборочное среднее произведения случайных величин X и Y. Таким образом,

. (23)

Ковариация может быть положительной, отрицательной или равной нулю. Если большим (малым) значениям x i соответствуют большие (малые) значения y i, то cov(X,Y)>0. Говорят, что в этом случае между признаками X и Y существует положительная корреляция. Если же большим (малым) значениям x i соответствуют малые (большие) значения y i, то cov(X,Y)<0. В этом случае говорят, что между признаками X и Y существует отрицательная корреляция. При cov(X,Y)=0 между признаками X и Y корреляция отсутствует.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: