Статистическое распределение выборки

В результате статистической обработки материалов можно подсчитать число единиц, обладающих конкретным значением того или иного признака. Каждое отдельное значение признака будем обозначать и называть вариантой, а абсолютное число, показывающее, сколько раз встречается та или иная варианта, - частотой и обозначать соответственно. При этом сумма частот равна объёму выборки, то есть , где - число вариант, - объём выборки.

Если при изучении результатов выборки отдельные значения признака (варианты) расположим в возрастающем или убывающем порядке[24] и относительно каждой варианты укажем, как часто она встречается в данной совокупности, то получим статистическое распределение [25] признака, или вариационный ряд. Он характеризует изменение (варьирование) какого-нибудь количественного признака. Следовательно, вариационный ряд представляет собой две строки (или колонки). В одной из них приводятся варианты, в другой – частоты.

Вариация признака может быть дискретной и непрерывной:

- Дискретной называется вариация, при которой отдельные значения признака (варианты) отличаются друг от друга на некоторую конечную величину (обычно целое число). Например: количество детей в семье; оценки, полученные студентами на экзамене; размеры обуви, проданной магазином за день. Если число элементов вариационного ряда велико, то для удобства его изучения образуют интервальный ряд, группируя значения в интервалы. Для интервального ряда частота равна числу значений, наблюдавшихся в -ом интервале. Длина интервала чаще всего берётся одинаковой.

- Непрерывной называется вариация, при которой значения признака могут отличаться одно от другого на сколь угодно малую величину. Например: уровень рентабельности предприятия; процент занятости трудоспособного населения; депозитная ставка коммерческих банков. При непрерывной вариации распределение признака называется интервальным. Частоты относятся не к отдельному значению признака, а ко всему интервалу. Часто значением интервала принимают его середину, то есть центральное значение.

Нередко вместо абсолютных значений частот используют относительные. Для этого можно использовать долю частоты того или иного варианта (а также интервала) в сумме всех частот. Такая величина называется относительной частотой и обозначается . Для получения относительных частот необходимо соответствующую частоту разделить на сумму всех частот:

,

где - относительная частота -ой варианты или интервала (). Сумма всех относительных частот равна единице: . Относительные частоты можно выражать и в процентах, тогда их сумма равна 100%.

В интервальном вариационном ряду в каждом интервале различают нижнюю и верхнюю границы интервала: нижняя граница интервала ; верхняя граница интервала ; величина интервала . Как правило, при построении интервальных вариационных рядов в каждый интервал включаются варианты, числовые значения которых больше нижней границы и меньше или равны верхней границе. Интервальные вариационные ряды бывают с одинаковыми и неодинаковыми интервалами. В последнем случае чаще всего встречаются последовательно увеличивающиеся интервалы. Для выбора оптимальной величины интервала, то есть такой величины, при которой вариационный ряд не будет громоздким и, при этом, будут сохранены все особенности данного явления, можно рекомендовать формулу:

,

где – число единиц в совокупности.

Так, если в совокупности 200 единиц, наибольший вариант равен 49,961, а наименьший – 49,918, то

.

Другими словами, в данном случае оптимальной величиной интервала может служить 0,005.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: