Генеральная и выборочная совокупности

Пусть необходимо исследовать некоторую совокупность объектов. Если она слишком многочисленна, либо её элементы малодоступны, либо имеются другие причины, не позволяющие изучить сразу все элементы, то из неё выбирают некоторое количество объектов для изучения. При этом первоначальное множество объектов называют генеральной совокупностью, а ряд случайно отобранных объектов – выборочной совокупностью или выборкой.

Требования, которым должна удовлетворять выборка:

1) репрезентативность, т.е. выборка должна правильно представлять генеральную совокупность (пропорции в выборки должны быть такими как в генеральной совокупности);

2) количество объектов должно быть достаточно большим;

3) выборка должна быть случайной, т.е. каждый элемент генеральной совокупности должен иметь одинаковую вероятность попасть в выборку.

Введем ряд необходимых нам понятий.

Пусть обследуется признак Х некоторой генеральной совокупности получена выборка х1, х2,…, хn, где хi – значение признака, причем эти значения могут повторяться. Пусть ni – количество повторений признака хi. Числа хi называют вариантами, а числа niчастотами. Объёмом выборки называется количество элементов в выборке. Отсюда,

, где n – объём выборки.

Отношение называется относительной частотой выборки или частостью и обозначается pi, т.е. .

Очевидно, что

Вариационным рядом называется перечень вариантов соответствующих им частот, причем варианты располагаются в порядке возрастания. Операция по расположению значений признака в порядке их возрастания называется ранжированием.

В общем виде вариационный ряд записывается следующим образом:

Иногда вместо перечня значений xi задают интервалы, в которые попадают элементы выборки, в качестве частоты, соответствующей интервалу принимают сумму частот вариантов, попадавших в этот интервал. Интервалы также располагают в порядке возрастания. Такой ряд называют интервальным.

В общем виде интервальный ряд записывается следующим образом:

Рекомендуется количество интервалов k выбирать по формуле Стерджеса:

.

Длина интервала определяется по формуле

.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: