Показатели выборочных наблюдений

Выборочным называется такое наблюдение, при котором изучается некоторая часть единиц совокупности и получаемые в результате обобщающие показатели с достаточной точностью могут быть использованы для характеристики всей совокупности в целом.

На этапе сбора данных статистическая процедура (см. п. 2.1) предусматривает проведение либо сплошного наблюдения (переписи), либо выборочного обследования.

По сравнению со сплошным выборочное наблюдение обладает следующими преимуществами:

· детализация в изучении первичного материала. Поскольку в выборку попадает не так много единиц совокупности, их обследование можно провести по более широкой программе;

· меньшее число ошибок регистрации, как следствие меньшего объема наблюдения;

· большая маневренность по сравнению со сплошным наблюдением. Выборочное наблюдение может быть организовано неспециализированным подразделением.

К недостаткам выборочных наблюдений относится то, что выборочные показатели почти никогда не совпадают с соответствующими показателями всей совокупности.

При проведении и обработке результатов выборочного обследования применяется следующая терминология.

v Генеральная совокупность (Population) – вся совокупность единиц, из которых производится отбор.

v Выборочная совокупность (Sampling population)– та часть единиц, которая попала в выборку.

v Генеральное среднее (Mean)`X.

v Выборочное среднее (Sample Mean)`x_в.

v Генеральная дисперсия (Variance) s².

v Выборочная дисперсия (Sample Variance) s²_в.

В число основных показателей выборки входят не только параметры центра распределения и рассеивания, но и значения ошибок выборки, оценивающие с определенным уровнем вероятности отклонения выборочных значений от соответствующих параметров генеральной совокупности. Вычисления выполняются по следующим формулам.

1)выборочное среднее для выборки объемом n, сгруппированной на K групп, рассчитывается по формуле среднего взвешенного:

S m_i`x_i

_i=1

`x_в = ¾¾¾¾, (2.23)

где`x_i - среднее i-ой группы,

m_i - частота i-ой группы,

K - количество групп.

2)Выборочная дисперсия:

S m_i(`x_i -`x_в)²

_i=1

s²_в = ¾¾¾¾¾¾¾¾¾. (2.24)

3)Средняя ошибка выборки, оценивающая (в среднем) величину отклонения выборочного от генерального среднего (т.е. от математического ожидания – в терминах теории вероятностей):

s²

m_x = ¾¾, (2.25)

где s²– генеральная дисперсия. При расчетах вместо неизвестной s²в формуле (2.25) используется близкое к ней расчетное значение выборочной дисперсии s²_в. Степень приближения определяется законом больших чисел, согласно которому при неограниченном увеличении объема выборки: n ® N, где N-общее число единиц генеральной совокупности, выборочная дисперсия стремится по вероятности к генеральной: s²_в ® s².

4)Предельная ошибка выборки, гарантируемая с вероятностью p:

s² n

D_в= t ¾¾ (1- ¾), (2.26)

n N

где t – коэффициент доверия, определяющий с вероятностью p пределы возможных значений генерального среднего:`X =`x_в ± D_в.

Согласно теореме Чебышева-Ляпунова, являющейся одним из выражений закона больших чисел, значения коэффициента доверия определяются нормальным законом распределения среднего выборочного и его целые значения могут быть рассчитаны из функции Лапласа:

t
p	0,683	0,954	0,997	0,999937

Задавшись заранее предельным значением ошибки выборки, коэффициент доверия t можно вычислить по статистическим данным (т.е. используя рассчитанное значение выборочной дисперсии s²_в) на основе формулы (2.26):

D_в

t = ¾¾¾¾¾¾¾¾¾¾,

s²_в n

¾¾ (1- ¾)

n N

и затем определить вероятность заданного значения D_в из обратной формулы функции Лапласа [2].

5)Объем выборки, гарантирующий с коэффициентом доверия t заданные пределы ошибки D_в:

t²s²N

n_t = ¾¾¾¾¾¾. (2.27)

D_в²N + t²s²

Формула (2.27) используется при планировании выборочных наблюдений для определения величины репрезентативного (представительного) набора данных.

Пример 2.10. Обработка выборочных наблюдений. В течение года на судоходной линии было выполнено N=525 рейсов однотипными судами. В порядке собственно-случайной выборки отобрано n=50 рейсов для определения среднего процента грузов иностранных фрахтователей (ГИФ) в общем потоке грузов. Данные полученной выборки сведены в группировочную таблицу (табл.2.9), в которой выполнены расчеты элементов для исчисления среднего выборочного и выборочной дисперсии. Определить:

1)Средний процент перевозки ГИФ: `x_в;

2)Выборочную дисперсию s²_в этого показателя;

3)Предельную ошибку выборки D_в, гарантированную с вероятностью p =0,997;

4)Пределы `x_в ± D_в, в которых находится генеральное среднее `X с заданной вероятностью p.

5)Какой объем выборки n_t гарантировал бы предельную ошибку D_в, равную 5%, с такой же вероятностью p =0,997?

Таблица 2.9

№ гр. i	Границы группы	Среднее группы `x_i	Час-тота m_i	Элементы для исчисления `x_ви s²_в
m_i`x_i	`x_i-`x_в	(`x_i-`x_в)²	m_i(`x_i -`x_в)²
	0-15	7,5		22,5	-45
	15-25	20,5		41,0	-32
	25-35	30,5		122,0	-22
	35-45	40,5		324,0	-12
	45-55	50,5		606,0	-2
	55-65	60,5		544,5
	65-75	70,5		352,5
	75-85	80,5		241,5
	85-100	92,5		370,0
å=

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

8 9 10 11 12 13 14

Индексы переменного и постоянного состава, индекс структурных сдвигов

Объяснительно-иллюстративный метод обучения

Элементы поперечного профиля дороги

II этап сестринского процесса: сестринская диагностика

ПРИМЕРЫ ИСПОЛЬЗОВАНИЯ СЕСТРИНСКОГО ПРОЦЕССА В ДЕЯТЕЛЬНОСТИ МЕДСЕСТРЫ

Техника наложения бинтовых повязок

Самый сильный аргумент, почему эволюция человека не могла быть