Определение необходимой численности выборки

Для определения необходимой численности выборки нужно задать уровень точности выборочной совокупности с определённой вероятностью. В частности, необходимая численность случайной повторной выборки определяется по формуле , которая вытекает из формулы предельной ошибки: .

При проектировании выборочного наблюдения предполагаются заранее заданными величина допустимой ошибки в соответствии с задачами конкретного исследования и вероятность выводов по результатам наблюдения . Величина , характеризующая дисперсию признака в генеральной совокупности, зачастую бывает неизвестна. Поэтому используют приближённые оценки генеральной дисперсии.

1. Исходя из результатов специально организованного пробного обследования (обычно небольшого объема), на базе которого определяется величина дисперсии признака, используемая в качестве оценки генеральной совокупности: ,

где – средняя арифметическая по результатам пробного обследования;

– число единиц, попавших в пробное обследование.

По данным нескольких пробных обследований выбирается наименьшее значение.

2. Опираясь на данные предыдущих обследований, как выборочных так и сплошных, проводившихся в аналогичных целях. Дисперсию изучаемого признака в выборке можно оценить по коэффициенту вариации, значение которого получено по итогам предшествующего сплошного или выборочного наблюдения. Коэффициент вариации v= Следовательно, дисперсия будет равна

3. Зная примерную величину средней дисперсии, находят дисперсию из соотношения .

4. Если известны и , то можно определить среднее квадратическое отклонение в соответствии с правилом «трёх сигм»:

,

где – размах вариации.

Размах вариации при нормальном распределении примерно равен 6 (крайние значения отстоят в ту и другую сторону от средней на расстоянии 3 ).

Пример 8. Сколько операционистов нужно обследовать в банках региона, чтобы получить характеристику среднего уровня оплаты труда этой категории работников банков в регионе?

Предположим, как известно, что разница между наивысшим и наименьшим уровнем оплаты труда операциониста в регионе составляет

3 000 руб. Для нормального распределения в промежутках х включается 99,7% всех вариантов значений признака, а это означает применительно к рассматриваемой задаче, что 3 000 руб. примерно 6 (3 000 ). Поэтому примерная оценка среднеквадратического отклонения заработной платы в генеральной совокупности операциониста региона составит 500 руб. ( =3000/6). Для дальнейших расчётов достаточно, чтобы с вероятностью 0,954 предельная ошибка выборки не превышала 100 руб.

Тогда, зная, что =500 руб., а t=2. Следовательно,

человек.

Таким образом, при заданных условиях нужно обследовать размер заработной платы у 100 операционистов региона.

5. Если распределение заведомо асимметричное, то .

6. Для относительной величины принимают максимальную величину дисперсии =0,25,

где – максимальная доля альтернативного признака.

На практике величина допустимой ошибки выборки, как правило, устанавливается не в абсолютном, а в относительном выражении: она рассчитывается как отношение ошибки к исследуемому параметру:

;

.

Существует градация надёжности результатов выборочного обследования:

1) повышенная надёжность допускает ошибку выборки до 3%;

2) обыкновенная 3–10%;

3) приближённая 10–20%;

4) ориентировочная 20–40%;

5) прикидочная – более 40%. Выборка считается репрезентативной, если .

Формулу для определения необходимой численности выборки при собственно-случайном повторном отборе можно представить следующим образом: ,

так как , то

Пример 9. Для изучения товарооборота по выделенной товарной группе планируется провести обследование торговых предприятий региона. Сколько предприятий розничной торговли необходимо обследовать, если по данным предшествующего обследования известно, что коэффициент вариации товарооборота по данной группе товаров составляет 90%, а предельная относительная ошибка выборки с вероятностью 0,95 не должна превысить 5%?

При Р=0,95 коэффициент доверия t=1,96 (Приложение 4). Следовательно, т.е. при повторном отборе необходимо обследовать

1 245 торговых предприятий.

Предельная ошибка выборки при собственно-случайном или механическом бесповторном отборе рассчитывается по формуле поэтому необходимая для достижения заданной ошибки численность выборки .

Если задана предельная относительная ошибка выборки и известен коэффициент вариации, то численность выборки определяется по формуле

.

При бесповторном отборе для нахождения доли альтернативного признака необходимая численность выборки

где – дисперсия альтернативного признака в выборочной совокупности (в генеральной ).

Пример 10. Исходя из условия предыдущего примера, но зная, что общее число торговых предприятий, осуществляющих продажу товаров изучаемой группы, составляет 15 тыс. единиц, объём выборки при бесповторном отборе рассчитывают следующим образом:

единиц,

т.е. выборка должна быть 8% ( %).

Как правило, цель выборочного обследования – определить пределы, в которых находится в генеральной совокупности не один, а несколько показателей. В таком случае дисперсия для каждого из них будет различна, соответственно будет различаться и необходимая численность выборки. Число обследуемых единиц будет максимально при изучении показателя с максимальной дисперсией. Соответственно и необходимая численность выборки должна быть принята на максимальном уровне из всех рассчитанных.

Пример 11. При проведении 10-ного % выборочного обследования предприятий оптовой торговли одного из регионов было установлено, что в среднем на одно предприятие приходилось 16 работников при среднем квадратическое отклонении 12 человек. Обследовано 100 предприятий. С какой вероятностью можно утверждать, что относительная предельная ошибка выборки не превысит 5%?

Так как .

Средняя ошибка при проведении обследования:

.

Коэффициент доверия: .

По таблице интеграла вероятностей Лапласа (Приложение Б) находим при вероятность . Следовательно, с вероятностью 0,516 можно гарантировать, что в результате проведённого обследования относительная предельная ошибка выборки не превысит 5%.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: