Объём выборки

При использовании любой выборки, кроме последовательной, необходимо ещё до начала исследования определять объём выборки.

Объём зависит от типа выборки, изучаемой статистики (показатель, вычисленный на основе данных выборки, например выборочное среднее), гомогенности генеральной совокупности, а также имеющихся времени, средств и персонала.

Обязательно следует учитывать требующуюся точность оценки – степень ошибочности результатов обследования или размер доверительного интервала (вычисленный на основе данных интервал, который с известной вероятностью содержит интересующий нас неизвестный параметр генеральной совокупности).

Абсолютная точность задаётся определённым интервалом, в котором должно находиться оцениваемое значение. Относительная точность соотносится с уровнем оценки параметра.

4.3.3.1. Определение объёма выборки при оценке среднего

При исследованиях сталкиваются с двумя ситуациями: когда генеральная дисперсия известна и когда – нет.

Генеральная дисперсия известна

Дисперсия генеральной совокупности σ2 может быть известна из предыдущих обследований или иных источников.

Расчёт размера выборки производится по формуле:

N = (z2/H2)*σ2, где

z – требуемый уровень точности (при 68,26% требуемой точности z = ±1, при 95,45% - ±2, при 99,73% - ±3);

H – заданный уровень точности исследуемого показателя от истинного генерального значения (например, не более чем на 100 рублей);

σ2 – дисперсия генеральной совокупности.

Для определения размера выборки также могут использоваться номограммы (карты для статистического описания), а также опыт других исследователей, собиравших аналогичные данные.

Генеральная дисперсия неизвестна

В этом случае процедура оценки объёма выборки остаётся практически неизменной, но вместо известного значения дисперсии используется оценочное. Оно либо рассчитывается на основе предварительно проведённого исследования, либо, исходя из обстоятельства, что для величины с нормальным распределением область изменения равна плюс-минус трём среднеквадратичным отклонениям, осуществить следующие шаги:

1. Определить область изменения исследуемого параметра;

2. Полученную область разделить на 6.

Полученное значение, вместе с остальными параметрами, подставляется в ту же формулу, которая использовалась и для случая с известной генеральной дисперсией.

В большинстве случаев исследуется не один параметр, а несколько. При определении объёма выборки для каждого из них, полученные значения могут не совпадать. В случае желания перестраховаться, для всех параметров должен быть взят максимальный размер выборки, из рассчитанных значений, однако, это приводит к необоснованному росту затрат.

В большинстве случаев из всех исследуемых параметров выбирается самый критический, т.е. наиболее важный, и объём выборки для всех параметров будет определяться по значению, рассчитанному для этого критического параметра. При этом обычно приходится жертвовать точностью других менее критичных параметров.

4.3.3.2. Определение объёма выборки при работе с выборочными долями

Маркетологов чаще интересуют вопросы не среднего значения, а доли какого либо элемента в совокупности. Расчёт выборки в этом случае проводится по формуле:

п = (z2/H2)*π*(1-π), где

π – доля признака в генеральной совокупности.

Н – заданный уровень точности в %, но представленный в виде доли от 1.

В данном уравнении два неизвестных. Долю признака в генеральной совокупности исследователь должен примерно оценить на основе предыдущих исследований, либо путём проведения предварительных исследований.

4.3.3.3. Объём генеральной совокупности и объём выборки

Следует обратить внимание на то, что ни в одну из представленных выше формул не входят объём генеральной совокупности. Это указывает на то, что объём выборки практически не зависит от объёма генеральной совокупности. Объём выборки напрямую зависит от степени изменчивости исследуемого параметра: чем она больше, тем больше объём выборки, чтобы выявить максимально большее разнообразие.

4.4. СБОР И АНАЛИЗ ДАННЫХ


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: