Кластерная выборка

Кластерная выборка (cluster sampling) -с начала изучаемая совокупность делится на взаимоисключающие и взаимодополняющие подгруппы, называемые кластерами. Затем с помощью вероятностного метода выборки, та­кого как простая случайная выборка, отбираются кластеры. В выборку включаются либо все элементы отобранного кластера, либо проводится их отбор вероятностным методом.

Если в выборку включаются все элементы каждого отобранного кластера, то такая процедура называется одноступенчатой кластерной выборкой. Если выборка получена с помощью вероятностного отбора из каждого выбранного кластера, такая процедура называет­ся двухступенчатой кластерной выборкой.

Как показано на рис. 11.3, существуют два вида двухступенчатой кластерной выборки — простая двухступенчатая кластерная выборка с ис­пользованием SRS и вероятностная выборка, пропорциональная объему (PPS). Кроме того, кластерная выборка может состоять из нескольких (больше двух) этапов, выступая как много­ступенчатая кластерная выборка.

вероятностная выборка, пропорциональная объему
простая кластерная выборка
Многоступенчатая
двухступенчатая
одноступенчатая
Кластерная выборка

Рис. 11.3. Типы кластерной выборки

Основное различие между кластерной и стратифицированной выборкой состоит в том, что в первом случае используются только отобранные подгруппы (кластеры), в то время как в стратифицированной выборке все подгруппы (слои) используются для дальнейшего отбо­ра.

Эти методы преследуют разные цели.

Цель кластерной выборки — увеличить эффектив­ность выборки, уменьшив затраты на ее проведение.

Цель стратифицированной выборки — увеличение точности.

По однородности и неоднородности критерии формирования класте­ров прямо противоположны критериям формирования слоев.

Элементы кластера должны быть максимально разнородны, а сами кластеры — как можно более однородными. В идеале каждый кластер должен представлять собой небольшую модель генеральной совокупности. При кластерной выборке основа выборочного наблюдения необходима только для кластеров, которые вошли в выборку.

Распространенная форма кластерной выборки — территориальная выборка (area sampling), в которой кластеры состоят из географических территорий, таких как округа, жилые районы или кварталы. Если отбор основных элементов проводится в один этап (например, исследователь выбирает некоторые кварталы, а затем все семьи, живущие в этих кварталах, включаются в вы­борку), такой выборочный метод называется одноступенчатой территориальной выборкой.

Ес­ли отбор основных элементов проводится в два (или больше) этапа (исследователь выбирает кварталы, а затем в каждом таком квартале отбирает семьи, которые будут включены в выбор­ку), такой метод называется двухступенчатой (или многоступенчатой) территориальной вы­боркой. Отличительная черта одноступенчатой территориальной выборки заключается в том, что все семьи из выбранных кварталов (или географических регионов) включаются в выборку.

Этот метод подходит в том случае, когда все кластеры равны по объему, т.е. каждый кла­стер содержит примерно одинаковое количество единиц. Однако, если объемы различны, простая двухступенчатая кластерная выборка может привести к ошибочным результатам. Иногда, объединив различные кластеры, можно сделать их равными по объему. Если объе­динить кластеры нельзя, следует воспользоваться вероятностной выборкой, пропорцио­нальной объему (PPS).

При вероятностной выборке, пропорциональной объему (Probability Proportionate to size Sampling — PPS) кластеры отбираются с вероятностью, пропорциональной их объему. Объем кластера определяется количеством входящих в него единиц выборки. Поэтому на первом эта­пе большие по объему кластеры имеют большую вероятность включения в выборку. На втором этапе вероятность отбора единицы из выбранного кластера обратно пропорциональна его объе­му. Поэтому вероятность включения в выборку будет равной для всех выборочных единиц, по­скольку неравная вероятность включения на первой стадии отбора компенсируется неравной вероятностью включения на второй стадии.

Вероятностная выборка, пропорциональная объему (Probability Proportionate to size Sampling — PPS) -м етод отбора, согласно которому кластеры выбираются с вероятностью, пропорциональной их объему, а вероятность выбора единицы из отобранного кластера обратно пропорцио­нальна его объему.

Кластерная выборка обладают двумя основными преимуществами — выполнимость и низ­кая себестоимость.

Во многих ситуациях единственными легко доступными инструментариями для изучения совокупности будут не элементы, а кластеры. Часто невозможно составить список всех потребителей, входящих в состав определенной совокупности, принимая во вни­мание ресурсы данного исследования и связанные с ним ограничения. Однако перечень гео­графических территорий, телефонных кодов определенного района и других кластеров потре­бителей получить довольно легко. Кластерная выборка наиболее эффективна с точки зрения затрат. Однако несмотря на это преимущество, ей присущ ряд ограничений. В результате отбора по кластерам создаются относительно неточные выборки. Кроме того, сложно сформировать неоднородные кластеры, так как, например, семьи, живущие в одном квартале, имеют больше схожих признаков, чем различий [25]. После кластерной выборки сложно рассчитать и оценить статистику. Все преимущества и недостатки основных методов формирования выборки, в том числе преимущества и недостатки кластерной выборки, приведены в табл. 11.3.



Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: