Систематическая и серийная выборки

Систематический отбор. В социологических исследованиях иногда применяется несколько упрощенный вариант простого случайного отбора, который носит название систематического. Основа выборки для него характеризуется теми же требованиями, что и для простого случайного отбора. Инымп словами, основу выборки составляют раз­личные алфавитные списки, картотеки учреждений, домовые книги и т. п. При систематическом отборе выбор единиц наблюдения осу­ществляется через один и тот же интервал к из исходного списка. Например, при к = 20 выбирается 3, 23, 43, 63 и т. д. единиц списка.

Таким образом, элементы выборочной совокупности однозначно определяются при систематическом отборе номером первого элемен­та (тройки в нашем лримере) и величиной интервала к.

В одной из схем систематического отбора в качестве первого элемента выбирается средний элемент списка или стоящий рядом с ним. Так, если список генеральной совокупности пронумерован

от 1 до N, то номер первого элемента может быть определеп по

N -4- I

формулам —5-—, если N — нечетное и N/2, если N — четное число.

Более распространен выбор первой единицы отбора случайным об­разом (например, по таблице случайных чисел).

Величина к зависит от характера поставленной проблемы, от разброса значений исследуемой характеристики генеральной сово­купности.

Если решен вопрос об объеме планируемой выборки, то число определяется в зависимости от объема генеральной совокупности и объема выборки (п).

Если Л' — кратное числа п, то интервал определяется по фор­муле к = —. Если N некратно п, то реальный объем выборки пр

и планируемый объем псл при различных способах вычисления числа к связаны следующими соотношениями:

если к — I — J, то пр > пал; (4)

Г N 1
если к = — -f-1, то пр ^ ппл,. (5)

Здесь [ ] означает целую часть числа.

Поясним сказанное на примере: пусть N=19 и п = 5, чему равно А? Тогда к равно либо 3, либо 4.

При к = 3 в выборку попадает больше пяти элементов — в дан­ном случае 6 или 7. При к = 4 в выборку попадут пять или четыре элемента.

Расчет характеристик систематической выборки. В связи о тем что систематическая выборка определяется как разновидность про­стого случайного отбора, ее характеристики рассчитываются с по­мощью соответствующих формул табл. 16.

В примере с подписчиками газет и журналов (см. табл. 15) и систематическую выборку объемом 5 единиц попали номера респоп-дентов 10, 20, 30, 40, 50, для которых соответствующее число вы­писываемых газет равно 3, 5, 5, 3, 2. Среднее по выборке равно 3,6, а дисперсия — 1,44 (а=1,2).

Применяя для простоты формулы повторной случайной выборки,

получаем М = -^- = -^- = 0,54.

Таким образом, с вероятностью 0,95 можно утверждать, что до­верительный интервал для генеральной средней имеет следующие границы: (3,6 ± 1,96 • 0,54) = (3,6 ± 1,05) = (2,55; 4,65).

Возможности и ограничения систематической выборки. Система­тическая выборка является экономным и удобным способом форми­рования выборочной совокупности. Однако при ее применении в социологических исследованиях необходимо следить за тем, чтобы список, используемый в качестве основы выборки, не обладал по-

рядком, отражающим периодичность в значениях изучаемой харак­теристики.

Проиллюстрируем это положение. При составлении основы вы­борки для опроса рабочих в одном из цехов завода выбранный интервал может совпасть с числом рабочих в бригаде, в списке ко­торой первым окажется бригадир. При систематическом отборе повышаются шансы попадания в выборку только одних бригадиров. При такой реализации выборки повышается вероятность получения значительных систематических ошибок.

Предварительное расположение элементов генеральной совокуп­ности по убыванию или возрастанию исследуемой характеристики позволит избавиться от этой опасности. Так, если в рассмотренном примере основа выборки организуется на базе платежной ведомости, в которой лица расположены в порядке возрастания их заработной платы, то опасность попадания только на одних бригадиров исклю­чается.

Систематическая выборка из-за простоты реализации получила широкое применение в социологических исследованиях.

Серийная (гнездовая) выборка. При серийной выборке единицы отбора представляют собой статистические серии, т. е. совокупности статистически различимых единиц. В качестве таких единиц могут выступать семья, бригада, школьный класс, небольшие производ­ственные коллективы в учреждениях, почтовые отделения, врачеб-пые участки, населенные пункты, территориальные общности и т. п. Отобранные в выборку серии подвергаются сплошному или выбо­рочному обследованию. Второй вариант используется в практике социологических исследований гораздо чаще, чем первый. Собствен­но говоря, любая многоступенчатая выборка представляет собой, гнездовую выборку, в которой единицы отбора на высших ступенях являются гнездами из единиц отбора нижних ступеней.

Организация серийной выборки. Серийная выборка имеет суще­ственные организационные преимущества перед простой случайной выборкой, так как значительно легче произвести отбор и изучение лескольких коллективов, бригад, цехов и т. д., находящихся на одном месте, чем нескольких сотен пространственно разбросанпых людей. Процедура отбора позволяет сконцентрировать выборку в сравнительно небольшом числе пунктов.

Серийная выборка может организовываться по -схемам простой случайной и систематической выборок. Наконец, она может форми­роваться после предварительного районирования генеральной сово­купности.

В первых двух случаях к информации о генеральной совокупно­сти — основе выборки — предъявляются те же требования, что и ко всем вероятностным выборкам: размещение элементов генеральной совокупности (серий) не должно быть каким-либо образом система­тизировано.

Метод маршрутного опроса. Этот метод социологи часто исполь­зуют, когда единицей наблюдения выступает семья.

В выборочную совокупность, например, намечено включить опрс-

деленное число случайно отобранных семей или квартир. На карте города или населенного пункта нумеруются все улицы. С помощью таблицы случайных чисел отбираются большие числа, которые поз­воляют идентифицировать семьи или квартиры, попавшие в выбор­ку. Каждое большое число рассматривается как состоящее из трех компонентов: первые две или три цифры в нем указывают номер улицы, следующая цифра — номер дома, последняя цифра — номер квартиры в выбранном доме.

Например, число 42—25—3 указывает квартиру № 3 дома № 25 на 42-й улице.

Организация серийной выборки методом маршрутного опроса наиболее приспособлена к городам, где преобладают отдельные квартиры, или к населенным пунктам, где еще сохраняется частное домовладение (в последнем случае отпадает необходимость выбирать номер квартиры).

Возможности и ограничения серийной выборки. При серийной выборке всегда имеет место занижение по сравнению с генеральной совокупностью дисперсии изучаемого признака в силу определен­ного сходства единиц в сериях.

Например, вполне объяснима заметная связь между членами семьи. Характер профессий детей в определенной мере может зави­сеть от профессии родителей. Очевидна связь членов семьи в отно­шении их социальной принадлежности.

С точки зрения статистика, сходство элементов серий приводит к избыточности однотипной, повторяющейся информации. Социолог должен учитывать этот органически присущий серийной выборке статистический порок при прочих равных условиях, выбирая в ка­честве гнезд такие общности, которые содержат максимально разно­родные конечные единицы наблюдения. Так, при изучении, ска­жем, качества медицинского обслуживания населепия города разум­но в виде гнезд выбрать совокупность жителей, обслуживаемых отдельными почтовыми отделениями, или проживающих на терри­тории отдельных жэков, но никак не врачебные участки, поскольку последний выбор привел бы к искажению результатов.

Расчет характеристик серийной выборки. Расчет характеристик серийной выборки имеет некоторое отличие от простой случайной и систематической выборок. Это отличие связано прежде всего с вычислением дисперсий и ошибки выборки.

Вычисление средней ошибки серийной выборки основано на дис­персии серийных средних.

Пример. Из генеральной совокупности, включающей 16 семей, сделана серийная выборка, состоящая из четырех семей (в каждой семье по 4 человека)'. Перед исследователями стоит задача найти оценку средней заработной платы в генеральной совокупности, оцен­ку ее дисперсии и среднюю ошибку выборки (табл. 18).

Средняя ошибка бесповторной серийной выборки определяется

Дружинин II. К. Математическая статистика в экономике. М., 1971, с. 193.

по формуле

N-V-7W=V' (6)

где Si — дисперсия серийных средних; С —число серий в гене­ральной совокупности (равных по численности); с — число серий js выборке.

Таблица 18. Данные для примера

Расчет дисперсии серийных средних:

(v*) (=«-=)'

81,75 —1,75 3,0625

86,75 3,25 10,5625

80,75 3,25 10,5625

78,75 -4,75 22,5625

х = 83,5 S = 46,75

Тогда

с» _ «J5 _ U an. м _ 1/"ii^2.f!illi\ = 1 53

В зависимости от выбранной доверительной вероятности средняя заработная плата для генеральной совокупности 83,5 ±21,53. На­пример, исследователь может с вероятностью в 0,95 утверждать, что в данной генеральной совокупности средняя заработная плата пе меньше 80,6 руб. и не больше 86,5 руб.

Так как вычисление ошибки для серийной выборки основано на дисперсии серийных средних, то серийный отбор будет тем репре­зентативнее, чем меньше степень колеблемости серийных средних, измеряемая величиной их дисперсии.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: