Методы получения первичной информации

Методы сбора первичных данных можно классифицировать как количественные и качественные.

Количественные исследования обычно отождествляют с прове­дением измерений и различных опросов. Опросы основаны на ис­пользовании структурированных вопросов закрытого типа, на ко­торые отвечает большое число респондентов. Структурированные вопросы закрытого типа — это вопросы, на которые можно дать только определенный ответ, например "да" или "нет". Характерны­ми особенностями таких исследований являются: четко определен­ные формы данных и источники их получения, обработка собран­ных данных с помощью упорядоченных количественных процедур. Качественные исследования включают сбор, анализ и интерпре­тацию данных путем наблюдения за тем, что люди делают и гово­рят. Наблюдения и выводы носят качественный характер и осуще­ствляются в нестандартной форме. Качественные данные могут быть переведены в количественную форму, но этому предшествуют спе­циальные процедуры.

Почему часто используются качественные методы? Качествен­ные методы нередко являются источниками идей. Опыт показыва­ет, что крупномасштабные дорогостоящие количественные иссле­дования далеко не всегда, особенно если в их основе нет перспек­тивных идей, дают необходимые результаты.

К качественным методам относят наблюдение, глубинные ин­тервью, анализ протоколов бесед, некоторые разновидности экс­пертных методов. Если наблюдения сопровождаются измерениями, то это способ количественного исследования.

Методы опроса. Опрос — это сбор первичной информации в форме ответов на прямые вопросы. Опрос может носить структури­рованный и неструктурированный характер; в первом случае все опрашиваемые отвечают на одни и те же вопросы, во втором — интервьюер задает вопросы в зависимости от полученных ответов. При проведении опроса группа опрашиваемых людей может под­вергаться однократному или многократному обследованиям. В пер­вом случае получается срез данной группы по многим параметрам для фиксированного момента. Например, редакции журналов и га­зет проводят разовые выборочные исследования своих читателей по таким параметрам, как возраст, пол, уровень образования, род занятий.

Во втором случае одна и та же группа опрашиваемых людей, называемая панелью, неоднократно изучается в течение опреде­ленного периода. В этом случае часто говорят, что используется па­нельный метод опроса.

Достоинства методов опроса: 1) стандартизация, обусловлен­ная тем, что всем респондентам задаются одни и те же вопросы с одинаковыми вариантами ответов на них; 2) простота, так как рес­пондентов посещать не обязательно, можно передавать им вопросни­ки по почте или опрашивать их по телефону, не нужно использовать технические средства и привлекать высококвалифицированных про­фессионалов; 3) возможность глубокого анализа, обусловленная применением последовательных уточняющих вопросов; 4) возмож­ность табулирования и проведения статистического анализа с ис­пользованием методов математической статистики и соответствую­щих статистических пакетов для персональных компьютеров.

Информация от респондентов при проведении опросов собира­ется тремя способами: 1) интервьюеры задают вопросы респон­дентам, ответы на которые интервьюер фиксирует; 2) вопросы за­даются с помощью компьютера; 3) путем самостоятельного запол­нения анкет респондентами.

Панельный метод обследования. Панель — выборочная совокуп­ность опрашиваемых единиц, подвергаемых повторяющимся иссле­дованиям, причем предмет исследования остается постоянным. Членами панели могут быть семьи, организации, эксперты, кото­рые с определенными оговорками остаются постоянными. Панель­ный метод опроса имеет преимущества по сравнению с обычными одноразовыми опросами, так как он дает возможность сравнивать результаты последующих опросов с итогами предыдущих и устанав­ливать тенденции и закономерности развития изучаемых явлений.

Все виды панелей подразделяются по: времени существования; характеру изучаемых единиц, характеру изучаемых проблем; мето­дам получения информации.

По времени существования панели делятся на краткосрочные — существующие до года, и долгосрочные — обычно не более пяти лет.

Долгосрочные панели могут давать непрерывную либо периоди­ческую информацию. Непрерывная информация фиксируется в днев­никах ежедневно, а сами дневники высылаются организаторам ис­следования через определенные промежутки времени. Периодичес­кая информация поступает по мере проведения опросов в виде за­полненных анкет.

По характеру изучаемых проблем панели могут быть специали­зированными. Специализированные панели создаются для изуче­ния узких проблем. Например, с их помощью осуществляются: те­стирование товаров и концепций новых товаров; отслеживание ры­ночных тенденций (изучается динамика показателя рыночной доли); определение источников, из которых потребители получают ин­формацию о новых товарах.

По методу получения информации возможны четыре вида пане-лий, когда члены панели: 1) высылают требуемую информацию (за­полненные дневники, опросные листы) почтой; 2) интервьюируют­ся; 3) заполняют дневники или опросные листы, но собирают ин­формацию специальные работники; 4) дают интервью через опреде­ленный промежуток времени, а внутри временного интервала высы­лают информацию по почте.

Целесообразность использования тех или иных панелей опреде­ляется характером решаемых задач и выделяемым объемом средств. Поэтому перед проведением опросов, исходя из целей исследова­ния, нужно выбрать вид панели.

Типичным примером использования панельного метода опроса может служить изучение медицинского обслуживания и рынка ле­карств во Франции*. В панель входило 1600 врачей — каждый двад­цатый врач, работающий с частной клиентурой. Члены панели вы­писывали в течение одной недели раз в три месяца рецепты в спе­циальной отрывной книжке с корешками. Это позволяло одновре­менно получать дубликат рецепта и определенную информацию, записанную на корешке: особенности больного, диагноз, терапев­тическое воздействие, ожидаемое от выписанного лекарства.

Процесс формирования панели в данном примере включал: 1) разделение территории на регионы и категории городов; 2) раз­деление медицинского персонала на категории по специальности и возрасту; 3) жеребьевку в каждой категории для отбора нужного числа врачей; 4) проверку выборки по многим параметрам.

Планирование выборочных исследований

Формирование выборки основывается на знании контура выбор­ки, под которым понимается список всех единиц совокупности, из которых выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автозаправочные станции города, то надо иметь список этих станций. Он и будет рассматриваться как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклоне­ния от истинных размеров совокупности. Очевидно, что может не быть полного официального списка всех автозаправочных станций большого города, включая и нелегальный бизнес в данной области.

Существуют три главные проблемы формирования выборки.

Исходя из сути рассматриваемой задачи необходимо определить, кто или что является единицей выборки. Например, производитель автомобилей решил изучить потенциальный рынок для своей про­дукции. Было принято решение изучить мнение по данному вопро­су лиц, принимающих решения по выбору автомобилей п рачлич-ных организациях, и глав семейств, определяющих данную поли­тику в семье. В указанном примере единицы выборки — это руково­дители соответствующих служб организаций и главы семейств.

Важно определить контур выборки. Например, список всех пред­приятий определенного региона. В целях выполнения правила реп­резентативности, то есть представительности проводимого иссле­дования, необходимо тщательно подобрать метод, с помощью ко­торого выбираются единицы выборки из контура выборки, и спла­нировать структуру выборки.

Кроме того, необходимо определить объем выборки, то есть число изучаемых единиц. Обоснованный объем выборки не зависит от размера совокупности. Например, для отдельного региона он мо­жет быть не больше, чем для государства в целом, хотя сами еди­ницы выборки должны отбираться по разным планам.

При формировании выборки предпочтительно использовать ве­роятностные, то есть случайные методы. Если все единицы выбор­ки имеют определенную вероятность быть включенными в выбор­ку, то выборка называется случайной. Нередко из-за невозможнос­ти точного определения размера совокупности нельзя точно рас­считать вероятности. Поэтому применение термина "известная ве­роятность" далеко не всегда обосновано.

Вероятностные методы включают: простой случайный отбор, си­стематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и одинакова для всех единиц сово­купности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности. Простой слу­чайный отбор может осуществляться с помощью таблиц или генераторов случайных чисел.

Могут использоваться генераторы случайных чисел, имеющие­ся в средствах электронных офисов. Единицам совокупности присваивают порядковые номера, после чего генерируются случайные числа в диапазоне всей генеральной совокупности. Количество чи­сел должно быть равно объему выборки.

Особенно широко метод систематического отбора использует­ся, когда для различных видов совокупностей имеются различные справочники, списки, спецификации, например справочники те­лефонных номеров.

Кластерный отбор основан на делении совокупности на под­группы. К сожалению, методологические ошибки в применении кластерного отбора чрезвычайно широко распространены, они про­никли даже в популярные учебники. При кластерном отборе необ­ходимо основываться на большой совокупности статистических данных и методах прикладной статистики — кластерном и дискриминантном анализе.

Предположим, что исследуется мнение населения страны отно­сительно какой-либо проблемы. Страна разбивается на четко опре­деляемые части — 89 регионов. По каждому региону подбираются данные статистики о показателях, которые могут влиять на мнение

населения по проблеме.

С помощью кластерного и дискриминантного анализа регионы группируются в группы — кластеры по близости характеристик. Далее в простейшем случае можно ограничиться выбором в каждом кла­стере одного из регионов случайным образом. Затем необходимо определить совокупность для отобранных регионов и проводить в них соответствующее исследование, а выводы обобщить для всей страны.

Формирование выборки можно осуществить на основе двухсту­пенчатого подхода, использующего двухступенчатую кластериза­цию. При этом1, например, каждый кластер может быть разбит на более мелкие и более однородные кластеры.

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределени­ем ее ключевых характеристик, то есть каждая выборка достаточно полно характеризует всю совокупность, различные крайности в выборке уравновешивают друг друга. Такая ситуация встречается не часто. Например, рыночный потенциал определенного региона для какого-то товара неоднороден. Население больших, средних и ма­лых городов, сельской местности региона может отличаться по уров­ню образования, дохода, образу жизни.

В случае несимметричного распределения совокупности после­дняя разделяется на различные подгруппы — страты, например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит назва­ние стратифицированного отбора. Для него следует выбрать при­знаки, характеризующие каждую единицу совокупности, напри­мер уровень дохода. Далее для каждой страты с помощью случайно­го отбора формируется выборка.

Если размер выборки для определенной страты пропорциона­лен размеру страты по отношению ко всей совокупности, то вы­борка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимей использовать весовые коэффициенты, уравновешивающие размеры страт. Вероятностно обоснованная стратификация строится на основе кластерного и дискриминантного анализа.

Систематический отбор имеет место при последовательном фор­мировании нескольких выборок с целью постепенного уточнения получаемых данных.

Формирование выборки может осуществляться следующими эта­пами: 1) определение соответствующей совокупности; 2) получе­ние "списка" совокупности; 3) определение структуры выборки; 4) определение методов доступа к совокупности; 5) определение иподготовка организационного обеспечения нужной численности выборки; 6) проверка выборки на соответствие требованиям про­водимого исследования.

Определение объема выборки. На практике используется множе­ство методов определения объема выборки. Обоснованными являются только вероятностный метод и метод экспертной оценки.

С помощью методов математической статистики может быть оп­ределен вероятностно обоснованный объем выборки, позволяющий получить данные с определенной точностью и достоверностью.

В статистике изменчивость признака, как известно, характери­зуется его вариацией. Вариация — это степень несхожести измере­ний признака, например ответов респондентов на определенный вопрос.

В качестве меры вариации обычно принимается среднеквадра­тичное отклонение, которое характеризует отличие отдельных ве­личин признака от средней величины. Эту меру вариации называют в разных случаях также стандартной ошибкой, стандартным откло­нением.

Напомним, кроме того, необходимое в оценках понятие "дове­рительный интервал", который представляет собой диапазон вели­чин признака, куда попадает определенный процент измерений или ответов на вопрос. Доверительный интервал прямо пропорциона­лен стандартному отклонению и тем шире, чем выше доверитель­ная вероятность, к которой по мере роста объема выборки прибли­жается доля попадающих в интервал ответов, величин измерений.

Значительная часть данных имеет нормальный закон распреде­ления. Свойства нормального распределения определяют диапазон отклонений доверительного интервала в единицах величины стан­дартного отклонения, то есть квантиль распределения, в зависимо­сти от величины доверительной вероятности (табл. 3.1).

Таблица 3.1

Значение отклонения доверительного интервала ±z от среднего значения в зависимости от доверительной вероятности Р результатов

Р,%               99,73
Z 0,84 1,03 1,29. 1,65 1,96 2,18 2,58 3,0

Часто, располагая некоторой информацией о характере вариа­ции изучаемого признака, минимальный размер выборки опреде­ляют на основе классического метода* определения параметра слу­чайной функции с заданной точностью следующим образом:

n = z2 • (s2 / Δ2), (3.1.)

где п — объем выборки, необходимый и достаточный для оцен­ки среднего значения признака, z2 квантиль нормального рас­пределения, s2 — стандартное отклонение признака, Δ2 — задавае­мая требованиями исследования ошибка определения признака.

Пример. Средняя контрактная цена товара составляет 1000 руб. Известно, что стандартное отклонение цены в контрактах 100 руб. Определим число сделок, за которыми необходимо проследить для оценки средней контрактной цены с точностью до 3%.

Допустимая абсолютная ошибка Д = 1000 • 3 /100 = 30 руб. В табл. 3.1 находим значение квантили распределения, соответству­ющей доверительному интервалу 97%, то есть ошибке в 3%. Оно составит 2,58. По формуле (3.1) подсчитываем объем выборки:

п = 2,582 • (1002/302) = 73,96 = 74.

Таким образом, необходимо проследить за 74 случайным обра­зом выбранными сделками, чтобы среднюю контрактную цену то­вара можно было с погрешностью до 3% считать равной средней цене в этих 74 сделках.

Часто бывает необходимо оценивать выбор потребителей, изби­рателей с определенной точностью по данным выборочного опроса. В таких случаях размер выборки оценивается следующим образом:

n = z2 • (1 – p) / (p• α2), (3.2.)

где п — объем выборки, необходимый и достаточный для оцен­ки вероятности выбора с относительной погрешностью не выше установленной, z2 — квантиль нормального распределения, соот­ветствующая заданной погрешности, р — частость выбора, α2 — задаваемая относительная погрешность.

Пример. Предварительное разведочное исследование показало, что за кандидата на пост президента собираются проголосовать 10% избирателей, то есть вероятность их выбора, которая оценивается частостью, составляет 0,10. Определить размер выборки избирате­лей, которых надо опросить, чтобы оценить вероятность выбора этого кандидата с относительной погрешностью не более 5%.

В табл. 3.1 находим значение квантили распределения, соответ­ствующей доверительному интервалу 95%, то есть ошибке в 5%, или 0,05. Оно составит 1,96. По формуле (3.2) подсчитываем объем выборки:

п = 1,962 • (1 - 0,10)/(0,10 • 0,052) = 13829,76 = 13 830.

Таким образом, необходимо опросить около 14 тыс. человек, для того чтобы оценить вероятность выбора с погрешностью не более 5 %.

Если допустить погрешность 10%, то размер выборки можно сократить до 3025 избирателей. Если 10% из них, то есть 302—303 человека, выберут рассматриваемого кандидата, то вероятность его победы на выборах можно оценить следующим образом. Минималь­ная вероятность может составить 10—10 • 10/100 = 9%, а макси­мальная — 10 + 10 • 10/100 = 11 %.

Из примеров видно, что размеры выборок минимальны, если предполагается оценивать среднее значение какой-либо одной ха­рактеристики.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: