Методы получения первичной информации

Методы сбора первичных данных можно классифицировать как количественные и качественные.

Количественные исследования обычно отождествляют с проведением измерений и различных опросов. Опросы основаны на использовании структурированных вопросов закрытого типа, на которые отвечает большое число респондентов. Структурированные вопросы закрытого типа — это вопросы, на которые можно дать только определенный ответ, например "да" или "нет". Характерными особенностями таких исследований являются: четко определенные формы данных и источники их получения, обработка собранных данных с помощью упорядоченных количественных процедур. Качественные исследования включают сбор, анализ и интерпретацию данных путем наблюдения за тем, что люди делают и говорят. Наблюдения и выводы носят качественный характер и осуществляются в нестандартной форме. Качественные данные могут быть переведены в количественную форму, но этому предшествуют специальные процедуры.

Почему часто используются качественные методы? Качественные методы нередко являются источниками идей. Опыт показывает, что крупномасштабные дорогостоящие количественные исследования далеко не всегда, особенно если в их основе нет перспективных идей, дают необходимые результаты.

К качественным методам относят наблюдение, глубинные интервью, анализ протоколов бесед, некоторые разновидности экспертных методов. Если наблюдения сопровождаются измерениями, то это способ количественного исследования.

Методы опроса. Опрос — это сбор первичной информации в форме ответов на прямые вопросы. Опрос может носить структурированный и неструктурированный характер; в первом случае все опрашиваемые отвечают на одни и те же вопросы, во втором — интервьюер задает вопросы в зависимости от полученных ответов. При проведении опроса группа опрашиваемых людей может подвергаться однократному или многократному обследованиям. В первом случае получается срез данной группы по многим параметрам для фиксированного момента. Например, редакции журналов и газет проводят разовые выборочные исследования своих читателей по таким параметрам, как возраст, пол, уровень образования, род занятий.

Во втором случае одна и та же группа опрашиваемых людей, называемая панелью, неоднократно изучается в течение определенного периода. В этом случае часто говорят, что используется панельный метод опроса.

Достоинства методов опроса: 1) стандартизация, обусловленная тем, что всем респондентам задаются одни и те же вопросы с одинаковыми вариантами ответов на них; 2) простота, так как респондентов посещать не обязательно, можно передавать им вопросники по почте или опрашивать их по телефону, не нужно использовать технические средства и привлекать высококвалифицированных профессионалов; 3) возможность глубокого анализа, обусловленная применением последовательных уточняющих вопросов; 4) возможность табулирования и проведения статистического анализа с использованием методов математической статистики и соответствующих статистических пакетов для персональных компьютеров.

Информация от респондентов при проведении опросов собирается тремя способами: 1) интервьюеры задают вопросы респондентам, ответы на которые интервьюер фиксирует; 2) вопросы задаются с помощью компьютера; 3) путем самостоятельного заполнения анкет респондентами.

Панельный метод обследования. Панель — выборочная совокупность опрашиваемых единиц, подвергаемых повторяющимся исследованиям, причем предмет исследования остается постоянным. Членами панели могут быть семьи, организации, эксперты, которые с определенными оговорками остаются постоянными. Панельный метод опроса имеет преимущества по сравнению с обычными одноразовыми опросами, так как он дает возможность сравнивать результаты последующих опросов с итогами предыдущих и устанавливать тенденции и закономерности развития изучаемых явлений.

Все виды панелей подразделяются по: времени существования; характеру изучаемых единиц, характеру изучаемых проблем; методам получения информации.

По времени существования панели делятся на краткосрочные — существующие до года, и долгосрочные — обычно не более пяти лет.

Долгосрочные панели могут давать непрерывную либо периодическую информацию. Непрерывная информация фиксируется в дневниках ежедневно, а сами дневники высылаются организаторам исследования через определенные промежутки времени. Периодическая информация поступает по мере проведения опросов в виде заполненных анкет.

По характеру изучаемых проблем панели могут быть специализированными. Специализированные панели создаются для изучения узких проблем. Например, с их помощью осуществляются: тестирование товаров и концепций новых товаров; отслеживание рыночных тенденций (изучается динамика показателя рыночной доли); определение источников, из которых потребители получают информацию о новых товарах.

По методу получения информации возможны четыре вида пане-лий, когда члены панели: 1) высылают требуемую информацию (заполненные дневники, опросные листы) почтой; 2) интервьюируются; 3) заполняют дневники или опросные листы, но собирают информацию специальные работники; 4) дают интервью через определенный промежуток времени, а внутри временного интервала высылают информацию по почте.

Целесообразность использования тех или иных панелей определяется характером решаемых задач и выделяемым объемом средств. Поэтому перед проведением опросов, исходя из целей исследования, нужно выбрать вид панели.

Типичным примером использования панельного метода опроса может служить изучение медицинского обслуживания и рынка лекарств во Франции*. В панель входило 1600 врачей — каждый двадцатый врач, работающий с частной клиентурой. Члены панели выписывали в течение одной недели раз в три месяца рецепты в специальной отрывной книжке с корешками. Это позволяло одновременно получать дубликат рецепта и определенную информацию, записанную на корешке: особенности больного, диагноз, терапевтическое воздействие, ожидаемое от выписанного лекарства.

Процесс формирования панели в данном примере включал: 1) разделение территории на регионы и категории городов; 2) разделение медицинского персонала на категории по специальности и возрасту; 3) жеребьевку в каждой категории для отбора нужного числа врачей; 4) проверку выборки по многим параметрам.

Планирование выборочных исследований

Формирование выборки основывается на знании контура выборки, под которым понимается список всех единиц совокупности, из которых выбираются единицы выборки. Например, если в качестве совокупности рассматривать все автозаправочные станции города, то надо иметь список этих станций. Он и будет рассматриваться как контур, в пределах которого формируется выборка.

Контур выборки неизбежно содержит ошибку, называемую ошибкой контура выборки и характеризующую степень отклонения от истинных размеров совокупности. Очевидно, что может не быть полного официального списка всех автозаправочных станций большого города, включая и нелегальный бизнес в данной области.

Существуют три главные проблемы формирования выборки.

Исходя из сути рассматриваемой задачи необходимо определить, кто или что является единицей выборки. Например, производитель автомобилей решил изучить потенциальный рынок для своей продукции. Было принято решение изучить мнение по данному вопросу лиц, принимающих решения по выбору автомобилей п рачлич-ных организациях, и глав семейств, определяющих данную политику в семье. В указанном примере единицы выборки — это руководители соответствующих служб организаций и главы семейств.

Важно определить контур выборки. Например, список всех предприятий определенного региона. В целях выполнения правила репрезентативности, то есть представительности проводимого исследования, необходимо тщательно подобрать метод, с помощью которого выбираются единицы выборки из контура выборки, и спланировать структуру выборки.

Кроме того, необходимо определить объем выборки, то есть число изучаемых единиц. Обоснованный объем выборки не зависит от размера совокупности. Например, для отдельного региона он может быть не больше, чем для государства в целом, хотя сами единицы выборки должны отбираться по разным планам.

При формировании выборки предпочтительно использовать вероятностные, то есть случайные методы. Если все единицы выборки имеют определенную вероятность быть включенными в выборку, то выборка называется случайной. Нередко из-за невозможности точного определения размера совокупности нельзя точно рассчитать вероятности. Поэтому применение термина "известная вероятность" далеко не всегда обосновано.

Вероятностные методы включают: простой случайный отбор, систематический отбор, кластерный отбор и стратифицированный отбор.

Простой случайный отбор предполагает, что вероятность быть избранным в выборку известна и одинакова для всех единиц совокупности. Вероятность быть включенным в выборку определяется отношением объема выборки к размеру совокупности. Простой случайный отбор может осуществляться с помощью таблиц или генераторов случайных чисел.

Могут использоваться генераторы случайных чисел, имеющиеся в средствах электронных офисов. Единицам совокупности присваивают порядковые номера, после чего генерируются случайные числа в диапазоне всей генеральной совокупности. Количество чисел должно быть равно объему выборки.

Особенно широко метод систематического отбора используется, когда для различных видов совокупностей имеются различные справочники, списки, спецификации, например справочники телефонных номеров.

Кластерный отбор основан на делении совокупности на подгруппы. К сожалению, методологические ошибки в применении кластерного отбора чрезвычайно широко распространены, они проникли даже в популярные учебники. При кластерном отборе необходимо основываться на большой совокупности статистических данных и методах прикладной статистики — кластерном и дискриминантном анализе.

Предположим, что исследуется мнение населения страны относительно какой-либо проблемы. Страна разбивается на четко определяемые части — 89 регионов. По каждому региону подбираются данные статистики о показателях, которые могут влиять на мнение

населения по проблеме.

С помощью кластерного и дискриминантного анализа регионы группируются в группы — кластеры по близости характеристик. Далее в простейшем случае можно ограничиться выбором в каждом кластере одного из регионов случайным образом. Затем необходимо определить совокупность для отобранных регионов и проводить в них соответствующее исследование, а выводы обобщить для всей страны.

Формирование выборки можно осуществить на основе двухступенчатого подхода, использующего двухступенчатую кластеризацию. При этом¹, например, каждый кластер может быть разбит на более мелкие и более однородные кластеры.

В основе всех описанных методов лежит предположение, что любая совокупность характеризуется симметричным распределением ее ключевых характеристик, то есть каждая выборка достаточно полно характеризует всю совокупность, различные крайности в выборке уравновешивают друг друга. Такая ситуация встречается не часто. Например, рыночный потенциал определенного региона для какого-то товара неоднороден. Население больших, средних и малых городов, сельской местности региона может отличаться по уровню образования, дохода, образу жизни.

В случае несимметричного распределения совокупности последняя разделяется на различные подгруппы — страты, например по уровню доходов, и выборки формируются из этих подгрупп, по сути дела являющихся сегментами рынка. Такой метод носит название стратифицированного отбора. Для него следует выбрать признаки, характеризующие каждую единицу совокупности, например уровень дохода. Далее для каждой страты с помощью случайного отбора формируется выборка.

Если размер выборки для определенной страты пропорционален размеру страты по отношению ко всей совокупности, то выборка называется пропорционально стратифицированной. В случае непропорционально стратифицированной выборки необходимей использовать весовые коэффициенты, уравновешивающие размеры страт. Вероятностно обоснованная стратификация строится на основе кластерного и дискриминантного анализа.

Систематический отбор имеет место при последовательном формировании нескольких выборок с целью постепенного уточнения получаемых данных.

Формирование выборки может осуществляться следующими этапами: 1) определение соответствующей совокупности; 2) получение "списка" совокупности; 3) определение структуры выборки; 4) определение методов доступа к совокупности; 5) определение иподготовка организационного обеспечения нужной численности выборки; 6) проверка выборки на соответствие требованиям проводимого исследования.

Определение объема выборки. На практике используется множество методов определения объема выборки. Обоснованными являются только вероятностный метод и метод экспертной оценки.

С помощью методов математической статистики может быть определен вероятностно обоснованный объем выборки, позволяющий получить данные с определенной точностью и достоверностью.

В статистике изменчивость признака, как известно, характеризуется его вариацией. Вариация — это степень несхожести измерений признака, например ответов респондентов на определенный вопрос.

В качестве меры вариации обычно принимается среднеквадратичное отклонение, которое характеризует отличие отдельных величин признака от средней величины. Эту меру вариации называют в разных случаях также стандартной ошибкой, стандартным отклонением.

Напомним, кроме того, необходимое в оценках понятие "доверительный интервал", который представляет собой диапазон величин признака, куда попадает определенный процент измерений или ответов на вопрос. Доверительный интервал прямо пропорционален стандартному отклонению и тем шире, чем выше доверительная вероятность, к которой по мере роста объема выборки приближается доля попадающих в интервал ответов, величин измерений.

Значительная часть данных имеет нормальный закон распределения. Свойства нормального распределения определяют диапазон отклонений доверительного интервала в единицах величины стандартного отклонения, то есть квантиль распределения, в зависимости от величины доверительной вероятности (табл. 3.1).

Таблица 3.1

Значение отклонения доверительного интервала ±z от среднего значения в зависимости от доверительной вероятности Р результатов

Р,%								99,73
Z	0,84	1,03	1,29.	1,65	1,96	2,18	2,58	3,0

Часто, располагая некоторой информацией о характере вариации изучаемого признака, минимальный размер выборки определяют на основе классического метода* определения параметра случайной функции с заданной точностью следующим образом:

n = z² • (s² / Δ²), (3.1.)

где п — объем выборки, необходимый и достаточный для оценки среднего значения признака, z² — квантиль нормального распределения, s² — стандартное отклонение признака, Δ² — задаваемая требованиями исследования ошибка определения признака.

Пример. Средняя контрактная цена товара составляет 1000 руб. Известно, что стандартное отклонение цены в контрактах 100 руб. Определим число сделок, за которыми необходимо проследить для оценки средней контрактной цены с точностью до 3%.

Допустимая абсолютная ошибка Д = 1000 • 3 /100 = 30 руб. В табл. 3.1 находим значение квантили распределения, соответствующей доверительному интервалу 97%, то есть ошибке в 3%. Оно составит 2,58. По формуле (3.1) подсчитываем объем выборки:

п = 2,582 • (100²/30²) = 73,96 = 74.

Таким образом, необходимо проследить за 74 случайным образом выбранными сделками, чтобы среднюю контрактную цену товара можно было с погрешностью до 3% считать равной средней цене в этих 74 сделках.

Часто бывает необходимо оценивать выбор потребителей, избирателей с определенной точностью по данным выборочного опроса. В таких случаях размер выборки оценивается следующим образом:

n = z² • (1 – p) / (p• α²), (3.2.)

где п — объем выборки, необходимый и достаточный для оценки вероятности выбора с относительной погрешностью не выше установленной, z² — квантиль нормального распределения, соответствующая заданной погрешности, р — частость выбора, α² — задаваемая относительная погрешность.

Пример. Предварительное разведочное исследование показало, что за кандидата на пост президента собираются проголосовать 10% избирателей, то есть вероятность их выбора, которая оценивается частостью, составляет 0,10. Определить размер выборки избирателей, которых надо опросить, чтобы оценить вероятность выбора этого кандидата с относительной погрешностью не более 5%.

В табл. 3.1 находим значение квантили распределения, соответствующей доверительному интервалу 95%, то есть ошибке в 5%, или 0,05. Оно составит 1,96. По формуле (3.2) подсчитываем объем выборки:

п = 1,96² • (1 - 0,10)/(0,10 • 0,05²) = 13829,76 = 13 830.

Таким образом, необходимо опросить около 14 тыс. человек, для того чтобы оценить вероятность выбора с погрешностью не более 5 %.

Если допустить погрешность 10%, то размер выборки можно сократить до 3025 избирателей. Если 10% из них, то есть 302—303 человека, выберут рассматриваемого кандидата, то вероятность его победы на выборах можно оценить следующим образом. Минимальная вероятность может составить 10—10 • 10/100 = 9%, а максимальная — 10 + 10 • 10/100 = 11 %.

Из примеров видно, что размеры выборок минимальны, если предполагается оценивать среднее значение какой-либо одной характеристики.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: