Первичная обработка данных

Ввод данных.

В случае проведения компьютерного телефонного, пер­сонального или Интернет-опроса данные вводятся в ком­пьютер непосредственно в ходе интервью. В других случаях они вводятся в компьютер с помощью считывающего устройства или с клавиатуры компьютера. В последнем случае для ввода исполь­зуется разнообразное программное обеспечение, позволяющее проверять допустимость значений вводимых переменных, их ло­гическую непротиворечивость по отношению к другим ответам.

Контроль попадания данных в допустимый диапазон не страхует от всех возможных ошибок ввода. Поэтому часть анкет, а зачастую, все анкеты, вво­дятся еще и вторым оператором, и результаты ввода сравнива­ются.

Иногда вместо ручного ввода применяются различные сред­ства автоматизации. Используются два варианта таких техно­логий:

1) специальные сканеры, считывающие информацию о пометках, внесенных в строго фиксированные места каждого листа бумажной анкеты. Иногда при этом в ходе полевых работ анкеты заполняются специаль­ным карандашом, пометки которого «узнает» сканер;

2) листы анкеты сканируются целиком, а затем с помощью специального программного обеспечения и на основе заданной «привязки» вопросов к намеченной компьютером сетке распознаются информативные места каждого листа и с них считывается информация.

Когда данные введены в компьютер, они проверяются еще раз. Отыскиваются логические несообразности, пред­назначенные исследователем к проверке. Далее иногда выполняется специальная работа с пропущен­ными по той или иной причине данными. Такие ситуации могут возникать из-за неразборчивости или неоднозначного толкова­ния записей в некоторых анкетах. Существует несколько под­ходов к решению этой проблемы.

1 Замена ответа нейтральным значением. Чаще всего под нейтральным понимается среднее значение. Такая замена ис­пользуется в количественных вопросах. Она не влияет на среднее значение показателя и на коэффициенты корреляции между показателями (рассчитанные по всей совокупности анкет).

2 Приписывание ответа на основании ответов на другие
вопросы.
Разработано много методов проведения такой операции. Например, можно построить зависимость между объемом потребления продукта и размером семьи по анкетам, где есть ответы на оба эти вопроса. После этого в анкетах, в которых не указан объем потребления продукта, проставляется его зна­чение, рассчитанное с учетом размера семьи.

3 Удаление анкет, содержащих хотя бы один пропущенный ответ. При таком подходе иногда приходится удалять из таблицы данных существенное число строк. Поэтому иногда возвращаются к полевому этапу исследований и опра­шивают дополнительных респондентов, чтобы заменить полу­ченной от них информацией удаленные строки таблицы дан­ных.

4 Учет только имеющихся ответов в каждом конкретном расчете. Анкеты с пропущенными ответами не удаляются, но и не учитываются в расчетах, в которых участвует соответствующая переменная. Процедура приемлема, если общее число анкет велико, пропусков относительно немного, а связи между переменными не слишком сильны.

Если ре­шено удалять строки таблицы данных, то это должно быть запланировано до начала анализа с указанием критерия, а не тогда, когда расчеты полностью или даже частично произведе­ны.

Статистическое выравнивание и преобразование инфор­мации. Процедуры статистического выравнивания данныхсостоят.

1 Взвешивание означает приписывание каждому респонденту весового коэффициента, отражающего относительную важность учета его высказывания по сравнению с высказываниями других респондентов. Сумма весовых коэффициентов равна общему числу респондентов.

2 Переопределение переменных представляет собой создание новых или модификацию существующих переменных в соот­ветствии с целями исследователя.

Приведем несколько приме­ров таких переменных.

Первый тип преобразования - укрупнение шкалы. Предпо­ложим, первоначально уровень использования продукта был измерен по десятибалльной шкале. После преобразования можно получить переменную, имеющую не десять, а лишь четыре возможных значения: «тяжелый пользователь», «сред­ний пользователь», «легкий пользователь» и «непользователь».

Другой тип преобразования - обобщение сведений, содер­жащихся в нескольких столбцах таблицы данных. Так, например, разделив общее количество товара, купленного респондентом, на число произведенных им покупок этого товара за месяц, можно рассчитать средний размер одной покупки.

3 Преобразование шкал используется, чтобы обеспечить сопоставимость оценок разных параметров и сделать данные более пригодными для анализа.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: