Ввод данных.
В случае проведения компьютерного телефонного, персонального или Интернет-опроса данные вводятся в компьютер непосредственно в ходе интервью. В других случаях они вводятся в компьютер с помощью считывающего устройства или с клавиатуры компьютера. В последнем случае для ввода используется разнообразное программное обеспечение, позволяющее проверять допустимость значений вводимых переменных, их логическую непротиворечивость по отношению к другим ответам.
Контроль попадания данных в допустимый диапазон не страхует от всех возможных ошибок ввода. Поэтому часть анкет, а зачастую, все анкеты, вводятся еще и вторым оператором, и результаты ввода сравниваются.
Иногда вместо ручного ввода применяются различные средства автоматизации. Используются два варианта таких технологий:
1) специальные сканеры, считывающие информацию о пометках, внесенных в строго фиксированные места каждого листа бумажной анкеты. Иногда при этом в ходе полевых работ анкеты заполняются специальным карандашом, пометки которого «узнает» сканер;
|
|
2) листы анкеты сканируются целиком, а затем с помощью специального программного обеспечения и на основе заданной «привязки» вопросов к намеченной компьютером сетке распознаются информативные места каждого листа и с них считывается информация.
Когда данные введены в компьютер, они проверяются еще раз. Отыскиваются логические несообразности, предназначенные исследователем к проверке. Далее иногда выполняется специальная работа с пропущенными по той или иной причине данными. Такие ситуации могут возникать из-за неразборчивости или неоднозначного толкования записей в некоторых анкетах. Существует несколько подходов к решению этой проблемы.
1 Замена ответа нейтральным значением. Чаще всего под нейтральным понимается среднее значение. Такая замена используется в количественных вопросах. Она не влияет на среднее значение показателя и на коэффициенты корреляции между показателями (рассчитанные по всей совокупности анкет).
2 Приписывание ответа на основании ответов на другие
вопросы. Разработано много методов проведения такой операции. Например, можно построить зависимость между объемом потребления продукта и размером семьи по анкетам, где есть ответы на оба эти вопроса. После этого в анкетах, в которых не указан объем потребления продукта, проставляется его значение, рассчитанное с учетом размера семьи.
3 Удаление анкет, содержащих хотя бы один пропущенный ответ. При таком подходе иногда приходится удалять из таблицы данных существенное число строк. Поэтому иногда возвращаются к полевому этапу исследований и опрашивают дополнительных респондентов, чтобы заменить полученной от них информацией удаленные строки таблицы данных.
|
|
4 Учет только имеющихся ответов в каждом конкретном расчете. Анкеты с пропущенными ответами не удаляются, но и не учитываются в расчетах, в которых участвует соответствующая переменная. Процедура приемлема, если общее число анкет велико, пропусков относительно немного, а связи между переменными не слишком сильны.
Если решено удалять строки таблицы данных, то это должно быть запланировано до начала анализа с указанием критерия, а не тогда, когда расчеты полностью или даже частично произведены.
Статистическое выравнивание и преобразование информации. Процедуры статистического выравнивания данныхсостоят.
1 Взвешивание означает приписывание каждому респонденту весового коэффициента, отражающего относительную важность учета его высказывания по сравнению с высказываниями других респондентов. Сумма весовых коэффициентов равна общему числу респондентов.
2 Переопределение переменных представляет собой создание новых или модификацию существующих переменных в соответствии с целями исследователя.
Приведем несколько примеров таких переменных.
Первый тип преобразования - укрупнение шкалы. Предположим, первоначально уровень использования продукта был измерен по десятибалльной шкале. После преобразования можно получить переменную, имеющую не десять, а лишь четыре возможных значения: «тяжелый пользователь», «средний пользователь», «легкий пользователь» и «непользователь».
Другой тип преобразования - обобщение сведений, содержащихся в нескольких столбцах таблицы данных. Так, например, разделив общее количество товара, купленного респондентом, на число произведенных им покупок этого товара за месяц, можно рассчитать средний размер одной покупки.
3 Преобразование шкал используется, чтобы обеспечить сопоставимость оценок разных параметров и сделать данные более пригодными для анализа.