Кодирование данных

Кодирование структурированных вопросов достаточно простой процесс. Он заключается в присвоении цифрового кода каждому варианту ответа [1, С. 42]. Аналогично кодируется вопрос, содержащий шкалу.

На основе кодирования создается электронный файл данных, который подвергается обработке и анализу. В электронном файле каждому респонденту будет соответствовать своя строка. Столбцы будут представлять собой ответы респондентов на соответствующие вопросы анкеты.

Если на вопрос анкеты было возможно дать только один вариант ответа, то в электронном файле такому вопросу будет выделен только один столбец (поле). Каждый вариант ответа получит собственный код. Например, кодировка вопроса "Укажите Ваш пол?" состоит в присваивании цифрового кода 1- варианту ответа "женский пол" и кода 2 - варианту ответа "мужской пол".

Рассмотрим другой пример:

Вопрос 2. Как бы вы оценили доставку товаров компании Кока-кола (Кока-кола, Спрайт, Фанта)?

   
Отлично [1]
Очень хорошо [2]
Хорошо [3]
Удовлетворительно [4]
Плохо [5]
Не знаю [6]

В данном примере каждому варианту ответа (отлично, очень хорошо, хорошо, удовлетворительно, плохо, не знаю) присвоен цифровой код (от 1 до 6). Цифра 26 означает, что ответы респондентов на данный вопрос будут находится в 26 столбце электронного файла данных.

Если же на вопрос анкеты было возможно дать несколько (2 и более) вариантов ответов, то в этом случае, каждому варианту ответа будет выделен собственный столбец (поле). Кодировка в этом случае будет осуществляться в двоичной системе (ответу "Да" будет присвоен код 1, ответу "Нет" - код 0).

Например, вопрос 1. Скажите, пожалуйста, продукцию каких компаний Вы закупаете и продаете? (Возможен множественный ответ).

  ДА НЕТ  
Кока-Кола [1] [0]  
Филип Морис (Мальборо, Парламент, L&M) [1] [0]  
БАТ (Лаки Страйк, Кент, Ява, Пэл Мэл) [1] [0]  
Другие (….) [1] [0]  

В данном примере каждому варианту ответа (Кока-Кола, Филип Морис, БАТ, Другие) в электронном файле будет выделен собственный столбец (поле) с номером 22, 23, 24, 25. Кодировка "1" означает, что данный вариант ответа был отмечен, код "0" означает отсутствие в анкете такого варианта ответа.

В процессе кодирования составляется кодировочная книга, которая содержит коды всех переменных и инструкции кодирования. Общий вид кодировочной книги приведен в таблице 1.1. Необходимо отметить, что помимо вопросов, содержащихся в анкете, кодировочная книга и электронный файл содержат обязательные поля или переменные. Обязательными переменными выступают: идентификационные данные респондента, номер проекта, номер интервьюера, код даты, код времени. Некоторые авторы [11, С.525] к обязательным полям добавляют: номер записи, проверочный код.

Таблица 1.1

Кодировочная книга

№ столбца № пере-менной Название переменной № воп-роса Инструкции кодирования
1-4   Идентификационные данные респондента - Присваиваем каждому респонденту порядковый номер от 0001 до n=1500
5-6   Номер проекта - Проект №23
7-8   Номер интервьюера - 01- Иванов 02-Петров 03-Сидоров …. 10 - Николаев
9-14   Код даты - По анкете
15-18   Код времени - По анкете
19, 20, 21   пробелы - Не заполнять столбцы
    Закупка и продажа продукции компании Кока-Кола   1 - закупают 0 -не закупают
    Закупка и продажа продукции компании Филип Морис   1 - закупают 0 -не закупают
    Закупка и продажа продукции компании БАТ   1 - закупают 0 -не закупают
    Закупка и продажа продукции других компаний   1 - закупают 0 -не закупают
    Оценка доставки товаров компании Кока-Кола   Отлично -1 очень хорошо -2 хорошо -3 удовлетворительно -4 плохо -5 не знаю -6

В данном примере номера столбцов были заданы таким образом, чтобы показать значность содержащихся в них переменных. Так, номер столбца 1-4 означает, что данный столбец содержит четырехзначные данные, начиная от 0001 и заканчивая 1500 номером. Номер столбца может быть задан и иначе. Кроме того, в номере столбца могут присутствовать как цифры, так и буквы или другие знаки. Выбор варианта номера столбца во многом будет определяться программой статистической обработки данных. Например, программа SPSS, будет требовать обязательной первой буквы в наименовании номера столбца.

Пример электронного файла данных приведен в таблице 1.2.

Таблица 1.2

Электронный файл данных

1-4 5-6 7-8 9-14 15-18                
      15.10.08 14.30                
      14.10.08 10.00                
     
      20.10.08 11.05                

Кодирование открытых вопросов осуществляется, как правило, после получения заполненных анкет. Исследователь составляет список, включающий все возможные варианты ответов на данный вопрос. После редактирования данного списка (список должен включать только взаимоисключающие варианты ответов), каждому варианту ответа присваивается свой цифровой код.

При кодировании открытых вопросов возможно введение варианта ответа "Другое", но в этом случае ответы, попавшие в данную категорию, будут полностью потеряны для анализа. Поэтому введение данной категории уместно в том случае, если в нее попадает лишь незначительная часть ответов (не более 5-10% ответов). По наиболее важным вопросам коды ответов должны присваиваться даже в том случае, если таких ответов вообще не было вообще. Иногда важно знать именно то, что никто из респондентов не дал тот или иной вариант ответа (например, при кодировании открытого вопроса: "Что вам больше всего не нравится в данном товаре?" можно ввести вариант ответа "Упаковка" даже в том случае, если ни один из респондентов не дал такого ответа).

Необходимо всегда помнить, что данные кодируются, для того чтобы сохранить как можно больше вариантов ответов, а не для того, чтобы упростить процедуру обработки и анализа данных.

Всем пропущенным данным также присваивается собственный код. Конечно же коды пропущенных значений должны отличаться от кодов, присвоенных ответам, полученным надлежащим способом в ходе опроса.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: