1. Кодирование или шифрование первичной (собранной) информации. Выбор средств математической обработки первичных данных. Статистический анализ полученной сервисной информации. Основные виды шкал измерения. Технические средства обработки сервисной информации.
2. Упорядочение и систематизация полученных данных - группировка и классификация. Простая группировка. Перекрестная группировка. Таблицы, схемы, полигоны, диаграммы (столбиковые, ленточные, круговые, фигурные), гистограммы, комулятивные кривые и т.д. Эмпирическая и теоретическая типологизация. Поиск взаимосвязей между переменными. Средняя арифметическая. Дисперсия. Коэффициент корреляции.
3. Анализ данных повторных и сравнительных исследований. Количественный и качественный анализ. Последовательность действий при качественно-количественном анализе данных. Недостатки количественных и преимущества качественных методов.
КОДИРОВАНИЕ
Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру - кодирование.
|
|
Кодирование - это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования.
Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов.
Код - это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.
Код характеризуется следующими параметрами:
• длиной;
• основанием кодирования;
• структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;
• степенью информативности;
• коэффициентом избыточности, который определяется как отношение максимального количества объектов фактическому количеству объектов.
Все системы кодирования можно сгруппировать в два подмножества: регистрационные и классификационные системы кодирования.
Особенностью регистрационных систем кодирования является их независимость от применяемых систем классификации. Регистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объекта и его кода в течение длительного периода времени и защищенности кода от помех и ошибок.
|
|
Регистрационные коды состоят из двух частей: информационной и контрольной, предназначенной для защиты передаваемой информации от ошибок. Контрольная часть может рассчитываться по различным алгоритмам, в частности, наиболее употребляемыми являются следующие формулы их расчета:
где М - модуль (простое число, делящееся на единицу и на само себя);
Хi - информационные разряды, i - номер разряда;
Вi - вес информационного разряда.
К регистрационным системам относятся порядковая и серийная системы кодирования.
Приведенная на рис. классификация систем кодирования может быть детализирована. Так, последовательная и параллельная системы кодирования строятся на основе разрядной (позиционной) или комбинированной систем кодирования. Создание систем кодирования базируется на использовании соответствующих методов кодирования.
В заключении необходимо дать оценку соответствия спроектированного лингвистического обеспечения требованиям к лингвистическому обеспечению системы (подсистемы), предъявляемым нормативными документами (стандартами, руководящими документами и др.), а также техническим заданием на создание конкретной АИС.