Тема 12. Использование современных информационных технологий при поиске и изучении литературных источников и обработке результатов

1. Кодирование или шифрование первичной (собранной) информации. Выбор средств математической обработки первичных данных. Статистический анализ полученной сервисной информации. Основные виды шкал измерения. Технические средства обработки сервисной информации.

2. Упорядочение и систематизация полученных данных - группировка и классификация. Простая группировка. Перекрестная группировка. Таблицы, схемы, полигоны, диаграммы (столбиковые, ленточные, круговые, фигурные), гистограммы, комулятивные кривые и т.д. Эмпирическая и теоретическая типологизация. Поиск взаимосвязей между переменными. Средняя арифметическая. Дисперсия. Коэффициент корреляции.

3. Анализ данных повторных и сравнительных исследований. Количественный и качественный анализ. Последовательность действий при качественно-количественном анализе данных. Недостатки количественных и преимущества качественных методов.

 

КОДИРОВАНИЕ

Для полной формализации информации недо­статочно простой классификации, поэтому проводят следующую процедуру - кодирование.

Кодирование - это процесс присвое­ния условных обозначений объектам и классификационным группам по соответствующей системе кодирования.

Система кодирования - это совокупность правил обозначения объектов и группировок с использованием кодов.

Код - это условное обозна­чение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определен­ном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.

Код характеризуется следующими параметрами:

• длиной;

• основанием кодирования;

• структурой кода, под которой понимают распределение зна­ков по признакам и объектам классификации;

• степенью информативности;

• коэффициентом избыточности, который определяется как отношение максимального количества объектов фактическому количеству объектов.

Все системы кодирования можно сгруппировать в два под­множества: регистрационные и классификационные системы кодирования.

Особенностью регистрационных систем кодирования являет­ся их независимость от применяемых систем классификации. Ре­гистрационные коды используются для идентификации объектов и передачи информации об объектах на расстояние, поэтому они должны удовлетворять следующим требованиям: минимальности длины кода, однозначности соответствия наименования объек­та и его кода в течение длительного периода времени и защищен­ности кода от помех и ошибок.

Регистрационные коды состоят из двух частей: информаци­онной и контрольной, предназначенной для защиты передавае­мой информации от ошибок. Контрольная часть может рассчи­тываться по различным алгоритмам, в частности, наиболее упот­ребляемыми являются следующие формулы их расчета:

где М - модуль (простое число, делящееся на единицу и на само себя);

Хi - информационные разряды, i - номер разряда;

Вi - вес информационного разряда.

К регистрационным системам относятся порядковая и серий­ная системы кодирования.

Приведенная на рис. классификация систем кодирования может быть детализирована. Так, последовательная и параллельная системы кодирования строятся на основе разрядной (позиционной) или комбинированной систем кодирования. Создание систем кодирования базируется на использовании соответствующих методов кодирования.

В заключении необходимо дать оценку соответствия спроектированного лингвистического обеспечения требованиям к лингвистическому обеспечению системы (подсистемы), предъявляемым нормативными документами (стандартами, руководящими документами и др.), а также техническим заданием на создание конкретной АИС.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow