Классификация и кодирование информации

Классификация - система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.

Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.

Реквизит - логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Классификатор - систематизированный свод наименований и кодов классификационных группировок.

Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков.

I. Иерархическая система классификации.

Иерархическая система классификации (рис. 2.3) строится следующим образом:

· исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;

· каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;

· каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень и т.д.

Рис. 2.3. Иерархическая система классификации

Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.

Достоинства иерархической системы классификации:

· простота построения;

· использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации:

· жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;

· невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.

II. Фасетная система классификации.

Фасетная система классификации в отличие от иерархической позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта. Признаки классификации называются фасетами(facet - рамка). Каждый фасет (Фi) содержит совокупность однородных значений данного классификационного признака.

Схема построения фасетной системы классификации в виде таблицы отображена на рис. 2.5. Названия столбцов соответствуют выделенным классификационным признакам (фасетам), обозначенным Ф1, Ф2,..., Фi,..., Фn. Например, цвет, размер одежды, вес и т.д. Произведена нумерация строк таблицы. В каждой клетке таблицы хранится конкретное значение фасета.

Рис 2.5. Фасетная система классификации

Процедура классификации состоит в присвоении каждому объекту соответствующих значений из фасетов. Для каждого объекта задается конкретная группировка фасетов структурной формулой, в которой отражается их порядок следования:

Ks=(Ф1, Ф2,..., Фi,..., Фn), где Фi- i-й фасет; n - количество фасетов.

Достоинства фасетной системы классификации:

· возможность создания большой емкости классификации, т.е. использования большого числа признаков классификации и их значений для создания группировок;

· возможность простой модификации всей системы классификации без изменения структуры существующих группировок.

Недостатком фасетной системы классификации является сложность ее построения, так как необходимо учитывать все многообразие классификационных признаков.

III. Дескрипторная система классификации.

Для организации поиска информации, для ведения тезаурусов (словарей) эффективно используется дескрипторная (описательная) система классификации, язык которой приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

· отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

· выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

· создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

· синонимические указывающие некоторую совокупность ключевых слов как синонимы;

· родо-видовые, отражающие включение некоторого класса объектов в более представительный класс;

· ассоциативные, соединяющие дескрипторы, обладающие общими свойствами.

Система кодирования применяется для замены названия объекта на условное обозначение (код) в целях обеспечения удобной и более эффективной обработки информации. Система кодирования - совокупность правил кодового обозначения объектов.

Код строится на базе алфавита, состоящего из букв, цифр и других символов. Код характеризуется:

· длиной - число позиций в коде;

· структурой - порядок расположения в коде символов, используемых для обозначения классификационного признака.

Процедура присвоения объекту кодового обозначения называется кодированием. Можно выделить две группы методов, используемых в системе кодирования (рис.2.7), которые образуют:

· классификационную систему кодирования, ориентированную на проведение предварительной классификации объектов либо на основе иерархической системы, либо на основе фасетной системы;

· регистрационную систему кодирования, не требующую предварительной классификации объектов. Рассмотрим представленную на рис. 2.7 систему кодирования.

Рис. 2.7. Система кодирования, использующая разные методы.

В основу классификации положено пять наиболее общих признаков: место возникновения, стадия обработки, способ отображения, стабильность, функция управления.

Рис. 2.8. Классификация информации, циркулирующей в организации


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: