Системы классификации экономической информации

Автоматизированная обработка на ЭВМ позволяет составлять различные сводки, таблицы, ведомости, где информация сгруппирована по каким-либо реквизитам-признакам, например по подразделениям.

Для выполнения группировок появляется необходимость кодирования этих группировочных реквизитов-признаков условными обозначениями, для чего используются системы классификаций и кодирования. Они позволяют представить информацию в форме, удобной для восприятия машиной. Как правило, кодируются те буквенные выражения реквизитов-признаков, по которым делается группировка. Кодирование же экономической информации предполагает предварительную ее классификацию. Классификация (классифицирование) – это деление множества объектов (предметов, явлений, процессов, понятий) на классы в соответствии с определенным признаком. Классификация объектов – это процедура группировки на качественном уровне, направленная на выделение однородных свойств. В основе классификации всегда лежит классификационный признак. Классифицировать студентов вуза можно по следующим классификационным признакам: пол, форма обучения, изучаемый иностранный язык, факультет, специальность и др.

Таблица 3

Классификационный признак Значение
Пол М (мужской)
Ж (женский)
Форма обучения Очная
Заочная
Изучаемый иностранный язык Английский
Немецкий
Французский
Испанский

Как правило, распределение множества объектов (понятий, процессов, явлений) требуется проводить не по одному, а по многим классификационным признакам. Для этого применяются системы классификации.

Систему классификации составляет набор правил, позволяющих упорядоченно расположить классифицируемые элементы на основе установленных взаимосвязей между признаками.

В зависимости от количества признаков и существующей соподчиненности между ними применяются иерархическая, фасетная или дескрипторная системы классификации объектов.

Иерархическую классификацию применяют в случае если признаков несколько и между ними существует иерархическая соподчиненность. То есть, исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень; каждый класс 1 -го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень; каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.

При построении иерархического классификатора используют следующие правила:

1. Определяется число признаков, с указанием их наименований и соподчиненности, например, Признак А – факультет включает Признак Б – специальность, Признак Б включает Признак В – год поступления в вуз, который включает Признак Г – порядковый номера студента.

2. Определяется число значений, принимаемых каждым признаком, и выбирается максимальное, например, А (факультет) принимает максимальное значение – 9, Б (специальность) – 5, В (год поступления) – 99, Г (номера студента) – 200.

3. Строится классификационное дерево:

Рис. 5

 
 

. Классификационное дерево

4.

 
 

Строится структура кода по схеме:

Рис. 6. Структура кода

Например, кодовое обозначение конкретного студента может иметь значение 5307115 или ЭФ07115, если использовать как цифры так и буквы.

К достоинствам иерархической системы классификации следует отнести:

• простота построения;

• использование независимых классификационных признаков в различных ветвях иерархической структуры.

Недостатки иерархической системы классификации

• жесткая структура, которая приводит к сложности внесения изменений, т.к. приходится перераспределять все классификационные группировки;

• невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков;

• нерациональное дублирование одних и тех же признаков на разных ветвях классификационного дерева.

Фасетная (одноуровневая многопризначная) классификация используется для деления на классы в случае если ранг всех признаков одинаков и между признаками нет иерархической зависимости. Фасетная система классификации позволяет выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемого объекта.

Признаки классификации называются фасетами (facet – рамка). Классы-фасеты получают путем отнесения объектов в классы соответственно значениям признаков. Каждый фасет содержит совокупность однородных значений данного классификационного признака. Значения в фасете могут располагаться в произвольном порядке, хотя предпочтительнее их упорядочение.

Например, множество студентов можно разделить по трем признакам: пол, успеваемость и место окончания школы. Тогда независимые классы-фасеты можно представить как показано на рисунке 7.


Рис. 7. Разделение множества объектов классификации по признакам (фасетам)

Полученные фасеты позволяют с помощью операций пересечения, объединения и др. получить ответы на различные вопросы. Например, на вопрос: «Какие студенты мужского пола, окончившие школу в Воронеже учатся на отлично?» - ответ: Иванов. Для получения ответа необходимо составить формулу: Ф11ÇФ21ÇФ31 – пересечение множеств.

К достоинствам фасетной системы классификации следует отнести:

• высокая степень гибкости;

• использование большого числа признаков классификации и их значений для создания группировок;

• простота модификации систем без изменения структуры группировок.

Недостатком фасетной системы классификации является сложность ее построения, т.к. необходимо учитывать все многообразие классификационных признаков.

Дескрипторная (описательная) система классификации эффективно используется для организации поиска информации, для ведения тезаурусов (словарей). Язык этой системы приближается к естественному языку описания информационных объектов. Особенно широко она используется в библиотечной системе поиска.

Суть дескрипторного метода классификации заключается в следующем:

1. отбирается совокупность ключевых слов или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов. Причем среди ключевых слов могут находиться синонимы;

2. выбранные ключевые слова и словосочетания подвергаются нормализации, т.е. из совокупности синонимов выбирается один или несколько наиболее употребимых;

3. создается словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормализации.

Например, в качестве объекта классификации рассматривается успеваемость студентов. Ключевыми словами могут быть выбраны: оценка, экзамен, зачет, преподаватель, студент, семестр, название предмета. Здесь нет синонимов, и поэтому указанные ключевые слова можно использовать как словарь дескрипторов. В качестве предметной области выбирается учебная деятельность в высшем учебном заведении. Ключевыми словами могут быть выбраны: студент, обучаемый, учащийся, преподаватель, учитель, педагог, лектор, ассистент, доцент, профессор, коллега, факультет, подразделение университета, аудитория, комната, лекция, практическое занятие; занятие и т.д. Среди указанных ключевых слов встречаются синонимы, например: студент, обучаемый, учащийся; преподаватель, учитель, педагог; факультет, подразделение университета и т.д. После нормализации словарь дескрипторов будет состоять из следующих слов: студент, преподаватель, лектор, ассистент, доцент, профессор, факультет, аудитория, лекция, практическое занятие и т.д.

Между дескрипторами устанавливаются связи, которые позволяют расширить область поиска информации. Связи могут быть трех видов:

1. синонимические – определяющие совокупность ключевых слов - синонимов

2. родовидовые – отражающие принадлежность некоторого объекта (класса) более представительному классу

3. ассоциативные – устанавливают связь между дескрипторами, обладающими общими свойствами

Например, синонимическая связь: студент — учащийся — обучаемый; родовидовая связь: университет — факультет — кафедра; ассоциативная связь: студент — экзамен — профессор — аудитория.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: