Классификация и кодирование информации

Реализация процессов передачи, накопления и хранения информации тесно связано с решением проблем формализации, классификации и кодирования её.

Информация в технических системах (ЭВМ,АСУ и др.) представляется в формализованном виде.

Определение 1. Информация, представленная в формализованном виде, называется данными.

Формализация, классификация и кодирование информации необходимы для унификации документов, параметров реальных объектов, для организации вычислительного процесса, накопления и хранения информации. Этот процесс обеспечивает высокую скорость обработки данных, однозначность представление информации, высокую скорость поиска требуемых данных в памяти ЭВМ, минимизирует объём требуемой памяти для хранения.

Классификацией называется процесс упорядоченного распределения объектов заданного множества по группам(классам).

Системой классификации называют совокупность правил распределения объектов заданного множества на подмножества.

Кодированием называют процесс присвоения кодового обозначения объекту.

Кодом называют обозначение объекта или группы объектов в виде знаков или групп знаков(символов) по определённым правилам.

Применение системы классификации и кодирования зависят от сферы деятельности, применяемых средств обработки, характеристик множества учитываемых объектов и их параметров.

При классификации технико-экономической информации наиболее часто используют две системы классификации:

1)Иерархическую,

2)Фасетную.

В иерархической системе установлено отношение подчинения между классификационными группировками. В ней устанавливаются ступени и уровни классификации. Основанием для деления являются признаки объектов. Система отличается большой информационной ёмкостью, привычностью применения, хорошей приспособленностью к ручной обработке, но в ней слабая гибкость структуры, так как основания деления заранее фиксированы, установлен порядок их следования, не допускающий включения новых объектов. Эту систему удобно представить схемой(Рис 6.1).

M Классифицируемое множество

1-я ступень

1-ый уровень Г1 Гm1

2-я ступень

2-й уровень

3-я ступень

3-й уровень

ёмкость системы классификации

Рис.6.1

В фасетной системе классификации классифицируемое множество образует независимые группировки по различным аспектам классификации. Она не имеет жёсткой структуры. В ней множество объектов, характеризующихся набором признаков(фасетов), делятся многократно и независимо. Фасеты располагаются в виде простого перечисления по своим группировкам (Рис. 6.2).

Ф1 Ф2 Фn

Рис.6.2

Исходное множество объектов может образовывать группировки по любому сочетанию фасетов: Г(Ф1,Ф2,…,Фn),Г(Ф1,Ф2),Г(Ф2,Фn) и т.п.

Ёмкость системы зависит от числа фасет и количества признаков в фасете. Значения различных фасет не должны пересекаться. Группы образуются из условия полезности применения в задачах.

Основные преимущества фасетной системы – гибкость структуры её построения, хорошая приспосабливаемость к машинной обработке информации. Недостаток – неполное использование ёмкости памяти.

Системы кодирования должны обеспечивать главные требования:

- позволять однозначное определение объекта(идентификацию);

- содержать необходимые сведения об объектах;

- обеспечивать минимальную длину кодового обозначения.

Они делятся на две основные группы:

1.Регистрационную,которая обеспечивает идентификацию объектов, но не содержит информации о его характеристиках.

2.Классификационную,которая даёт обширную информацию об объекте, но обладает ограниченной идентификацией.

В процессе кодирования объектам присваиваются цифровые, буквенные или буквенно-цифровые обозначения.

В регистрационной системе используются:

1.Порядковая система кодирования, в которой каждый объект кодируется текущим номером в списке. Для удобства обработки применяется равномерный код(например,001,002,…,999).

Достоинства: простота присвоения кодов и ввода новых объектов. Недостаток: отсутствие информации об объектах, сложность автоматической обработки.

2.Серийно-порядковая система кодирования отличаемая тем, что в ней выделяются серии порядковых номеров для сходных групп объектов. Например, на первой странице (№№ 1-20) – одна группа объектов (пылесосы), на второй странице(№№ 21-40) – другая группа объектов (часы) и т.д. Система даёт некоторую информацию об объектах, но ёмкость памяти используется плохо.

В классификационной системе используются последовательная и параллельная системы кодирования.

Последовательная система ориентирована на иерархическую систему классификаций. Код нижестоящей группировки образуется путём добавления символов к коду вышестоящей группировки. Достоинства: логичность построения, большая ёмкостью. Недостатки – негибкая структура.

Параллельная система характеризуется независимым кодированием признаков. Чаще используются при фасетной системе классификации. Система хорошо приспособлена для машинной обработки.

Существуют системы классификации и кодирования ведомственные, государственные и международные. Например, Международная стандартная хозяйственная классификация (ООН) использует четырёхступенчатую иерархическую систему классификации с последовательной системой кодирования цифровыми десятичными знаками (Х + Х + Х + Х).

Международная стандартная торговая классификация (ООН) имеет пять уровней (Х + Х + Х + Х + Х).

Единая система классификации и кодирования предметов материально-технического снабжения армий-членов НАТО использует четырёхступенчатую иерархическую систему классификации с последовательной и параллельной системой кодирования тринадцатью цифрами и идентификацией объектов в пределах групп

(ХХ + ХХ +: 00 + 0000000) – после двух ступеней кодирования продукции следует двухзначный код (00) страны и семизначный рациональный код предмета снабжения.

Государственные стандарты России используют иерархическую систему классификации с последовательным кодированием. Например, код 021124 означает:

02 – нефтепродукты,

021 – нефтепродукты светлые,

0211 – бензины,

02112 – бензины автомобильные,

021124 – бензин автомобильный марки А-72.

В конструкторско-технологической классификации деталей используется аналогичный код. Например, код 401111 означает:

40 – тело вращения,

401 – тело вращения с L>2D

4011 – тело вращения с наружной поверхностью цилиндрической

гладкой, без наружной резьбы,

40111 – тело вращения без центрального отверстия,

401111 – тело вращения без закрытых уступов, без

пазов, лысок, граней на наружной поверхности, без

дополнительных отверстий.

Пример показывает, что порой надо учитывать весьма большое число параметров, свойств объекта: размеры, группу материала, вид исходной заготовки, вид детали по технологическому процессу, класс точности и др. В таких случаях удобнее применять параллельную систему кодирования и фасетную классификацию. На каждую фасету выделять несколько разрядов цифр(например,код А4446104533119 несёт в себе информацию: А – вид заготовки,44 – класс точности,4 – класс чистоты,61 – характеристики технологических требований,0 – характеристики термической обработки и т.д).

В информационных технических системах для целей удобства обработки, передачи по каналам связи часто применяется перекодировка исходных закодированных сообщений.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

2 3 4 5 6 7 8

Подборка статей по вашей теме: