Классификация и кодирование информации

Классификация информации и последующее ее кодирование осуществляется с целью упорядочения всей совокупности данных, циркулирующих в организации, уменьшения объема информации в базах данных и удобства ее поиска, формирования различных справок.

Под классификацией понимается разделение заданного множества информации на подмножества в соответствие с заданными признаками.

Подмножества, получаемые в результате разделения заданного множества по одному или нескольким признакам классификации, называются классификационными группами (виды, подвиды, семейства, рода и т.д.)

Признаком классификации называют признак, по которому делят заданное множество на подмножества. Каждый этап разделения множества на подмножества называется ступенью классификации. Число ступеней определяет глубину классификации.

Количество знаков в кодовом обозначении называют длиной кода. В результате классификации определяется структура кода. Максимальное количество объектов, которое можно закодировать называют емкостью кода. Емкость классификатора является важнейшей его характеристикой

А10 = 10n – 1, если используются десятичные цифры,

Арусс = 33n,при использовании букв русского алфавита (кириллица);

Алат = 25n,при использовании букв латинского алфавита (латиница);

где n – количество знаков в коде.

После завершения классификации осуществляют кодирование информации – образование и присвоение условного обозначения (кода) объекту классификации или классификационной группировке.

Различают иерархический, фасетный и смешанный методы классификации.

При иерархическом методе между классификационными группами устанавливаются отношения (иерархии), то есть исходное множество объектов М вначале (на 1-ой ступени) делят на классы М1, М2,…ММ, которые на 2-ой ступени делятся соответственно на подклассы М11, М12 … М14,на третьей ступени М111, М112 … и т.д.

Фасетным называют такой метод классификации, при котороммножество делится по независимым признакам или их совокупностям – (фасет с франц. – грань).

В настоящее время наиболее широкое распространение получили следующие системы кодирования.

В тех случаях, когда объект обладает одним признаком применяют порядковую систему кодирования. Например: лето – 01, осень – 02, зима – 03, осень – 04; 01 – кафедра математики, 02 – кафедра физики …., 21 – кафедра менеджмента.

При наличие двух признаков (предположим, что один признак зависит от другого) используется серийно – порядковая система классификации, основанная на сочетании иерархического метода классификации и порядковой системы кодирования с постоянным или переменным шагом серии номеров.

Последовательная система кодирования используется при наличии нескольких признаков классификации, построенных по иерархическому методу. Она заключается в поочередном указании в кодовом обозначении признаков классификации.

Параллельная система кодирования используется при наличии нескольких независимых признаков и строится по структурной формуле фасетного метода классификации (при этом кодирование по всем признакам проводится параллельно, независимо). Она используется в тех случаях, когда информация об объекте является устойчивой в течение длительного времени.

Параллельная система кодирования используется при наличии нескольких независимых признаков и строится по структурной формуле фасетного метода классификации.

Выбор способа классификации и кодирования зависит от технико- экономического содержания решаемых задач и объемов классификации, от рационального построения кодов и правильной классификации в значительной мере зависит эффективность применения вычислительной техники.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: