Классификация информации и последующее ее кодирование осуществляется с целью упорядочения всей совокупности данных, циркулирующих в организации, уменьшения объема информации в базах данных и удобства ее поиска, формирования различных справок.
Под классификацией понимается разделение заданного множества информации на подмножества в соответствие с заданными признаками.
Подмножества, получаемые в результате разделения заданного множества по одному или нескольким признакам классификации, называются классификационными группами (виды, подвиды, семейства, рода и т.д.)
Признаком классификации называют признак, по которому делят заданное множество на подмножества. Каждый этап разделения множества на подмножества называется ступенью классификации. Число ступеней определяет глубину классификации.
Количество знаков в кодовом обозначении называют длиной кода. В результате классификации определяется структура кода. Максимальное количество объектов, которое можно закодировать называют емкостью кода. Емкость классификатора является важнейшей его характеристикой
А10 = 10n – 1, если используются десятичные цифры,
Арусс = 33n,при использовании букв русского алфавита (кириллица);
Алат = 25n,при использовании букв латинского алфавита (латиница);
где n – количество знаков в коде.
После завершения классификации осуществляют кодирование информации – образование и присвоение условного обозначения (кода) объекту классификации или классификационной группировке.
Различают иерархический, фасетный и смешанный методы классификации.
При иерархическом методе между классификационными группами устанавливаются отношения (иерархии), то есть исходное множество объектов М вначале (на 1-ой ступени) делят на классы М1, М2,…ММ, которые на 2-ой ступени делятся соответственно на подклассы М11, М12 … М14,на третьей ступени М111, М112 … и т.д.
Фасетным называют такой метод классификации, при котороммножество делится по независимым признакам или их совокупностям – (фасет с франц. – грань).
В настоящее время наиболее широкое распространение получили следующие системы кодирования.
В тех случаях, когда объект обладает одним признаком применяют порядковую систему кодирования. Например: лето – 01, осень – 02, зима – 03, осень – 04; 01 – кафедра математики, 02 – кафедра физики …., 21 – кафедра менеджмента.
При наличие двух признаков (предположим, что один признак зависит от другого) используется серийно – порядковая система классификации, основанная на сочетании иерархического метода классификации и порядковой системы кодирования с постоянным или переменным шагом серии номеров.
Последовательная система кодирования используется при наличии нескольких признаков классификации, построенных по иерархическому методу. Она заключается в поочередном указании в кодовом обозначении признаков классификации.
Параллельная система кодирования используется при наличии нескольких независимых признаков и строится по структурной формуле фасетного метода классификации (при этом кодирование по всем признакам проводится параллельно, независимо). Она используется в тех случаях, когда информация об объекте является устойчивой в течение длительного времени.
Параллельная система кодирования используется при наличии нескольких независимых признаков и строится по структурной формуле фасетного метода классификации.
Выбор способа классификации и кодирования зависит от технико- экономического содержания решаемых задач и объемов классификации, от рационального построения кодов и правильной классификации в значительной мере зависит эффективность применения вычислительной техники.