Кодирование

Классификация

Классификация, кодирование и индентификация применяются для того, чтобы упорядочить информацию об объектах стандартизации для последующего ее использования.

Классификация разделение множества объектов на классификационные группировки по их сходству или различию на основе определенных признаков в соответствии с принятыми правилами. Основными методами классификации объектов стандартизации для их информационного описания являются иерархический и фасетный.

Прииерархической классификации исходное множество объектов последовательно разделяется на классы, подклассы, группы, подгруппы, виды и т.п. по принципу «от общего к частному». Иначе - каждая группировка в соответствии с выбранным признаком (основанием деления) делится на несколько других группировок, каждая из которых, в свою очередь, по другому признаку делится еще на несколько подчиненных группировок, и т.д. Таким образом, между классификационными группировками устанавливается отношение подчинения (иерархии) (рис. 2.2).

При иерархической классификации необходимо соблюдать следующие правила:

· разделение множества на подмножества на каждом уровне производится только по одному признаку;

· группировки, получаемые в результате деления на очередном уровне, относятся только к одной группи­ровке предыдущего уровня и не пересекаются, т.е. не повторяются;

 
 

· разделение множества осуществляется без пропусков очередного или добавления промежуточного уровня деления;

· классификация производится таким образом, чтобы сумма образованных подмножеств составляла делимое множество.

Приведем в качестве примера схему иерархической классификации множества «Тракторы и сельскохозяйственные машины» [1]. На первом уровне производится разбиение на подмножества по признаку «группы однородной продукции»:

m1 - резерв;
m2 - тракторы;
m3 - машины сельскохозяйственные;
m4 - машины для животноводства, птицеводства и кормопроизводства;
m5 - двигатели тракторов и сельхозмашин, узлы и детали двигателей;
m6 - агрегаты, узлы и детали тракторов;
m7 - агрегаты, узлы и детали сельхозмашин и др.

Второй уровень деления сформирован по признаку «применение». Например, для m3 (тракторы):

m2.1 - резерв;
m2.2 - тракторы сельскохозяйственные общего назначения;
m2.3 - тракторы сельскохозяйственные универсально-пропашные;
m2.4 - тракторы сельскохозяйственные специальные (виноградниковые, свекловодческие, мелиоративные и др.);
m2.5 - тракторы лесопромышленные (трелеровочные, лесосплавные и др.);
m2.6 - тракторы промышленные.

На третьем уровне деление осуществляется по признаку «тяговый класс». Например, для m2.3 (тракторы сельскохозяйственные универсально-пропашные):

m2.3.1 - тракторы тяговых классов до 0,9;
m2.3.2 - тракторы тяговых классов свыше 0,9 и до 1,4;
m2.3.3 - тракторы тяговых классов свыше 1,4 и до 2.

Четвертый уровень сформирован по признаку «мощность». Например, для m2.3.2 (тракторы тяговых классов свыше 0,9 и до 1,4):

m2.3.2.1   мощностью свыше 23,7 и до 47,8 кВт;
m2.3.2.2   мощностью свыше 47,8 и до 80,9 кВт.

Основные преимущества иерархической классификации за­ключаются в ее логичности, последовательности и хорошей приспособленности для ручной обработки информации. Недостатком является малая гибкость структуры, обусловленная фиксированностью признаков (оснований деления) и заранее установленным порядком их следования. В связи с этим включение новых уровней деления по дополнительным признакам становится затруд­нительным, особенно если не предусмотрены резервные емкости.

 
 

Фасетный метод классификации предполагает разделение множества объектов на независимые друг от друга классификационные группировки. При таком подходе некоторое подмножество m образуется по принципу «от частного к общему» (рис. 2.3).

Каждой классификационной группировке (фасету Фj) соответствует набор (группа) независимых признаков {nj1, nj2, …}. Признаки n в различных фасетах Ф не пересекаются, то есть каждый признак отличается от другого по наименованию, значению и кодовому обозначению. Например, для задач классификации информации о населении можно выделить фасеты «Пол», которому соответствуют признаки «мужской» и «женский»; «Образование» («начальное», …, «среднее», …, «высшее»); «Стаж работы» («до 5 лет», …, «15 лет и более») и т. д.

Подмножество m формируется следующим образом. Например, из множества работающих на предприятии необ­ходимо выделить подмножество специалистов с высшим образованием, имею­щих стаж работы более 15 лет. В искомое подмножество включаются только те, которые соответствуют нижеприведенной совокупности признаков:

фасет Признак
Образование Высшее
Стаж работы 15 лет и более

Фасетная классификация обладает гибкостью (при необходимости учесть новую группу признаков достаточно ввести новый фасет) и большой информационной емкостью. используют там, где номенклатура продукции часто изменяется, появляются новые виды продукции; недостаток - необходимо четко знать, на каком месте какой фасет стоит.

Кодирование - образование по определен­ным правилам и присвоение кодов объекту или группе объек­тов, позволяющее заменить несколькими знаками (символами) наименования этих объектов. Код — знак или совокупность знаков, присваиваемых объек­ту с целью его идентификации.

Коды должны удовлетворять следующим основным требова­ниям:

· однозначно идентифицировать объекты и (или) группы объектов, т.е. быть идентификаторами;

· иметь минимальное число знаков (минимальную длину) и достаточное для кодирования всех объектов (призна­ков) заданного множества;

· иметь достаточный резерв для кодирования вновь возни­кающих объектов кодируемого множества;

· быть удобными для использования человеком, а также для компьютерной обработки закодированной информа­ции;

· обеспечивать возможность автоматического контроля ошибок при вводе в компьютерные системы.

Кодовое обозначение характеризуется:

· алфавитом кода;

· структурой кода;

· числом знаков — длиной кода;

· методом кодирования.

Алфавит кода представляет собой систему знаков (симво­лов), составленных в определенном порядке, куда могут входить цифры, буквы и другие знаки, имеющиеся на клавиатуре печа­тающего устройства. В этой связи коды бывают цифровые, бук­венные и буквенно-цифровые.

Наиболее широкое применение в отечественной, зарубежной и международной практике кодирования информации находят цифровые коды. При этом, как правило, используются десятич­ные коды. В таком случае, когда подмножество не превышает 10 объектов, код состоит из одной цифры — от 0 до 9 включительно, а когда в подмножество входит не более 100 объектов - две цифры (от 00 до 99 включительно) и т.д. Установлено, что наибольшая эффектив­ность в процессе обработки информации обеспечивается при применении цифровых кодов из пяти и менее цифр.

Структура кода представляет собой, как правило, графическое изображение последовательности расположения знаков кода и соответствующие этим знакам наименования уровней деления (рис. 2.4).

Число знаков в коде определяется его структурой и зависит от количества объектов, входящих в подмножества, образуемые на каждом уровне деления. При определении числа знаков на каждом уровне деления необходимо иметь в виду возможность по­явления новых объектов и предусматривать резервные коды.

Методы кодирования в значительной степени связаны с ме­тодами разделения множества на подмножества.

Наиболее прост метод присвоения объектам порядковых цифровых номеров. В этом случае код представляет собой натуральное число, которое является не чем иным как порядковым номером данного объекта в пределах некоторого множества. В принципе, такой код обеспечивает идентификацию, но не является информативным, так как не отражает признаков, присущих множеству.

Указанный недостаток может быть преодолен при использовании классификационных методов кодирования. Получаемый при этом код некоторого объекта включает в себя коды отдельных признаков, характеризующих этот объект. Классификационные методы кодирования подразделяют на два типа: последовательный и параллельный.

Последовательный метод основан на иерархической классификации. Кодовое обозначение имеет структуру, соответствующую последовательности и количественному составу признаков объекта на каждом уровне деления. Недостатки метода: зависимость кода от установленных правил образования, необходимость иметь резервные коды на случай включения дополнительных объектов, невозможность изменения состава и количества признаков объекта.

Параллельный (независимый) метод основан на фасетной классификации. При таком подходе коды присваиваются фасетам и признакам независимо друг от друга. В этом случае структура кодового обозначения определяется фасетной формулой. Данный метод хорошо приспособлен для машинной обработки и решения технико-экономических задач, характер которых часто меняется, и для тех случаев, когда необходимо анализировать различные множества объектов. Он обеспечивает возможность независимого изменения и дополнения характери­стик объектов и их различных сочетаний, необходимых для ре­шения конкретных задач. Недостатки: громоздкость фасетных формул избыточная емкость кодов.

При использовании обоих классификационных методов кодирование осуществляется присвоением порядковых номеров, причем фасетный метод может успешно применяться в сочетании с иерархическим. В этом случае одинаковыми кодами ко­дируются одинаковые объекты (признаки), находящиеся на од­ном уровне деления, но в разных подмножествах. Такой подход применен, например, в Общероссийском классификаторе видов экономической деятельности, продукции и услуг (ОКДП).

В ОКДП интегрированы одновременно три объекта классификации: виды экономической деятельности, виды продукции, виды услуг. Виды экономической деятельности отображаются четырехзначным цифровым кодом, образуемым по иерархическому методу. Виды продукции и услуг - семиразрядным цифровым кодом, в котором классы и подклассы кодируются по иерархической схеме, а виды – по фасетной. Однако в последнем случае первые четыре разряда, кодирующие класс продукции или услуг, полностью идентичны первым четырем разрядам кода, соответствующего виду экономической деятельности, результатом которой эта продукция или услуга являются.

Например, прокат черных металлов как класс продукции имеет код 2712000. Здесь «27» – подраздел «Производство металлургическое» раздела «Обрабатывающая промышленность», «1» – группа «Черные металлы (чугун и сталь)», «2» – подгруппа «Прокатка».

Основным классификационным признаком для видов продукции и услуг является функциональный. При необходимости функциональный признак дополняется конструктивно-технологическими признаками, присущими объектам классификации.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: