Таксономия с суперцелью

В качестве синонима слова таксономия иногда употребляются термины «обучение без учителя», «самообучение». Этим отражается тот факт, что при решении задачи таксономии задается критерий качества (максимальные связи внутри таксона, минимальные связи между таксонами и т. д.), но не указывается, для какой конкретной цели эта группировка делается. Т. е. не указывается, что будет описываться в терминах полученных таксонов, что от чего нужно будет отличать по этим описаниям и т. д.

Но такая таксономия «на все случаи жизни» для каждого конкретного случая может оказаться неоптимальной. Например, если при распознавании устных слов мы пользуемся не отдельными фонемами, а их группами (звукотипами) и при этом объединим в один таксон очень похожие по своим характеристикам звуки «п», «т» и «к», то такая таксономия окажется неприемлемой, если в составе распознаваемого словаря имеются слова типа «кот», «ток», «кто» и т. д. В этом примере показано место таксономии в многоуровневой системе. Таксоны на уровне звукотипов должны строиться с учетом «суперцели»: помимо того, что таксоны должны объединять похожие элементы, количество таксонов еще должно быть минимальным и достаточным для принятия правильных решений на следующем более высоком уровне системы.

Этими условиями четко фиксируется цель таксономии, вследствие чего исключается возможность для использования терминов самообучение, обучение без учителя и т. п. Все, что требуется от учителя — конечная цель таксономии, методы ее достижения и критерии для оценки получаемых результатов — здесь заданы однозначно. Таксономия с учетом суперцели может быть получена алгоритмом ROST.

Таксономия в анизотропном пространстве [71]

До сих пор мы работали при вполне естественном предположении, что пространство признаков изотропно, так что расстояние между точками и не зависит от того, идем ли мы от точки к точке или от к . Однако если близость, похожесть точек измерять, например, затратами сил на преодоление пути между ними, то направление движения (например, идти в гору или под гору) часто бывает не безразлично.

Такая ситуация возникает в известной задаче выбора оптимального ряда типоразмеров изделий или машин [15]. Так, перевозка груза в 2,5 тонны на 5-тонном грузовике вызывает потери от полухолостых пробегов. Если же на эту машину погрузить 7,5 тонн, то она может выйти из строя и потери будут гораздо большими, чем в предыдущем случае. Для того чтобы учесть этот эффект, при таксономии в анизотропном пространстве направление анализа фиксируется правилом, по которому расстояния измеряются всегда от центра таксона к его внутренним точкам. При этом относительная значимость направления вдоль координаты отмечается весовыми коэффициентами , если направление измерения совпадает с направлением увеличения -й координаты, и — в противоположном случае.

Рис. 9

Предположим, что мы хотели бы обеспечить возможность замены любого объекта таксона на любой другой объект этого же таксона. При этом потери от всех замен будут равны сумме потерь от каждой отдельной замены. Потери от взаимных замен объектов и равны сумме расстояний между ними в двух противоположных направлениях: . Тогда потери от всех парных замен внутри -гo таксона, состоящего из точек, выражаются величиной для всех и от 1 до . В результате качество таксономии может быть оценено через сумму потерь для всех таксонов: . Чем меньше , тем лучше таксономия.

На рис. 9, а приведен пример множества точек в двумерном пространстве, подвергаемого таксономии с помощью алгоритма семейства FOREL. Если принять, что , то пространство будет изотропным и таксономия , приведенная на рис 9, б, представляется вполне естественной. Если же считать, что свойства пространства вдоль оси анизотропны и при этом , то получаем таксономию , показанную на рис. 9, в. Если имеет место одновременная анизотропия по обеим координатам и такая, что , то таксономия имеет вид , показанный на рис. 9, г.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: