Обобщение по признакам

Выделяют два ключевых критерия, используемых в процедурах обобщения — признаки объектов и структура отношений между объектами. Обобщение по признакам представляет собой наиболее простой и хорошо изученный случай.

Общая постановка задачи имеет следующий вид. Имеется множество объектов А = {аi} и множество признаков П = {pi}, каждый из которых может принимать какое-либо значение из соответствующего множества значений признаков i}. Здесь верхний индекс показывает тот признак, к которому относится это множество значений. Все множества, кроме А, предполагаются ко­нечными. Обобщенным объектом называется некоторое подмножест­во множества А. Если удаетс я построить такую функцию y(p1, p2, …, pn), что она определяет принадлежность или непринадлеж­ность любого аi к интересующему нас подмножеству, то эта функ­ция называется решающей функцией. В самом простейшем случае функ­ция y может быть булевой функцией — когда для определения принад­лежности элемента аi к подмножеству АiÍA требуется ответить на вопрос, какими признаками или значениями признаков он обладает или не обладает.

Все методы, используемые для обобщения можно разделить на два больших класса: первые используют лишь сведения о пространстве признаков, методы же второго класса учитывают имеющуюся априорную информацию об объектах — обучающую выборку. Методы первого класса получили название методов разделения в пространстве признаков.

а) Методы разделения в пространстве признаков.

В методах такого типа предполагается, что структура признаков выбрана столь удачно, что в про­странстве признаков объекты, образующие некоторое понятие, груп­пируются компактным образом. Они как бы «сгущаются» около не­которого «ядра», характеризующего наиболее существенные для данного признака комбинации их значений (такой метод в свое время М.М. Бонгард назвал «развал на кучи»).

Обобщением такого подхода к образованию понятий служит идея использования специальной функции для выделения «ядер» из заданного множества объектов. Эта функция может быть построена различными способами. Например, она может принимать на объ­ектах, входящих в ядро, значения, значительно превосходящие зна­чения той же функции в некоторой окрестности пространства призна­ков, окружающей ядро. Эти функции как бы задают распределение потенциалов в пространстве признаков, почему и сам метод работы с такими функциями получил название метода потенциальных функций.

Однако подобные методы, основанные на использовании лишь сведений о пространстве признаков и некоторых его свойствах, имеют очевидный недостаток — не учитывается априорная информация о конкретных представителях, входя­щих в формируемое понятие. Подобная априорная информация, как правило, имеется у исследователя. Иными словами, мы заранее знаем, что некоторые объекты должны входить в формируемое понятие (положительные примеры), а другие не должно входить в него (отрицательные примеры).

Это приводит к постановке задачи обобщения по признакам на основе обучающей выборки, состоящей из положительных и отрицательных примеров.

б) Методы обобщения по признакам на базе обучающей выборки

Существует большое число методов, занимающих пограничное положение между методами типа выделения ядер и методами, осно­ванными на привлечении дополнительной содержательной информации об объекте управления и методах организации управления им. Наиболее широко распространенный метод та­кого пограничного типа, который обычно называют методом гиперплоскостей.

Кратко этот метод можно описать следующим образом.

Имеется некоторое множество объектов А = {аi}, элементы которого обладают признаками из множества П = {pi} (при геометрической интерпретации каждый признак pi рассматривается как ось в n-мерном пространстве). Тогда все объекты в пространстве признаков находятся внутри некоторой области. Подмножество А1 представляет собой набор (множество) положительных примеров, А2 — отрицательных. Выбирается один из положительных примеров и строится разделяющая плоскость, которая отделяла бы его от некоторого отрицательного примера. Из множества возможных разделяющих плоскостей выбирается та, которая позволяет отделить как можно большее число положительных примеров от выбранного отрицательного. Эта операция выполняется до тех пор, пока не останется ни одной гиперплоскости, содержащей разнородные (положительные и отрицательные) примеры.

Видоизменением метода разделяющих гиперплоскостей являются методы, в которых разделение происходит за счет криволинейных поверхностей. Однако в силу трудностей формирования удачных разделяющих поверхностей второго и более высоких порядков эти методы на практике применения фактически не нашли.

Недостаток описанного метода: языки, на которых задано как описание объектов, так и описание самого сформированного понятия, различны, что не позволяет производить процедуру обобщения на последующем шаге, т. е. получать понятия второго уровня общности, а, следовательно, не дает основ и для построения классификации понятий.

Именно поэтому в системах поддержки принятия решений, как правило, используются другие принципы формирования понятий и организации классификации.

Прежде всего, необходимо указать группу методов, в основе которых лежит предложенная Бонгардом схема формирования решающего правила для оценки принадлежности объектов к форми­руемому понятию — так называемый алгоритм «кора» (этот алгоритм будет описан далее).

Стоит упомянуть еще один метод формирования понятий на основе призначной структуры — метод растущих пирамидальных сетей (РПС-метод). Мы не будем подробно описывать данный метод. Лишь вкратце обозначим основные этапы его функционирования.

Рис. 4.

Растущая пирамидальная сеть — динамический объект, ее конфигурация меняется в процессе функционирования. Она состоит из вершин двух типов. Вершины первого типа называются рецепторами, вершины второго типа — ассоциативными элементами. Любой элемент РПС может быть в двух состояниях — воз­бужденном и невозбужденном. Набор возбужденных рецепторов в некоторый момент времени образуется в результате подачи на вход РПС в данный момент опи­сания некоторого объекта через значения его признаков. Каждый ассоциативный элемент выступает еще и в роли задержки, величина которой зависит от длины пути, проходимого сигналом возбуждения.

На базе обучающей выборки корректируется структура РПС за счет введения по определенным правилам новых ассоциативных элементов, из числа которых выбираются положительные и отрицательные контрольные элементы. При формировании РПС обучающая выборка используется многократно — после появления каждого нового контрольного элемента начинается новый просмотр обучающей выборки, начиная с первого примера. Обучение РСП считается завершенным, если описания всех объектов, входящих в обучающую выборку, при подаче их на рецепторы сети не вызывает появления новых контрольных элементов.

После настройки структуры РПС она может использоваться для отнесения объектов к сформированному понятию по правилам, основывающимся на определенной комбинации положительных и отрицательных контрольных элементов.

К достоинствам данного метода можно отнести: 1) содержательная интерпретируемость формируемых понятий; 2) простота автоматизации на ЭВМ; 3) возможность модификации данного метода для учета противоречивости обучающей выборки.

Теперь перейдем к другому виду обобщения, учитывающего не только признаки, присущие объектам, но и те отношения, которые между этими объектами существуют.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: