Основные задачи построения систем распознавания

Понятие образа.

Образ – это некоторое структурированное приближенное(!) описание изучаемого объекта, явления или процесса. Любой образ представляется некоторым набором признаков.

[Не следует путать два понятия: образ и объект (вид из окна – словесное описание видимого – картина-пейзаж). Чем большее число свойств и качеств объекта отражено в образе, тем полнее это описание, тем полнее этот образ характеризует описываемый объект. ]

Основное назначение образов – это их использование в процессе установления соответствия объектов, т.е. при доказательстве их идентичности, аналогичности, подобия, сходства и т.п., которое осуществляется путем сравнения (сопоставления). Два образа считаются подобными, если удается установить их соответствие.

Задача распознавания образов возникает в различных разделах ИИ, например, в понимании естественного языка компьютером, символьной обработке алгебраических выражений, экспертных системах, преобразовании и синтезе программ ЭВМ. Причем в различных задачах образу придается разный смысл.

Важным термином в теории РО является понятие «класса». [При получении некоторых характеристик объекта (создании образов) обычно происходит его отождествление с некоторым классом. Например, характеристики выхода из строя систем АЭС – класс опасных отказов или класс отказов, требующих определенного технического вмешательства, но не опасных.]

Классы – это объединения объектов, явлений или процессов, отличающиеся общими свойствами. При этом целью распознавания является отнесение объекта, представленного своим образом, к тому или иному заранее определенному классу.

[

]

Система распознавания – это сложная динамическая система, состоящая из совокупности технических средств получения и обработки информации и коллектива специалистов, обеспечивающих на основе определенных алгоритмов решение задачи классификации соответствующих объектов, явлений или процессов.

Задача 1:

Задача состоит в подробном и тщательном изучении объектов, для распознавания которых предназначена проектируемая система. Её цель – уяснить особенности изучаемых объектов и выяснить, что роднит и отличает их друг от друга. В решении этой задачи - главное найти все признаки, характеризующие существо распознаваемых объектов (явлений). Любые ограничения, любая неполнота приводят к ошибкам или полной невозможности правильной классификации объектов (явлений).

Но чтобы назначать признаки распознавания, необходимо, во-первых, понять, что не существует способов их автоматической генерации. На сегодня это под силу только человеку. Поэтому говорят, что выбор признаков - эвристическая операция. Во-вторых, выбор признаков можно осуществлять, имея представление об их общих свойствах. С этих позиций достаточно принять, что признаки могут подразделяться на детерминированные, вероятностные, логические и структурные.

Детерминированные признаки - это такие характеристики объектов или явлений, которые имеют конкретные и постоянные числовые значения.

Примерами детерминированных признаков могут быть, например, ТТХ бомбардировщиков и истребителей США (таблиц № 1).

Числовые значения признаков по каждому из самолетов можно интерпретировать как координаты точек, представляющих каждый самолет в 11-мерном пространстве признаков.

Таблица № 1

Характеристики	Т и п ы с а м о л е т о в
Бомбардировщики	Истребители
В-1А	В-52	В-57А	FB-111	F - 4 E Фантом	F - 105 E Тандерчиф	F - 15 Игл	F - 100 D Суперсейбр	Хантер
Экипаж (чел.)
Vmax (км\ч) при H=15 км
Vmin (км\ч) при H=0.3 км
Потолок (м)
Бомб.нагрузка (т)					7.2	6.4	-	3.4	0.9
Макс.взлетная масса (т)
Размах крыльев (м)
Длина самолета (м)
Кол-во двигателей
Тяга двигателей (т)	13.6	7.7	3.3	9.2	5.4		10.9	5.3	4.5
Дальность полета (км

Распознавание осуществляется путем сравнения полученных размеров с имеющимися в базе данных характеристиками деталей.

Вероятностные признаки - это характеристики объекта (явления), носящие случайный характер. С такими признаками в основном и имеют дело в природе и технике.

Отличаются эти признаки тем, что в силу случайности соответствующей величины признак одного класса может принимать значения из области значений других классов, каждый из которых подлежит распознаванию в системе.

Если признак не может принять значений в области соответствующих значений для других классов, то, следовательно, имеем дело не с вероятностным, а с тем же детерминированным признаком. Это как раз подчеркивает, почему вероятностные системы являются системами более общего порядка.

Примеры вероятностных признаков распознавания:

· среднее значение мощности сигнала радиолокатора, отраженного от самолета (причина - изрезанность круговой диаграммы рассеяния сигнала радиолокатора самолетом и электронные и атмосферные шумы в том же радиолокационном диапазоне);

· размер листа растения (причины - отличия в питании, освещенности, влаги и т.п.);

· размер патологического изменения какого-либо органа человека (причины - различные стадии заболевания при его обнаружении, различные ракурсы и сечения наблюдений образования и т.п.) и т.д.

Логические признаки распознавания - это характеристики объекта или явления, представленные в виде элементарных высказываний об истинности (“да”, "нет” или “истина”, “ложь”).

Эти признаки не имеют количественного выражения, то есть являются качественными суждениями о наличии, либо об отсутствии некоторых свойств или составляющих у объектов или явлений.

Примеры логических признаков:

· наличие ТРД на самолете;

· боль в горле пациента;

· кашель;

· насморк;

· растворимость реактива и т.д.

Здесь по каждому признаку можно сказать только то, что он есть, либо его нет. К логическим можно отнести также такие признаки, у которых важна не величина признака у распознаваемого объекта, а лишь факт попадания или непопадания ее в заданный интервал. (например, крейсерская скорость самолета больше или меньше 2000 км/ч).

Структурные признаки - непроизводные (то есть, элементарные) элементы (символы), примитивы изображения объекта распознавания.

Примеры структурных признаков:

а)для изображения прямоугольника:

- горизонтальный отрезок прямой;

- вертикальный отрезок прямой.

б) для любого изображения на экране дисплея:

-пиксел.

В результате связей из непроизводных элементов (структурных признаков) образуется объект, аналогично тому, как предложения языка строятся путем соединения слов, в свою очередь состоящих из букв. В этом структурные методы проявляют аналогию с синтаксисом естественного языка. Отсюда структурные признаки носят еще название лингвистических или синтаксических.

Задача 2:

Эта задача заключается в первоначальной классификации объектов (явлений), подлежащих распознаванию т.е. в составление априорного алфавита классов.

Основное в данной задаче – выбор надлежащего принципа классификации. Для этого:

1-е - определяется, какие решения могут приниматься по результатам распознавания либо человеком, либо автоматической системой управления объектом (цель распознавания).

2-е - на основе определенной выше цели формулируются требования к системе распознавания, позволяющие выбрать принцип классификации.

3-е - составляется априорный алфавит классов объектов (явлений).

[

]

Однако, возможны ситуации, когда количество классов, по которым надежно распознаются некоторые объекты (явления), заранее неизвестно и должно определяться самой системой распознавания. Эта задача называется задачей кластеризации, в которой можно отказаться уже от эвристического подхода. Однако решение здесь достигается при выборе некоторых общих правил кластеризации, которые задает разработчик системы.

Задача 3:

Эта задача состоит в разработке априорного словаря признаков распознавания.

При разработке словаря признаков сталкиваются с рядом ограничений.

Ограничение 1. Оно состоит в том, что в словарь могут быть включены только признаки, относительно которых может быть получена априорная информация, достаточная для описания классов на языке этих признаков.

Ограничение 2. Это ограничение связано с нецелесообразностью включения в словарь всех признаков. Так, некоторые признаки, относительно которых хотя и имеется достаточный объём априорных данных, включать в словарь признаков нет смысла, поскольку они либо совсем бесполезны при решении задачи распознавания, либо весьма мало полезны. О таких признаках говорят, что они малоинформативны и не обладают достаточными разделительными свойствами.

Ограничение 3. Это ограничение связано с наличием или с возможностью создания технических средств наблюдений, обеспечивающих на основе проведения экспериментов определение предварительно отобранных признаков.

Эффективность СР в значительной мере определяется объёмом и качеством измерительной информации о распознаваемых объектах, что обуславливает необходимость создания таких средств наблюдений, которые позволяют с максимально возможной точностью определять наиболее информативные признаки.

Задача 4:

Задача состоит в описании классов объектов на языке априорного словаря признаков.

В рамках этой задачи необходимо каждому классу поставить в соответствие числовые параметры детерминированных и вероятностных признаков, значения логических признаков и предложения, составленные из структурных признаков-примитивов.

Значения этих параметров описаний можно получить из экспериментальных наблюдений, математических расчетов, результатов моделирования, извлечения из литературных источников.

Если признаки распознаваемых объектов - детерминированные, то описанием класса может быть точка в n -мерном пространстве детерминированных признаков из априорного словаря, сумма расстояний до которой от точек, представляющих объекты данного класса, минимальна.

[ Например, в таблице с ТТХ самолетов мы имеем дело с 11-мерным пространством признаков. Каждая координата - это одна какая-нибудь характеристика, например “экипаж”.

Характеристики	Типы самолетов
Бомбардировщики	Истребители
В-1А	В-52	В-57А	Фантом	Игл	Хантер
Экипаж (чел.)

Если рассматривать только одну координату “экипаж”, то точкой эталона для истребителей будет - 1, для бомбардировщиков - 4. Это точки, суммы расстояний которых от всех истребителей и всех бомбардировщиков, представляющих эти два класса, минимальны.

Точно также это можно сделать по всем 11 координатам (т.е. “потолок”, “размах крыльев”, ”бомбовая нагрузка “ и т.д.), в результате чего будем уже иметь дело с точками эталонов в 11-мерном пространстве.

]

Если признаки распознавания - логические, то для описания каждого класса необходимо, прежде всего, иметь полный набор элементарных логических высказываний A, B, C, входящих в состав априорного словаря, а также установить соответствие между набором значений приведенных признаков A, B, C и классами W₁, W₂,...W_m.

[

Например, необходимо распознавать два заболевания - обычная простуда и ангина (W₁,W₂), а в качестве логических признаков выберем:

А - повышенная температура (А=0 - нет, А=1 - да);

В - насморк (В=0 - нет, В=1 - да);

С - нарывы в горле (С=0 - нет, С=1 - да).

Тогда так называемое булево соотношение между классом W₁ (обычное простудное заболевание) и значениями признаками (а эти значения - бинарные) выглядит так:

Здесь умножение, как вы знаете, соответствует логическому “И”, а сложение - “ИЛИ”.

Точно также для второго класса заболеваний получим следующее описание:

]

Если распределение объектов распознавания, представляемых числовыми значениями их признаков по областям соответствующего пространства вероятностное, то для описания классов необходимо определить характеристики этих распределений:

· функции плотности распределения вероятностей f_i (x₁,x₂,....,x_n), где x₁.....x_n - вероятностные признаки, i - номер класса;

· P(W_i) - априорная вероятность того, что объект, случайно выбранный из общей совокупности, окажется принадлежащим к классу W_i.

Для того чтобы получить f_i (x₁,x₂,....,x_n) и P(W_i) можно воспользоваться одним из трех способов: 1) экспериментальное определение по статистическим данным; 2) теоретический вывод; 3) моделирование.

Если признаки распознавания - структурные, то описанием каждого класса должен быть набор предложений (цепочек из непроизводных элементов с правилами соединения). Каждое из предложений класса - характеристика структурных особенностей объектов этого класса. [Пример – код Фримена???]

Задача 5:

Выбор алгоритма классификации, обеспечивающего отнесение распознаваемого объекта или явления к соответствующему классу.

Алгоритмы распознавания основываются на сравнении значений той или иной меры близости распознаваемого объекта с каждым классом. При этом если значение выбранной меры близости (сходства) L данного объекта w с каким-либо классом W_g достигает экстремума относительно значений ее по другим классам, то есть

то принимается решение о принадлежности этого объекта классу W_g, т.е. wW_g.

В алгоритмах распознавания, использующих детерминированные признаки в качестве меры близости, используется среднеквадратическое расстояние между данным объектом w и совокупностью объектов (w₁,w₂,....,w_n), представляющих (описывающих) каждый класс. Так для сравнения с классом W_g это выглядит так

где k_g - количество объектов, представляющих W_g -й класс.

При этом метод измерения расстояния между объектами d(w,w_g) свободен для выбора. Так, если сравнивать непосредственно координаты, то

где N - размерность признакового пространства.

Если сравнивать угловые отклонения, то, рассматривая вектора, составляющими которых являются признаки распознаваемого объекта w и класса w_g, будем иметь:

где ||X_w|| и ||X_wg|| - нормы соответствующих векторов.

В алгоритме распознавания, использующем детерминированные признаки можно учитывать и их веса V_j (устанавливать степень доверия или важности). Тогда рассмотренное среднеквадратическое расстояние принимает следующий вид:

В алгоритмах распознавания, использующих вероятностные признаки, в качестве меры близости используется риск, связанный с решением о принадлежности объекта к классу W_i, где i - номер класса. (i=1,2,..,m.).

Пусть даны описания классов

и риски правильных и ошибочных решений, представляющие собой элементы платежной матрицы вида:

Здесь на главной диагонали расположены потери при правильных решениях. Обычно принимают С_ii=0 или C_ii<0.

По обеим сторонам от главной диагонали - потери при ошибочных решениях. В каждой системе эти потери свои, свойственные только ей.

Если вектор признаков распознаваемого объекта w - , то риск, связанный с принятием решения о принадлежности этого объекта к классу W_g, когда на самом деле он может принадлежать классам W₁,W₂,...,W_m, наиболее целесообразно определять как среднее значение потерь

С_1g, C_2g,...,C_mg,

то есть, потерь, стоящих в g -ом столбце платежной матрицы.

Тогда этот средний риск можно записать:

где P(W_i/X_w) - условная апостериорная вероятность того, что wW_i в соответствии с теоремой гипотез или по формуле Байеса

Вероятности и плотности, входящие в формулу - ни что иное, как характеристики описания классов в вероятностной системе.

Для алгоритмов, основанных на логических признаках, понятие “мера близости” не имеет смысла. Вспомним упрощенный пример, рассмотренный нами для логических признаков заболеваний (простой простуды и ангины).

Имея значения признаков А,B,C, достаточно подставить их в булевы соотношения между классами и признаками, чтобы сразу получить результат как истинность или ложность булевой функции описания того или иного класса.

Действительно, пусть признаки приняли следующие значения:

-Повышенная температура: A=1

-Насморк: B=0

-Нарывы в горле: C=1

Тогда подстановка их в булевы соотношения даст следующий результат:

То есть, истинным является второе соотношение, соответствующее распознаванию ангины как диагностируемого класса из двух заболеваний.

Для алгоритмов, основанных на структурных (лингвистических) признаках, понятие “меры близости” более специфично.

С учетом того, что каждый класс описывается совокупностью предложений, характеризующих структурные особенности объектов соответствующих классов, распознавание неизвестного объекта осуществляется идентификацией предложения, описывающего этот объект, с одним из предложений в составе описания какого-либо класса.

При этом идентификация может подразумевать наибольшее сходство предложения, описывающего распознаваемый объект, с предложениями из наборов описания каждого класса.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

3 4 5 6 7 8 9

Подборка статей по вашей теме: