Распознавание формы и положения

 

Этот этап работы системы, можно с уверенностью считать наиболее сложным и наукоемким. Распознавание формы и трансформации объекта уже никак не зависит от аппаратной реализации датчиков, потому что все данные получаются на этапе выделения и отслеживания ключевых областей.

Если объект не имеет способности к свободной трансформации, то остается сопоставить положения ключевых областей модели объекта, и будут получены форма и положение. Таким объектом может быть, к примеру, стол. Все его части имеют постоянное положение относительно друг друга. Но существуют и объекты, которые могут изменять форму в своем локальном пространстве. Рука – различным расположением пальцев мы можем придавать ей самые различные формы. Для таких объектов распознавание формы производится несколько сложнее.

Существуют три подхода к распознаванию формы.

Без использования модели. Допустим, существует способ передачи двоичных данных, в котором поднятая вверх рука означает ноль, а расположенная перпендикулярно позвоночнику – единицу. Тогда наблюдателю не важны никакие другие данные о передающем, кроме его положения руки. В этом случае можно не создавать модель человека, необходим только лишь упрощенный скелет и три ключевые области на объекте.

С косвенным использованием модели. Рассмотрим случай, когда нужно проанализировать движения спортсмена, чтобы затем указать на его слабые стороны. Для этой цели не имеет смысла создавать очень детальную модель, но и одним скелетом обойтись будет сложно. В этом случае создается простая модель. На ней проводится анализ некоторого количества стандартных поз. А затем, при анализе движения реального человека, его движения приводятся к этим стандартным позам.

С непосредственным использованием модели. В особо сложных случаях, например, при анализе мимики лица человека, необходимо создание очень детальной и удобной в использовании модели. Обработка такого рода движений сейчас вызывает особенно высокий интерес разработчиков диагностической аппаратуры и крупных студий, занимающихся компьютерной графикой.

Рассмотрим подробнее наиболее сложный вариант архитектуры данной подзадачи – вариант с использованием активной модели.

Во-первых, все реализации систем рассматриваемого типа можно разделить на автоматические и мануальные. В автоматических система сама должна исследовать результат простого применения данных трекинга к модели, а затем решать, возможно ли существование такой позы объекта, были ли ошибки при определении ключевых областей, соответствует ли такая поза объекта его предыдущему характеру движения. Если система обнаруживает какие-либо ошибки или несоответствия, она должна сама принимать решения о том, каким образом можно корректно исправить данные. В случае мануальной системы суждение о корректности полученных данных предоставляется пользователю и он сам должен вносить соответствующие изменения в случае визуального несоответствия данных предполагаемому характеру движения объекта.

В мануальных системах главной задачей является организация удобного и эффективного интерфейса пользователя. Должна присутствовать процедура визуализации данных, чтобы обеспечить наглядность. Также должна присутствовать удобная интерактивная система внесения изменений.

В автоматических же системах могут присутствовать процедуры интерфейса пользователя, но основной задачей является проектирование высокоинтеллектуальной подсистемы анализа данных. Система должна быть настолько отлаженной, чтобы обеспечивать возможность ее использования в задачах, которые вообще не предусматривают визуального контроля пользователем.

 

Распознавание действия

 

Это завершающая фаза работы системы, как анализатора, за ней следует непосредственно ответная реакция системы, если таковая предусмотрена.

Распознавание действия, как и распознавание формы, может быть реализовано с использованием статических или динамических данных.

Системы, которые распознают действия объекта по статическим данным, просто сравнивают вычисленную на предыдущем этапе позу объекта с хранящимися в системе шаблонами. Такие системы обычно распознают только очень простые действия. Они могут сказать, что человек сидит, стоит, указывает на что-то. Но не смогут определить, подпрыгнул человек или падает с какой-то высоты.

Системы динамического распознавания действия работают уже с некоторой последовательностью данных распознавателя формы, и поэтому могут узнавать сложные действия. Большая часть таких систем может распознавать только идет человек или стоит, такие распознаватели считаются низкоуровневыми. Если же система может достоверно распознать такие действия, как перенос объектов, бег, контролирующие действия, элементы танца, то это система высокого уровня.

Как статические, так и динамические системы, на конечном этапе своей работы сравнивают действие объекта, которое они получили, с шаблонами, которые хранятся в их памяти. И делают заключение о сходстве с одним из таких шаблонов.

Алгоритм работы статических систем обычно не накладывает особых требований на реализацию предыдущего этапа анализа. Однако динамические системы распознавания действия могу пользоваться такими данными, как, например, состояние каких-то отдельных мышц тела человека. В таких случаях распознавание формы должно быть реализовано соответствующим образом.

Реакция системы

 

Когда все действия связанные с анализом завершены и система имеет шаблон действия объекта, остается только одно: выбрать соответствующую для данного шаблона реакцию и отреагировать. Реакция системы полностью зависит от ее реализации. Это может быть изменение положения графитовых стержней в системе управления ядерным реактором, отчет о состоянии пациента в медицинском оборудовании, перенос данных на компьютерную модель и ее визуализация в компьютерной графике.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: