Принципы работы нейронных сетей. Решение задачи распознавания образов с помощью нейронной сети

Искусственные нейронные сети - математические модели, построенные по принципу организации и функционирования биологических нейронных сетей - сетей нервных клеток живого организма. Это понятие возникло при изучении процессов, протекающих в мозге, и при попытке смоделировать эти процессы. Нейрон – основная вычислительная ячейка нейронной сети.

Искусственные нейронные сети демонстрируют удивительное число свойств, присущих мозгу, — это обучение на основе опыта, обобщение, извлечение существенных данных из избыточной информации. После анализа входных сигналов они самонастраиваются и обучаются, чтобы обеспечить правильную реакцию. В качестве примера рассмотрим многослойную полносвязанную нейронную сеть прямого распространения, которая широко используется для поиска закономерностей и классификации образов. Полносвязанной нейронной сетью называется многослойная структура, в которой каждый нейрон произвольного слоя связан со всеми нейронами предыдущего слоя, а в случае первого слоя — со всеми входами нейронной сети. Прямое распространение сигнала означает, что такая нейронная сеть не содержит петель. Способность к обучению является основным свойством мозга. Для искусственных нейронных сетей под обучением понимается процесс настройки архитектуры сети и весов синаптических связей (влияющих на сигналы коэффициентов) для эффективного решения поставленной задачи. Обычно обучение нейронной сети осуществляется на некоторой выборке. По мере процесса обучения, который происходит по некоторому алгоритму, сеть должна все лучше и лучше реагировать на входные сигналы. Выделяют три вида обучения: с учителем, самообучение и смешанная. В первом способе известны правильные ответы к каждому входному примеру, а веса подстраиваются так, чтобы минимизировать ошибку. Обучение без учителя позволяет распределить образцы по категориям за счет раскрытия внутренней структуры и природы данных. При смешанном обучении комбинируются два вышеизложенных подхода.

Распознавание образов — научное направление, связанное с разработкой принципов и построением систем, предназначенных для определения принадлежности объекта к одному из классов объектов. Классы объектов могут быть заранее выделены (задача классификации) или необходимо их выявить в процессе решения задачи (задача кластеризации). Под объектами в распознавании образов понимают (семантическая классификация): - различные предметы; - явления; - процессы;- ситуации;- сигналы;- и т.п.

Задача распознавания образов возникает, в различных областях искусственного интеллекта, например в понимании естественного языка, символьной обработке алгебраических выражений, экспертных системах и др. В общем случае, любую задачу можно рассматривать как распознавание образа – при известных исходных данных за счет использования определенного алгоритма (методики) требуется получить решение (образ). При построении ИИС не требуется заранее знать обо всех закономерностях исследуемой области, но необходимо располагать достаточным количеством примеров для настройки разрабатываемой системы, которая после обучения будет способна получать требуемые результаты с определенной степенью достоверности.

Решение задачи распознавания образов с помощью нейронной сети. Задача классификации - определение для какого-либо произвольного объекта, с измеренными свойствами, к какому классу он принадлежит. Есть несколько классов, для этих классов выделены общие признаки, для всех известных объектов каждого класса имеются значения этих свойств. Количество признаков равно количеству входов на первом слое нейрона, количество классов равно количеству нейронов на выходе. Суть алгоритма по шагам – многослойная сеть, подается на вход какой-либо объект, определяется к какому классу он принадлежит. Далее сравнивается с ожидаемым результатом, если определено неправильно – вычисляется ошибка нейронов выходного слоя, затем ошибка всех нейронов на всех промежуточных слоях. После чего определяется величина, на которую необходимо изменить весовые коэффициенты всех связей, и происходит изменение этих коэффициентов. После этого загружается этот же объект и выполняется те же действия до тех пор, пока не получится удовлетворяющий решение результат.

22 23 24 25 26 27 28

Подборка статей по вашей теме: