Обучение однослойной сети

Наиболее просто градиент функционала вычисляется для однослойных нейронных
сетей. В этом случае M = 1 и выражение для функционала принимает вид:

, (3.2)

где – функция активации; – сигнал на входе функции активации
для i -го нейрона; – вектор входного сигнала; R – число элементов вектора входа;
S – число нейронов в слое; – весовые коэффициенты сети.

Включим вектор смещения в состав матрицы весов , а вектор входа дополним элементом, равным 1.

Применяя правило дифференцирования сложной функции, вычислим градиент функционала ошибки, предполагая при этом, что функция активации дифференцируема:

(3.3)

Введем обозначение

, (3.4)

и преобразуем выражение (3.3) следующим образом:

. (3.5)

Полученные выражения упрощаются, если сеть линейна. Поскольку для такой сети выполняется соотношение то справедливо условие . В этом случае выражение (3.3) принимает вид:

(3.6)

Выражение (3.6) положено в основу алгоритма WH, применяемого для обучения линейных нейронных сетей [45].

Линейные сети могут быть обучены и без использования итерационных методов,
а путем решения следующей системы линейных уравнений:

, (3.7)

или в векторной форме записи:

. (3.8)

Если число неизвестных системы (3.7) равно числу уравнений, то такая система может быть решена, например, методом исключения Гаусса с выбором главного элемента. Если же число уравнений превышает число неизвестных, то решение ищется с использованием метода наименьших квадратов.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

1 2 3 4 5 6 7

Основные черты сходства и различия культуры Древней Греции и Древнего Рима

Основные формы безналичных расчётов в РФ

Высвобождение оборотных средств

Нарушения слоговой структуры слова у детей

Основные экономические группировки стран современного мира

РАВНОМЕРНЫЙ ПРОКАТ

Самый сильный аргумент, почему эволюция человека не могла быть