Рассмотрим задачу синтеза оптимального управления системой

из условия обращения в минимум критерия

при дополнительных изопериметрических ограничениях

Как и в дискретном случае, для учета изопериметрических ограничений применим метод множителей Лагранжа, сводя исходную задачу к задаче минимизации обобщенного критерия

где
—множители Лагранжа (
) удовлетворяющие при оптимальном управлении системе уравнений
В соответствии с этим для выявления структуры оптимального управления следует воспользоваться уравнением Беллмана, соответствующим обобщенному критерию:

с граничным условием, принимающим в данном случае вид

Фактически уравнение (5.91) дает возможность определить закон оптимального управления при различных значениях множителей Лагранжа
. Для отыскания окончательного решения следует решить систему уравнений (5.90) относительно
. При этом сначала необходимо раскрыть зависимости характеристик
при оптимальном управлении от множителей
. Это можно сделать вообще различными способами. Один из них предполагает отыскание в общем случае плотности распределения вектора состояния в конечный момент времени с помощью уравнения Колмогорова и последующего раскрытия в соответствующей операции математического ожидания. Другой способ заключается в получении уравнения и последующем решении его непосредственно для анализируемой характеристики
. С этой целью обратимся к рекуррентному соотношению (5.29). Буквально повторяя рассуждения, используемые при выводе уравнения Беллмана, нетрудно установить, что при осуществлении предельного перехода при
из (5.29) получим следующее уравнение в частных производных:

относительно функции

с очевидным граничным условием

Параметры a*(х,t), b*(х,t) представляют собой вектор сноса и матрицы коэффициентов диффузии случайного процесса (5.88) при оптимальном законе управления u(х,t). Функция Rj(х,t) представляет собой фактически величину
, вычисленную при условии, что движение системы (5.88) начинается с момента t из состояния х и происходит при действии оптимального управления u(х,t). Поэтому

Так как закон управления u(х,t), определяемый с помощью уравнения (5.91), параметрически зависит от набора
, то как Rj, так и
будут также зависеть от
.
Таким образом, решение задачи синтеза при наличии изопериметрических ограничений сводится к решению уравнения Беллмана (5.91) с целью выявления структуры оптимального управления, решению уравнения (5.92) с использованием уже найденного управления для установления зависимостей
от а и последующему решению системы (5.90) относительно
.
Задача в общем случае является достаточно сложной. Основная трудность состоит в необходимости совместного решения уравнений (5.91), (5.92). Она легко преодолевается для линейных систем при отсутствии ограничений на вектор управления, когда функции f 0,
являются квадратичными по своим аргументам. В этом случае задача формулируется следующим образом.
Пусть динамическая система описывается линейным стохастическим уравнением

где
— по-прежнему белый шум с нулевым математическим ожиданием и матрицей интенсивностей D. Требуется найти оптимальный закон управления системой из условия обращения в минимум критерия

при дополнительных ограничениях

Предполагается, что матрицы
положительно определенные. В соответствии с этим уравнение Беллмана для данной задачи
имеет вид

с граничным условием

Решение этого уравнения может быть записано в форме

где Λ (t), c(t) определяются с помощью системы обыкновенных дифференциальных уравнений

при граничных условиях

Структура оптимального управления при этом получается линейной

где матрица L определяется через матрицу Λ:

Как видно из приведенных соотношений, параметры, формирующие оптимальное уравнение, зависят от набора
. Поэтому для окончательного решения необходимо определить этот набор. Для этого обратимся к системе (5.90):

Установим зависимости
. С этой целью раскроем сначала выражение для параметров a*, b*. Получим

Подставим a*, b* в уравнение (5.92):

Нетрудно установить, что решение этого уравнения с граничным условием
имеет также вид квадратичной формы

где Λ (t), c(t) зависят лишь от времени. Действительно, подставляя
в (5.94), получаем

Это уравнение выполняется тождественно при любых х, если c j и Λ j удовлетворяют системе

с граничными условиями

Представленные соотношения позволяют определить
и тем самым установить искомую зависимость
. Остается решить систему уравнений (5.93) относительно
.
Таким образом, в задаче управления линейной системой с аддитивным белым шумом при наличии изопериметрических ограничений структура оптимального управления по-прежнему остается линейной. Однако коэффициенты обратной связи теперь уже зависят от статистических свойств возмущения. Эта зависимость проявляется через множители Лагранжа
, которые являются корнями системы (5.93).






