Учет изопериметрических ограничений

Рассмотрим задачу синтеза оптимального управления системой

из условия обращения в минимум критерия

при дополнительных изопериметрических ограничениях

Как и в дискретном случае, для учета изопериметрических ограничений применим метод множителей Лагранжа, сводя исходную задачу к задаче минимизации обобщенного критерия

где —множители Лагранжа () удовлетворяющие при оптимальном управлении системе уравнений

В соответствии с этим для выявления структуры оптимального управления следует воспользоваться уравнением Беллмана, соответствующим обобщенному критерию:

с граничным условием, принимающим в данном случае вид

Фактически уравнение (5.91) дает возможность определить закон оптимального управления при различных значениях множителей Лагранжа . Для отыскания окончательного решения следует решить систему уравнений (5.90) относительно . При этом сначала необходимо раскрыть зависимости характеристик при оптимальном управлении от множителей . Это можно сделать вообще различными способами. Один из них предполагает отыскание в общем случае плотности распределения вектора состояния в конечный момент времени с помощью уравнения Колмогорова и последующего раскрытия в соответствующей операции математического ожидания. Другой способ заключается в получении уравнения и последующем решении его непосредственно для анализируемой характеристики . С этой целью обратимся к рекуррентному соотношению (5.29). Буквально повторяя рассуждения, используемые при выводе уравнения Беллмана, нетрудно установить, что при осуществлении предельного перехода при из (5.29) получим следующее уравнение в частных производных:

относительно функции

с очевидным граничным условием

Параметры a*(х,t), b*(х,t) представляют собой вектор сноса и матрицы коэффициентов диффузии случайного процесса (5.88) при оптимальном законе управления u(х,t). Функция R^j(х,t) представляет собой фактически величину , вычисленную при условии, что движение системы (5.88) начинается с момента t из состояния х и происходит при действии оптимального управления u(х,t). Поэтому

Так как закон управления u(х,t), определяемый с помощью уравнения (5.91), параметрически зависит от набора , то как R^j, так и будут также зависеть от .

Таким образом, решение задачи синтеза при наличии изопериметрических ограничений сводится к решению уравнения Беллмана (5.91) с целью выявления структуры оптимального управления, решению уравнения (5.92) с использованием уже найденного управления для установления зависимостей от а и последующему решению системы (5.90) относительно .

Задача в общем случае является достаточно сложной. Основная трудность состоит в необходимости совместного решения уравнений (5.91), (5.92). Она легко преодолевается для линейных систем при отсутствии ограничений на вектор управления, когда функции f ₀, являются квадратичными по своим аргументам. В этом случае задача формулируется следующим образом.

Пусть динамическая система описывается линейным стохастическим уравнением

где — по-прежнему белый шум с нулевым математическим ожиданием и матрицей интенсивностей D. Требуется найти оптимальный закон управления системой из условия обращения в минимум критерия

при дополнительных ограничениях

Предполагается, что матрицы положительно определенные. В соответствии с этим уравнение Беллмана для данной задачи имеет вид

с граничным условием

Решение этого уравнения может быть записано в форме

где Λ (t), c(t) определяются с помощью системы обыкновенных дифференциальных уравнений

при граничных условиях

Структура оптимального управления при этом получается линейной

где матрица L определяется через матрицу Λ:

Как видно из приведенных соотношений, параметры, формирующие оптимальное уравнение, зависят от набора . Поэтому для окончательного решения необходимо определить этот набор. Для этого обратимся к системе (5.90):

Установим зависимости . С этой целью раскроем сначала выражение для параметров a*, b*. Получим

Подставим a*, b* в уравнение (5.92):

Нетрудно установить, что решение этого уравнения с граничным условием имеет также вид квадратичной формы

где Λ (t), c(t) зависят лишь от времени. Действительно, подставляя в (5.94), получаем

Это уравнение выполняется тождественно при любых х, если c^j и Λ ^j удовлетворяют системе

с граничными условиями

Представленные соотношения позволяют определить и тем самым установить искомую зависимость . Остается решить систему уравнений (5.93) относительно .

Таким образом, в задаче управления линейной системой с аддитивным белым шумом при наличии изопериметрических ограничений структура оптимального управления по-прежнему остается линейной. Однако коэффициенты обратной связи теперь уже зависят от статистических свойств возмущения. Эта зависимость проявляется через множители Лагранжа , которые являются корнями системы (5.93).