В некоторых случаях задачи оптимального управления можно решать методами вариационного исчисления.
Рассмотрим задачу
(1)
(2)
(3)
(4)
где , управление скалярная функция, непрерывная на отрезке , , где функции и непрерывны как функции четырех переменных и непрерывно дифференцируемы как функции двух фазовых переменных , дважды непрерывно дифференцируема как функция четырех переменных , и данные скалярные функции, непрерывные на , конец отрезка фиксирован, конец не фиксирован: правые концы графиков функций и скользят по прямым и .
Без ограничения (4) на управление эта задача представляет собой задачу Лагранжа на условный экстремум при уравнениях связи (1). Заметим, что интеграл функционала (3) |
не зависит от производных искомых функций (задача Лагранжа в форме Понтрягина).
Пусть из системы уравнений Эйлера-Пуассона
(5)
где функция Лагранжа, множители Лагранжа, с учетом краевых условий (2) найдены одна или несколько экстремалей .
Можно доказать, что если экстремум функционала имеется, то он достигается на функции , где управление - непрерывная функция, график которой составлен из кусков графиков функций (или некоторых из них), содержащихся |
между графиками и , и кусков графиков функций и - границ множества допустимых значений управлений. В каких точках стыкуются куски, можно найти. В этом случае управление является оптимальным, а функция дает соответствующую оптимальную траекторию.
|
|
В рассмотренной задаче управление было непрерывным. Однако в большинстве задач оптимального управления оно бывает разрывным (кусочно-непрерывным) и потому применение методов вариационного исчисления затруднено.
Возьмем, например, линейную стационарную задачу оптимального быстродействия (п. 2.2):
, , (6)
(здесь ). Оказывается, что в классе непрерывных управлений эта задача, вообще говоря, неразрешима.
Действительно, попытаемся ее решить рассмотренным только что способом. Функция Лагранжа имеет вид (здесь )
(7)
Если экстремаль существует, то она удовлетворяет системе уравнений Эйлера-Пуассона (5), которая в нашем случае имеет вид
где .
Продифференцируем по второе равенство:
. Исключим из равенств , умножив первое равенство справа на . Получили систему уравнений для и :
(8)
с матрицей . Ее ранг при транспонировании сохраняется. Транспонированная матрица имеет вид
.
Согласно критерию Калмана (теорема 2.2.1), система (6) управляема тогда и только тогда, когда . Следовательно, ранг матрицы системы (8) совпадает с числом неизвестных и потому однородная линейная система (8) имеет единственное (тривиальное) решение Но тогда функция Лагранжа (7) имеет вид , т.е. не учитывает уравнений связи (6). Однако данная задача без самой системы (6) бессодержательна. Можно доказать, что экстремалей не существует.
|
|
Если же экстремалей не существует, то оптимальным может быть только управление , график которого составлен из кусков графиков функций и (границ множества допустимых значений управлений). Но остается открытым вопрос, в каких точках |
происходит переключение управления от значения к значению и наоборот. Управление может иметь разрывы.
Таким образом, рассмотренная задача неразрешима в классе непрерывных управлений.
В 1956г. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко предложили метод, который обобщил методы классического вариационного исчисления на случай кусочно-непрерывных управлений. В основу этого метода был положен так называемый принцип максимума. В общем случае он сложен. Мы познакомимся с ним в сравнительно простом случае линейной стационарной задачи оптимального быстродействия.