В некоторых случаях задачи оптимального управления можно решать методами вариационного исчисления.
Рассмотрим задачу
(1)
(2)
(3)
(4)
где
, управление
скалярная функция, непрерывная на отрезке
,
, где функции
и
непрерывны как функции четырех переменных
и непрерывно дифференцируемы как функции двух фазовых переменных
,
дважды непрерывно дифференцируема как функция четырех переменных
,
и
данные скалярные функции, непрерывные на
, конец
отрезка
фиксирован, конец
не фиксирован: правые концы графиков функций
и
скользят по прямым
и
.
| Без ограничения (4) на управление эта задача представляет собой задачу Лагранжа на условный экстремум при уравнениях связи (1). Заметим, что интеграл функционала (3)
|
не зависит от производных искомых функций (задача Лагранжа в форме Понтрягина).
Пусть из системы уравнений Эйлера-Пуассона
(5)
где
функция Лагранжа,
множители Лагранжа, с учетом краевых условий (2) найдены одна или несколько экстремалей
.
Можно доказать, что если экстремум функционала имеется, то он достигается на функции , где управление - непрерывная функция, график которой составлен из кусков графиков функций (или некоторых из них), содержащихся
|
|
между графиками
и
, и кусков графиков функций
и
- границ множества допустимых значений управлений. В каких точках
стыкуются куски, можно найти. В этом случае управление
является оптимальным, а функция
дает соответствующую оптимальную траекторию.
В рассмотренной задаче управление
было непрерывным. Однако в большинстве задач оптимального управления оно бывает разрывным (кусочно-непрерывным) и потому применение методов вариационного исчисления затруднено.
Возьмем, например, линейную стационарную задачу оптимального быстродействия (п. 2.2):
,
,
(6)

(здесь
). Оказывается, что в классе непрерывных управлений
эта задача, вообще говоря, неразрешима.
Действительно, попытаемся ее решить рассмотренным только что способом. Функция Лагранжа имеет вид (здесь
)

(7)
Если экстремаль
существует, то она удовлетворяет системе уравнений Эйлера-Пуассона (5), которая в нашем случае имеет вид

где
.
Продифференцируем по
второе равенство:
. Исключим
из равенств
, умножив первое равенство справа на
. Получили систему уравнений для
и
:
(8)
с матрицей
. Ее ранг при транспонировании сохраняется. Транспонированная матрица имеет вид
.
Согласно критерию Калмана (теорема 2.2.1), система (6) управляема тогда и только тогда, когда
. Следовательно, ранг матрицы системы (8) совпадает с числом неизвестных и потому однородная линейная система (8) имеет единственное (тривиальное) решение
Но тогда функция Лагранжа (7) имеет вид
, т.е. не учитывает уравнений связи (6). Однако данная задача без самой системы (6) бессодержательна. Можно доказать, что экстремалей не существует.
Если же экстремалей не существует, то оптимальным может быть только управление , график которого составлен из кусков графиков функций и (границ множества допустимых значений управлений). Но остается открытым вопрос, в каких точках
|
|
происходит переключение управления от значения
к значению
и наоборот. Управление может иметь разрывы.
Таким образом, рассмотренная задача неразрешима в классе непрерывных управлений.
В 1956г. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко предложили метод, который обобщил методы классического вариационного исчисления на случай кусочно-непрерывных управлений. В основу этого метода был положен так называемый принцип максимума. В общем случае он сложен. Мы познакомимся с ним в сравнительно простом случае линейной стационарной задачи оптимального быстродействия.
, где управление
(или некоторых из них), содержащихся
, график которого составлен из кусков графиков функций
и
(границ множества допустимых значений управлений). Но остается открытым вопрос, в каких точках






