Управления с помощью вариационного исчисления

1 2 3 4 5 6 7

В некоторых случаях задачи оптимального управления можно решать методами вариационного исчисления.

Рассмотрим задачу

(1)

(2)

(3)

(4)

где , управление скалярная функция, непрерывная на отрезке , , где функции и непрерывны как функции четырех переменных и непрерывно дифференцируемы как функции двух фазовых переменных , дважды непрерывно дифференцируема как функция четырех переменных , и данные скалярные функции, непрерывные на , конец отрезка фиксирован, конец не фиксирован: правые концы графиков функций и скользят по прямым и .

Без ограничения (4) на управление

эта задача представляет собой задачу Лагранжа на условный экстремум при уравнениях связи (1). Заметим, что интеграл

функционала (3)

не зависит от производных искомых функций (задача Лагранжа в форме Понтрягина).

Пусть из системы уравнений Эйлера-Пуассона

(5)

где функция Лагранжа, множители Лагранжа, с учетом краевых условий (2) найдены одна или несколько экстремалей .

Можно доказать, что если экстремум функционала имеется, то он достигается на функции

, где управление

- непрерывная функция, график которой составлен из кусков графиков функций

(или некоторых из них), содержащихся

между графиками и , и кусков графиков функций и - границ множества допустимых значений управлений. В каких точках стыкуются куски, можно найти. В этом случае управление является оптимальным, а функция дает соответствующую оптимальную траекторию.

В рассмотренной задаче управление было непрерывным. Однако в большинстве задач оптимального управления оно бывает разрывным (кусочно-непрерывным) и потому применение методов вариационного исчисления затруднено.

Возьмем, например, линейную стационарную задачу оптимального быстродействия (п. 2.2):

, , (6)

(здесь ). Оказывается, что в классе непрерывных управлений эта задача, вообще говоря, неразрешима.

Действительно, попытаемся ее решить рассмотренным только что способом. Функция Лагранжа имеет вид (здесь )

(7)

Если экстремаль существует, то она удовлетворяет системе уравнений Эйлера-Пуассона (5), которая в нашем случае имеет вид

где .

Продифференцируем по второе равенство:

. Исключим из равенств , умножив первое равенство справа на . Получили систему уравнений для и :

(8)

с матрицей . Ее ранг при транспонировании сохраняется. Транспонированная матрица имеет вид

Согласно критерию Калмана (теорема 2.2.1), система (6) управляема тогда и только тогда, когда . Следовательно, ранг матрицы системы (8) совпадает с числом неизвестных и потому однородная линейная система (8) имеет единственное (тривиальное) решение Но тогда функция Лагранжа (7) имеет вид , т.е. не учитывает уравнений связи (6). Однако данная задача без самой системы (6) бессодержательна. Можно доказать, что экстремалей не существует.

Если же экстремалей не существует, то оптимальным может быть только управление

, график которого составлен из кусков графиков функций

(границ множества допустимых значений управлений). Но остается открытым вопрос, в каких точках

происходит переключение управления от значения к значению и наоборот. Управление может иметь разрывы.

Таким образом, рассмотренная задача неразрешима в классе непрерывных управлений.

В 1956г. Л.С. Понтрягин, В.Г. Болтянский, Р.В. Гамкрелидзе, Е.Ф. Мищенко предложили метод, который обобщил методы классического вариационного исчисления на случай кусочно-непрерывных управлений. В основу этого метода был положен так называемый принцип максимума. В общем случае он сложен. Мы познакомимся с ним в сравнительно простом случае линейной стационарной задачи оптимального быстродействия.