Принцип максимума в задаче о максимальном быстродействии

Как и в случае динамического программирования, для простоты рассмотрим задачу о максимальном быстродействии для линейного объекта, описываемого уравнением состояния

; . (7.27)

В силу стационарности (линейности) уравнения (7.27) переменную со свойствами (6.3) можно не вводить. Нет также причин для введения переменной со свойствами (6.4), так как в задаче о максимальном быстродействии и не зависит от управления .

Запишем принцип максимума (6.22) через функцию Гамильтона (6.21) с учётом (7.27):

. (7.28)

Так как от управлений зависит только вторая группа слагаемых в составе (7.28), то принцип максимума приобретёт следующую форму:

. (7.29)

Это условие (7.29) должно выполняться для каждого управления , вследствие чего можно записать:

, . (7.30)

Условие (7.30) при существовании на управление ограничений выполняется, если при или при .

Отсюда следует, что

, , (7.31)

Таким образом, в задаче о максимальном быстродействии в случае применения принципа максимума, как и при динамическом программировании, оптимальное управление принимает два значения или в зависимости от функции (- при динамическом программировании).

Как видно из (7.31) для отыскания конкретного управления необходимо знать компоненты , , вектора . С этой целью составляется система сопряжённых уравнений (6.26) с учётом линейности уравнения (7.27):

, . (7.32)

Здесь учтено, что .

Таким образом, функцию можно найти из системы однородных линейных уравнений, не зависящих от управления и состояния объекта управления.

Однако так как не задаётся ни начальное , ни конечное значения вектора , то такую систему решить нельзя. В этом случае начальное значение вектора выбирается произвольно. Из (7.32) находятся компоненты вектор и подставляются в выражение для оптимального управления (7.31). После вычисления управления его подставляют в уравнение состояния линейного объекта (7.27), откуда находят вектор состояния , обусловленный оптимальным управлением и начальным состоянием .

Если можно подобрать такое , при котором , то начальное значение оказалось верным, а найденное управление явилось оптимальным. Если , то выбирается другое начальное значение вектора . Последовательный поиск оптимального управления осуществляется с помощью ЭВМ.

В некоторых случаях найти оптимальное управление можно, не решая систему сопряжённых уравнений (7.32). Для этого воспользуемся уравнением состояния (7.27) при отсутствии управления

, . (7.33)

В векторной форме уравнения (7.32) и (7.33) примут вид

; .

В общем виде решение уравнения (7.32) можно представить, используя формулу Эйлера:

, , (7.34)

где - постоянные интегрирования;

- положительные корни характеристического уравнения, определяемые из сопряжённой системы

, (7.35)

где .

После подстановки в (7.35) имеем . После сокращения на множитель получаем характеристическое уравнение

, (7.36)

где – единичная матрица;

- комплексная переменная.

Определив корни характеристического уравнения и постоянные интегрирования , можно получить выражение оптимального управления :

, , (7.37)

где - некоторая константа.

Схематически изменение оптимального управления можно представить в виде графика (рис. 7.4), как и в случае динамического программирования, только здесь моменты времени переключения оптимального управления соответствуют корням характеристического уравнения .

Рисунок 7.4 – График переключения оптимального управления

Из рис. 7.4 видно, что оптимальное управление является кусочно-постоянной функцией, имеющей на интервале управления не более точек разрыва, в которых оно переходит с одной границы области допустимых управлений на другую. Другими словами, оптимальное управление имеет не более интервалов постоянства, а число переключений управления не превышает . Это свойство называется теоремой об -интервалах (доказана Фельдбаумом).

Теорема об n-интервалах: если количество действительных корней характеристического уравнения объекта равно , то число переключений каждого из управлений , , …, не превышает