Условие оптимальности

Для простоты рассмотрим случай одномерного управления. Представим, что оптимальное управление при начальных условиях (6.9) известно. Пусть до времени неоптимальное и оптимальное управления совпадают (рис. 6.1), а на отрезке времени они отличаются на величину , т.е.

Рисунок 6.1 - Отличие оптимального и неоптимального управлений на отрезке времени на величину

Далее, на отрезке неоптимальное и оптимальное управления снова совпадают. Пусть отрезок является бесконечно малым.

Теперь рассмотрим траекторию движения объекта при оптимальном и неоптимальном управлениях (рис. 6.2).

Рисунок 6.2 - Траектории движения объекта при оптимальном и неоптимальном управлениях

Как видно из рис. 6.2, до точки оптимальная и неоптимальная траектории движения совпадают. Различие в управлении на отрезке вызывает различие оптимальной и неоптимальной траекторий движения при .

Обозначим отклонение вектора состояния от оптимального через :

, (6.11)

где .

На бесконечно малом отрезке траекторию можно считать линейной в силу малости . Тогда при отклонение можно записать, используя разложение в ряд Маклорена:

. (6.12)

Поскольку является критерием качества, то отключение от критерия качества также должно быть минимальным, т.е.

. (6.13)

Условие (6.13) можно переписать следующим образом:

. (6.14)

Если ввести -мерный вектор

, (6.15)

то условие (6.14) примет вид:

. (6.16)

Для произвольных можно подобрать такой вектор , чтобы выполнялось условие

. (6.17)

Поскольку , то при можно записать, что

. (6.18)

Подставив (6.12) в выражение (6.18), получим:

. (6.19)

Здесь не зависит от , поэтому его можно сократить.

Так как может быть выбрана на любом участке , то можно заменить на . Тогда выражение (6.19) примет вид:

Поскольку второе слагаемое соответствует оптимальному управлению и не зависит от неоптимального управления , т.е. является постоянным при любом , то чтобы выполнялось условие максимума необходимо, чтобы максимальным было первое слагаемое. Следовательно,

. (6.20)

Обычно произведение записывают как аргумент какой-то функции, например :

, (6.21)

где , - компоненты векторов и .

Функцию называют функцией Гамильтона или гамильтонианом.

Следовательно, принцип максимума Понтрягина формулируется следующим образом: для того, чтобы в задаче с закреплённым левым концом траектории свободным правым концом траектории и фиксированным временем управления управление было оптимальным, необходимо существование такой непрерывной ненулевой векторной функции , чтобы при любых функция , представляющая скалярное произведение вектора скорости движения точки на вектор , достигала максимума по управлению , т.е. необходимо, чтобы выполнялось условие

(6.22)

и в конечный момент времени имело место соотношение: .

Оптимальное управление получено для разомкнутой системы. Для перехода к замкнутой системе необходимо, чтобы оптимальное управление зависело только от , т.е. . Для многомерного управления вместо скаляра используется вектор .

6.3 Система сопряжённых уравнений

При выводе принципа максимума был введен вектор , который ещё не был определён. Для нахождения его выражение (6.17) продифференцируем по времени и приравняем к нулю:

. (6.23)