Для простоты рассмотрим случай одномерного управления. Представим, что оптимальное управление
при начальных условиях (6.9) известно. Пусть до времени
неоптимальное
и оптимальное
управления совпадают (рис. 6.1), а на отрезке времени 
они отличаются на величину
, т.е.
![]() |
.
Рисунок 6.1 - Отличие оптимального
и неоптимального
управлений на отрезке времени
на величину 
Далее, на отрезке
неоптимальное и оптимальное управления снова совпадают. Пусть отрезок
является бесконечно малым.
Теперь рассмотрим траекторию движения объекта при оптимальном и неоптимальном управлениях (рис. 6.2).
![]() |
Рисунок 6.2 - Траектории движения объекта при оптимальном и неоптимальном управлениях
Как видно из рис. 6.2, до точки
оптимальная
и неоптимальная
траектории движения совпадают. Различие в управлении на отрезке
вызывает различие оптимальной
и неоптимальной
траекторий движения при
.
Обозначим отклонение вектора состояния
от оптимального
через
:
, (6.11)
где
.
На бесконечно малом отрезке
траекторию можно считать линейной в силу малости
. Тогда при
отклонение
можно записать, используя разложение в ряд Маклорена:
. (6.12)
Поскольку
является критерием качества, то отключение от критерия качества также должно быть минимальным, т.е.
. (6.13)
Условие (6.13) можно переписать следующим образом:
. (6.14)
Если ввести
-мерный вектор
, (6.15)
то условие (6.14) примет вид:
. (6.16)
Для произвольных
можно подобрать такой вектор
, чтобы выполнялось условие
. (6.17)
Поскольку
, то при
можно записать, что
. (6.18)
Подставив (6.12) в выражение (6.18), получим:
. (6.19)
Здесь
не зависит от
, поэтому его можно сократить.
Так как
может быть выбрана на любом участке
, то
можно заменить на
. Тогда выражение (6.19) примет вид:
.
Поскольку второе слагаемое соответствует оптимальному управлению
и не зависит от неоптимального управления
, т.е. является постоянным при любом
, то чтобы выполнялось условие максимума необходимо, чтобы максимальным было первое слагаемое. Следовательно,
. (6.20)
Обычно произведение
записывают как аргумент какой-то функции, например
:

, (6.21)
где
,
- компоненты векторов
и
.
Функцию
называют функцией Гамильтона или гамильтонианом.
Следовательно, принцип максимума Понтрягина формулируется следующим образом: для того, чтобы в задаче с закреплённым левым концом траектории
свободным правым концом траектории
и фиксированным временем управления
управление
было оптимальным, необходимо существование такой непрерывной ненулевой векторной функции
, чтобы при любых
функция
, представляющая скалярное произведение вектора скорости движения точки 
на вектор
, достигала максимума по управлению
, т.е. необходимо, чтобы выполнялось условие
(6.22)
и в конечный момент времени
имело место соотношение:
.
Оптимальное управление
получено для разомкнутой системы. Для перехода к замкнутой системе необходимо, чтобы оптимальное управление
зависело только от
, т.е.
. Для многомерного управления вместо скаляра
используется вектор
.
6.3 Система сопряжённых уравнений
При выводе принципа максимума был введен вектор
, который ещё не был определён. Для нахождения его выражение (6.17) продифференцируем по времени
и приравняем к нулю:
. (6.23)
Упростим (6.23). Для этого разложим второе слагаемое (6.23) в ряд Тейлора*:
. (6.24)
С учётом (6.24) выражение (6.23) примет вид:
.
*Разложение в ряд Тейлора приведено в приложении А
Так как
, то
(6.25)
или в скалярной форме:
, (6.26)
где
.
Система (6.25), (6.26) называется сопряжённой по отношению к системе уравнений объекта (6.8).
Из выражения (6.26) можно найти компоненты
, используя уравнение состояния (6.8)
, выражение для функции Гамильтона (6.22) и граничное условие
.
Из выражений (6.25) и (6.21) видно, что
,
а из (6.8) и (6.22) получается, что

или в скалярной форме
;
,
. (6.27)
Соотношения (6.27) называются каноническими уравнениями Гамильтона.








