Метод динамического программирования.
Рассмотрим систему
(4.1)
и функционал
(4.2)
который требуется минимизировать. Правый конец фазовых координат является свободным.
Наряду с этой вариационной задачей рассмотрим вспомогательную, когда процесс рассматривается в интервале и минимизируется функционал
. (4.3)
Пусть сначала найден минимум J (4.2) и соответствующее ему оптимальное управление (рис. 1а):
(4.4)
а потом – минимум (4.3) и оптимальное управление (рис. 1б):
. (4.5)
В последнем случае предполагается, что в момент процесс начинается с состояния
, достигнутого к моменту времени
при оптимизации процесса в интервале
.
Вообще говоря, управления и
отличаются интервалом и значениями. Принцип оптимальности утверждает, что оптимальные управления
и
в общей части интервала
совпадают, не зависимо от предыстории процесса и вполне определяются состоянием
в момент
.
В случае со свободным правым концом принцип оптимальности доказывается. В самом деле, допустим, что на участке управления
и
не совпадают и
|
|
![]() |
![](https://ok-t.ru/studopediaru/baza2/1958883841402.files/image035.gif)
Рис. 1 а Рис.1 б
Тогда для первой задачи введем управление
(4.7)
и вычислим функционал
При управлении u (4.7) функционал(4.2) принимает меньшее значение, чем при (4.4). Но управление
является оптимальным. Поэтому допущение (4.6) неверно.
A предположение
противоречит тому, что - управление, минимизирующее
(4.3).
Таким образом, остается, что
,
и если оптимальное управление единственное, то
.
Кратко принцип оптимальности можно сформулировать так: последний участок оптимальной траектории является оптимальным независимо от предыстории процесса.