Оптимальное поведение обладает тем свойством, что каковы бы не были начальные состояния и решения в начальным момент времени, последующие решения должны составлять оптимальное поведение относительно состояния, получающегося в результате первого решения.
Для динамических систем, описываемых дифференциальными уравнениями, состояние характеризуется набором значений координат в каждый момент времени и поведение такой системы определяется изменением координат во времени. Решением является управляющее воздействие на систему (приложенное к системе).
,
есть критерий оптимальности , граничные условия:
;
.
Если в начальный момент будет определено оптимальное управление и оптимальная траектория , в соответствии с которыми изменяется состояние системы, то система удовлетворяет принципу оптимальности Беллмана, если для любого момента , считать за начальный, будет определено вновь оптимальное управление и траектория и они будут налагаться на первоначально определенное управление и траекторию (совпадут).
|
|
E
D
B
С
A
t
Предположим, что оптимальная траектория , определенная в начальный момент времени. Пусть с момента вновь получается оптимальная траектория: . Если критерий имеет вид:
Если в результате повторного определения и движения по траектории оказался меньше интеграла, первоначально полученного для движения по траектории , следовательно, либо первоначальная траектория не была оптимальной, т.к. интеграл может быть еще меньше, либо траектории должны совпадать. При интегральных критериях система управления удовлетворяет принципу оптимальности Беллмана.