Принцип оптимальности: каково бы ни было состояние системы S в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех следующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.
Уравнения Беллмана. Рассмотрим последовательность задач.
n шаг:
Sn-1 - состояние системы к началу n шага;
Sn = - конечное состояние; Хn - управление на данном шаге;
fn (Sn-1, Хn) – целевая функция n шага;
- условный max(min) целевой функции на n шаге;
- условное оптимальное управление.
Согласно принципу оптимальности Хn - выбираем так, чтобы для любого Sn-1 получить max(min) целевой функции:
.
k шаг:
Эти рекуррентные соотношения, позволяют найти предельное значение функции, зная последующие. Процесс решения уравнений Беллмана называется условной оптимизацией.