Принцип оптимальности и уравнения Беллмана

Принцип оптимальности: каково бы ни было состояние системы S в результате какого-либо числа шагов, на ближайшем шаге нужно выбирать управление так, чтобы оно в совокупности с оптимальным управлением на всех следующих шагах приводило к оптимальному выигрышу на всех оставшихся шагах, включая данный.

Уравнения Беллмана. Рассмотрим последовательность задач.

n шаг:

Sn-1 - состояние системы к началу n шага;

Sn = - конечное состояние; Хn - управление на данном шаге;

fn (Sn-1, Хn) – целевая функция n шага;

- условный max(min) целевой функции на n шаге;

- условное оптимальное управление.

Согласно принципу оптимальности Хn - выбираем так, чтобы для любого Sn-1 получить max(min) целевой функции:

.

k шаг:

Эти рекуррентные соотношения, позволяют найти предельное значение функции, зная последующие. Процесс решения уравнений Беллмана называется условной оптимизацией.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: