ДП - метод оптимизации, в котором процесс принятия решения может быть разбит на шаги.
Рассмотрим управляемый процесс распределения ресурсов (средств) между предприятиями, замены оборудования, пополнение запасов и т.д. В результате управления система S переводится из начального состояния S0 в состояние . Пусть управление можно разбить на n шагов, т.е. принимается последовательно на каждом шаге, а управление, переводящее систему S из начального состояния в конечное, представляет собой совокупность n пошаговых управлений.
Пусть = (Х1, Х2,…, Хк,…Хп) - уравнение переводящее систему S из S 0 в . Обозначим через Хк уравнение на к шаге. Переменные Хк удовлетворяют некоторым ограничениям и в этом смысле называется допустимым. Sк - состояние системы после к шага управления. Получаем последовательность состояний.
Показатель эффективности рассматриваемой управляемой операции - целевая функция - зависит от начального состояния и управления: Z = F(S0, Х)
1. Состояние Sk системы в конце к шага зависит только от предшествующего состояния Sk-1 и управления на к шаге Хк. Это называется «отсутствием последствия».
Sk = φk(Sk-1, Хk), k = 1,n - уравнения состояний.
2. Целевая функция является аддитивной от показателя эффективности каждого шага. Обозначим показатель эффективности к шага через Zk = fk(Sk-1, Хk), тогда
.
Задача пошаговой оптимизации формулируется так:
определить такое дополнительное решение Х, переводящее систему S из S0 в , при котором функция принимает max(min) значения.