Идея динамического программирования (ДП)

Метод ДП (Р. Беллман, В.С. Михалевич, Н.З. Шор) можно трактовать как алгоритмическую версию рассуждений по индукции.

Пусть s_k (y), 1 £ k £ n, 0 £ y £ Y, — оптимальное значение целевой функции задачи (1) – (3), где n заменено на k, Y заменено на y.

Требуется найти s_n (Y) и набор переменных, на котором достигается это значение.

ТЕОРЕМА 1. Пусть f ₁, …, f_n —монотонно неубывающие функции. Тогда справедливы следующие рекуррентные соотношения:

s ₁(y) = f ₁(y), 0 £ y £ Y;	(4)
s_k (y) = max { s_k_- ₁(y - x) + f_k (x) \| 0 £ x £ y }, 2 £ k £ n, 0 £ y £ Y,	(5)

Доказательство: Соотношение (4)очевидно. По определению

s_k (y) ³ max { s_k_- ₁(y - x) + f_k (x) | 0 £ x £ y }.

Пусть теперь — такой вектор, что и

Поскольку имеем

Алгоритм ДП вычисляет множество S_k ={ s_k (y) | 0 £ y £ Y}, k =1,…, n с помощью соотношений (4) и (5), где на каждом шаге оптимизируется ровно одна переменная.