Моделирование многошаговых процессов

Многошаговый процесс принятия решения часто применяется при решении задачи распределения определенного количества ресурса (R) во времени (по годам) или между предприятиями одной фирмы с целью получения наибольшего полезного эффекта.

При этом целевая функция задачи является нелинейной, обычно заданной в виде таблицы, а возможные варианты планов оказываются дискретными величинами.

В общей форме задача динамического программирования трактуется как проблема управления экономической системой на некотором промежутке времени (в несколько лет). Путем осуществления некоторого управления система (например, фирма) переходит из некоторого начального состояния в заданное конечное состояние.

Например, выполнен некоторый инвестиционный проект, построен новый производственный объект. Этот переход может быть реализован различными способами. Задача состоит в том, чтобы из множества возможных уравнений выбрать то, которое дает максимальное значение полезного эффекта (дополнительного дохода, прибыли и т.п.).

Применительно к проблеме распределения ресурсов задача динамического программирования может быть представлена в следующей форме.

Фирма выделяет капитальные средства в размере R рублей для использования их для строительства крупного промышленного объекта в течение п лет (t₁,…,t_n ). Этот объект вводится в эксплуатацию по частям и, таким образом, фирма получает дополнительный доход по мере готовности той или иной части объекта.

Обозначим объем средств, выделяемых для стройки в году t_j через x_j а ожидаемый дополнительный доход (локальную целевую функцию) — через fj(Xj).

Требуется найти распределение капиталовложений по годам, обеспечивающее максимальное увеличение дополнительного дохода фирмы.

Математическая постановка задачи состоит в определении наибольшего значения нелинейной функции

(1)

при условиях

(2)

(3)

План распределения капиталовложений являющийся решением поставленной задачи, называется оптимальным планом распределения.

2.4.3. Принцип оптимальности

При решении математической задачи (1)—(3) исходят из того, что максимальный доход за п лет может быть представлен как максимум суммы максимального дохода за (я - 1) первых лет и дохода года п. Максимум определяется по всем возможным вариантам капиталовложений х_п в течение года п. Таким образом,

(4)

где F_n_-1— функция максимального дохода за (я - 1) лет, которая строится по формуле аналогичной (4). Здесь существенным является то, что в формуле (4) фигурирует не максимальный доход за (n - 1) лет, а значение функции максимального дохода (интервальной целевой функции), зависящее от решения на последнем шаге (величины х_п).

Это замечание распространяется на любой шаг j процесса принятия решений (определение величины xj) и формулируется обычно в виде принципа оптимальности Р. Беллмана:

Каково бы ни было состояние системы перед очередным шагом j, надо выбрать управление (x_j) на этом шаге так, чтобы полезный эффект на данном шаге плюс оптимальный полезный эффект на всех предыдущих шагах был максимальным.

Исходя из принципа оптимальности можно построить следующие рекуррентные соотношения:

(5)