Учет последействия в задачах оптимального распределения ресурсов

При постановке задачи оптимального распределения ресурсов мы предполагали, что доход на каждом шаге от всех предприятий и максимальный доход , начиная с k -го шага до конца планового периода, зависели только от состояния системы к k -му шагу и от управления на этом шаге, но не зависели от того, каким образом распределялись средства между предприятиями на предыдущих шагах. Однако во многих задачах оптимального распределения средств доход, полученный на k -м шаге, может оказаться зависимым и от того, какие средства и в каком количестве выделялись каждому из предприятий на предыдущих шагах, т. е. от предыстории процесса.

Таким образом, нарушается одно из условий, предъявляемых к задачам оптимизации, для того чтобы их можно было описать моделью ДП. Чтобы учесть предысторию процесса распределения ресурсов, можно увеличить число параметров состояния на каждом шаге, искусственно включив в число фазовых координат все управляющие параметры: предшествующих шагов, которые определяют последействие. Если число таких параметров велико, то схема ДП усложняется настолько, что становится практически неприменимой. В случае если размерность искусственного фазового пространства не превышает 3-4, то задачу можно решить вручную или (для большого числа шагов n) на машине.

Рассмотрим модель задачи оптимального распределения ресурсов с последействием, аналогичную задаче 2.

Задача 5. Начальные средства распределяются между двумя предприятиями в течение n лет. Доход, полученный в конце k -го года от предприятий I и II, зависит от средств и , выделенных соответственно в предприятия I и II в k -м году, и от суммы всех вложенных в предприятия I и II средств соответственно за предыдущие k —1 лет. От этих же факторов зависит и величина средств, которые возвращаются в конце каждого года и перераспределяются в очередном плановом периоде. Новые средства не поступают, доход в производство не вкладывается.

Требуется найти оптимальный способ распределения ресурсов между предприятиями I и II на n лет.

Обозначим через , функции дохода, а через и — функции возврата средств для предприятии I и II соответственно.

Состояние системы в конце k -го шага удовлетворяет уравнению

, (2.11)

а доход, полученный на k -м шаге от двух предприятий, равен

. (2.12)

Величины (2.11) и (2.12) зависят не только от управления на k -м шаге, но и от всех управлении на предшествующих шагах (процесс распределения ресурсов обладает последействием).

Введем в рассмотрение две новые фазовые координаты:

, , (2.13)

полагая . Состояние системы к началу k -го шага характеризуется тремя параметрами: , , . Так как все наличные средства в k -м году полностью распределяются между предприятиями I и II, то .

Уравнение состояния имеет вид

(2.14)

а доход на k -м шаге равен

. (2.15)

Суммарный доход за n лет составляет

. (2.16)

Требуется найти неотрицательные переменные , обращающие в максимум функцию (2.16) и удовлетворяющие уравнениям (2.14) при начальных условиях , , .

Обозначим через условный максимальный доход, полученный за n — k +1 шагов, начиная с k -го до n -го включительно, при оптимальном распределении средств на этих шагах.

Функциональные уравнения (1.5) для имеют вид

;

. (2.17)

Решая последовательно уравнения (2.17) для , получим, как и выше, две последовательности значений и . Далее при начальных условиях , , , учитывая уравнение состояния (2.14), по цепочке получим оптимальное управление и :

Оптимальное управление получается по формулам , а соответствующий максимальный доход равен .

Рассмотрим, как реализуется схема ДП, учитывающая предысторию процесса, на следующей дискретной модели оптимального распределения ресурсов.

Задача 6. Средства = 6 распределяются между тремя предприятиями, принадлежащими одному объединению и связанными одним технологическим циклом так, что продукция предприятия I служит полуфабрикатом для предприятияII, и продукция первых двух предприятий служит полуфабрикатом для предприятия III. В табл. 7 заданы функции , , , характеризующие выпуск продукции в одних и тех же единицах в зависимости от вложенных средств в предприятия I, II, III соответственно. Каждому предприятию можно выделить не более 5 ед. средств, кратных .

Требуется распределить начальные средства между тремя предприятиями так, чтобы максимизировать выпуск продукции.

Запишем модель ДП задачи.

Начальное состояние =6; номер шага k —номер предприятия (k =l, 2, 3); переменные - средства, выделенные предприятиям I, II, III соответственно,— удовлетворяют условиям

. (2.18)

Таблица 7

Предприятия	Продукция		1	2	3	4	5
I			2,1	3,2	4,3	5,1	5,1
II		x ₁ x ₂	1	2	3	4	5
		0	2,2	2,8	3.1	4,3	6
		1	3,1	4.2	5,3	7,1	8
		2	3,3	4,5	6,1	7,3	-
		3	3,5	4,8	6,7	-	-
		4	5,4	5,9	-	-	-
III		x ₃ x ₁₊ x ₂	1	2	3	4	5
		0	3,4	3,8	4,2	5,0	5,0
		1	3,7	4,1	4,5	5,3	5,3
		2	3,7	4,1	4,5	5,4	-
		3	4,0	4,5	4,8	-	-
		4	4,2	4,8	-	-	-
		5	4,6	-	-	-	-
		6	-	-	-	-	-

Показатель эффективности — суммарная продукция — равен

. (2.19)

Найти переменные , удовлетворяющие условиям (2.18) и обращающие в максимум функцию (2.19).

Будем характеризовать состояние процесса распределения средств в начале k -го шага двумя параметрами: — остатком средств после выделения предыдущим k —1 предприятиям; — количеством средств, вложенных в предыдущее предприятие (). Уравнения состояний имеют вид

(2.20)

Пусть - условный максимум продукции, выпущенной предприятиями, считая с k -го до конца. Функции при удовлетворяют уравнениям

, (2.21)

Обозначим выражения, стоящие в фигурных скобках второго и третьего уравнений (2.21), соответственно через и .

Условная оптимизация 3-го шага сводится к решению первого уравнения из (2.21). Результат ее совпадает с разделом III табл. 7 (здесь ).

Условная оптимизация 2-го шага проведена в табл. 8, при этом во втором из уравнений (2.21) состояния и выражены через и из соотношений (2.20). Условные максимумы для всех , в таблице подчеркнуты. При заполнении табл. 8 использовались разделы II и III табл. 7.

Условная оптимизация 1-го шага проведена в табл. 9 только для =6. При использовании третьего из уравнений (2.21) и выражены через и из соотношений (2.20). При расчетах в табл. 9 использовались раздел I табл. 7 и подчеркнутые значения табл. 8.

Используя результат условной оптимизации (табл. 9, 8 и раздел III табл. 7), получим оптимальное решение.

Из табл. 9 получаем Z _max=15,l; это значение достигается при . Отсюда . Из табл. 8 находим ; следовательно, . Из раздела III табл.7 определяем .

Таким образом, при распределении =(4, 1, 1) средств между тремя предприятиями может быть достигнут максимальный выпуск продукции, величина которого равна 15,1 ед.

Таблица 8

3,4

3,7

3,5

4,6

2,2

3,1

3,3

5,3

4,0

5,4

3,8

4,1

4,5

4,8

2,2

3,7

5,9

3,1

3,7

6,8

3,3

4,0

7,3

3,5

4,2

7,7

5,4

4,6

10,0

2,8

4,2

4,5

4,8

5,9

4,0

4,2

4,5

4,8

2,2

6,0

3,1

4,1

7,2

3,3

4,5

7,8

3,5

4,8

8,3

2,8

3,7

6,5

4,2

4,0

8,2

4,5

4,2

8,7

4,8

4,6

9,4

3,1

5,3

6,1

6,7

5,3

5,4

2,2

4,5

6,7

3,1

4,5

7,6

3,3

4,8

8,1

2,8

4,1

6,9

4,2

4,5

8,7

4,5

4,8

8,4

3,1

7,1

5,3

4,2

9,5

6,1

4,6

10,7

4,3

7,1

7,3

5,3

2,2

5,3

7,5

3,1

5,4

8,5

2,8

4,5

7,3

4,2

4,8

3,1

4,5

7,6

5,3

4,8

10,1

4,3

4,2

8,5

7,1

4,6

11,7

2,2

5,3

7,5

2,8

5,4

8,2

3,1

4,8

7,9

4,3

4,8

9,1

4,6

10,6

Таблица 9


0	6	0	0	10,6	10,6
1	5	1	2,1	11,7	13,8
2	4	2	3,2	10,7	13,9
3	3	3	4,3	9,4	13,7
4	2	4	5,1	10	15,1
5	1	5	5,1	5,4	10,5

Заключение

В работе было рассмотрено применение динамического программирования для решения задач оптимального распределения ресурсов. Этот метод играет важную роль в решении прикладных задач различных областей науки, что обусловлено его высокой эффективностью. Однако, как и любой математический аппарат, методы динамического программирования нельзя слепо применять для решения той или иной задачи без тщательного предварительного анализа. Практическое применение данных методов требует от исследователя определенного искусства. При этом определяющее значение имеет корректное построение модели и применение подходящих численных процедур.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:

1 2 3 4 5 6 7

Основные закономерности психического развития

Теория естественного права

Лексическое и грамматическое значение слова

Расчет нормальной концентрации

Соучастие в преступлении: понятие и признаки. Виды соучастников и формы соучастия

НЭП: ПРИЧИНЫ, СУЩНОСТЬ И ПРОТИВОРЕЧИЯ

Самый сильный аргумент, почему эволюция человека не могла быть

Как можно поддерживать порядок в государстве без религии? Когда один человек умирает от голода рядом с другим, больным от обжорства, он не способен смириться с таким различием, если только власть не объяснит ему, что «это от Бога». Религия – отличное средство утихомиривать людей. © Наполеон ==> читать все изречения...

6105

5689