Формулювання задачі оптимального керування в термінах відображень

 

Сформулюємо задачу оптимального стохастичного керування (4) – (5), а також алгоритм динамічного програмування за допомогою відображення , яке задане формулою:

 

.

 

Розглянемо оператори  і , які відображують множину функцій, що приймають дійсні значення на , в себе:

 

,

, .

 

За таких позначень задачу оптимального стохастичного керування (4) – (5) можна записати у вигляді:

 

,

,

 

де , , а  – суперпозиція операторів  (нагадаємо, що суперпозицією відображень  і  називається відображення  таке, що , ).

Алгоритм динамічного програмування (9) – (10) у термінах відображень можна записати у такий спосіб:

 

, ,

 

звідки випливає, що , де  – -кратний добуток оператора  на себе.

Задачу з нескінченним горизонтом (6)-(7) у термінах відображень
можна сформулювати в такий спосіб.


,

.

 

Функціональне рівняння Беллмана тепер буде еквівалентно рівності

 

, .




Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: