Основное уравнение метода динамического программирования

Применим принцип оптимальности к решению вариационной задачи (4.1), (4.2). Для этого сначала рассмотрим функционал (4.3). Наименьшее значение его при связях (4.1) обозначим:

. (4.8)

Если - оптимальное управление,

то .

Оптимальное управление зависит от начального состояния y (t) в момент t. Следовательно, v является функцией от y и t: v = v (y, t), а от управления u и его вариаций функция v = v (y, t) не зависит. Она вполне определяется значениями y, t.

Интервал (t, T) разделим на два интервала (t, t + d t) и (t + d t, T) и выражение (4.8) запишем в виде:

.

Согласно принципу оптимальности последний участок также является оптимальным:

 
(4.9)

Обозначим:


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: