double arrow

Основное уравнение метода динамического программирования

2

Применим принцип оптимальности к решению вариационной задачи (4.1), (4.2). Для этого сначала рассмотрим функционал (4.3). Наименьшее значение его при связях (4.1) обозначим:

. (4.8)

Если - оптимальное управление,

то .

Оптимальное управление зависит от начального состояния y(t) в момент t. Следовательно, v является функцией от y и t: v = v(y, t), а от управления u и его вариаций функция v = v(y, t) не зависит. Она вполне определяется значениями y, t .

Интервал (t, T) разделим на два интервала (t, t + dt) и (t + dt, T) и выражение (4.8) запишем в виде:

.

Согласно принципу оптимальности последний участок также является оптимальным:

 
(4.9)

Обозначим:



2




Сейчас читают про: