Если и заданы, то равенство уравнение (2) обеспечивается при
Если задано только , а не задано, тогда то равенство обеспечивается при
Если не задано, а задано, тогда , то равенство уравнение (2) обеспечивается при
Если не задано и не задано то равенство уравнение)2) обеспечивается уравнением (2) обеспечивается при
,
Обобщение на п- случай
Пример: , ,
Уравнение , ,
, ,
х=t
Т.е.
Проверка:
,
По условию в любом случае, поэтому такие при
т. е при
Вопрос 3. Синтез оптимальных систем методом динамического программирования.
В основе синтеза оптимального управления лежат два принципа:
-Синтез оптимального управления как функции времени и начального состояния системы (программное управление)
-Синтез оптимального управления как функции от текущих фазовых координат состояния ОУ и времени (управления по ОС)
Первое направление называется разомкнутой формой управления, второе замкнутой.
Наиболее предпочтительным является -второй принцип, его основана на методе динамического программирования предложенного Беллманом.
|
|
В основе динамического программирования лежит принцип оптимальности.
Рассмотрим оптимальную траекторию системы в трехмерном фазовом пространстве:
Начальное положение задается точкой А при
Конечное положение точкой В при
Пусть система перешла из т. А в т. С по оптимальной траектории (кривой 1)
Принцип гласит: что дальнейшее движение должно быть оптимальным (кривая 2). Т.е. независимо от того, каким образом система пришла в т.С. дальнейшее ее движение должно быть оптимальным.
Рассмотрим систему описываемую д.у.
, ,
Управление и необходимо выбрать так, чтобы функционал качества
(1)
Рассмотрим некоторый момент времени
Если принять значение х(t) за начальное, то на интервале управление и(t) оптимальное в смысле минимума функционала J совпадает с оптимальным управлением и(t) для
2 Вопрос вывод управления динамического программирования
На основании структуры функционала J определим оптимальную функцию стоимости (функция Беллмана)
(2)
где -это есть и(t) интервале
t-текущее время
Отсюда очевидно, что
Допущение: V-непрерывна и имеет непрерывные частные производные до 20го порядка включительно.
Представим выражение в виде суммы
Таким образом:
(3)
Это соотношение получено, исходя из принципа оптимальности не зависит от предыстории не влияет на
Второе слагаемое в (3) есть функция Беллмана
Таким образом,
(4)
Поэтому =
Второе слагаемое в (4) может быть разложено в ряд Тейлора
(5)
Подставляя (5) в (4) получим
или (т.к. не зависит от и)
|
|
(6)
Разделим левую и правую часть на и устремляем его к нулю получим
(7)
-функция которая определяет
Уравнение (7) получено название динамического программирования или уравнения Гамильтона-Якоби-Беллмана.
Оно решается при граничном условии
(8)
Т.о. для определения оптимального необходимо решить уравнение Беллмана с краевым условием (8)
Рассмотрим векторное обобщение:
Пусть
Поскольку V –функция стоимости, то V Т.о. уравнение Беллмана имеет вид
, (9)
где
, .