1. Записать уравнение Беллмана (5) с граничным условием.
2. Найти структуру оптимального управления с полной обратной связью, исходя из условия максимума (6) по управлению. Искомое управление обычно выражается через производные функции .
3. Подставить полученное выражение для управления в уравнение (5). Нахождение искомого оптимального управления сводится к решению нелинейного дифференциального уравнения с частными производными первого порядка.
4. Найти решение полученного уравнения и явный вид искомого управления.
Пример.
Дано:
- модель объекта управления
;
где
- функционал
Требуется найти оптимальное управление с полной обратной связью .
По виду функционала это задача Больца.
В принятых выше обозначениях
Решение по алгоритму.
1. Записываем уравнение Беллмана и граничные условия
2. Находим структуру оптимального управления из условия максимума по управлению выражения в фигурных скобках, то есть :
.
3. Подставляем полученное выражение для управления в уравнение Беллмана
4. Ищем решение полученного уравнения в частных производных в виде (см. граничное условие в п.3), где - неизвестная функция. Подставляем выражение для в п.3:
Граничное условие в задаче Коши получено с учетом п.3 и п.4: .
Полученное в задаче Коши ОДУ является уравнением с разделяющимися переменными. Найдем его решение аналитически:
.
Постоянную интегрирования С находим из граничного условия
.
Искомое решение
Решение задачи Коши в Matlab:
Искомое оптимальное управление с полной обратной связью
. (7)
Найдем оптимальную траекторию и оптимальное управление .
Модель объекта управления , подставляя (7), получаем:
.
Получили задачу Коши. ОДУ с разделяющимися переменными.
Решаем уравнение, разделяя переменные:
Постоянную интегрирования С находим из начального условия:
.
Оптимальная траектория . (8)
Оптимальное управление получаем из формулы (7) подстановкой оптимальной траектории :
Оптимальное управление (9)
Если применить для решения вышеприведенной задачи принцип максимума Понтрягина, рассмотренный на предыдущей лекции, то мы получим ту же оптимальную траекторию (8) и то же оптимальное управление (9). Но уравнение Беллмана позволяет дополнительно определить уравнение оптимального регулятора с полной обратной связью (7), то есть решить задачу синтеза оптимального регулятора в системе с полной обратной связью.