Задача 1. Даны модель управления
где: и функционал
Требуется найти оптимальное программное управление и оптимальную траекторию .
Задача 2. Даны модель управления
где: и функционал
Требуется найти оптимальное программное управление и оптимальную траекторию .
Задача 3. Даны модель управления
где: и функционал
Требуется найти оптимальное программное управление и оптимальную траекторию .
Задача 4. Даны модель управления
где: и функционал
Требуется найти оптимальное программное управление и оптимальную траекторию .
Задача 5. Даны модель управления
где: и функционал
Задано конечное условие
Требуется найти оптимальную тройку на которой достигается минимум функционала.
Нахождение оптимального управления с полной обратной связью
Постановка задачи.
Пусть поведение объекта управления описывается системой обыкновенных дифференциальных уравнений (ОДУ)
(1)
|
|
где: - вектор состояния системы, ;
- вектор управления, , U – заданное множество допустимых управлений;
t – время, - интервал времени функционирования системы;
- непрерывная вместе со своими частными производными вектор-функция, - n -мерное евклидово пространство,
.
Момент начала процесса t 0 задан, а момент окончания процесса t 1 или задан, или определяется первым моментом достижения точкой некоторой заданной гиперповерхности ,
, (2)
т.е. в момент времени t 1 должно выполняться условие
b). Функционал
Требуется определить вектор функции доставляющие минимум заданному функционалу при переводе системы из начального состояния в конечное состояние .
Начальное условие заранее не задано и может быть произвольно на множестве .
Произвольность начального значения понимается в следующем смысле:
Пусть - множество точек , из которых можно достигнуть терминального множества Г по некоторой траектории, соответствующей допустимому управлению. Тогда - сечение множества Q при фиксированном t = t0.
Задано множество допустимых управлений U0, элементами которого являются кусочно-непрерывные функции u(t) со значениями в множестве .
Задано множество допустимых процессов D, элементами которого являются тройки , которые включают момент окончания процесса, траекторию x(t) и управление u(t), где для любого непрерывные и кусочно-непрерывно дифференцируемые, u(t) – кусочно-непрерывные, удовлетворяющие уравнению (1) с начальным условием и условию (2).
На множестве допустимых процессов D определен функционал качества управления
|
|
(3)
где - заданные непрерывно дифференцируемые функции.
Предполагается, что при управлении используется информация о времени t и всех координатах вектора состояния .
Множество допустимых управлений с полной обратной связью Un образуют функции которые для каждого начального состояния порождают соответствующие тройки , в которых программное управление , а для любого .
Управление с полной обратной связью схематично представлено на рис. 1.
Рис. 1.
Требуется найти такую функцию , чтобы функционал (3) на этой функции достигал минимума
(4)
где .
Функция называется оптимальным управлением с полной обратной связью, а формула, описывающая эту функцию, является уравнением оптимального регулятора в системе с полной обратной связью.
Для любого начального состояния функция порождает оптимальную траекторию , оптимальное управление и оптимальное время окончания процесса .