Задача 1. Даны модель управления
где:
и функционал
Требуется найти оптимальное программное управление
и оптимальную траекторию
.
Задача 2. Даны модель управления
где:
и функционал
Требуется найти оптимальное программное управление
и оптимальную траекторию
.
Задача 3. Даны модель управления
где:
и функционал
Требуется найти оптимальное программное управление
и оптимальную траекторию
.
Задача 4. Даны модель управления
где:
и функционал
Требуется найти оптимальное программное управление
и оптимальную траекторию
.
Задача 5. Даны модель управления
где:
и функционал
Задано конечное условие
Требуется найти оптимальную тройку
на которой достигается минимум функционала.
Нахождение оптимального управления с полной обратной связью
Постановка задачи.
Пусть поведение объекта управления описывается системой обыкновенных дифференциальных уравнений (ОДУ)
(1)
где:
- вектор состояния системы,
;
- вектор управления,
, U – заданное множество допустимых управлений;
t – время,
- интервал времени функционирования системы;
- непрерывная вместе со своими частными производными вектор-функция,
- n -мерное евклидово пространство,
.
Момент начала процесса t 0 задан, а момент окончания процесса t 1 или задан, или определяется первым моментом достижения точкой
некоторой заданной гиперповерхности
,
, (2)
т.е. в момент времени t 1 должно выполняться условие
b). Функционал
Требуется определить вектор функции
доставляющие минимум заданному функционалу при переводе системы из начального состояния
в конечное состояние
.
Начальное условие
заранее не задано и может быть произвольно на множестве
.
Произвольность начального значения
понимается в следующем смысле:
Пусть
- множество точек
, из которых можно достигнуть терминального множества Г по некоторой траектории, соответствующей допустимому управлению. Тогда
- сечение множества Q при фиксированном t = t0.
Задано множество допустимых управлений U0, элементами которого являются кусочно-непрерывные функции u(t) со значениями в множестве
.
Задано множество допустимых процессов D, элементами которого являются тройки
, которые включают момент окончания процесса, траекторию x(t) и управление u(t), где для любого
непрерывные и кусочно-непрерывно дифференцируемые, u(t) – кусочно-непрерывные, удовлетворяющие уравнению (1) с начальным условием
и условию (2).
На множестве допустимых процессов D определен функционал качества управления
(3)
где
- заданные непрерывно дифференцируемые функции.
Предполагается, что при управлении используется информация о времени t и всех координатах вектора состояния
.
Множество допустимых управлений с полной обратной связью Un образуют функции
которые для каждого начального состояния
порождают соответствующие тройки
, в которых программное управление
, а для любого
.
Управление с полной обратной связью схематично представлено на рис. 1.
|
|
|
Рис. 1.
Требуется найти такую функцию
, чтобы функционал (3) на этой функции достигал минимума
(4)
где
.
Функция
называется оптимальным управлением с полной обратной связью, а формула, описывающая эту функцию, является уравнением оптимального регулятора в системе с полной обратной связью.
Для любого начального состояния
функция
порождает оптимальную траекторию
, оптимальное управление
и оптимальное время окончания процесса
.






