Классификация систем оптимального управления
Системы оптимального управления классифицируются по различным признакам. Рассмотрим некоторые из них.
По оптимизируемым показателям качества:
1) Оптимальные по быстродействию, обеспечивающие минимум функционала качеста
где Т – время протекания процесса управления при заданных ограничениях на управляющие воздействия. При этом перевод изображающей точки из одного положения в пространстве состояний в другое достигается за наименьшее время.
2) Оптимальные по расходу ресурсов, обеспечивающие минимум функционала качества
где Сi – коэффициент связи скорости расхода ресурсов с управляющими воздействиями. При этом перевод изображающей точки из начального состояния в конечное достигается при минимальных затратах ресурсов.
3) Оптимальные по затратам энергии, обеспечивающие минимум функционала
Кроме перечисленных, применяются оптимальные системы с минимальными потерями управления, характеризуемые минимальным отклонением действительных координат объекта от желаемых значений (следящие системы с минимальными ошибками воспроизведения задающего воздействия), оптимальные системы с максимальной производительностью и другие.
|
|
По характеру используемой информации:
1) Системы с полной априорной информацией об объекте управления.
В этом случае управляющие воздействия вырабатываются путем решения детерминированной задачи отыскания экстремума функционала.
2) Системы с неполной априорной информацией и пассивным ее накоплением.
В таких системах для выработки управляющего воздействия используются статистические методы обработки информации о работе системы.
3) Системы с неполной априорной информацией и активным ее накоплением в процессе работы.
В таких системах недостающая информация восполняется за счет использования пробных воздействий. Оптимальное управляющее воздействие вырабатывается с учетом реакции системы на пробные воздействия. Такие системы называют еще экстремальными системами.
Основными методами решения задач оптимального управления являются классическое вариационное исчисление; принцип максимума; метод динамического программирования.
Метод позволяет решать достаточно общие задачи нахождения оптимального времени переходного процесса, а также вычислять некоторые другие критерии оптимальности для непрерывных систем.
Проблема в общем виде содержит ряд достаточно сложных положений, однако для решения определенного класса задач об оптимизации, использование принципа максимума (называемого принципом максимума Понтрягина) дает инженерно приемлемый математический аппарат.
|
|
Пусть заданная система управления имеет вид, приведенный на рис.12.1.
На рисунке обозначено: ОУ – объект управления, УПИ - устройство получения информации, УПОИ – устройство передачи и обработки информации, УУ – управляющее устройство.
Рис.12.1. Блок-схема САУ
Управляющие воздействия U1, U2,….Uk, поступающие на объект управления, обеспечивают в каждый момент времени на выходе объекта параметры х1,х2,….хn, которые характеризуют состояние объекта управления. Управляющие воздействия Uk, очевидно, в реальных условиях ограничены по своим значениям рядом условий. Если эти сигналы управления представить в виде векторов, направляемых по «К» координатным осям К – мерного пространства, то наложенные на них ограничения выделят в этом пространстве некоторую ограниченную замкнутую область, называемую областью управления Гк. Совокупность всех векторов управляющих сигналов в каждый момент времени можно представить как суммарный вектор с компонентами u1(t), u2(t),…uk(t), определенный на отрезке времени t0 £ t £ t1 и расположенный внутри области управления. Вектор-функция , удовлетворяющая некоторым наложенным на нее условиям управления, определяется как допустимое управление. Заданными условиями управления могут быть кусочная непрерывность функции , кусочная дифференцируемость и некоторые другие условия.
Если принять, что управляющее устройство в системе безинерционно, а функция управления кусочно-непрерывна, то ее значения могут, очевидно, без задержки во времени перемещаться из одной точки управления в любую другую.
Предполагается, что уравнения элементов, определяющих поведение объекта управления, представляют собой совокупность дифференциальных уравнений первого порядка (или уравнений, могущих быть приведенными к этому виду), имеющих следующий вид:
dx1/dt = f1(x1,x2,…xn, u1,….uk),
……………………………….. (12.1)
dxi/dt = f1(x1,x2,…xn, u1,….uk),
где i = 1,2,……n
здесь в соответствии с рис.12.1 величины x1,x2,…xn –выходные параметры объекта; u1,u2,….uk – входные (управляющие) воздействия.
Перейдя к векторной форме, примем:
- вектор с компонентами x1,x2,…xn; - вектор с компонентами u1,u2,….uk; - вектор с компонентами .
При этом вектор-функции Fi в (12.1) считаются непрерывными функциями аргументов и непрерывно дифференцируемыми по этим аргументам. Поэтому уравнение (12.1) можно записать в векторной форме
. (12.2)
Уравнение (12.2), как и уравнение (12.1) можно рассматривать как уравнение элементов, определяющих поведение объекта управления с «К» регулируемыми органами. Такая система при безинерционном управляющем устройстве, является «К» - мерной системой управления.
Для обеспечения оптимального закона управления необходимо найти все значения Ui как функции всех выходных параметров хi и всех других К – 1 управляющих воздействий ui или, иначе говоря, определить функции:
U1 = j1(x1,x2,…xn, u2,u3….uk)
U2 = j1(x1,x2,…xn, u1,u3….uk)
………………………………
Uk = j1(x1,x2,…xn, u1,u2….uk-1)
или в векторной форме
.
Если сигналы управления с учетом определенных ограничений заданы, т.е. известны и вектор находится внутри или на границе К – мерного пространства, то решение уравнения (12.2) при любых начальных условиях однозначно определяет выходную вектор-функцию . Выбранный допустимый закон управления при to £ t £ t1, изображающую точку , определяющую состояние объекта управления в момент времени to и в n – мерном пространстве имеющую координаты , переводит в положение с координатами , что и является целью управления.
Если задаться в соответствии с (12.2) функцией Fo(x1,x2,…xn, u1,u2….uk) и считать целью управления указанный выше перевод изображающей точки в фазовом пространстве из состояния в состояние , то требуется найти такую вектор-функцию управления с учетом заданных ограничений, которая обращала бы в минимум или максимум функционал вида
|
|
.
Если принять, что , то это приводит к J = t1 - to, что означает минимальное время перехода изображающей точки в фазовом пространстве из состояния в состояние , т.е. максимально возможное быстродействие системы.
Решение поставленной задачи с использованием принципа максимума сводится к следующему.
Дополним основную систему уравнений (12.1) системой уравнений относительно дополнительных переменных yо,y1,…yn в виде
, (12.3)
где i = 0,1,…n
Системы уравнений (12.1) и (12.3) объединяются одной записью при введении вспомогательной функции H переменных xi, yi и uj, (i = 0,1,….n; j = 1,2,….k), называемой гамильтонианом. Эта функция называется также функцией Понтрягина.
. Тогда
, (12.4)
, (12.5)
где i= 0,1,….n
При выбранных значения и функция Н зависит только от управляющего воздействия .
Если считать, что максимальное значение непрерывной функции Н в некоторой точке области управления при выбранном значении и равно то = .
Принцип максимума формулируется следующим образом. Для оптимальности управления и траектории необходимо существование такой ненулевой непрерывной вектор-функции ,соответствующей функциям и , что:
1) при любом t на отрезке to £ t £ tk функция переменного достигает в точке максимума;
2) в конечный момент времени tk выполняются соотношения
yо(tk) £ 0, .
Кроме того, если величины удовлетворяют системе уравнений (12.4) и (12.5) и условию п.1, то функции yо(t) и переменного t являются постоянными, и условие п.2 выполняется в любой момент времени на отрезке to £ t £ tk.
Если критерием оптимальности является максимальное быстродействие, то целью расчета является определение вектор-функции , при которой перемещение системы из состояния Мо в состояние Мk в многомерном пространстве происходит за минимальное время (рис.12.2).
Рис.12.2. Переход изображающей точки из начального положения в конечное
Принцип максимума сводится к подбору в каждой данной точке многомерного пространства вектора так, чтобы функция стала максимальной.
|
|
Зная вектор в точке Мо (рис.12.2), можно определить в этой точке вектор и затем переместиться в ближайшую точку М1, где снова определить значение и т.д.
В итоге кривая МоМ1М2… в многомерном пространстве будет экстремалью, т.е. перемещение системы по этой кривой происходит с максимальным быстродействием. Если экстремаль не проходит через требуемую точку Мк, то следует изменить начальный вектор . В этом случае получится группа экстремальных кривых, одна из которых при соответствующем подборе вектора пройдет через требуемую точку Мк.