Оптимальное управление летательным аппаратом в бессиловом поле. Оптимальное управление линейной системой

Применение принципа минимума для программирования оптимального управления проиллюстрируем сначала на следующем примере.

Пусть в бессиловом поле движется летательный аппарат под действием силы тяги двигателя. Математическая модель такого аппарата может быть упрощенно представлена в виде уравнений движения

где — скорость аппарата; — путь, пройденный к текущему мо­менту времени; и — программная, неслучайная составляющая управ­ляющего ускорения; — случайное возмущение программной со­ставляющей. Полагаем, что статистические характеристики возму­щения известны, причем . Для простоты считаем также, что ограничения на управление отсутствуют. Поставим задачу оп­ределения такой программы u(t), которая обеспечила бы перевод летательного аппарата из заданного начального состояния , в желаемое конечное состояние , с мини­мальным значением критерия

где — заданные числа.

Интегральное слагаемое в этом критерии характеризует среднее значение расхода топлива, затрачиваемого на процесс управления, а величина является мерой близости конеч­ного состояния к желаемому. Коэффициент а показывает весовую долю этих составляющих в общем критерии оптимальности.

Для решения данной задачи воспользуемся необходимыми усло­виями оптимальности (4.45) с учетом (4.49), (4.47), (4.44). Соглас­но этим соотношениям гамильтониан Н будет равен

где компоненты сопряженного вектора определяются согласно уравнениям

с граничными условиями

а само условие достижения гамильтонианом минимального по уп­равлению значения примет вид

Отсюда искомое управление следующим образом связано с сопря­женной переменной :

Из сопряженной системы уравнений находим

Поэтому

и оптимальное управление равно

В свою очередь согласно исходным уравнениям движения матема­тические ожидания и удовлетворяют уравнениям

при начальных условиях . Интегрируя эту систему с учетом найденного управления, получаем

Полагая здесь t = T, получаем линейную систему алгебраических уравнений относительно неизвестных величин х i (T), х2(Т). Таким образом, в данном примере краевая задача свелась к системе ли­нейных алгебраических уравнений второго порядка относительно (Т), (Т). Определяя их, т. е. решая указанную систему и под­ставляя решение в выражение (4.50), окончательно получаем иско­мую программу управления.

А теперь рассмотрим задачу управления линейной системой бо­лее общего вида:

где А, В — матрицы, зависящие в общем случае от времени; — случайное возмущение типа «белого шума» с нулевым математиче­ским ожиданием

и корреляционной функцией

где - -функция; D(t) -матрица интенсивностей белого шума.

Поставим задачу определения такой матрицы коэффициентов обратной связи L(t) в зависимости

которая обеспечила бы минимизацию интегротерминального кри­терия

Предполагается, что матрицы W, положительно определены. Ста­тистические характеристики вектора начального состояния х(0) счи­таются известными.

Отметим, что сформулированная задача является также зада­чей программирования оптимального управления. Правда, в каче­стве искомого управляющего воздействия теперь является зависи­мость матрицы L от времени.

Составим гамильтониан для данной задачи. Так как с учетом (4.52) система (4.51) и критерий оптимальности могут быть пред­ставлены в виде

то согласно (4.49)

При оптимальном управлении (в данном случае при оптималь­ной матрице L) сопряженный вектор согласно (4.47) удовлетво­ряет уравнению:

с граничным условием (4.44)

Ввиду отсутствия ограничений на управление необходимые ус­ловия оптимальности (4.45) принимают вид

Здесь для краткости введены обозначения

Нетрудно установить, что матрица К удовлетворяет следующему дифференциальному уравнению:

С целью определения второй ковариационной матрицы M ус­тановим сначала связь векторов и х для произвольного момента t. Запишем уравнения, определяющие эти векторы, в виде системы

Здесь для краткости даны следующие обозначения: — единичная матрица.

Пусть —фундаментальная матрица этой системы, т. е. матрица, удовлетворяющая уравнению

Тогда общее решение для х и можно представить так:

где — соответствующие блоки матрицы Ф. Нетруд­но заметить, что в данном случае блок для любых мо­ментов t. Другими словами, решение для вектора х не зависит от вектора .

С учетом найденных решений (4.54) связь между векторами х и для конечного момента Т принимает вид

Отсюда полагая, что матрица Ф22(T,t) неособенная, получаем связь и х для любого момента времени:

где

Перемножая и и производя операцию математического ожидания, получаем

В силу свойств -функции интегральный член в этом выражении равен нулю. Поэтому матрицу M можно представить в виде

где

Таким образом, матрица ковариации векторов и х линейно связана с матрицей вторых моментов К в любой момент времени.

Подчеркнем теперь, что как матрица , так и матрица К не за­висят от значений матрицы L в текущий момент t. Правда, матри­ца зависит через элементы матрицы от всех значений при , а матрица К — от значений при . Учитывая это, из условия (4.53) можно записать следующее выра­жение для оптимального значения матрицы L в текущий момент времени:

Чтобы воспользоваться этим соотношением, необходимо определить матрицу Л. Формально она определяется в соответствии с соотно­шениями (4.56), (4.55). Однако нетрудно получить и уравнение, оп­ределяющее матрицу непосредственно. Для этого продифферен­цируем соотношение (4.57). С учетом уравнения для матрицы К по­лучим

С другой стороны, на основе определения матрицы M учетом уравнений для векторов х и имеем

причем согласно (4.54) и (4.55)

Объединяя эти уравнения, получаем

Это уравнение выполняется тождественно при любых матрицах К, если удовлетворяет дифференциальному уравнению

Раскрывая здесь смысл матриц , и принимая во внимание выражение (4.58), окончательно получаем

Граничное условие для этого матричного уравнения получается из сравнения выражения (4.57) для момента

и аналогичного соотношения для Ж{Т) согласно определению

Поэтому

Таким образом, задача определения оптимальных коэффициен­тов обратной связи в линейном законе управления сводится к реше­нию обыкновенного матричного дифференциального уравнения (4.59) при граничном условии (4.60).

ЗАДАЧА ОПТИМАЛЬНОГО ПЛАНИРОВАНИЯ НАВИГАЦИОННЫХ ИЗМЕРЕНИЙ

Задачу оптимального планирования навигационных изме­рений будем интерпретировать как задачу отыскания оптимальной программы управления некоей фиктивной динамической системой, в качестве которой рассмотрим алгоритм оценивания, в простейшем случае — линейный фильтр Калмана. Кроме того, в отличие от пре­дыдущего раздела с целью получения более наглядных результатов задачу обработки информации рассмотрим в непрерывной поста­новке.

Итак, пусть имеется линейная динамическая система

состояние которой x(t) требуется оценить. В (4.61) x(t) —вектор n×1; A(t) —матрица п × п; —вектор белых шумов с матрицей

интенсивностей . Модель (4.61) идентична модели (3.49) при .

Будем считать, что на интервале (t0, T) измеряются m векторных процессов размерности l m×1 каждый, причем уравнения измерите­лей однотипны и имеют вид

где Hk — матрица l k×n; —вектор белого шума размерности с матрицей интенсивностей .

Точность оценивания состояния х(t) системы (4.61) по измере­ниям (4.62), как и в разд. 3.6.1, определяется с помощью апостери­орной корреляционной матрицы P*(t), изменение которой в силу непрерывности измерений, описывается уравнением, аналогичным (3.57):

Уравнение (4.63) отличается от (3.57) наличием суммы в пра­вой части. Эта сумма обусловлена тем, что измеряется не один, а т векторных процессов . Будем рассматривать (4.63) как некоторую управляемую динамическую систему, в которой т — мерный вектор управления u(t) с компонентами , задает программу измерений векторов .В даль­нейшем будем считать, что компоненты вектора и принадлежат множеству U, состоящему из двух элементов 0 и :

где

В (4.65) под будем понимать множество моментов времени, в которые можно (по техническим причинам) проводить измерения процессов . С учетом (4.64), (4.65) программа u(t) имеет наглядный физический смысл: если , то в мо­мент t k-e измерительное средство используется, если — не используется.

В том случае, если в конкретной технической задаче два раз­личных измерителя не могут работать одновременно, то на компо­ненты вектора и накладывается дополнительное ограничение

В конкретной технической задаче планирования эксперимента по уточнению состояния динамической системы наиболее распро­страненной является ситуация, когда необходимо выполнить требования по точности оценки какого-либо скалярного параметра, характеризующего движение летательного аппарата, при ограниче­нии на время наблюдения в силу условий видимости, загруженно­сти командно-измерительного или бортового навигационного комп­лекса и т. д.

Поэтому представляет интерес следующая задача. Требуется определить вектор u*(t), минимизирующий критерий

характеризующий временные затраты на измерения при ограниче­нии на конечную точность оценивания скалярного параметра s = аТх(Т), характеризуемую апостериорной дисперсией . Сформулированную задачу будем рассматривать как задачу программирования оптимального управления в системе (4.63) по критерию (4.67) при ограничениях на управление (4.64) — (4.65) и на конечное состояние . Непосредственное ре­шение подобной задачи [36] приводит к необходимости решения краевой задачи, размерность которой определяется числом различ­ных элементов матрицы Р* в (4.63), т. е. , и сопряжено со

значительными трудностями. С целью их преодоления воспользуем­ся следующим приемом. Введем некоторые п- мерные векторы , q(t) таким образом, чтобы во все моменты времени на интервале (t0, T) выполнялось тождество

Дифференцируя левую и правую части соотношения (4.68) с учетом (4.63) и требуя выполнения получающегося равенства при любых P*(t), получаем систему дифференциальных уравнений для и q(t).

Действительно,

Из последнего выражения непосредственно следует (4.69). В силу (4.68) на начальные условия этой системы уравнений на­ложены следующие ограничения:

Можно доказать, что если в системе (4.69) к ограничениям (4.70) добавить следующие ограничения на векторы и q в момент Т:

то задача программирования оптимального управления, задавае­мая соотношениями (4.69) — (4.72), (4.64) — (4.67), будет эквива­лентна исходной оптимизационной задаче в смысле управления u*(t).

Наиболее простое решение эквивалентной задачи получается при малой интенсивности шумов в модели (4.61), так что можно положить .

В этом случае система уравнений (4.69) принимает следующий вид:

Рассмотрим последние п уравнений

Если — фундаментальная матрица системы (4.74), то

Умножим (4.75) слева на а т и с учетом (4.70), (4.72) получим

Таким образом, ограничение (4.72) сводится к ограничению на левом конце траектории:

Обозначим

Тогда

При этом, поскольку решение системы (4.74) записано в явном виде (4.75), последнюю систему уравнений можно исключить из (4.73), так как . Тогда

где

В результате проведенных преобразований система (4.73), име­ющая размерность 2n, сведена к системе (4.78) размерности п. Те­перь рассмотрим задачу программирования оптимального управ­ления уже в системе (4.78) при ограничениях (4.64), (4.65), (4.71), (4.77) и критерии (4.67). В соответствии с приведенными условия­ми оптимальности составляем гамильтониан

Структуру оптимального управления опре­делим из условия максимума гамильтониана по u(t):

где программная функция.

Система уравнений для n -мерного вектора сопряженных переменных линейна: , и ее решение может быть записано на основе фундаментальной матрицы исходной системы (4.61):

Начальные условия для вектора определяются с учетом (4.77) из условия трансверсальности:

где x — постоянный множитель.

Подставим (4.81) в выражение для Mk(t) и, учитывая соотноше­ние (4.82) для значения момент t 0, получим при k=1, 2,..., m следующее выражение:

Получим краевую задачу для системы уравнений (4.78) при уп­равлении (4.80), заключающуюся в подборе (п+ 1)-мерного вектора таким образом, чтобы выполнялись ограничения (4.71), (4.77). Последнее эквивалентно определению вектора из решения следующей системы трансцендентных уравнений размерно­сти (п+ 1):

Для установления функциональной зависимости вектора конечного состояния от вектора и скаляра x необходимо записать в явном виде решение системы (4.78) на основе формулы Коши. В результате получим

Здесь

где . Моменты времени , являющаяся соответственно началом и концом мерных ин­тервалов, количество которых равно для k-го измерительного средства, определяются как корни уравнений

Для получения эффективной численной процедуры решения систе­мы уравнений (4.84) преобразуем эту систему к более удобному для вычислений виду, разработав, кроме того, специальный прием определения начального приближения для вектора . Разрешим первые п уравнений системы (4.84) относительно ср(/0) на основе установленной ранее зависимости (4.85):

Моменты времени , зависящие в свою очередь от , будем искать как точки переключения программы u(t), оп­ределяемой соотношениями (4.80), (4.83). При этом множитель к в (4.83) подбираем из условия , тем самым решая последнее скалярное уравнение системы (4.84). Отметим, что в этом уравнении зависимость от к проявляется неявно через соот­ношения (4.80), (4.83). Очевидно, что с учетом сказанного решение системы (4.84) может быть сведено к отысканию корня уравнения

где под F понимается некоторый нелинейный оператор, определяе­мый (4.86) с учетом (4.80), (4.83). Для решения этого уравнения можно предложить метод последовательных приближений, приво­дящий к следующей итерационной процедуре:

где i -e приближение, .

В процессе численного решения уравнения су­щественное значение имеет выбор достаточно хорошего на­чального приближения . Прием, используемый для его нахождения, состоит в приближенном решении задачи пла­нирования на основе ее упрощения за счет замены критерия (4.67) квадратичным критерием соответственно за счет снятия ограничений (4.64), (4.66). Последова­тельность решения упрощенной задачи управления системой (4.69) совпадает с рассмотренным ранее решением точной задачи, но из-за различия критериев приводит к несколько иным результатам. Мож­но показать, что в этом случае краевая задача, соответствующая квадратическому критерию, сводится к решению системы (n+1) алгебраических уравнений 2-го порядка. Решение этой системы можно получить, например, методом Ньютона.

Для иллюстрации эффективности предложенного выше метода рассмотрим оптимальное планирование измерений в задаче опреде­ления состояния ИСЗ, движущегося по наклонной орбите, близкой к круговой. В качестве модели движения примем линейную систему уравнений, описывающую движение ИСЗ в окрестности опорной круговой орбиты:

где шестимерный вектор состояния Δх определяет отклонение ИСЗ от опорной орбиты в орбитальной подвижной системе координат, введенной в разд. 3.3.4 (см. рис. 3.22).

Введем вектор состояния ИСЗ с компонентами , где Δr — отклонение ИСЗ от положения на опорной орбите в направле­нии радиус-вектора; Δl — вдоль орбиты; Δn — по нормали к плос­кости орбиты:

Воспользовавшись приемом, описанным в разд. 3.3.4, получим фундаментальную матрицу системы (4.87), формально совпадающую с (3.78) с точностью до постоянного множителя 1/r0 в диагональных элементах. В качестве измеряемого (навигационного) параметра рассмотрим суммарную наклонную дальность до ИСЗ — . Пусть измерения проводятся двумя наземными измерительными пунктами на интервале (t0, T) с максимально допустимой частотой , где — шаг измерений. Быстро меняющиеся ошибки измерений пред­ставляют собой последовательность некоррелированных гауссовских величин с характеристиками .

Предположим, что большая частота измерений позволяет перей­ти к непрерывной модели наблюдения. Тогда для каждого НИПа имеем

где — расширенный вектор состояния, включающий компоненты; —отклонения гринвичских коор­динат НИПа от расчетных значений; С(t) —систематическая (мед­ленно меняющаяся) ошибка измерения ; — блочная матрица, блок которой — матрица частных производ­ных от суммарной дальности по элементам вектора состояния ИСЗ; блок —матрица частных производных от по коорди­натам НИПов; —белый шум с интенсивностью .

Изменение опишем простейшими формирующими фильтрами с начальными условиями

где — априорная корреляционная матрица, задающая неопреде­ленность координат НИПов; — дисперсия систематической ошибки измерений параметра .

Фундаментальная матрица системы, описывающей эволюцию вектора , имеет вид (для одного НИПа)

Рис. 4.1. Стандартная (а) и оптимальная (б) программы измерений

где — единичная матрица размерности (3×3).

В качестве ограничения на точность определения орбиты примем ограничение на апостериорную дисперсию координаты . На режим работы НИПов наложим ограничения, заключающиеся в том, что продолжительность одного сеанса измерений не должна превышать , а продолжительность интервала прогнозирования между двумя соседними сеансами для одного и того же НИПа — .

Расчеты проводились при следующих исходных данных. Пара­метры опорной орбиты:

r0=20 000 км, = 20°, i =60°, u(t0)=0°. Ограничения принимались равными 10 и 180 мин соответственно. Длина мерного участка Т принималась равной трем суткам. На рис. 4.1 приведены примеры так называемой «стандартной» и оптимальной программ измерений, имеющие одну и ту же суммарную продолжительность измерений . Расчеты показывают, что в зависимости от значений выигрыш в точности оценивания скалярного параметра может составить от 10 до 40% (по апостериорному среднеквад­ратичному отклонению ).


ГЛАВА 5.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  



double arrow
Сейчас читают про: