double arrow

ОПТИМИЗАЦИЯ ПРОЦЕССА КОРРЕКЦИИ КОСМИЧЕСКОГО АППАРАТА


Проиллюстрируем применение необходимых условий оп­тимальности на примере решения задачи оптимизации процесса коррекции космического аппарата с целью минимизации конечной ошибки по какому-либо одному параметру траектории.

Обозначим через х величину конечной ошибки, называемую для краткости промахом; через — промах, прогнозируемый в мо­мент, предшествующий проведению i-й коррекции; через — ве­личину i-ro корректирующего воздействия; через — функцию влияния i-ro корректирующего воздействия на прогнозируемый промах, . Совершенно очевидно, что функция связа­н­на с моментом проведения i-й коррекции и зависит от него. Тогда в качестве математической модели процесса коррекции в первом приближении можно принять скалярное дискретное уравнение

где — случайное возмущение, обусловленное ошибками траекторных измерений и ошибками реализации корректирующего воз­действия ; N — число коррекций.

Полагаем, что статистические характеристики случайного воз­мущения заданы и имеют вид

Считается, что прогнозируемый априори (до совершения каких-либо коррекций) промах, равный по определению величине , известен.

Рассмотрим сначала задачу оптимизации программы проведе­ния коррекций, в которой требуется найти последовательность кор­ректирующих воздействий , обеспечивающую при заданных энергетических возможностях минимум конечного про­маха. В качестве критерия оптимальности примем величину второ­го момента конечного промаха .

Энергетические возможности будем оценивать суммой квадра­тов всех корректирующих импульсов, считая, что должно иметь место условие

где — заданная величина.

Заметим, что в рассматриваемой задаче ограничения, накла­дываемые непосредственно на управления , отсутст­вуют. Учет ограничения на энергетические затраты осуществим с помощью обобщенного метода множителей Лагранжа [28]. Сущ­ность этого метода базируется на известном свойстве, заключающемся в том, что необходимые условия оптимальности исходной задачи при наличии ограничений совпадают с необходимыми усло­вия-ми оптимальности новой задачи, но уже без ограничений. По­следняя отличается от исходной задачи лишь критерием оптималь­ности. В качестве нового (обобщенного) критерия оптимальности выступает функция Лагранжа. Применительно к рассматриваемо­му примеру таким обобщенным критерием оптимальности являет­ся интегротерминальный критерий

где — множитель Лагранжа, . Определение множителя а осуществляется после решения задачи минимизации критерия по при фиксированном из условия

Здесь через обозначено оптимальное решение при фиксиро­ванном значении . Для отыскания этого решения обратимся к не­обходимым условиям оптимальности. Составим согласно (4.14) га­мильтониан, соответствующий обобщенному критерию оптималь­ности:

Так как условия выпуклости по в данном случае выполне­ны, то имеет место дискретный принцип минимума (4.12). Если бы на управляющие (корректирующие) воздействия накладыва­лись дополнительные ограничения, то операцию минимума в (4.12)

следовало бы раскрывать с учетом этих ограничений. В данном же случае таких ограничений нет. Поэтому для достижения мини­мума в (4.12) необходимо и достаточно выполнения условия

где через обозначено математическое ожидание сопряженной переменной . Из этого условия получаем связь оптимального управления ,с неизвестным пока множителем Лагранжа а и сопря­женной переменной :

Согласно (4.14) находим

откуда следует, что и поэтому , а оптималь­ное управление выражается через математическое ожидание ко­нечного промаха

Из последнего выражения следует, что при а = 0 задача оказывает­ся вырожденной. Это связано с тем, что = 0 соответствует случаю неограниченных энергетических возможностей. Естественно, что при этом и управление оказывается неограниченным. В этом слу­чае нет необходимости в проведении нескольких коррекций, ибо сразу можно устранить любой ожидаемый промах. Поэтому в дальнейшем будем считать, что >0.

Учитывая полученную структуру управления, на основании ис­ходного уравнения (4.15) с учетом (4.16) нетрудно установить связь ожидаемого промаха c неизвестным пока множите­лем :

откуда

С учетом последнего соотношения оптимальное управление при­нимает вид

Это выражение с точностью до константы (множителя ) и да­ет решение поставленной задачи по определению оптимальной про­граммы проведения коррекций.

Следует отметить, что при заданных статистических свойствах возмущения (4.16) решение задачи оказалось инвариантным по отношению к этому возмущению. Другими словами оно полно­стью совпадает с решением соответствующей детерминированной задачи, когда считается .

Как уже указывалось, множитель должен быть определен из условия , которое с учетом найденного управления(4.17) легко сводится к квадратному относительно уравнению

Неотрицательный корень этого уравнения равен

причем >0 имеет место лишь при условии .

Учитывая комментарий, сделанный ранее относительно случая =0, последнее условие можно интерпретировать, как условие це­лесообразности проведения нескольких коррекций (во всяком слу­чае, более одной).

Подставляя найденное значение в (4.17), окончательно получаем оптимальное управление

При решении данной задачи, предполагалось, что моменты про­ведения коррекций или, что то же самое, коэффициенты зада­ны. Получив решение при фиксированных и установив зависи­мость критерия оптимальности от этих коэффициентов, можно по­ставить задачу и об определении оптимальных моментов проведе­ния коррекции. Эта задача является классической задачей матема­тического программирования и может быть решена соответствую­щими методами [28].

При решении задачи оптимизации программы проведения кор­ректирующих воздействий полагалось, что в процессе реализации этих воздействий никакая информация использована быть не мо­жет. Более типичным случаем является использование при прове­дении коррекции информации о траекторию измерениях. Оказы­вается, что в этом случае задачу оптимизации также можно сформулировать как задачу программирования оптимального управле­ния (правда, это будет совсем другая задача), если заранее за­даться структурой управления. В качестве примера рассмотрим типичный случай, когда корректирующее воздействие формируется пропорционально величине прогнозируемого промаха:

Знак минус в выражении (4.18) введен для того, чтобы подчерк­нуть использование принципа обратной связи в процессе коррек­ции.

Задачу оптимизации сформулируем следующим образом: найти последовательность коэффициентов , которые с уче­том закона коррекции (4.18) и в силу уравнения (4.15) обеспечат минимум терминальному критерию при условии .

Отметим, что последнее условие, как и ранее, учитывает огра­ничение на энергетику, но в отличие от рассмотренного случая со­держит теперь операцию математического ожидания. Дело в том, что в задаче программирования, рассмотренной ранее, любое уп­равление было неслучайно и поэтому ограничение на энергетику носило неслучайный характер. Теперь же управляющее воздействие согласно (4.18) носит случайный характер в силу случайности каждого . Поэтому и ограничения на энергетику также принимают случайный характер. Его учет может быть раз­личным. Можно потребовать выполнения этого условия, например, по вероятности. А можно поступить более просто, заменив левую часть в ограничении соответствующим математическим ожидани­ем. Именно таким приемом мы и воспользовались. При этом, ко­нечно, следует иметь в виду, что ограничение будет удовлетворяться лишь в среднем.

Для решения задачи перепишем модель процесса коррекции (4.15) с учетом (4.18):

Как и прежде, перейдем к обобщенному критерию оптимальности, который теперь принимает вид

где — также множитель Лагранжа, подлежащий в дальнейшем определению, .

Воспользуемся необходимыми условиями оптимальности. Со­ставим для этого согласно (4.14) гамильтониан.

При оптимальных значениях сопряженная переменная в соответствии с (4.14) удовлетворяет следующему уравнению:

с граничным условием

Так как ограничения на коэффициенты отсутствуют, то со­гласно (4.11) необходимые условия оптимальности принимают вид

Здесь через обозначен второй момент промаха . В соответст­вии с уравнением (4.19) может быть определен с помо­щью уравнения

Так как считается, что априорный промах известен, то имеем следующее граничное (начальное) условие:

Отсюда видно, что зависит от значений коэффициентов лишь в предшествующие моменты j= 1,..., i—1 и не зависит от .

Основная трудность использования условия оптимальности (4.21) состоит в необходимости раскрытия математического ожи­дания , зависящего от искомого значения . Установим эту зависимость. Используя временно для краткости обозначение

перепишем уравнения (4.19) и (4.20) в виде

На основании этих уравнений можно записать следующее выраже­ние для сопряженной переменной :

Образуем произведение , учитывая, что и произведем статистическое осреднение его:

Теперь учтем, что для любого имеет место соотношение

Получим

Если теперь ввести в рассмотрение параметр , определив его с помощью рекуррентного соотношения

или в развернутом виде

с граничным условием , то выражению (4.22) можно при­дать следующую компактную форму:

Подставляя его в условие оптимальности (4.21), получаем оконча­тельно уравнение для определения оптимальных значений .

Здесь введено обозначение

Так как в общем случае , то оптимальное значение пара­метра должно быть равно

С учетом выражений (4.23), (4.24) рекуррентное соотношение для параметра , преобразуется к виду

Таким образом, задача определения оптимальных значений сведена к последовательному применению рекуррентного со­отношения (4.25) с учетом (4.23), (4.24). Решение заканчивается определением множителя из условия


Сейчас читают про: