Проиллюстрируем применение необходимых условий оптимальности на примере решения задачи оптимизации процесса коррекции космического аппарата с целью минимизации конечной ошибки по какому-либо одному параметру траектории.
Обозначим через х величину конечной ошибки, называемую для краткости промахом; через
— промах, прогнозируемый в момент, предшествующий проведению i -й коррекции; через
— величину i -ro корректирующего воздействия; через
— функцию влияния i -ro корректирующего воздействия на прогнозируемый промах,
. Совершенно очевидно, что функция
связанна с моментом проведения i -й коррекции и зависит от него. Тогда в качестве математической модели процесса коррекции в первом приближении можно принять скалярное дискретное уравнение
где
— случайное возмущение, обусловленное ошибками траекторных измерений и ошибками реализации корректирующего воздействия
; N — число коррекций.
Полагаем, что статистические характеристики случайного возмущения заданы и имеют вид

Считается, что прогнозируемый априори (до совершения каких-либо коррекций) промах, равный по определению величине
, известен.
Рассмотрим сначала задачу оптимизации программы проведения коррекций, в которой требуется найти последовательность корректирующих воздействий
, обеспечивающую при заданных энергетических возможностях минимум конечного промаха. В качестве критерия оптимальности примем величину второго момента конечного промаха
.
Энергетические возможности будем оценивать суммой квадратов всех корректирующих импульсов, считая, что должно иметь место условие

где
— заданная величина.
Заметим, что в рассматриваемой задаче ограничения, накладываемые непосредственно на управления
, отсутствуют. Учет ограничения на энергетические затраты осуществим с помощью обобщенного метода множителей Лагранжа [28]. Сущность этого метода базируется на известном свойстве, заключающемся в том, что необходимые условия оптимальности исходной задачи при наличии ограничений совпадают с необходимыми условия-ми оптимальности новой задачи, но уже без ограничений. Последняя отличается от исходной задачи лишь критерием оптимальности. В качестве нового (обобщенного) критерия оптимальности выступает функция Лагранжа. Применительно к рассматриваемому примеру таким обобщенным критерием оптимальности является интегротерминальный критерий

где
— множитель Лагранжа,
. Определение множителя а осуществляется после решения задачи минимизации критерия
по
при фиксированном
из условия

Здесь через
обозначено оптимальное решение при фиксированном значении
. Для отыскания этого решения обратимся к необходимым условиям оптимальности. Составим согласно (4.14) гамильтониан, соответствующий обобщенному критерию оптимальности:

Так как условия выпуклости
по
в данном случае выполнены, то имеет место дискретный принцип минимума (4.12). Если бы на управляющие (корректирующие) воздействия
накладывались дополнительные ограничения, то операцию минимума в (4.12)
следовало бы раскрывать с учетом этих ограничений. В данном же случае таких ограничений нет. Поэтому для достижения минимума в (4.12) необходимо и достаточно выполнения условия

где через
обозначено математическое ожидание сопряженной переменной
. Из этого условия получаем связь оптимального управления,с неизвестным пока множителем Лагранжа а и сопряженной переменной
:

Согласно (4.14) находим

откуда следует, что
и поэтому
, а оптимальное управление выражается через математическое ожидание конечного промаха

Из последнего выражения следует, что при а = 0 задача оказывается вырожденной. Это связано с тем, что
= 0 соответствует случаю неограниченных энергетических возможностей. Естественно, что при этом и управление оказывается неограниченным. В этом случае нет необходимости в проведении нескольких коррекций, ибо сразу можно устранить любой ожидаемый промах. Поэтому в дальнейшем будем считать, что
>0.
Учитывая полученную структуру управления, на основании исходного уравнения (4.15) с учетом (4.16) нетрудно установить связь ожидаемого промаха
c неизвестным пока множителем
:

откуда
С учетом последнего соотношения оптимальное управление принимает вид

Это выражение с точностью до константы (множителя
) и дает решение поставленной задачи по определению оптимальной программы проведения коррекций.
Следует отметить, что при заданных статистических свойствах возмущения (4.16) решение задачи оказалось инвариантным по отношению к этому возмущению. Другими словами оно полностью совпадает с решением соответствующей детерминированной задачи, когда считается
.
Как уже указывалось, множитель
должен быть определен из условия
, которое с учетом найденного управления(4.17) легко сводится к квадратному относительно
уравнению

Неотрицательный корень этого уравнения равен

причем
>0 имеет место лишь при условии
.
Учитывая комментарий, сделанный ранее относительно случая
=0, последнее условие можно интерпретировать, как условие целесообразности проведения нескольких коррекций (во всяком случае, более одной).
Подставляя найденное значение в (4.17), окончательно получаем оптимальное управление

При решении данной задачи, предполагалось, что моменты проведения коррекций или, что то же самое, коэффициенты
заданы. Получив решение при фиксированных
и установив зависимость критерия оптимальности от этих коэффициентов, можно поставить задачу и об определении оптимальных моментов проведения коррекции. Эта задача является классической задачей математического программирования и может быть решена соответствующими методами [28].
При решении задачи оптимизации программы проведения корректирующих воздействий полагалось, что в процессе реализации этих воздействий никакая информация использована быть не может. Более типичным случаем является использование при проведении коррекции информации о траекторию измерениях. Оказывается, что в этом случае задачу оптимизации также можно сформулировать как задачу программирования оптимального управления (правда, это будет совсем другая задача), если заранее задаться структурой управления. В качестве примера рассмотрим типичный случай, когда корректирующее воздействие формируется пропорционально величине прогнозируемого промаха:

Знак минус в выражении (4.18) введен для того, чтобы подчеркнуть использование принципа обратной связи в процессе коррекции.
Задачу оптимизации сформулируем следующим образом: найти последовательность коэффициентов
, которые с учетом закона коррекции (4.18) и в силу уравнения (4.15) обеспечат минимум терминальному критерию
при условии
.
Отметим, что последнее условие, как и ранее, учитывает ограничение на энергетику, но в отличие от рассмотренного случая содержит теперь операцию математического ожидания. Дело в том, что в задаче программирования, рассмотренной ранее, любое управление
было неслучайно и поэтому ограничение на энергетику
носило неслучайный характер. Теперь же управляющее воздействие согласно (4.18) носит случайный характер в силу случайности каждого
. Поэтому и ограничения на энергетику также принимают случайный характер. Его учет может быть различным. Можно потребовать выполнения этого условия, например, по вероятности. А можно поступить более просто, заменив левую часть в ограничении соответствующим математическим ожиданием. Именно таким приемом мы и воспользовались. При этом, конечно, следует иметь в виду, что ограничение
будет удовлетворяться лишь в среднем.
Для решения задачи перепишем модель процесса коррекции (4.15) с учетом (4.18):

Как и прежде, перейдем к обобщенному критерию оптимальности, который теперь принимает вид

где
— также множитель Лагранжа, подлежащий в дальнейшем определению,
.
Воспользуемся необходимыми условиями оптимальности. Составим для этого согласно (4.14) гамильтониан.

При оптимальных значениях
сопряженная переменная
в соответствии с (4.14) удовлетворяет следующему уравнению:

с граничным условием

Так как ограничения на коэффициенты
отсутствуют, то согласно (4.11) необходимые условия оптимальности принимают вид

Здесь через
обозначен второй момент промаха
. В соответствии с уравнением (4.19)
может быть определен с помощью уравнения

Так как считается, что априорный промах
известен, то имеем следующее граничное (начальное) условие:

Отсюда видно, что
зависит от значений коэффициентов
лишь в предшествующие моменты j= 1,..., i —1 и не зависит от
.
Основная трудность использования условия оптимальности (4.21) состоит в необходимости раскрытия математического ожидания
, зависящего от искомого значения
. Установим эту зависимость. Используя временно для краткости обозначение

перепишем уравнения (4.19) и (4.20) в виде

На основании этих уравнений можно записать следующее выражение для сопряженной переменной
:

Образуем произведение
, учитывая, что
и произведем статистическое осреднение его:

Теперь учтем, что для любого
имеет место соотношение

Получим

Если теперь ввести в рассмотрение параметр
, определив его с помощью рекуррентного соотношения

или в развернутом виде

с граничным условием
, то выражению (4.22) можно придать следующую компактную форму:

Подставляя его в условие оптимальности (4.21), получаем окончательно уравнение для определения оптимальных значений
.

Здесь введено обозначение

Так как в общем случае
, то оптимальное значение параметра
должно быть равно

С учетом выражений (4.23), (4.24) рекуррентное соотношение для параметра
, преобразуется к виду

Таким образом, задача определения оптимальных значений
сведена к последовательному применению рекуррентного соотношения (4.25) с учетом (4.23), (4.24). Решение заканчивается определением множителя
из условия







