Математическая постановка задачи оптимального управления любым динамическим объектом предполагает формирование математической модели с определением области ее существования, выбор критерия оптимальности и, наконец, задание класса управлений с учетом той информации, которая может быть использована при реализации искомого оптимального управления.
В качестве математических моделей летательных аппаратов обычно выступают уравнения движения. Это - либо обыкновенные дифференциальные уравнения, либо их конечно-разностные аналоги. Первый случай соответствует непрерывному времени, второй - дискретному.
Изучение задач оптимизации целесообразно начать с рассмотрения дискретного случая. Этому случаю в последнее время уделяется все большее внимание в связи с широким применением цифровой вычислительной техники не только при решении задач, связанных с исследованием вопросов динамики и управления летательных аппаратов, но и непосредственно в процессе управления ими.
Итак, будем считать, что математическая модель летательного аппарата представляет собой систему конечно-разностных уравнений, которую в общем случае можно представить в виде
Здесь -мерный вектор фазовых координат, вектор состояния летательного аппарата; -мерный вектор управления; - мерный вектор случайных возмущений в i -й момент; -мерная вектор-функция; N — количество шагов (временных) управления. Ввиду того, что в правой части уравнения (4.1) присутствует случайный вектор, в общем случае вектор состояния также оказывается случайным.
Предполагается, что на вектор управления накладывается ограничение вида , где под понимается допустимое множество векторов в i -й момент.
Считается, что статистические характеристики случайных векторов , полностью известны. Не нарушая общности, можно считать, что вектор состояния в начальный момент х0 известен точно. Возможные случайные разбросы начальных условий включаются в состав вектора .
Примером модели (4.1) может служить модель космического аппарата в задаче о многоимпульсной коррекции его траектории. В этом случае вектором состояния является совокупность элементов орбиты перед i -й коррекцией. В качестве вектора управления выступает корректирующий импульс скорости в i -й момент. Векторы возмущений включают в себя ошибки реализации корректирующих импульсов, ошибки знания векторов состояния и т. д. Вектор-функция устанавливает связь между элементами орбиты до и после совершения коррекции. Число N характеризует количество коррекций. Условие отражает тот факт, что любой корректирующий импульс в общем случае ограничен по величине и определяется запасом топлива на борту аппарата.
Задача программирования оптимального управления заключается в определении такой последовательности , обозначаемой для кратности через и, которая с учетом имеющихся ограничений обеспечивает перевод системы (4.1) из заданного начального состояния х0 в конечное состояние с минимальным значением некоторого критерия. При этом на вектор конечного состояния в общем случае могут быть наложены дополнительные ограничения, характеризующие, например, допустимые конечные ошибки выведения летательного аппарата.
В качестве основного критерия оптимальности в дальнейшем принимается терминальный критерий, равный математическому ожиданию некоторой скалярной функции конечного состояния
Таким образом, минимизации подлежит величина
Здесь и далее символ (—) используется для более компактного обозначения математического ожидания. В соответствии с определением математического ожидания в развернутом виде выражение (4.2) имеет следующий вид:
где p(xN+l) —плотность распределения вероятностей случайного вектора xN+1; XN+1 —допустимое множество всех случайных векторов; dxN+1 — элементарный объем этого множества. Интеграл в данном выражении следует понимать как многомерный.
Следует отметить, что выбор критерия оптимальности в виде (4.2) не нарушает общности рассмотрения задачи. Действительно, критерий более общей (интегротерминальной) структуры
легко сводится к виду (4.2):
правда, в отношении вектора, расширенного на одну дополнительную компоненту , определяемую уравнением
с начальным условием .
Первое слагаемое в критерии (4.3) характеризует качество управления (в интегральном смысле, второе — эффект управления конечным состоянием. Так, в задаче коррекции траектории космического аппарата слагаемое может оценивать расход топлива
при коррекции или энергетические затраты, а функция — определять конкретную характеристику конечной точности процесса коррекции.
Итак, пусть сформирована математическая модель объекта управления, определена область ее существования и выбран критерий оптимальности. Для завершенности постановки задачи оптимального управления остается определить класс управлений, в котором будет искаться оптимальное управление. При этом помимо ограничений, накладываемых на управление, важно уточнить ту информацию, которая может быть использована при реализации искомого управления. В рассматриваемом случае, т. е. при определении программы управления, дело обстоит просто — здесь никакой информации для реализации управления использовать не предполагается. При решении в последующем задачи синтеза это обстоятельство является принципиальным.