Основные понятия. Решение многих задач промысла можно разделить на этапы, или шаги, последовательность которых представляет весь процесс принятия в целом

Решение многих задач промысла можно разделить на этапы, или шаги, последовательность которых представляет весь процесс принятия в целом. каждый этап позволяет выбор различных действий, называемых у п р а в л е н и я м и, каждое из которых, переводит процесс принятия решений на следующий этап и может быть оценено некоторой функцией –выигрышем. Цель, преследуемая в задаче, - максимизация этой функции в целом после всех этапов принятия решений. Критерий эффективности для такого рода задач должен обладать свойством а д д и т и в н о с т и, т.е. эффективность всего решения (полного набора управлений по всем этапам) должна быть равной сумме эффективностей решений на каждом этапе. При этом, если принимается некое управление на i-м этапе, то оценка его эффективности не зависит от того, каким образом решение задачи подошло к такому моменту.

задачи, удовлетворяющие указанным условиям, решаются методом – д и н а м и ч е с к о г о п р о г р а м м и р о в а н и я. Это – особый метод, вытекающий из общей теории оптимального управления, разработанной коллективом математиков во главе с академиком Л.С. Понтрягиным. Однако заслуга в разработке динамического программирования принадлежит Р. Беллману. Название «динамическое», не очень удачное, поскольку слово «динамическое» предполагает какое-то движение исследуемого объекта. В то же время задачи, к которым прилагается метод, могут быть чисто статическими, а динамизм прививается им искусственно введением понятия ф а з о в о г о п р о с т р а н с т в а и оптимальной траектории в этом пространстве.

Все сказанное выше, нуждается в пояснении. Сначала сделаем это в абстрактной форме, а затем – на конкретных примерах.

Имеется некоторый объект (или система) S, у которого можно различать его с о с т о я н и я. Пусть можно как-то воздействовать на объект, заставляя его менять свои состояния. Такой объект будем называть у п р а в л я е м ы м объектом (или системой), а способ воздействия на него – у п р а в л е н и е м U. Пусть с объектом связана некоторая величина W, которую мы будем называть в ы и г р ы ш е м, так что каждому управлению соответствует своя величина выигрыша:

Задача состоит в том, чтобы найти Uопт, т.е. о п т и м а л ь н о е управление, при котором

Если при этом указаны начальное и конечное состояния объекта (системы), то рассматривается весь путь из начального в конечное состояние. В некоторых случаях конечное состояние явно не задается, а должно быть найдено по максимуму выигрыша.

Сказанное дает понятие об общей постановке задачи оптимизации управления.

Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями: