Выпуклость функции многих переменных

Функция f(X), заданная в выпуклой области, называется выпуклой вниз (вверх), если для любых точек Х(1), Х(2) из области ее определения и любого числа 0 1 выполняется:

f( X(1) + (1- (2)) () f(X(1)) + (1- )f(Х(2))

Для функции одной переменной это означает, что выпуклая вверх функция лежит выше отрезка, соединяющего любые две точке ее графика, а выпуклая вниз – ниже.

Определение выпуклой функции уже давалось ранее при изучении исследования функций с помощью дифференциального счисления, только вместо формулы отрезка использовалась формула, определяющая середину отрезка (см. рисунок 3.7).

Если неравенства в определении выполняются, как строгие, то функция называется строго выпуклой. В соответствии с этим определением линейная функция является нестрого выпуклой одновременно вверх и вниз.

Для выпуклой функции равенство нулю частных производных является не только необходимым, но и достаточным условием экстремума. Т.е. если функция является строго выпуклой на всей рассматриваемой области, и получена стационарная точка, то в ней достигается глобальный максимум (при выпуклости вверх) или минимум (при выпуклости вниз).

Для отыскания глобального максимума (наибольшего значения) выпуклой вниз функции или глобального минимума (наименьшего значения) выпуклой вверх функции достаточно исследования экстремумов только на границе области определения.

Условный экстремум

Рассмотренные выше ситуации поиска локальных и глобальных экстремумов представляли собой задачи нахождения безусловных экстремумов, или задачи безусловной оптимизации. Если на аргументы функции наложены некоторые дополнительные ограничениями в форме равенств, то задача оптимизации превращается в задачу на условный экстремум.

Такую задачу можно записать в общем виде следующим образом:

или ,

где Х=(х1, х2,... хn), а выражения gi(X) = bi называют уравнениями связи, m – число таких уравнений (запись означает, что система имеет вид ).

Если есть возможность выразить из ограничений задачи m переменных через (n-m) остальных, то тривиальным подходом к решению является подстановка этих переменных в целевую функцию и далее безусловная оптимизация полученной функции.

Если такой возможности нет, то для нахождения условного экстремума в математическом анализе используют метод множителей Лагранжа. Он состоит в том, что строится функция Лагранжа, имеющая следующий вид:

L(x1,..., xn, l1,..., lm) = f(x1,..., xn) + li (bi - gi(x1,..., xn)),

где li, - множители Лагранжа.

Можно доказать, что если задача на условный экстремум имеет решение в некоторой точке, то существуют такие значения множителей Лагранжа, что вместе с координатами этой точки они будут представлять собой точку экстремума функции Лагранжа. Поэтому для решения задачи достаточно провести исследование на экстремум функции Лагранжа.


Понравилась статья? Добавь ее в закладку (CTRL+D) и не забудь поделиться с друзьями:  




Подборка статей по вашей теме: