Разберите задачу на нахождение точки минимума функции двух переменных с ограничением (задача Лагранжа): дайте критерии применимости метода множителей Лагранжа и проанализируйте случаи вырождения ограничений
Задача. Минимизировать функцию f:Rn→Rf:\mathbb{R}^n\to\mathbb{R}f:Rn→R при равенствах-ограничениях gi(x)=0, i=1,…,mg_i(x)=0,\; i=1,\dots,mgi(x)=0,i=1,…,m. Обозначим вектор ограничений g=(g1,…,gm)Tg=(g_1,\dots,g_m)^Tg=(g1,…,gm)T. 1) Метод множителей Лагранжа — формулировка - Лагранжиан L(x,λ)=f(x)−∑i=1mλigi(x),
L(x,\lambda)=f(x)-\sum_{i=1}^m\lambda_i g_i(x), L(x,λ)=f(x)−i=1∑mλigi(x),
где λ=(λ1,…,λm)\lambda=(\lambda_1,\dots,\lambda_m)λ=(λ1,…,λm) — множители Лагранжа. - Необходимые условия стационарности (первые производные): ∇xL(x∗,λ∗)=∇f(x∗)−∑i=1mλi∗∇gi(x∗)=0,g(x∗)=0.
\nabla_x L(x^*,\lambda^*)=\nabla f(x^*)-\sum_{i=1}^m\lambda_i^*\nabla g_i(x^*)=0,\qquad g(x^*)=0. ∇xL(x∗,λ∗)=∇f(x∗)−i=1∑mλi∗∇gi(x∗)=0,g(x∗)=0.
Иными словами градиент fff в точке экстремума лежит в линейной оболочке градиентов ограничений. 2) Критерии применимости (условия корректности вывода множителей) - Стандартное условие (LICQ): матрица Якоби Dg(x∗)=[∇g1(x∗),…,∇gm(x∗)]TDg(x^*)=[\nabla g_1(x^*),\dots,\nabla g_m(x^*)]^TDg(x∗)=[∇g1(x∗),…,∇gm(x∗)]T имеет ранг mmm. Тогда при достаточно гладких f,gif,g_if,gi любая точка локального экстремума удовлетворяет уравнениям Лагранжа (существуют λ∗\lambda^*λ∗), и λ∗\lambda^*λ∗ уникальны. - Если LICQ не выполняется, стандартная теорема о существовании множителей не гарантирует λ\lambdaλ. Могут существовать множители, но они не уникальны и/или дополнительные квалификационные условия (MFCQ, CRCQ и т.д.) нужны для теоретического обеспечения. 3) Вторые производные — достаточное и необходимое условия - Обозначим матрицу Гессиана Лагранжиана по xxx: H=∇xx2L(x∗,λ∗)=∇2f(x∗)−∑i=1mλi∗∇2gi(x∗).
H=\nabla^2_{xx}L(x^*,\lambda^*)=\nabla^2 f(x^*)-\sum_{i=1}^m\lambda_i^*\nabla^2 g_i(x^*). H=∇xx2L(x∗,λ∗)=∇2f(x∗)−i=1∑mλi∗∇2gi(x∗).
- Ещё определим касательное подпространство к многообразию ограничений: T={v∈Rn: Dg(x∗) v=0}(то есть ∇gi(x∗)Tv=0, ∀i).
T=\{v\in\mathbb{R}^n:\ Dg(x^*)\,v=0\}\quad(\text{то есть } \nabla g_i(x^*)^T v=0,\ \forall i). T={v∈Rn:Dg(x∗)v=0}(тоесть∇gi(x∗)Tv=0,∀i).
- Необходимое условие: для любого v∈Tv\in Tv∈T выполняется vTHv≥0.
v^T H v \ge 0. vTHv≥0.
- Достаточное условие строгого локального минимума: для любого ненулевого v∈Tv\in Tv∈TvTHv>0.
v^T H v >0. vTHv>0.
- Альтернативно используют бордерную (bordered) матрицу, но практичнее проверять положительную определённость квадратичной формы vTHvv^T H vvTHv на TTT. 4) Анализ вырождения ограничений (ранг Dg(x∗)<mDg(x^*)<mDg(x∗)<m) Классификация и приёмы: - Случай 1 — некоторые ограничения избыточны (линейно зависимые градиенты), но множество допустимых точек локально всё ещё гладкое многообразие кодимензии r=rankDg(x∗)r=\operatorname{rank}Dg(x^*)r=rankDg(x∗). Действия: исключить зависимые ограничения (найти независимый набор), применить метод Лагранжа к независимому набору. Множители при этом не уникальны в исходной постановке. - Случай 2 — ранга нет (не удаётся получить локальную параметризацию через неявную функцию): множество допустимых точек может иметь сингулярность (узел, самопересечение, кут). Тогда: - не действует обычная неявная функция; нельзя гарантировать существование λ\lambdaλ; - применяют параметризацию вручную (если возможно) и сводят задачу к неограниченному минимуму по параметрам; - если градиенты исчезают, нужно исследовать старшие по порядку члены разложения Тейлора вдоль возможных направлений: найти наименьший порядок kkk с ненулевыми производными и сравнить соответствующие однородные формы (анализ высших порядков). - Общие методы при вырождении: удалить избыточные ограничения; перейти к параметрическому описанию допустимого множества; использовать метод штрафов/аугментированные Лагранжианы для численной аппроксимации; применять общие условные оптимизационные критерии (KKT) с соответствующими квалификационными условиями. 5) Практическая последовательность решения - Записать LLL, решить систему ∇xL=0, g=0\nabla_x L=0,\ g=0∇xL=0,g=0. Проверить ранг DgDgDg в найденных точках. - Если rankDg=m \operatorname{rank}Dg=mrankDg=m, применить вторые условия на TTT (проверить vTHvv^T H vvTHv на TTT). - Если ранг меньше — попытаться устранить зависимость ограничений или параметризовать множество ограничений; если это невозможно, исследовать старшие порядки в направлении касательной (анализ по Тейлору). Кратко: метод множителей Лагранжа даёт необходимые условия при гладкости; для гарантии существования и уникальности множителей нужна независимость градиентов (LICQ). Для достаточности минимума проверяют положительную определённость Гессиана Лагранжиана на касательном подпространстве. Вырождение градиентов требует устранения избыточности, параметризации или анализа высших порядков.
1) Метод множителей Лагранжа — формулировка
- Лагранжиан
L(x,λ)=f(x)−∑i=1mλigi(x), L(x,\lambda)=f(x)-\sum_{i=1}^m\lambda_i g_i(x),
L(x,λ)=f(x)−i=1∑m λi gi (x), где λ=(λ1,…,λm)\lambda=(\lambda_1,\dots,\lambda_m)λ=(λ1 ,…,λm ) — множители Лагранжа.
- Необходимые условия стационарности (первые производные):
∇xL(x∗,λ∗)=∇f(x∗)−∑i=1mλi∗∇gi(x∗)=0,g(x∗)=0. \nabla_x L(x^*,\lambda^*)=\nabla f(x^*)-\sum_{i=1}^m\lambda_i^*\nabla g_i(x^*)=0,\qquad g(x^*)=0.
∇x L(x∗,λ∗)=∇f(x∗)−i=1∑m λi∗ ∇gi (x∗)=0,g(x∗)=0. Иными словами градиент fff в точке экстремума лежит в линейной оболочке градиентов ограничений.
2) Критерии применимости (условия корректности вывода множителей)
- Стандартное условие (LICQ): матрица Якоби Dg(x∗)=[∇g1(x∗),…,∇gm(x∗)]TDg(x^*)=[\nabla g_1(x^*),\dots,\nabla g_m(x^*)]^TDg(x∗)=[∇g1 (x∗),…,∇gm (x∗)]T имеет ранг mmm. Тогда при достаточно гладких f,gif,g_if,gi любая точка локального экстремума удовлетворяет уравнениям Лагранжа (существуют λ∗\lambda^*λ∗), и λ∗\lambda^*λ∗ уникальны.
- Если LICQ не выполняется, стандартная теорема о существовании множителей не гарантирует λ\lambdaλ. Могут существовать множители, но они не уникальны и/или дополнительные квалификационные условия (MFCQ, CRCQ и т.д.) нужны для теоретического обеспечения.
3) Вторые производные — достаточное и необходимое условия
- Обозначим матрицу Гессиана Лагранжиана по xxx:
H=∇xx2L(x∗,λ∗)=∇2f(x∗)−∑i=1mλi∗∇2gi(x∗). H=\nabla^2_{xx}L(x^*,\lambda^*)=\nabla^2 f(x^*)-\sum_{i=1}^m\lambda_i^*\nabla^2 g_i(x^*).
H=∇xx2 L(x∗,λ∗)=∇2f(x∗)−i=1∑m λi∗ ∇2gi (x∗). - Ещё определим касательное подпространство к многообразию ограничений:
T={v∈Rn: Dg(x∗) v=0}(то есть ∇gi(x∗)Tv=0, ∀i). T=\{v\in\mathbb{R}^n:\ Dg(x^*)\,v=0\}\quad(\text{то есть } \nabla g_i(x^*)^T v=0,\ \forall i).
T={v∈Rn: Dg(x∗)v=0}(то есть ∇gi (x∗)Tv=0, ∀i). - Необходимое условие: для любого v∈Tv\in Tv∈T выполняется
vTHv≥0. v^T H v \ge 0.
vTHv≥0. - Достаточное условие строгого локального минимума: для любого ненулевого v∈Tv\in Tv∈T vTHv>0. v^T H v >0.
vTHv>0. - Альтернативно используют бордерную (bordered) матрицу, но практичнее проверять положительную определённость квадратичной формы vTHvv^T H vvTHv на TTT.
4) Анализ вырождения ограничений (ранг Dg(x∗)<mDg(x^*)<mDg(x∗)<m)
Классификация и приёмы:
- Случай 1 — некоторые ограничения избыточны (линейно зависимые градиенты), но множество допустимых точек локально всё ещё гладкое многообразие кодимензии r=rankDg(x∗)r=\operatorname{rank}Dg(x^*)r=rankDg(x∗). Действия: исключить зависимые ограничения (найти независимый набор), применить метод Лагранжа к независимому набору. Множители при этом не уникальны в исходной постановке.
- Случай 2 — ранга нет (не удаётся получить локальную параметризацию через неявную функцию): множество допустимых точек может иметь сингулярность (узел, самопересечение, кут). Тогда:
- не действует обычная неявная функция; нельзя гарантировать существование λ\lambdaλ;
- применяют параметризацию вручную (если возможно) и сводят задачу к неограниченному минимуму по параметрам;
- если градиенты исчезают, нужно исследовать старшие по порядку члены разложения Тейлора вдоль возможных направлений: найти наименьший порядок kkk с ненулевыми производными и сравнить соответствующие однородные формы (анализ высших порядков).
- Общие методы при вырождении: удалить избыточные ограничения; перейти к параметрическому описанию допустимого множества; использовать метод штрафов/аугментированные Лагранжианы для численной аппроксимации; применять общие условные оптимизационные критерии (KKT) с соответствующими квалификационными условиями.
5) Практическая последовательность решения
- Записать LLL, решить систему ∇xL=0, g=0\nabla_x L=0,\ g=0∇x L=0, g=0. Проверить ранг DgDgDg в найденных точках.
- Если rankDg=m \operatorname{rank}Dg=mrankDg=m, применить вторые условия на TTT (проверить vTHvv^T H vvTHv на TTT).
- Если ранг меньше — попытаться устранить зависимость ограничений или параметризовать множество ограничений; если это невозможно, исследовать старшие порядки в направлении касательной (анализ по Тейлору).
Кратко: метод множителей Лагранжа даёт необходимые условия при гладкости; для гарантии существования и уникальности множителей нужна независимость градиентов (LICQ). Для достаточности минимума проверяют положительную определённость Гессиана Лагранжиана на касательном подпространстве. Вырождение градиентов требует устранения избыточности, параметризации или анализа высших порядков.