-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathPM7.tex
152 lines (129 loc) · 8.68 KB
/
PM7.tex
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
\documentclass[PM.tex]{subfiles}
\begin{document}
\chapter{Teoría Lagrangiana}
\section{Condiciones para problemas con restricciones de igualdad.}
Se desea resolver el problema
\begin{equation}\label{lagrange-prob}
\begin{aligned}
P: & \min
& & f(x) \\
& \text{s. a.}
& & h_i(x) = 0 & i = 1,2,\dots,m
\end{aligned}
\end{equation}
donde $f : \R^n \to \R$ y $h_i : \R^n \to \R^m$ son funciones diferenciables con continuidad. Por simplicidad $h(x) = (h_1(x),\dots,h_m(x))$.
A este problema (P) le asociamos una función, denominada función lagrangiana $L(x,λ) = f(x) + λ'h(x)$ que tiene la importante propiedad de que si $x^*$ es un mínimo local de (P), entonces existe un único multiplicador $λ^*$ de forma que:
\[ \nabla f(x^*) + \nabla h(x^*) λ^* = 0 \]
Nótese que si la intersección de las restricciones $h_i(x) = 0$ formaran un recinto convexo entonces podríamos utilizar las técnicas presentadas en el capítulo $3$ y $4$.
Lo que se va a desarrollar es una herramienta alternativa a los métodos iterados del tema anterior que se permitirá identificar los mínimos locales del problema \eqref{lagrange-prob}.
\begin{theorem} Sea $x^*$ un mínimo local de $f$ de $h(x) = 0$. Supongamos que las restricciones verifican $\nabla h_1(x^*),\dots,\nabla h_m(x^*)$ son linealmente independientes ($x^*$ es regular). Entonces existe un único vector
$λ^* = (λ^*_1, \dots, λ^*_m)$ tal que:
\[ \nabla f(x^*) + \sum_{i=1}^m λ^*_i \nabla h_i(x^*) = 0 \]
Si $f$ y $h$ son dos veces diferenciables con continuidad se tiene:
\[ y'(\nabla^2 f(x^*) + \sum_{i=1}^m λ^*_i \nabla^2 h_i(x^*))y ≥ 0 \quad \forall i = 1,\dots,m \quad y \in V(x^*) \]
\[ V(x^*) = \{y : \nabla h_i(x^*)'y = 0, \forall i = 1,\dots,m\} \]
\end{theorem}
La interpretación geométrica de la condición del teorema de multipicadores es que si $x^*$ es mínimo local de $(P)$, el gradiente de la función objetivo debe pertenecer al subespacio generado por los gradientes de las restricciones en $x^*$. Esto es, $\nabla f(x^*)+\nabla h(x^*) {λ^*}' = 0$. Igualmente se puede interpretar como que el gradiente de la función objetvio en el óptimo debe ser ortogonal al espacio de variaciones factibles de primer orden $V(x^*)$. La segunda condición es que el Hessiano de la Lagrangiana respecto a $x$ sea semidefinida positiva en el espacio de variaciones factibles de primer orden $V(x^*)$.
La condicion suficiente nos la da el siguiente teorema.
\begin{theorem} Sean $f$ y $h$ dos veces diferenciables con continuidad y sean $x^*$ y $λ^*$ tales que:
\begin{enumerate}
\item[i)] $\nabla_x L(x^*,λ^*) = 0$, $\nabla_{λ} L(x^*, λ^*) = 0$
\item[ii)] $y'\nabla^2_{xx} L(x^*, λ^*) y > 0$, $\forall y \neq 0$, $\nabla h(x^*)'y = 0$
\end{enumerate}
entonces $x^*$ es un mínimo local estricto de $f$ sujeto a $h(x) = 0$. De hecho, existen $γ > 0$, $ϵ > 0$ tales que:
\[ f(x) ≥ f(x^*) + \frac{γ}{2} {||x-x^*||}^2 \quad \forall x, h(x) = 0 \]
y
\[ ||x-x^*|| < ϵ \]
\end{theorem}
Los multiplicadores tienen una interpretación económica muy interesante. Se pueden entender como la tasa de cambiio del valor objetivo como función del lado derecho de las restricciones (nivel de las restricciones). Los precios sombra son el valor del multiplicador de Lagrange en el punto óptimo.
Lo veremos en el caso de un problema con una única restricción lineal.
\begin{equation}\label{lagrange-ejem}\begin{aligned}
P: & \min
& & f(x) \\
& \text{s. a.}
& & a'x = b
\end{aligned}\end{equation}
Supongamos que $x^*$, $λ^*$ son la solución óptima y el multiplicador óptimo. Si cambiamos $b$ a $b + \triangle b$ el mínimo cambiará a $x^* + \triangle x$. $\triangle b$ y $\triangle x$ están relacionados mediante
\[ a'(x^* + \triangle x) = b + \triangle b \]
entonces como $a'x^* = b$ se tiene
\[ a' \triangle x = \triangle b \]
Usemos la condición de Lagrange $\nabla f(x^*) = -λ^* a'$
\begin{align*}
\triangle \text{coste} & = f(x^* + \triangle x) - f(x^*)\\
& = \nabla f(x^*)' \nabla x + o(||\triangle x||)\\
& = - λ^* a' \triangle x + o(||\triangle x||)\\
& = - λ^* \triangle b + o(||\triangle x||)
\end{align*}
por tanto
\[ λ^* = -\frac{\triangle \text{coste}}{\triangle b} \]
hasta el orden $1$.
Este resultado es cierto en general para restricciones no necesarimente lineales, como puede verse en la proposición .
\section{Condiciones para problemas con desigualdades}
\[\begin{aligned}
& \min
& & f(x) \\
& \text{s. a.}
& & h_1(x) = 0,\dots,h_m(x) = 0\\
& & & g_1(x) ≤ 0, \dots, g_r(x) ≤ 0
\end{aligned}\]
que es equivalente al problema:
\begin{equation}\label{langcond-prob}\begin{aligned}
& \min
& & f(x) \\
& \text{s. a.}
& & h(x) = 0\\
& & & g(x) ≤ 0
\end{aligned}\end{equation}
En un punto $x$, $A(x) = \{j : g_j (x) = 0\}$ es el conjunto de restricciones activas.
Si $x^*$ es un mínimo local de \eqref{langcond-prob} es también un mínimo local del problema en el que las restricciones inactivas (no se da la igualdad) en $x^*$ se han eliminado. Por otra parte en el entorno de $x^*$ las restricciones activas (se da la igualdad) se pueden considerar como igualdades de manera que $x^*$ será un mínimo local de:
\begin{equation}\label{langcond-prob2}\begin{aligned}
& \min
& & f(x) \\
& \text{s. a.}
& & h(x) = 0\\
& & & g(x) = 0
\end{aligned}\end{equation}
Por tanto si $x^*$ es regular (los gradientes son l.i.) existirán multiplicadores $λ^* = (λ^*_1,\dots,λ^*_m)$ y $μ^*_j$ $\forall j \in A(x^*)$ tales que:
\[ \nabla f(x^*) + \sum_{i=1}^m λ^*_i \nabla h_i(x^*) + \sum_{j \in A(x^*)} μ^*_j \nabla g_j(x^*) = 0 \]
y si asociamos $μ^*_j = 0$ $\forall j \notin A(x^*)$ tendríamos una definición similar a la del caso con igualdades.
\[ \nabla f(x^*) + \sum_{i=1}^m λ^*_i \nabla h_i(x^*) + \sum_{j=1}^r μ^*_j \nabla g_j(x^*) = 0 \]
\[ μ^*_j = 0 \ \forall j \notin A(x^*) \]
Véase que esta última condición, llamada \emph{condición de holgura complementaria} también se puede escribir como $µ^*_jg_j(x^*) = 0\ \forall j$.
Además se puede argumentar intuitivamente que los $μ^*_j$ son no negativos. En efecto, si consideramos $g_j(x) ≤ b_j$ con $b_j > 0$ el valor óptimo del problema será menor pues la región factible ha crecido. Por tanto como sabemos que $μ^*_j = \frac{-\triangle \text{ coste debido a }b_j}{b_j} > 0$ (pues $(\triangle\text{ coste debido a }b_j) ≤ 0$ y los $b_j > 0$).
A continuación daremos un enunciado riguroso.
\begin{theorem} Sea $x^*$ un mínimo local de \eqref{langcond-prob} y $x^*$ es regular. Entonces existen multiplicadores únicos $λ^* = (λ^*_1,\dots,λ^*_m)$, $μ^* = (μ^*_1,\dots,μ^*_r)$ tales que:
\[ \nabla_x L(x^*,λ^*,μ^*) = 0 \]
\[ μ^*_j ≥ 0 \ \forall j\]
\[ μ^*_j = 0 \ \forall j \notin A(x^*) \]
donde $A(x^*) = \{j : g_j(x^*) = 0\}$. Si además las funciones son dos veces diferencibales con continuidad se verifica que
\[ y' \nabla^2_{xx} L(x^*, λ^*, μ^*) y ≥ 0, \ \forall y \in V(x^*) \]
donde $V(x^*) = \{y | \nabla h_i(x^*)' y = 0\ \forall i, \nabla g_j(x^*)'y = 0\ \forall j \in A(x^*)\}$.
\end{theorem}
\begin{prop}[Condición suficiente de segundo orden (o KKT)]
Supongamos que $f$, $h$ y $g$ son dos veces diferenciables con continuidad, y sean $x^* \in \R^n$, $λ^* \in \R^m$ y $μ^* \in \R^r$ satisfaciendo:
\[ \nabla_x L(x^*, λ^*, μ^*) = 0, \ h(x^*) = 0, \ g(x^*) ≤ 0 \]
\[ μ^*_j ≥ 0, \ j=1,\dots,r \]
\[ μ^*_j = 0, \ j \notin A(x^*) \]
\[ y' \nabla^2_{xx} L(x^*, λ^*, μ^*) y > 0, \text{ para todo }y\neq 0\text{ con }y \in V(x^*) \]
donde
\[ V(x^*) = \{y | \nabla h_i(x^*)y' = 0,\ i = 1,\dots,m, \nabla g_j(x^*)'y = 0, j \in A(x^*)\} \]
Asumimos también que
\[ μ^*_j > 0, \ \forall j \in A(x^*) \]
Entonces $x^*$ es un mínimo local estricto de $f$ sujeto a $h(x) = 0$, $g(x) ≤ 0$.
\end{prop}
Esta última condición es conocida como la \emph{condición de complementariedad estricta}.
\begin{example}
\[\begin{aligned} & \min & & x_1+x_2+x_3\\ & \text{s.a.} & & x_1^2+4x_2^2+9x_3^2 ≤ 1 \end{aligned}\]
Tomando el Lagrangiano (podemos usar $+λ$ ó $-λ$ indistintivamente):
\[ L(x,λ) = f(x)-λg(x) = x_1+x_2+x_3 - λ(x_1^2+4x_2^2+9x_3^2 - 1) \]
\[ \frac{\partial L}{\partial x} = \begin{pmatrix}1-2λx_1\\1-8λx_2\\1-18λx_3\end{pmatrix} = \begin{pmatrix}0\\0\\0\end{pmatrix}\]
Por tanto $λ \neq 0$. Despejando:
\[ x_1 = \frac{1}{2λ}, \quad x_2 = \frac{1}{8λ}, \quad x_3 = \frac{1}{18λ} \]
Como se debe verificar la condición de holgura complementaria:
\[ λg(x) = λ(x_1^2+4x_2^2+9x_3^2-1) = 0 \]
Dividiendo por $λ$ y sustituyendo:
\[ \left(\frac{1}{2λ}\right)^2+4 \left(\frac{1}{8λ}\right)^2+9\left(\frac{1}{18λ}\right)^2 = 1 \Rightarrow λ = \pm \frac{42}{72} = \pm \frac{7}{12} \]
Elegimos el $λ < 0$ para minimizar $x_1+x_2+x_3$. Así pues, el mínimo es:
\[ x_1 = -\frac{6}{7}, \quad x_2 = -\frac{3}{14}, \quad x_3 = -\frac{6}{63} \]
\end{example}
\end{document}