Ale 2
Ale 2
Ale 2
Extremos
Contenido
2.1. Desarrollo de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.1. Fórmula de Taylor y aplicaciones en una variable . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
2.1.2. El desarrollo de Taylor multidimensional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
2.1.3. Series de Taylor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2. Máximos y mı́nimos relativos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.2.1. Matrices definidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
2.2.2. Índice de formas cuadráticas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2.3. Puntos crı́ticos no degenerados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2.3. Extremos condicionados. Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . . . . . 15
2.3.1. La regla del multiplicador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15
Ejercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
P (k (a)
bk = , k = 0, 1, 2, . . . , n.
k!
Ası́
n
X P (k (a)
P (x) = (x − a)k . (2.1)
k!
k=0
La expresión de los coeficientes bk tiene sentido si consideramos una función f con suficientes derivadas
en un punto dado a ∈ R, pero no cabe esperar una identidad como (2.1) en general -¡esto implicarı́a que
toda función suficientemente regular serı́a un polinomio!- Sin embargo, como veremos en el apartado 2.1.3,
la versión de (2.1) para n → ∞ es cierta en ciertas circunstancias.
Nótese que
f (k (a) = Pn,a
(k
(a)
para todo k = 0, 1, 2, . . . , n y que, por lo anteriormente expuesto, dicho polinomio es el único de grado ≤ n
que satisface esta propiedad.
El Teorema de Taylor se obtiene de un resultado más general que, a su vez, es una extensión del
Teorema de Cauchy.
Teorema 2.1 (Cauchy generalizado). Sean f y g dos funciones con derivadas n-ésimas f (n y g (n en
un intervalo abierto (a, b) y derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ [a, b].
Entonces, para todo x ∈ [a, b], x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
! n−1
!
X f (k (c) X g (k (c)
f (x) − (x − c)k g (n (ξ) = f (n (ξ) g(x) − (x − c)k
k! k!
k=0 k=0
Demostración. Sin pérdida de generalidad supongamos c < x. Para x fijo sean F y G las funciones
n−1
X f (k (t)
F (t) = f (t) + (x − t)k
k!
k=1
n−1
X g (k (t)
G(t) = g(t) + (x − t)k
k!
k=1
para t ∈ [c, x]. Puesto que F y G son continuas en [c, x] y derivables en (c, x), de acuerdo con el Teorema de
los incrementos finitos, existe ξ ∈ (c, x) para el que
o
F 0 (ξ) g(x) − G(c) = G0 (ξ) f (x) − F (c) ,
(2.2)
ya que F (x) = f (x) y G(x) = g(x).
De la expresión que define F tenemos
n−1
f (n (t)
0 0
X 1 (k+1
F (t) = f (t) + f (t)(x − t)k − kf (k (t)(x − t)k−1 = f 0 (t) + (x − t) n−1 0
− f (t)
k! (n − 1)!
k=1
f (n (t)
= (x − t)n−1
(n − 1)!
ya que los sumandos se cancelan mutuamente. Análogamente,
g (n (t)
G0 (t) = (x − t)n−1 .
(n − 1)!
En particular, con g(x) = (x − c)n se deduce el siguiente Teorema (nótese que g (k (c) = 0, k =
0, 1, . . . , n − 1 y g (n (c) = n!)
Teorema 2.2 (Taylor). Sea f una función que admita derivada n-ésima en el intervalo abierto (a, b) y
derivadas hasta orden (n − 1) continuas en [a, b]. Supongamos que c ∈ (a, b). Entonces, para todo x ∈ [a, b],
x 6= c, existe ξ en el interior del intervalo que une c con x tal que
n−1
X f (k (c) f (n (ξ)
f (x) = f (c) + (x − c)k + (x − c)n (2.3)
k! n!
k=1
2
Curso 21/22 MMII Aproximación local. Extremos
Definición 2.1. Como ya hemos mencionado, en las hipótesis del Teorema 2.2, el polinomio
En la figura 2.1 se muestran los 4 primeros polinomios de Maclaurin para la función f (x) = sen x+cos x
en el intervalo [−π, π]. Obsérvese como convergen sus gráficas a medida que n crece ...
y P1 (x) = 1 + x
| |
π
x
−π
x2
P2 (x) = 1 + x − 2!
f (x) = senx + cosx
x2 x3 x4
P4 (x) = 1 + x − 2!
− 3!
+ 4!
x2 x3
P3 (x) = 1 + x − 2!
− 3!
En este apartado estableceremos la versión integral de (2.3). Para ello necesitaremos la siguiente regla
de derivación de Leibniz
Proposición 2.1 (Regla de derivación de Leibniz). Sea f : [a, b] × [c, d] → R una función C 1 y
α, β : [a, b] → [c, d] dos funciones C 1 tales que α ≤ β. Entonces, la función
1
ˆ β(λ)
F (λ) : = f (λ, x)dx
α(λ)
es C 1 en [a, b] y
ˆ β(λ)
∂f
F 0 (λ) = β 0 (λ)f (λ, β(λ)) − α0 (λ)f (λ, α(λ)) + (λ, x)dx. (2.4)
α(λ) ∂λ
3
Curso 21/22 MMII Aproximación local. Extremos
Demostración. De (2.4), si ˆ x
1
u(x) = (x − t)n−1 f (n (t)dt
(n − 1)! c
tenemos
ˆ x
1
u0 (x) = (x − t)n−2 f (n (t)dt ⇒ u0 (c) = 0
(n − 2)! c
ˆ x
1
u00 (x) = (x − t)n−3 f (n (t)dt ⇒ u00 (c) = 0
(n − 3)! c
..
.
ˆ x
(n−1
u (x) = f (n (t)dt ⇒ u(n−1 (c) = 0
c
u(n (x) = f (n (x) ← para todo x ∈ [a, b]
y por tanto f − u es un polinomio de grado a lo sumo n − 1 que debe ser igual al de Taylor de f en c. Esto
es exactamente (2.5). t
u
4
Curso 21/22 MMII Aproximación local. Extremos
es la única que satisface u(n = f en [a, b] y las condiciones iniciales u(a) = u0 (a) = u00 (a) = . . . = u(n−1 (a) =
0. Además, la única solución de la ecuación u(n = f tal que u(a) = ξ0 , u0 (a) = ξ1 , . . . , u(n−1 (a) = ξn−1 es
n−1 ˆ x
X ξk 1
u(x) = (x − a)k + (x − t)n−1 f (t)dt.
k! (n − 1)! a
k=0
Observación 2.1. 1. Nótese que por el Teorema del valor medio integral
ˆ x ˆ x
1 f (n (ξ) f (n (ξ) t=x f (n (ξ)
(x − t)n−1 f (n (t)dt = (x − t)n−1 dt = − (x − t)n = (x − c)n
(n − 1)! c (n − 1)! c n! t=c n!
para algún ξ en el intervalo que une c con x. Ası́, (2.5) implica (2.3).
2. La segunda parte del corolario 2.1 muestra que el espacio de soluciones de la ecuación diferencial ho-
mogénea u(n = 0 forma un espacio vectorial de dimensión n para el que 1, x−a, (x−a)2 , . . . , (x−a)n−1
es una base. La solución general de la ecuación completa u(n = f se puede escribir como u = uh + up
donde ˆ x
1
up (x) = (x − t)n−1 f (t)dt
(n − 1)! a
(n
es una solución particular de la ecuación completa (satisface up = f ) y
n−1
X
uh (x) = ak (x − a)k
k=0
entonces
n−1 ˆ x
n−1
1 X
u0n (x) = (−1)j xn−1 f (x) + (n − 1 − j)xn−2−j tj f (t)dt
(n − 1)! j=0 j 0
n−1 ˆ x n−2
n−1 n − 2 n−2−j j
1 X 1 X
= (−1)j xn−1 f (x) + (−1)j x t f (t)dt
(n − 1)! j=0 j (n − 2)! a j=0 j
| {z } | {z }
(1−1)n−1 =0 (x−t)n−2
ˆ x
1
= (x − t)n−2 f (t)dt = un−1 (x)
(n − 2)! a
(k (k
si n ≥ 2. Por tanto un (x) = un−k (x) para k = 0, 1, . . . , n−1 y en particular, un (a) = 0 si k = 0, 1, . . . , n−1.
Además ˆ x
0 d
u(n
n (x) = u1 (x) = f (t)dt = f (x).
dx a
(1)
La Teorı́a de ecuaciones diferenciales ordinarias forman parte de los contenidos de la asignatura de grado Métodos
Matemáticos IV del primer cuatrimestre de segundo curso.
(2)
Aquı́, y en P
el
m cálculo siguiente, hemos usado (con a = −t, b = x y m = n − 2, n − 1) el binomio de Newton
m
(a + b)m =
j m−j
j
a b , válida para todo a, b ∈ R y m = 1, 2, . . .
j=0
5
Curso 21/22 MMII Aproximación local. Extremos
Supongamos que en un entorno del punto a ∈ R, la función f admita derivadas continuas hasta orden
ny
f 0 (a) = f 00 (a) = · · · = f (n−1 (a) = 0
pero f (n (a) 6= 0. La fórmula de Taylor nos permite escribir
f (n (ξ)
f (x) = f (a) + (x − a)n .
n!
Si x está próximo a a, ξ también lo estará y, por continuidad, f (n (ξ) tendrá el mismo signo que f (n (a). Por
tanto si n es par f tendrá en x = a un máximo o un mı́nimo relativo según sea f (n (a) < 0 o f (n (a) > 0
respectivamente. Si n es impar, se deduce que f (x) − f (a) cambia de signo dependiendo del lado de a en el
que nos encontremos. En este caso f presenta una inflexión en x = a.
Infinitésimos equivalentes
En el cálculo de lı́mites es usual utilizar infinitésimos, y a este respecto, para una función dada, el
Teorema de Taylor 2.2 permite encontrarlos. Si f es una función definida en un entorno de a ∈ R con
derivadas continuas hasta orden n + 1, entonces
donde,
n
X f (k (a)
Pn (x) = (x − a)k
k!
k=1
y por tanto,
f (x)
lı́m =1
x→a Pn (x)
ya que Pn tiene grado ≤ n.
x3
sen x ∼ x − ,
6
x2
cos x ∼ 1 − ,
2
ln(1 + x) ∼ x,
(1 + x)α ∼ 1 + αx (α ∈ R),
cuando x → 0.
Sean a ∈ Rn , r > 0 y f : B(a, r) ⊂ Rn → R una función real con derivadas continuas en B(a, r)
hasta orden N + 1. Entonces, para cada vector unitario ~v ∈ Rn , la función f~v : I~v ⊂ R → R definida en
I~v = {a + t~v / |t| < r} dada por
f~v (t) : = f (a + t~v )
admite derivadas continuas hasta orden N + 1.
El Teorema de Taylor unidimensional permite escribir
6
Curso 21/22 MMII Aproximación local. Extremos
(N
f~v00 (0) 2 f (0) N
f~v (t) = f~v (0) + f~v0 (0)t + t + · · · + ~v t + EN (t) (2.7)
2 N!
donde
EN (t)
lı́m = 0. (2.8)
t→0 tN
Ahora bien, para cada m = 1, 2, . . . , N ,
n
(m
X ∂ m f (a + t~v )
f~v (t) = vk vk · · · vkm ,
∂xk1 ∂xk2 · · · ∂xkm 1 2
k1 ,k2 ,...,km =1
por lo que
(m
X m
f~v (0) = ∂ α f (a)~v α ,
α
|α|=m
donde
n
α = (α1 , α2 , . . . , αn ) ∈ N ∪ {0} ,
|α| = α1 + α2 + · · · + αn ,
α! = α1 ! · α2 ! · . . . · αn !,
~v α = v1α1 · v2α2 · . . . · vnαn ,
m m!
=
α α!
y,
∂ |α| f
∂αf = αn .
∂xα α2
1 ∂x2 · · · ∂xn
1
m=0
m! α
|α|=m
x−a
Finalmente, haciendo ~v = |x−a| y t = |x − a| encontramos que
N X
X 1 m α
f (x) = ∂ f (a)(x − a)α + TN (x), (2.9)
m=0
m! α
|α|=m
con
1 X N +1 α
TN (x) = EN (|x − a|) = ∂ f (ζ)(x − a)α , (2.10)
(N + 1)! α
|α|=n+1
donde ζ = a + θ(x − a), (0 < θ < 1) es algún punto del segmento [a, x] \ {a, x}, para el que (2.8) se traduce
en
|TN (x)|
lı́m = 0.
x→a |x − a|N
7
Curso 21/22 MMII Aproximación local. Extremos
donde
1 X m α
fm (x) = ∂ f (a)(x − a)α
m! α
|α|=m
donde,
||∂ α f ||∞ = sup |∂ α f (x)| .
x∈B(a,r)
8
Curso 21/22 MMII Aproximación local. Extremos
lı́m f (k (x) = 0,
x→0
N
zk
P
ya que, de la desigualdad triangular, su sucesión de sumas parciales k! está mayorada por las
k=1
correspondientes en (2.17)
9
Curso 21/22 MMII Aproximación local. Extremos
N N
X z k X |z|k
≤ .
k! k!
k=0 k=0
Ası́, para θ ∈ R, con z = iθ
∞ ∞ k k ∞ ∞
X (iθ)k X i θ X i2m θ2m X i2m+1 θ2m+1
eiθ = = = +
k! k! m=0
(2m)! m=0
(2m + 1)!
k=0 k=0
∞ ∞
X θ2m X θ2m+1
= (−1)m +i (−1)m = cos θ + i sen θ
m=0
(2m)! m=0
(2m + 1)!
•
eiθ = cos θ + i sen θ
sen θ
θ
x
cos θ
Nota. Recordemos que la notación polar z = %θ de un número complejo z = x + iy ∈ C, significa que
% = |z| = x2 + y 2 es su módulo y θ = arg θ = arc tg xy su argumento. Equivalentemente,
p
)
x = % cos θ
.
y = % sen θ
Con relación a la fórmula de Euler podemos también escribir %θ = %eiθ . Considerar (%, θ) como nuevas
variables proporcionan las llamadas coordenadas polares.
Esta sección está dedicada al estudio local de aquellos puntos donde una función dada alcanza su
valor máximo o mı́nimo tanto en el caso libre como para el caso de extremos condicionados. En el caso
unidimensional, éstos se encuentran igualando a cero la primera derivada para luego, haciendo uso de la
segunda, decidir (cuando el método lo permita) si son máximos o mı́nimos.
El análogo multidimensional es similar, pero el estudio local usando la segunda derivada es un poco
más sutil. En este caso, para una función de varias variables f , la ecuación que deben satisfacer los puntos
crı́ticos es ∇f = 0 que, en el caso de n variables, realmente es un sistema de n ecuaciones con n incógnitas,
y su segunda derivada es ahora una matriz de orden n × n (la matriz hessiana).
Además, al contrario que en una variable, podemos considerar problemas máx/mı́n con restricciones,
es decir, problemas en los que las variables están sujetas a alguna relación a priori. La idea fundamental se
presenta como la regla del multiplicador y proporciona el conocido método de los multiplicadores de Lagrange.
Definición 2.2. Sea f una función real definida en un abierto Ω ⊂ Rn y a ∈ Ω. Decimos que f tiene un
máximo relativo o local en a si existe r > 0 tal que B(a, r) ⊂ Ω y f (x) ≤ f (a) para todo x ∈ B(a, r).
De igual forma, a es un mı́nimo relativo o local de f si existe una bola B(a, r) ⊂ Ω tal que f (a) ≤ f (x) para
cualquier x ∈ B(a, r).
10
Curso 21/22 MMII Aproximación local. Extremos
~u 6= 0. Por tanto, f (x) ≥ f (a) + γ4 |x − a|2 si x 6= a, lo que significa que a es un mı́nimo local estricto de f .
Por último, el caso que resta sigue de éste aplicado a la función la función −f . t
u
Observación 2.5. La relevancia de la Proposición anterior queda de manifiesto con el ejemplo siguiente:
la función f (x, y) = 3x4 − 4x2 y + y 2 tiene un mı́nimo local en (0, 0) sobre cualquier recta que pase por
(0, 0). Sin embargo, f no tiene un mı́nimo local (bidimensional) en el origen. Para ver esto observemos
que, completandocuadrados, f se puede escribir como f (x, y) = (y − 2x2 )2 − x4 , por lo que el conjunto
2 2 2
D : ={f ≤ 0} = (x, y) ∈ R / x ≤ y ≤ 3x no contiene, cerca del origen, ninguna recta que pasa por él
(figura 2.3).
11
Curso 21/22 MMII Aproximación local. Extremos
x
m
=
D
y
x
Sea A = (aij ) una matriz cuadrada real de orden n × n y L su correspondiente transformación lineal.
Un real λ es un valor caracterı́stico o autovalor de L si la transformación L − λI es singular. Si L(~u) = λi ~u
y ~u 6= 0, ~u es un vector caracterı́stico o autovector correspondiente al autovalor λi . En general existen n
autovalores complejos λ1 , λ2 , . . . , λn contados con sus multiplicidades, y sus correspondientes autovectores
pueden, a su vez, tener componentes complejas.
Si A es simétrica A> = A (aij = aji para todo i, j = 1, 2, . . . , n), entonces todos los autovalores de A
son reales. De hecho cada uno está caracterizado por ser el valor de cierto máximo condicionado. Nótese
que A es simétrica si, y sólo si,
(L~u) · ~v = ~u · (L~v ) (2.18)
para todo ~u, ~v ∈ Rn .
Consideremos el polinomio cuadrático homogéneo
n
X
Q(~u) : = (L~u) · ~u = aij ui uj ,
i,j=1
λ1 : = máx{Q(~u) / ~u ∈ S1 },
y ~u1 ∈ S1 un vector donde se alcanza el máximo. Ahora veremos que λ1 es un autovalor de L para el que
~u1 es un autovector. Para ver esto primero observamos que
L ~u⊥ u⊥
1 ⊂~ 1 (2.19)
ya que, si ~v ∈ ~u⊥ , por la desigualdad de Cauchy aplicada a la forma cuadrática Q1 (~u) = λ1 |~u1 |2 − Q(~u) (que
es no negativa de la definición de λ1 ) tenemos
:0
|~v · L~u1 | = |λ1~v · ~u1 − ~v · L~u1 | ≤ |λ1 |~v |2 − Q(~v )|
1−
(λ Q(~
u 1 )| = 0
por lo que, L~v · ~u1 = ~v · L~ u1 = 0 y ası́ L~v ⊥ ~u1 . Ahora bien, ~v1 : = L~u1 − λ1 ~u1 ⊥ ~u1 ya que
λ1 = L~u1 · ~u1 ⇒ L~u1 − λ~u1 · ~u1 = 0 y por tanto
que significa que ~v1 = 0 o equivalentemente que L~u1 = λ1 ~u1 según querı́amos ver.
Sean ahora S2 = S1 ∩ ~u⊥
1 = {~
u ∈ S1 ~u ⊥ ~u1 } y ~u2 ∈ S2 tal que Q(~u2 ) = λ2 : = máx{Q(~u) ~u ∈ S2 }.
Por el mismo razonamiento anterior pero ahora trabajando en ~u⊥ n
1 en lugar de R vemos que ~ u2 es un
autovector de L con autovalor λ2 ≤ λ1 . Continuando de esta forma encontramos una base ortonormal
{~u1 , ~u2 , . . . , ~un } de Rn constituida de vectores propios de L.
Ası́ hemos probado
12
Curso 21/22 MMII Aproximación local. Extremos
Teorema 2.4. Toda matriz simétrica A es ortogonalmente diagonalizable, es decir, todos sus valores propios
son reales y existe una base ortonormal {~u1 , ~u2 , . . . , ~un } formada por vectores propios.
Si (x1 , x2 , . . . , xn ) denotan las componentes de un vector ~u en esta base, la forma cuadrática Q asociada
a A toma la forma
Q(~u) = λ1 x21 + λ2 x21 + · · · + λn x2n .
Corolario 2.2. Sea A una matriz cuadrada simétrica. Entonces, todos sus autovalores son reales y,
(i) A es definida positiva, esto es, (A~u) · ~u > 0 para todo ~u =
6 0 si, y sólo si, todos sus autovalores son
positivos.
(ii) A es definida negativa, esto es, (A~u) · ~u < 0 para todo ~u =6 0 si, y sólo si, todos sus autovalores son
negativos.
Demostración. Que (i) implica (ii) es inmediato de las relaciones de Cardano-Vieta(3) (que no son mas que
aquellas que resultan de escribir los coeficientes de p en término de sus raı́ces).
Recı́procamente, por hipótesis, los coeficientes del polinomio q(t) : = p(−t) tienen todos el mismo signo
y por tanto no tiene raı́ces positivas. Ası́, todas las raı́ces de p (que suponemos reales) deben ser positivas. t
u
13
Curso 21/22 MMII Aproximación local. Extremos
∂2f
= 2 + y 2 exy
∂x2
∂2f
∂x∂y = (1 + xy)exy ,
2
∂ f
= 2 + x2 exy
∂y 2
que evaluadas en el punto (0, 0) nos proporciona la matriz hessiana
21
Hf (0, 0) = .
12
Sus autovalores se calculan resolviendo la ecuación caracterı́stica
2 − λ 1
p(λ) =
= 0,
1 2 − λ
que es equivalente a (2 − λ)2 − 1 = 0 ⇔ λ = 1, 3. Ası́ Hf (0, 0) tiene sus dos autovalores > 0 (nótese los
cambios de signo en los coeficientes de p(λ) = λ2 − 4λ + 3 respecto al Corolario 2.3) y por tanto podemos
afirmar que (0, 0) es un mı́nimo local de f .
Nota. Puesto que et ≥ 1 + t para todo t ∈ R (¿por qué?),
(y + 2x)2 + 3y 2
f (x, y) = x2 + y 2 + exy ≥ x2 + y 2 + xy + 1 = + 1 ≥ 1 = f (0, 0)
4
para todo (x, y) ∈ R2 . Por tanto (0, 0) es un mı́nimo global de f .
14
Curso 21/22 MMII Aproximación local. Extremos
Definición 2.3. Al entero q en el Teorema 2.5 se le llama ı́ndice de la correspondiente forma cuadrática.
Observación 2.8. Si a no es degenerado y 0 < q < n, existen autovectores ~u± 6= 0 de Hf (a) asociados a
autovalores λ− < 0 < λ+ . Las funciones ϕ~u± (t) = f (a + t~u± ) entonces presentan, en t = 0, un máximo y un
mı́nimo local estricto respectivamente.
En el caso de dos variables (n = 2), los puntos crı́ticos no degenerados sólo pueden ser de tres tipos
dependiendo del signo de los autovalores λ1 , λ2 de Hf (a), a saber:
1. Máximos locales estrictos, si λ1 , λ2 < 0 (q = 2).
2. Mı́nimos locales estrictos, si λ1 , λ2 > 0 (q = 0).
3. Puntos de silla, si λ1 < 0 < λ2 (q = 1).
El origen (0, 0) es crı́tico no degenerado de ı́ndice q = 1 para la función f (x, y) = x2 − y 2 . Obsérverse
que
1 0
Hf (0, 0) = 2 ,
0 −1
y por tanto, ~u+ = ~i y ~u− = ~j con λ± = ±2 (la figura 2.4 muestra su geometrı́a local).
·
·
•
Observación 2.9. La condición suficiente para decidir si un punto crı́tico es máximo o mı́nimo local dada
en la Proposición 2.3 implica que éste no es degenerado. Sin embargo ésta se requiere para una silla.
Por otro lado, la misma geometrı́a local que se presenta en estos puntos crı́ticos puede darse en el caso
degenerado. Por ejemplo, (0, 0) es crı́tico para las funciones f (x, y) = x4 + y 4 y g(x, y) = x4 − y 4 para las
que Hf (0, 0) = Hg(0, 0) = ( 00 00 ) es la matriz nula. Obsérvese que (0, 0) es un mı́nimo para f , máximo para
−f y una silla para g.
Supongamos que queremos hallar los extremos, máximos o mı́nimos, de una función f : Ω ⊂ Rn → R
condicionados a que g(x) = 0, x ∈ Ω, donde g : Ω ⊂ Rn → R y ∇g(x) 6= 0 si g(x) = 0.
15
Curso 21/22 MMII Aproximación local. Extremos
Si en a ∈ Ω con g(a) = 0, f tiene un extremo condicionado, para cualquier curva γ : (−ε, ε) → Ω (ε > 0)
tal que g(γ(t)) = 0 y γ(0) = a, la función t ∈ (−ε, ε) → f (γ(t)) debe tener un extremo en t = 0. Como
sabemos, esto implica que
d
∇f (a) · γ 0 (0) = f (γ(t)) = 0,
dt t=0
Ahora observamos que la condición que debe satisfacer el vector γ 0 (0) es ∇g(a) · γ 0 (0) = dt
d
t=0
g(γ(t)) = 0.
Ası́ ∇f (a) debe ser perpendicular al espacio tangente a la “superficie” g = 0 en x = a o, equivalentemente,
paralelo a ∇g(a), esto es, debe existir λ ∈ R tal que ∇f (a) = λ∇g(a) (figura 2.5).
Por tanto, el sistema )
∇f (x) = λ∇g(x)
g(x) = 0
nos proporciona los puntos crı́ticos de f bajo la condición g = 0.
∇g
γ 0 (0)
•
a
∇f γ
g=0
Si en general hubiera más de una condición de ligadura, g1 (x) = g2 (x) = · · · = gd (x) = 0, 1 ≤ d < n (con
∇g1 (x), ∇g2 (x), . . . , ∇gd (x) independientes cuando g1 (x) = g2 (x) = · · · = gd (x) = 0), es decir, g : Ω → Rd
y g(x) = (g1 (x), g2 (x), . . . , gd (x)), el razonamiento anterior nos proporcionarı́a escalares λ1 , λ2 , . . . , λd ∈ R
para los que el sistema )
∇f (x) = λ1 ∇g1 (x) + λ2 ∇g2 (x) + · · · + λd ∇gd (x)
(2.22)
g1 (x) = g2 (x) = · · · = gd (x) = 0
debe ser satisfecho por los puntos crı́ticos en cuestión. Estos escalares se denominan multiplicadores de
Lagrange, y al vector de multiplicadores λ = (λ1 , λ2 , . . . , λd ) se le denomina simplemente multiplicador de
Lagrange.
Observación 2.10. De la primera ecuación en (2.22), cada punto crı́tico tiene asociado un único multiplicador
ya que los vectores ∇g1 , . . . , ∇gd son independientes cuando se evalúan sobre g1 = g2 = · · · = gd = 0.
Esta discusión sugiere introducir la función auxiliar F (x, λ) = f (x) − λ · g(x) = f (x) − λ1 g1 (x) −
λ2 g2 (x) − . . . − λd gd (x), con lo que el sistema (2.22) puede expresarse como ∇(x,λ) F (x, λ) = 0 con x ∈
Rn , λ = (λ1 , λ2 , . . . , λd ) ∈ Rd .
Del sistema anterior encontramos los puntos crı́ticos para el problema de optimización considerado. Si
x0 ∈ Rn tiene asociado el multiplicador λ0 ∈ Rd , particularizamos la función auxiliar F fijando λ = λ0 para
obtener la función de n variables
F0 (x) = f (x) − λ0 · g(x), (2.23)
la cual debemos estudiar en x0 . Si su hessiano resulta definido positivo o negativo, en x0 tendremos un
mı́nimo o un máximo relativo, respectivamente.
1
En caso de que este hessiano no sea definido hemos de estudiar su comportamiento en las direcciones
tangentes a g = 0 en el punto x0 . Esto quiere decir que si elegimos una base ortonormal ~u1 , ~u2 , . . . , ~un−d del
espacio tangente anterior y formamos el hessiano “restringido”
H{g=0} F0 (x0 ) = HF0 (x0 )~ui · ~uj ∈ M(n−d)×(n−d) (R), (2.24)
1≤i,j≤n−d
16
Curso 21/22 MMII Aproximación local. Extremos
F tendrá en x0 un mı́n . o un máx . local sobre g = 0 si H{g=0} F0 (x0 ) es > 0 ó < 0 respectivamente puesto
que la discusión anterior sigue igual con la matriz restringida atendiendo a la siguiente
∂F
Haciendo t = 0 y teniendo en cuenta que ∇F (x0 ) = 0 ⇔ ∂xk (x0 ) = 0, k = 1, 2, . . . , n, se tiene
n
d2 ∂2F
X
(x0 )γj0 (0)γk0 (0) = HF (x0 )γ 0 (0) · γ 0 (0).
2
F (γ(t)) = t
u
dt t=0
∂xj ∂xk
j,k=1
Observación 2.11. En el caso que nos ocupa, F = F0 sobre g = 0 y ∇F0 (x0 ) = 0 ya que λ0 es el multiplicador
asociado a x0 (2.22).
Observación 2.12. Puesto que las matrices asociadas a una forma cuadrática en diferentes bases son congruen-
tes, el Teorema 2.5 permite concluir que su carácter de positividad será independiente de la base elegida para
representarla. Por tanto, la base ~u1 , ~u2 , . . . , ~un−d del espacio tangente tras la Observación 2.10 no tiene que
ser necesariamente ortonormal, esto es, cualquier base será suficiente para representar el hessiano restringido
H{g=0} F0 (x0 ) en (2.24).
17
Curso 21/22 MMII Aproximación local. Extremos
Ejemplo 2.4 (Un problema en la granja). Presentamos un ejemplo intuitivo de esta clase de problemas. Su
enunciado es el siguiente:
Ha llegado el momento de ordeñar en una granja, y un granjero se dirige al campo para recoger la
leche del dı́a. Antes de ordeñar debe lavar su cubo en un rı́o cercano.
Justo cuando se encuentra en el punto P (figura 2.6) divisa una vaca en el punto Q. Como el granjero
tiene algo de prisa, quiere encontrar la forma mas rápida de ir al rı́o y luego hasta la vaca. Si el rı́o describe
una curva que satisface la ecuación g(x, y) = 0, ¿cuál es el camino más corto a tomar?
rı́o [g = 0]
M
•
•
Q
• f = cte
P
En términos matemáticos, el granjero quiere encontrar un punto M en el rı́o tal que dist(P, M ) +
dist(M, Q) sea mı́nima. Ası́, debemos minimizar la función f (M ) = dist(P, M ) + dist(M, Q) sujeta a la
condición g(M ) = 0.
Interpretación geométrica
Vamos a usar la siguiente propiedad de las elipses: para todo punto M en una elipse dada, la suma de
las distancias de M a sus focos es constante.
En nuestro problema, esto significa que el granjero puede llegar a la vaca en el mismo tiempo sobre
una elipse dada: las elipses son las curvas de nivel f = cte.
La figura 2.6 muestra una sucesión de elipses de tamaño creciente con focos en los puntos P y Q que
termina en aquélla que es tangente al rı́o. Aquı́ tangente es la propiedad crucial. En el punto de tangencia
de esta elipse crı́tica, su vector normal es perpendicular a g = 0 y por tanto ∇f (M ) paralelo a ∇g(M ). Este
es precisamente el contenido del apartado 2.3.1.
Ejemplo 2.5. En el plano euclı́deo hallar la mı́nima y máxima distancia del punto (2, 0) a la circunferencia
x2 + y 2 = 1.
En este ejemplo (trivial), la función objetivo es
Entonces f (θ) = (cos θ − 2)2 + sen 2 θ = 5 − 4cos θ. Derivando respecto a θ obtenemos df /dθ = 4sen θ que
se anula para θ = 0, π. Además d2 f /dθ2 (0) = 4 > 0 y d2 f /dθ2 (π) = −4 < 0 con lo que en θ = 0 habrá un
mı́nimo y en θ = π un máximo (aunque el punto θ = 0 no es interiorpal intervalo [0, 2π], lapfunción objetivo
es 2π periódica). Estos valores corresponden a la distancia mı́nima f (0) = 1 y máxima f (π) = 3.
18
Curso 21/22 MMII Aproximación local. Extremos
De aquı́ se obtienen los puntos crı́ticos P0 = (1, 0) con λ0 = −1 y P1 = (−1,0) con λ1 = 3. Para estudiar de
qué tipo son, consideramos la función auxiliar F0 (x, y) = F (x, y, λ0 ) para P0 y F1 (x, y) = F (x, y, λ1 ) para
P1 . Consecuentemente
Como !
40
HF0 (1, 0) = >0
04
es definida positiva encontramos que el punto P0 es un mı́nimo relativo de f condicionado a g = 0. El caso
P1 se trata de igual manera, pero ahora
!
−4 0
HF1 (−1, 0) = <0
0 −4
Ejemplo 2.6. Hallar las dimensiones del rectángulo inscrito en una circunferencia de radio a > 0 para que su
área sea máxima (figura 2.7).
Si denotamos por x e y los semilados del rectángulo que buscamos, el problema se traduce en maximizar
la función A(x, y) = 4xy sujeta a la condición g(x, y) = x2 + y 2 − a2 = 0. Por tanto la función de Lagrange
toma la forma
Φ(x, y, λ) = 4xy − λ(x2 + y 2 − a2 ),
y los puntos crı́ticos deben satisfacer
4y − 2λx = 0
4x − 2λy = 0 .
2 2 2
x +y = a
√ √ √ √
De aquı́ se sigue que los puntos crı́ticos son (±a/ 2, ±a/ 2) con λ = 2 y (±a/ 2, ∓a/ 2) ambos con
λ = −2 (notemos que el sistema lineal formado por las dos primeras ecuaciones debe, por la tercera, tener
solución no trivial y por tanto su matriz de coeficientes debe ser singular, es decir
−λ 2 2
2 −λ = 0 ⇔ λ = 4 ⇔ λ = ±2.
y sus autovalores son 0 y −8 independientemente del punto crı́tico considerado. Por tanto, la matriz hessiana
no es definida y debemos estudiar esta matriz restringida a las direcciones tangentes a la circunferencia
x2 + y 2 = a2 en los puntos crı́ticos. La recta tangente en un punto (x0 , y0 ) de esta circunferencia tiene como
ecuación x0 x + y0 y = a2 cuyo vector director es (−y0 , x0 ). Ası́
19
Curso 21/22 MMII Aproximación local. Extremos
√ !! √ !
√ √ −a/ 2 −a/ 2
HΦ0 (a/ 2, a/ 2) √ · √ = −8a2 < 0 (2.25)
a/ 2 a/ 2
√ √
√ (a/ 2,
y por tanto habrá un máximo local en √a/ 2).
Para el√ √ crı́tico (−a/ 2, −a/ 2) el tratamiento es similar y encontramos otro máximo local.
otro punto
En (a/ 2, −a/ 2) la función auxiliar Φ1 (x, y) = 4xy + 2(x2 + y 2 − a2 )tiene hessiano
!
44
HΦ1 (x, y) = ,
44
cuyos autovalores son 0 y 8 por lo que, de nuevo, se hace necesario estudiar el hessiano restringido. En este
caso, √ !! √ !
√ √ a/ 2 a/ 2
HΦ1 (a/ 2, −a/ 2) √ · √ = 8a2 > 0.
a/ 2 a/ 2
√ √
Ası́ (a/ 2, −a/ 2) es un mı́nimo local. De igual manera se trata el caso restante.
Por último, ambos casos considerados son simétricos y por esta razón tienen la misma naturaleza.
Observamos también que los mı́nimos ‘degenerados’ en (0, ±a) y (±a, 0) no aparecen, ya que en el plantea-
miento del problema hemos considerado la posibilidad de “áreas negativas”. Por la misma razón, estos cuatro
puntos crı́ticos determinan el mismo cuadrado: el área real es |A(x, y)| = 4|x| |y| con lo que los mı́nimos para
A representan máximos geométricos con valor |A|.
(x, y)
•
y a
x
x
Observación 2.13. Otro análisis para el estudio en el caso λ = 2 es el siguiente: los autovectores asociados a
1
la matriz HΦ0 se calculan encontrando las soluciones no triviales del sistema homogéneo
−4x + 4y = 0
4x − 4y = 0
20
Ejercicios
Problema 2.1. (a) Utilizando el desarrollo de Taylor, estimar el error que se comete al aproximar el número
1 1 1 (*)
e por 1 + 1 + 2! + 3! + 4! .
(b) Evaluar aproximadamente e0,1 estimando el error cometido.
(c) ¿Cuál es el grado óptimo (ell más pequeño) del polinomio de Maclaurin que aproxima la función f (x) = ex
en el intervalo [−1, 1] con error menor que 10−4 ?
Problema 2.2. Calcular aproximadamente los siguientes valores usando el polinomio de Taylor de orden
dos para las funcionas apropiadas en los puntos adecuados
(a) sen(0, 3)e−1,05 ,
(b) sen(0, 01) cos 0, 03).
Estimar el error cometido en ambos casos.
Problema 2.3. Determinar la fórmula de Taylor de segundo orden en (0, 0) para las siguientes funciones
(a) f (x, y) = (x + y)2 ,
(b) f (x, y) = 1−x12 −y2 ,
(c) f (x, y) = ex+y ,
2 2
(d) f (x, y) = e−x −y ,
(e) f (x, y) = sen xy + cos xy,
2
(f ) f (x, y) = e(1−x) cos y.
Problema 2.4. Se considera la parábola de ecuación y = 12 − x2 y el triángulo, en el primer cuadrante,
formado por la tangente a dicha curva (figura 2.8). Determinar el punto de tangencia para que el área de
dicho triángulo sea mı́nima.
•(a, 12 − a2 )
y = 12 − x2
a
x
(∗) 1 1 1
Para referencia: 1 + 1 + 2!
+ 3!
+ 4!
= 65/24 ≈ 2, 7083 y e ≈ 2, 71828182 . . .
Curso 21/22 MMII Aproximación local. Extremos
Problema 2.5. Calcular y clasificar los puntos crı́ticos de las siguientes funciones
(a) f (x, y) = x2 − 2xy + y 2 ,
(b) f (x, y) = log(1 + x2 + y 2 ),
(c) f (x, y) = x5 y + xy + xy 5 ,
(d) f (x, y) = x3 + y 2 − 6xy + 6x + 3y,
(e) f (x, y) = (y − 3x2 )(y − x2 ).
Problema 2.6. El precio de un diamante es proporcional al cuadrado de su peso. Demostrar que si un
diamante se rompe en dos hay pérdida de su valor y que ésta es máxima cuando las dos partes son iguales.
Problema 2.7. Un alambre de longitud ` se corta en dos trozos con los que se forman un cı́rculo y un
cuadrado. Hallar el corte que debe hacerse para que la suma de las áreas sea
(a) máxima,
(b) mı́nima.
Problema 2.8. (a) Probar que el paralelepı́pedo rectangular con área de superficie fija y volumen máximo
es un cubo.
(b) Inscribir en una esfera dada un cono recto de base circular y volumen máximo.
(c) ¿Qué cilindro de volumen dado tiene área lateral mı́nima?
1
Problema 2.9. Encontrar los puntos sobre la gráfica de la función f (x, y) = xy más cercanos al origen.
Problema 2.10. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
el disco unidad cerrado U : x2 + y 2 ≤ 1
(a) f (x, y) = (x4 + y 4 )2 ,
(b) f (x, y) = x5 y + xy + xy 5 .
Problema 2.11. Encontrar los valores máximo y mı́nimo absolutos que alcanzan las siguientes funciones en
los recintos indicados
(a) f (x, y) = sen x + cos y en R = [0, 2π]2 ,
(b) f (x, y) = xy en R = [−1, 1]2 .
Problema 2.12. Encontrar los extremos relativos de f Σ si
(a) f (x, y) = x2 + y 2 y Σ : y = 2,
(b) f (x, y) = x2 + y 2 y Σ : y ≥ 2,
(c) f (x, y) = x2 − y 2 y Σ : y = cos x,
(c) f (x, y, z) = x2 + y 2 + z 2 y Σ : z ≥ 2 + x2 + y 2 .
Problema 2.13. Usar el método de los multiplicadores de Lagrange para encontrar los extremos de las
siguientes funciones baja las restricciones señaladas
(a) f (x, y) = x, si x2 + 2y 2 = 3,
(b) f (x, y) = x − y, si x2 − y 2 = 2,
(c) f (x, y, z) = x − y + z, si x2 + y 2 + z 2 = 12,
(c) f (x, y, z) = x − y + z, si x2 − y 2 = 1 y 2x + z = 1.
Problema 2.14. Probar que la ecuación x2 + y 2 + z 2 + xy + 2z = 3 determina z como función de x e y en
un entorno del punto (0, 0, 1) donde z tiene un máximo local:
(a) considerando z = z(x, y) implı́citamente definida por la ecuación anterior,
(b) utilizando el método de los multiplicadores de Lagrange.
Problema 2.15. Usando el método de los multiplicadores de Lagrange, determinar las dimensiones de un
depósito descubierto con base circular y capacidad 16π m3 que minimicen el coste de material para su
construcción si el precio del m2 de la base es el doble que el de la pared lateral.
22
Curso 21/22 MMII Aproximación local. Extremos
Problema 2.16. (a) El perı́metro de un triángulo isósceles es 2τ . ¿Cuánto deben medir sus lados para que
el volumen del cono engendrado al girar sobre su altura sea máximo?
(b) Probar que entre todos los triángulos inscritos en una circunferencia, el de mayor perı́metro es el equi-
látero.
√ 2
• x
Problema 2.18. Utilizar el método de los multiplicadores para calcular la distancia mı́nima entre la circun-
ferencia x2 + y 2 = 1 y la parábola y 2 = 2x + 6 (figura 2.10).
Ayuda: Usar p el hecho que la distancia de un punto (x, y) en la parábola dada a la circunferencia x2 + y 2 = 1
es D(x, y) = x2 + y 2 − 1.
y 2 = 2x + 6
x2 + y 2 = 1
x
23
1
Curso 21/22 MMII Aproximación local. Extremos
Problema 2.20. Calcular, utilizando el método de Lagrange, los puntos de mayor/menor altura en la elipse
obtenida por la intersección del plano x + y + z = 24 y el paraboloide z = x2 + y 2 .
Problema 2.21. Calcular el volumen de la caja rectangular más grande situada en el primer octante, con
tres caras en los planos coordenados y un vértice sobre el plano Π : x + 2y + 3z = 6 (figura 2.11).
z
Π
y
•
24