Inversa de La Matriz Del Jacobiano
Inversa de La Matriz Del Jacobiano
Inversa de La Matriz Del Jacobiano
Función inversa
Como segundo resultado fundamental del cálculo diferencial, estudiaremos ahora la posible
existencia, así como la diferenciabilidad, de la función inversa de una función diferenciable.
Empezamos probando una regla de diferenciación de la función inversa, para funciones entre
espacios normados arbitrarios, que generaliza casi al pie de la letra la que conocemos para
funciones reales de una variable real.
Pasamos entonces al problema mucho más interesante que empieza por discutir la propia
existencia de la función inversa, esto es, la inyectividad de una función diferenciable. Claro
está que, una vez asegurada la inyectividad, también nos preguntamos si la función inversa es
diferenciable. En el caso conocido de las funciones reales de una variable real, este problema se
resolvía mediante el llamado “teorema de la función inversa” para tales funciones, que tiene una
versión “local” y otra “global”. A la hora de su generalización a funciones de varias variables,
estos dos resultados se comportan de manera muy diferente. La versión local se generaliza de
forma casi literal, obteniendo el teorema de la función inversa en RN . Como consecuencia de
este teorema fundamental, que como se ha dicho tiene carácter “local”, deducimos fácilmente
un resultado que puede entenderse como una versión “global” del teorema, pero no generaliza
lo que conocemos para funciones de una variable, es un resultado mucho más débil.
125
11. Función inversa 126
Con vistas a generalizar este resultado, de forma que pueda aplicarse a una función entre
dos espacios normados arbitrarios, conviene aclarar dos cuestiones.
Tendremos un subconjunto abierto Ω de un espacio normado X y una función f : Ω → Y ,
donde Y es otro espacio normado, que será diferenciable en un punto a ∈ Ω e inyectiva. Surge
aquí la única pequeña diferencia con el caso particular que acabamos de recordar: para poder
hablar de la diferenciabilidad de f −1 en el punto b = f (a) , necesitamos que b sea, no sólo
punto de acumulación del conjunto B = f (Ω) , sino punto interior del mismo. Las hipótesis
sobre f no permiten asegurar que esto ocurra, luego deberemos suponerlo. Al fin y al cabo, si
b∈/ B ◦ , no tendría sentido plantearse el problema que estamos estudiando.
La otra cuestión, más relevante, se refiere a la forma correcta de generalizar la afirmación
(ii) , más concretamente la condición f 0 (a) 6= 0 que en ella aparece. Es una ingenuidad pensar
que, en general, la condición vaya a ser D f (a) 6= 0 . Recordemos que, en el caso particular, la
diferencial D f (a) es la aplicación lineal de R en R que consiste en multiplicar por f 0 (a) .
Por tanto, decir que f 0 (a) 6= 0 , es tanto como decir que D f (a) es biyectiva, y entonces, la
0
expresión de f −1 (b) al final del enunciado anterior nos dice que D f −1 (b) = D f (a)−1 .
En general, si queremos tener la misma expresión para la diferencial de la función inversa, no
sólo necesitamos que D f (a) sea biyectiva, sino también que su inversa D f (a)−1 sea continua.
Como se trata de una aplicación lineal de Y en X , su continuidad será automática cuando Y
tenga dimensión finita, pero no en general. Esto motiva la siguiente definición.
Si X e Y son espacios normados, llamamos homeomorfismo lineal de X sobre Y a toda
aplicación lineal y continua de X en Y , que sea biyectiva y tal que T −1 también sea continua.
Más brevemente, estamos exigiendo que T ∈ L(X,Y ) sea biyectiva con T −1 ∈ L(Y, X) . La
nomenclatura es coherente con la noción de homeomorfismo que se usa en Topología: biyección
continua entre dos espacios topológicos, cuya función inversa también es continua. En nuestro
caso, un homeomorfismo lineal entre dos espacios normados X e Y no es más que lo que su
nombre indica: un homeomorfismo de X sobre Y que además es lineal, lo que obviamente
hace que la función inversa también sea lineal. Notemos que, cuando dos espacios normados
son linealmente homeomorfos, es decir, existe un homeomorfismo lineal de uno en otro, son
idénticos como espacios vectoriales (pues tenemos una biyección lineal entre ellos) y también
como espacios topológicos (pues son homeomorfos). Podemos por tanto pensar que se trata de
un mismo espacio vectorial, en el que tenemos dos normas que pueden ser distintas, pues un
homeomorfismo lineal puede no preservar las normas, pero sí son equivalentes, pues dan lugar
a la misma topología.
Los comentarios hechos anteriormente hacen ver que el siguiente resultado generaliza, de
manera casi literal, la regla de derivación de la función inversa que acabamos de recordar.
Esto prueba que D f (a) es biyectiva con D f (a)−1 = D f −1 (b) ∈ L(Y, X) , luego D f (a) es un
homeomorfismo lineal de X sobre Y , como queríamos. De paso, hemos probado ya la última
afirmación del enunciado.
(ii) ⇒ (i) . Para abreviar escribimos T = D f (a) ∈ L(X,Y ) y, por hipótesis, sabemos que T es
biyectiva con T −1 ∈ L(Y, X) . Como ya hemos usado otras veces, la diferenciabilidad de f en
el punto a equivale a la continuidad en a de la función Φ : Ω → R definida por
f (x) − f (a) − T (x − a)
Φ(x) = ∀ x ∈ Ω \ {a} y Φ(a) = 0
kx−ak
Por tanto Φ es continua en el punto a y evidentemente verifica que
f (x) − f (a) − T (x − a)
= Φ(x)
x − a
∀x ∈ Ω (1)
Λ(y) =
x − a − T −1 (y − b)
=
T −1 T (x − a) − (y − b)
6
T −1
T (x − a) − f (x) − f (a)
(3)
=
T −1
Φ(x)
x − a
donde hemos usado la definición de la norma en L(Y, X) y la igualdad (1) . Por otra parte,
tenemos también
k x − a k =
T −1 T (x − a)
=
T −1
Φ(x)
x − a
+
y − b
o lo que es lo mismo,
1 − k T −1 k Φ(x) k x − a k 6 k T −1 k k y − b k
(4)
11. Función inversa 128
Nuestro objetivo es conseguir a partir de (4) una estimación de k x − a k que podamos usar
en (3) . Para ello necesitamos que k T −1 k Φ(x) < 1 , lo cual es cierto para y suficientemente
próximo a b como vamos a ver. En primer lugar, por ser Φ continua en a con Φ(a) = 0 , existe
ρ > 0 tal que, para z ∈ Ω con k z−a k < ρ se tiene k T −1 k Φ(z) < 1 . Usando entonces que f −1
es continua en el punto b , podemos encontrar δ > 0 de forma que, para y ∈ B con k y − b k < δ
se tenga k f −1 (y) − f −1 (b) k < ρ , es decir, k x − a k < ρ , de donde k T −1 k Φ(x) < 1 como
queríamos.
Por tanto, si y ∈ B verifica que k y − b k < δ , para x = f −1 (y) tenemos, usando (4) , que
k T −1 k k y − b k
kx−ak 6
1 − k T −1 k Φ(x)
k T −1 k2 Φ(x) k y − b k
Λ(y) 6
1 − k T −1 k Φ(x)
k T −1 k2 Φ f −1 (y)
Λ(y)
y ∈ B , 0 < k y − b k < δ =⇒ 0 6 6 (5)
1 − k T −1 k Φ f −1 (y)
ky−bk
Esta igualdad, junto con (5) , nos da directamente (2) , que era la igualdad buscada.
La implicación fácil del teorema anterior tiene una consecuencia que merece la pena resaltar:
Cada aplicación lineal T ∈ L(RN , RN ) lleva asociada la matriz cuadrada AT ∈ MN×N que
la representa en la base usual de RN , cuyo determinante denotaremos por | AT | . Sabemos que
6 0 . Si ahora Ω es un abierto de RN y f : Ω → RN una
T es biyectiva si, y sólo si, | AT | =
función diferenciable en un punto a ∈ Ω , para T = D f (a) sabemos que AT = J f (a) es la
matriz jacobiana de f en a y se dice que | AT | = | J f (a) | es el determinante jacobiano de f
en a . Según hemos dicho, D f (a) es biyectiva si, y sólo si, | J f (a) | =
6 0 . Así pues, en nuestro
caso particular, el teorema anterior toma la siguiente forma:
En relación con el determinante jacobiano, resaltamos un hecho elemental que será muy útil
enseguida. Es fácil ver que la aplicación T 7→ | AT | , definida en el espacio normado L(RN , RN )
y con valores en R , es continua. En efecto, para cada k, j ∈ IN sabemos que el coeficiente que
aparece en la k-ésima fila y la j-ésima columna de la matriz AT viene dado por
∀ T ∈ L(RN , RN )
αk j (T ) = T (ek ) | e j
Vamos a conseguir una generalización casi literal del teorema anterior, válida para funciones
de N variables. El único cambio se debe a que sólo podemos usar la diferenciabilidad de una
función en puntos interiores de su conjunto de definición. Por tanto, el papel de los intervalos
que aparecen en el enunciado anterior, lo harán convenientes subconjuntos abiertos de RN . La
demostración es muy diferente de la que se hace en R , basada en la noción de monotonía. En
RN las cosas son más complicadas, como se podrá comprobar.
Como, por hipótesis, D f es continua en el origen, vemos claramente que Dg también lo es,
con Dg(0) = 0 , luego existe δ1 > 0 tal que B(0, δ1 ) ⊂ Ω y
| J f (x) | 6= 0 ∀ x ∈ B(0, δ2 )
Puesto que B(0, 3r) es un subconjunto abierto y convexo de RN , un corolario del teorema
del valor medio nos asegura que g es lipschitziana en dicho abierto, más concretamente:
Llegamos al paso clave de la demostración, que consiste en usar el teorema del punto fijo
de Banach, para probar lo siguiente:
(*) Para cada y0 ∈ B (0, r) existe un único x0 ∈ B (0, 2r) tal que f (x0 ) = y0 . Además, si
k y0 k < r , se tiene también k x0 k < 2r .
lo que nos hace pensar en un punto fijo de la aplicación x 7→ g(x) + y0 . Así pues, tomamos
E = B (0, 2r) , que es un espacio métrico completo, por ser un subconjunto cerrado de RN , y
definimos h(x) = g(x) + y0 para todo x ∈ E . Usando (8) tenemos
Por el teorema del punto fijo, existe un único x0 ∈ E tal que h(x0 ) = x0 y, en vista de (9) , x0 es
el único punto de B (0, 2r) tal que f (x0 ) = y0 . Por último, si k y0 k < 2r , razonando como antes
tenemos k x0 k = k h(x0 ) k 6 (1/2) k x0 k + k y0 k 6 r + k y0 k < 2r . Queda así comprobada la
afirmación (*) , y el resto de la demostración se obtendrá ya sin dificultad.
11. Función inversa 132
Concretamente tomamos
D f0 (z) = T −1 ◦ D f (z + a) ∀ z ∈ Ω0 (11)
y basta tener en cuenta que D f es continua en a . En resumen, f0 verifica las hipótesis del
teorema, pero además está en el caso particular que ya hemos resuelto.
11. Función inversa 133
Sólo queda hacer el camino de vuelta, traduciendo toda esta información en términos de f .
Para ello, sea U = {z + a : z ∈ U0 } que claramente es un abierto de RN con a ∈ U ⊂ Ω .
A partir de (10) deducimos claramente que
f (x) = T f0 (x − a) + f (a) ∀x ∈ Ω (13)
D f (x) = T ◦ D f0 (x − a) ∀x ∈ Ω (14)
Comprobamos ya, de forma bastante rutinaria, que f tiene en U las propiedades requeridas.
(i). Si f (x1 ) = f (x2 ) con x1 , x2 ∈ U , usando (13) tenemos T f0 (x1 − a) = T f0 (x2 − a) ,
pero T es biyectiva, luego f0 (x1 − a) = f0 (x2 − a) . Como x1 − a, x2 − a ∈ U0 y f0 es inyectiva
en U0 , concluimos que x1 = x2 , luego f es inyectiva en U .
(ii) . Veamos que V = f (U) es abierto. Como V0 = f (U0 ) es abierto y T es un homeomorfismo,
tenemos que W0 = T (V0 ) es abierto. En vista de (13) tenemos V = {v ∈ RN : v − f (a) ∈ W0 } ,
luego V es abierto por ser la imagen inversa del abierto W0 por una traslación.
(iii) . Para x ∈ U tenemos x − a ∈ U0 , luego | J f0 (x − a) | 6= 0 , es decir, D f0 (x − a) es biyectiva.
Como T también lo es, deducimos de (14) que D f (x) es biyectiva, es decir, | J f (x) | 6= 0 .
(iv) . Si ϕ es la restricción de f a U encontramos paso a paso la relación entre ϕ −1 y ϕ0−1 .
Para y ∈ V se tiene y − f (a) ∈ W0 = T (V0 ) , luego T −1 y − f (a) ∈ V0 , lo que permite tomar
x = ϕ0−1 ◦ T −1 y − f (a) + a ∈ U , y usando (13) vemos claramente que f (x) = y . Esto
prueba que
ϕ −1 (y) = ϕ0−1 ◦ T −1 y − f (a) + a
∀y ∈ V
y tenemos ϕ−1 como composición de funciones diferenciables. Por la regla de la cadena, ϕ−1
es diferenciable con
Como esto es válido para todo x ∈ U , hemos comprobado la afirmación (iv) , lo que concluye
la demostración del teorema.
11. Función inversa 134
∂x ∂x ∂y ∂y
(ρ, θ) = cos θ , (ρ, θ) = −ρ sen θ , (ρ, θ) = sen θ , (ρ, θ) = ρ cos θ
∂ρ ∂θ ∂ρ ∂θ
∀ (ρ, θ) ∈ R+ × R
h(ρ, θ) = g ρ cos θ , ρ sen θ
Fijado (x0 , y0 ) ∈ R2 \ {(0, 0)} , queremos probar que g es diferenciable en (x0 , y0 ) . Para
ello tomamos (ρ0 , θ0 ) ∈ Ω = R+ × R tal que f (ρ0 , θ0 ) = (x0 , y0 ) . Puesto que f era de clase
C 1 en Ω con | J f (ρ0 , θ0 ) | = ρ0 > 0 , el teorema de la función inversa nos dice que existe un
abierto U de R2 , con (ρ0 , θ0 ) ∈ U ⊂ Ω , tal que f es inyectiva en U , el conjunto V = f (U) es
abierto y, llamando ϕ a la restricción de f a U se tiene que ϕ −1 es diferenciable.
Pues bien,
−1 −1 −1
para (x, y) ∈ V se tiene que ϕ (x, y) ∈ U luego f ϕ (x, y) = ϕ ϕ (x, y) = (x, y) de
donde deducimos que
A diferencia de lo que ocurrió con el teorema local, la generalización del resultado anterior
que cabría esperar, no es cierta. Concretamente, sustituyendo como es natural el intervalo I por
un abierto Ω ⊂ RN , que se puede suponer conexo o incluso convexo, podríamos pensar que
una función diferenciable f : Ω → RN verificando que | J f (x) | 6= 0 para todo x ∈ Ω tenga que
ser inyectiva, pero esto es falso: basta considerar la función f del ejemplo que acabamos de
estudiar en detalle: es inyectiva en un entorno de cada punto del abierto convexo Ω = R+ × R ,
podríamos decir que es localmente inyectiva, pero no es inyectiva en Ω . Debemos pues aceptar
que, para funciones de varias variables, la versión global del teorema de la función inversa va
a ser mucho más débil que en el caso de una variable, pues la inyectividad de la función no
será parte de la tesis, sino que habrá de suponerse como hipótesis. Enunciamos ya el resultado
global que podemos conseguir.
En primer lugar, que f sea inyectiva en U no es nada nuevo, pues f es inyectiva en Ω . Pero
también tenemos que V = f (U) es abierto y, como y = f (x) ∈ f (U) = V ⊂ W deducimos que
y ∈ W ◦ . Antes de seguir con el razonamiento, como y ∈ W era arbitrario, tenemos ya probado
que W es abierto. De nuevo para el punto y ∈ W que teníamos fijado, si ϕ es la restricción
de f al abierto U , está claro que la función ϕ −1 : V → U no puede ser otra que la restricción
de f −1 a V . Como el teorema local nos dice que ϕ−1 es diferenciable, por el carácter local
de la diferenciabilidad deducimos que f −1 es diferenciable en el punto y . Otra vez y ∈ W
era arbitrario, luego f −1 es diferenciable en todo punto de W . Para x ∈ U , podemos tomar
y = f (x) ∈ V y, usando de nuevo el teorema local, obtenemos
D f −1 f (x) = D f −1 (y) = D ϕ −1 (y) = D ϕ −1 ( f (x) ) = D f (x)−1