Vous êtes sur la page 1sur 22

Teoremas de la Funcion Inversa y de la Funcion

Implcita
Beatriz Porras

Introducci
on

En el captulo anterior estudiamos algunas propiedades de las funciones diferenciables que tenan la diferencial nula. El desarrollo de Taylor de la Funcion
permita compararla con una funcion cuadratica, en un entorno del punto crtico,
y a partir de ah podamos hacer un estudio de esos puntos crticos para determinar los extremos de la funcion.
Cuando por el contrario la diferencial es no nula, la propia definicion de
la diferenciabilidad nos permite aproximar la funcion con una aplicacion lineal. Esta aproximacion, aunque es solamente local, nos permite comparar las
propiedades de una funcion con propiedades de las aplicaciones lineales; y una de
las propiedades mas importantes de las aplicaciones lineales es su inversibilidad.
En el Teorema de la Funcion Inversa se dan condiciones que aseguran que si la
diferencial de una funcion en un punto a de su dominio es inversible, la propia
funcion tiene una inversa local en un entorno de a, e incluso determina la forma
de calcular la diferencial de la funcion inversa F 1 .
Este tipo de resultado es especialmente util en una asignatura de analisis
para el estudio de funciones que no estan definidas con una formula explcita,
sino por el hecho de ser la inversa de otra funcion. As por ejemplo en el analisis de
funciones reales de una variable real se utiliza el teorema de la funcion inversa para
determinar la derivada de la funcion logaritmo, o de las funciones trigonometricas
inversas arcoseno, arcocoseno, arcotangente, ...
Ejemplo 1. La funcion logaritmo se define como la inversa de la exponencial
La funcion exponencial, f (x) = ex , f : R R, es inyectiva en R y
derivable, y verifica f 0 (x) = ex en cualquier punto de R. La funcion inversa
g : R+ R, definida por
g(y) = el unico x R tal que ex = y
es la funcion logaritmo, g(y) = ln y. Para calcular la derivada de g, utilizamos
la regla de la cadena aplicada a la composicion de las dos funciones:
1

AVAVAR

(f g)(y) = f (g(y)) = y
derivando
(f g)0 (y) = f 0 (g(y)) g 0 (y) = 1
luego
g 0 (y) =

1
1
1
=
=
f 0 (g(y))
eg(y)
y

Para que este argumento sea correcto, hace falta comprobar que se puede
aplicar la regla de la cadena, es decir, hace falta demostrar primero que la funcion
logaritmo g(y) = ln y es derivable. Esto sera lo que demuestre el Teorema deN
la
Funcion Inversa.
En el caso del analisis de varias variables veremos una primera aplicacion en
la demostracion del segundo teorema de este captulo, el Teorema de la Funcion
Implcita. Y jugara un papel fundamental en la teora de integracion, para la
utilizacion de cambios de variables, y en el calculo vectorial sobre curvas y superficies.
En un lenguaje algebraico, la condicion para que una funcion definida en un
conjunto abierto U de Rn , F : U Rn tenga inversa, es que sea inyectiva,
es decir, que para cada y F (U ) exista un unico x U tal que F (x) = y.
Escribiendo las coordenadas de y y las componentes de F , se trata de que el
sistema de ecuaciones

f1 (x1 , . . . , xn ) = y1

..
..
.
.

fn (x1 , . . . , xn ) = yn
tenga para cada y F (U ) una unica solucion en U . En el Teorema de la
Funcion Inversa se dan condiciones para que una funcion de clase C 1 definida en
un abierto de Rn pueda tener una inversa tambien de clase C 1 , al menos local en
un entorno de un punto de U . La regla de la cadena nos permitira luego calcular
la diferencial de esa funcion inversa.
El Teorema de la Funcion Implcita se basa en las propiedades de los sistemas
de ecuaciones con infinitas soluciones: cuando un sistema de m ecuaciones con
n + m incognitas es compatible indeterminado, tiene infinitas soluciones y se
dice que el conjunto de soluciones esta definido implcitamente por el sistema de
2

AVAVAR
ecuaciones. As, por ejemplo, se define implcitamente una recta en el espacio
mediante un sistema de dos ecuaciones con tres incognitas que expresa la interseccion de dos planos. La resolucion del sistema de ecuaciones despejando dos
variables en funcion de la tercera nos da una ecuacion que describe la recta como
la grafica de una funcion (de R en R2 ).
En el Teorema de la Funcion Implcita se dan condiciones para que un sistema
de ecuaciones descrito por una funcion de clase C 1 de Rn+m en Rm defina
implcitamente una funcion tambien de clase C 1 , de modo que el conjunto de
soluciones del sistema de ecuaciones se pueda expresar como la grafica de esa
funcion; y para calcular la diferencial de esa funcion.
Aunque aparentemente los dos teoremas son muy distintos, el hecho es que
son equivalentes: vamos a demostrar primero el Teorema de la Funcion Inversa, y luego como aplicacion el Teorema de la Funcion Implcita, pero pueden
demostrarse tambien en el orden contrario, y deducir el Teorema de la Funcion
Inversa como aplicacion del Teorema de la Funcion Implcita.

Teorema de la Funci
on Inversa

El teorema de la Funcion Inversa se basa en la aproximacion de una funcion


diferenciable por una aplicacion lineal. Si F es una funcion definida en un abierto
de Rn y con valores en un espacio de la misma dimension Rn , su diferencial en
un punto x0 de U es una aplicacion lineal de Rn en Rn .
Para que una aplicacion lineal entre espacios vectoriales de la misma dimension sea inversible, basta que sea inyectiva, ya que automaticamente entonces
es biyectiva. Y que sea inyectiva es equivalente a que su nucleo sea unicamente
el vector cero (el nucleo de una aplicacion lineal es el conjunto de vectores que
se transforman en cero). Cuando una aplicacion lineal no es biyectiva, contrae el
espacio en un subespacio de dimension menor (por ejemplo transforma el espacio
tridimensional en un plano, o en una recta). Cuando por el contrario es biyectiva,
solo produce una deformacion en el espacio, pero sigue manteniendo la misma
dimension.
Cuando se trata de funciones no lineales, el comportamiento puede no ser el
mismo en todo en conjunto donde esta definida la funcion: puede aplastarlo por
un lado, e inflarlo por otro. As que el estudio de la funcion no puede hacerse de
forma global, sino que se hace de forma local: se estudia el comportamiento de F
en un entorno de un punto x0 . Las observaciones o conclusiones que se obtienen
tiene validez solo de forma local. Esta es una caracterstica propia del Analisis
Matematico, que se refleja en especial en los dos teoremas de este captulo.
Para las proximas demostraciones utilizaremos en varias ocasiones las sigu3

AVAVAR
ientes observaciones:
Observaciones:

1. Recordemos que si F es una funcion diferenciable en un punto x0 , se llama


Jacobiano de F en x0 al determinante de la diferencial de F en x0

df
1 (x0 ) . . . df1 (x0 )

dx1
dxn


.
.
.
.
.
.
JF (x0 ) = det dF (x0 ) =

.
.
.

dfn
df
n

(x0 ) . . .
(x0 )
dx1

dxn

2. Sea F : U Rn una
funcion de clase C 1 (U ) en un abierto U de Rn . Definimos una funcion




(z1 , . . . , zn ) =

df1
(z )
dx1 1

...
...

..
.
dfn
(z ) . . .
dx1 n

df1
(z )
dxn 1





..

.

dfn
(z )
dxn n

: U U R es continua. Si (a, . . . , a) 6= 0, existira un entorno


B de (a, . . . , a) en U U de modo que (z1 , . . . , zn ) 6= 0 para todos
(z1 , . . . , zn ) B, o equivalentemente, existira una bola B(a, r) U
de modo que (z1 , . . . , zn ) 6= 0 para todos z1 , . . . , zn B(a, r). En
particular (x, . . . , x) 6= 0 para todo x B(a, r).
U U
U

x
a
z2

(x, x)
(a, a)
(z1 , z2 )

B(a, r)
B

z1

B(a, r)

AVAVAR
Lema 1.
Sea U un conjunto abierto de Rn , F : U Rn una funcion de clase C 1 (U ), y
a U tal que JF (a) 6= 0. Entonces:
a) Existe r > 0 tal que B(a, r) U , JF (x) 6= 0 para todo x de la bola
cerrada B(a, r), y F es inyectiva en B(a, r)
b) Existe s > 0 tal que B(F (a), s) F (B(a, r))
Demostracion:
U

F (U )
F (B(a, r))

s
F (a)

Consideremos como en la observacion anterior la funcion


df

1 (z1 ) . . . df1 (z1 )
dx1

dxn


.
.
.
.
.
.
(z1 , . . . , zn ) =

.
.
.
dfn

dfn

(z ) . . . dxn (zn )
dx1 n
Como F es de clase C 1 , es continua; y por hipotesis (a, . . . , a) =
JF (a) 6= 0. Por tanto existe una bola B(a, R) contenida en U de modo que
(z1 , . . . , zn ) 6= 0 para todos z1 , . . . , zn en B(a, R). Tomando un radio r < R
podemos asegurar ademas que B(a, r) esta contenida en U
Veamos ahora que se verifica el apartado (a):
Sean x, y B(a, r) tales que F (x) = F (y). Aplicando el teorema del Valor
Medio a cada componente de F en el segmento [x, y], se tiene que para cada
j {1, . . . , n} existe un punto zj [x, y] tal que
0 = fj (x) fj (y) =< fj (zj ), (x y) >
lo que nos da un sistema de ecuaciones
df1
df1
(z1 )(x1 y1 ) + +
(z1 )(xn yn )
dx1
dxn
..
.
dfn
dfn
(zn )(x1 y1 ) + +
(zn )(xn yn )
dx1
dxn
5

=0
..
.
=0

AVAVAR
Es decir, el vector x y es
cientes es
df1
df1
(z1 ) . . . dx
(z1 )
x1
n

..
.
..
..

.
.
dfn
(z )
dx1 n

...

dfn
(z )
dxn n

una solucion del sistema, cuya matriz de coefi

Su determinante es (z1 , . . . , zn ) que por construccion de B(a, r) es distinto de


cero. As el sistema es homogeneo compatible determinado, que solo tiene la
solucion trivial, y por tanto tiene que ser x y = 0.
Luego en efecto F es inyectiva en B(a, r). Ademas JF (x) = (x, . . . , x) 6=
0 para todo x de bola B(a, r)
Veamos ahora el apartado b)
Definimos la funcion : S(a, r) R por (x) = kF (x) F (a)k
U
F (U )
F (x)

(x) = F (x) F (a)

F (a)

F (B(a, r))

B(a, r)

es una funcion continua. Ademas (x) > 0 para todo x S(a, r), ya que
F es inyectiva en la bola cerrada de centro a y radio r y si x S(a, r), x 6= a.
Y S(a, r) es un conjunto compacto. Por tanto alcanza en mnimo en S(a, r).
Es decir, existe un punto z S(a, r) tal que
(z) = kF (z) F (a)k = min{kF (x) F (a)k; x S(a, r)} > 0
Llamamos s = (z)/2. Vamos a ver que B(F (a), s) F (B(a, r))

AVAVAR

F (U )

F (a)

s = (z)/2

F (z)

F (B(a, r))

B(a, r)

Sea y0 B(F (a), s), fijo. Hay que ver que existe un punto x0 B(a, r) tal
que y0 = F (x0 )

Definimos ahora la funcion : B(a, r) R por (x) = kF (x) y0 k

F (U )
x

F (a)
y0

F (x)
(x) = F (x) y0 

F (B(a, r))

B(a, r)

Otra vez es continua, y B(a, r) es compacto, y por tanto alcanza el


mnimo en un punto x0 de B(a, r)
Veamos que x0 esta de hecho en la bola abierta de centro a y radio r.
Por un lado tenemos que
(x0 ) (a) = kF (a) y0 k < s = (z)/2
Por otro lado, si fuese x0 S(a, r), tendramos
(x0 ) =

=
>

kF (x0 ) y0 k = kF (x0 ) F (a) (y0 F (a))k


| kF (x0 ) F (a)k ky0 F (a)k |
kF (x0 ) F (a)k ky0 F (a)k
(x0 ) ky0 F (a)k
(z) s = (z)/2
7

AVAVAR
en contradiccion con la desigualdad anterior, luego necesariamente x0 esta en la
bola abierta y no en la esfera.
Queda por probar que F (x0 ) = y0
Como x0 es un mnimo de , que es una funcion positiva, tambien es mnimo
n
X
de 2 (x) =
(fj (x) yj0 )2 ; y como es un punto del interior de su dominio,
j=1

tiene que ser un punto crtico de 2 . Es decir, para todo i = 1, . . . , n se tiene


n

X dfj
d 2
2
0=
(x0 ) =
(x0 ) (fj (x0 ) yj0 )
dxi
dxi
i=1
lo que da lugar a un sistema de ecuaciones
df1
dfn
(x0 ) (f1 (x0 ) y10 ) + +
(x0 ) (fn (x0 ) yn0 )
dx1
dx1
..
.
dfn
df1
(x0 ) (f1 (x0 ) y10 ) + +
(x0 ) (fn (x0 ) yn0 )
dxn
dxn

=0
..
.
=0

Es decir, el vector F (x0 ) y0 es solucion del sistema homogeneo que tiene


como matriz de coeficientes dF (x0 )t , la transpuesta de la diferencial de F en
x0 , que tiene determinante distinto de cero por la construccion de B(a, r) al
principio de la demostracion. As, el sistema es compatible determinado, y solo
puede tener la solucion trivial, luego tiene que ser F (x0 ) = y0 , como queramos
demostrar.
N
Observaciones:
Si U es un abierto de Rn , y F : U Rn es una funcion de clase C 1 en U
tal que JF (x) 6= 0 en todos los puntos x U , se puede aplicar el lema anterior
en cada punto de U .
Aplicando el primer apartado, se obtiene que para cada punto x U existe
una bola B(x, rx ) de modo que F es inyectiva en la bola cerrada B(x, rx ). Sin
embargo no se puede asegurar que F sea inyectiva en todo U .
Aplicando el segundo apartado, para cada x de U hay una bola centrada en
F (x), B(F (x), sx ), contenida en F (B(x, rx )), que a su vez esta contenido en
F (U ). Por tanto F (U ) es abierto.
N

AVAVAR

Teorema (de la Funcion Inversa).


Sea U un abierto de Rn, F : U Rn una funcion de
clase C 1 en U , y a U tal que JF (a) es distinto de
cero. Entonces existen dos conjuntos abiertos A U y
B F (U ), y una funcion G, tales que:
i) a A y b = F (a) B
ii) B = F (A)
iii) F es inyectiva en A
iv) G : B Rn verifica G(B) = A y G(F (x)) = x
para todo x A
v) G es de clase C 1 en B, y dG(F (x)) = (dF (x))1
para todo x A. En particular dG(b) = (dF (a))1
Se dice entonces que F admite, en un entorno de a, una
inversa local de clase C 1, o que G es una inversa local, de
clase C 1, de F en un entorno de a
Demostracion:
I (Saltar al final de la demostracion)
Como en el teorema anterior, existe una bola B(a, r) tal que B(a, r) U ,
F es inyectiva en B(a, r), y (z1 , . . . , zn ) 6= 0 para todos z1 , . . . , zn B(a, r),
con la funcion definida antes.
Y existe B(F (a), s) F (B(a, r))
Llamamos B = B(F (a), s), y A = F 1 (B) B(a, r)
Para entender esta construccion haremos una representacion grafica en el
caso de funciones de R en R

b = F (a)

B = B(F (a), s)

F (B(a, r))

AVAVAR

a
B(a, r)
A = F 1 (B) B(a, r)
F 1 (B)

B es abierto, por ser una bola abierta. A es abierto, ya que como F es


continua F 1 (B) es abierto, y B(a, r) es abierto. Ademas B F (B(a, r))
F (U ), y A B(a, r) U .
Y evidentemente b = F (a) B, y a F 1 (B) B(a, r) = A
Veamos que F (A) = B. Por un lado, como por definicion A F 1 (B),
entonces F (A) B
Por otro lado, si y B, como B F (B(a, r)), existe un x B(a, r)
tal que F (x) = y. En particular x B(a, r) F 1 (B) = A y por tanto
y = F (x) F (A). Luego B F (A)
Tambien tenemos que F es inyectiva en A, por ser un subconjunto de B(a, r)
Para construir G, consideramos la restriccion de F a B(a, r). F es inyectiva
y continua en la bola cerrada, que es compacto, y por tanto la inversa de F es
continua

F : B(a, r) R

F 1 : F (B(a, r)) B(a, r)


y el unico x B(a, r)
tal que F (x) = y

Y definimos G = (F 1 )|B la restriccion de F 1 a B.


Como B = F (A) y A B(a, r), es evidente que G(B) = A y que
G(F (x)) = x para todo x A.
10

AVAVAR
Para terminar la demostracion del teorema hay que ver que G es de clase C 1
en B
Sea y B, fijo. Vamos a ver que existen todas las derivadas parciales
dgk
(y), y que esas derivadas parciales son continuas en B.
dyi
Consideramos el i-esimo vector de la base canonica de Rn , ei , y |t| 6= 0
suficientemente pequeno para que y+tei B. Entonces existen x y xt en A tales
que y +tei = F (xt ) e y = F (x), o equivalentemente G(y +tei ) = xt , G(y) = x.
F 1 (B)

B(a, r)

A
a

y + tei

ei

b = F (a)

xt = G(y + tei )

x = G(y)
G

Partimos de la ecuacion F G(y) = y para todo y B, o fj (G(y)) = yj


para cada j = 1, . . . , n, y para todo y B
Por un lado

(y + tei )j yj
fj (G(y + tei )) fj (G(y))
0
si i 6= j
=
= (ei )j =
1
si i = j
t
t
y por otro lado, aplicando el primer teorema del valor medio a cada componente
de F en el segmento [xt , x] (que esta contenido en B(a, r)),existen z1 , . . . , zn
en [xt , x] tales que
fj (G(y + tei )) fj (G(y))
fj (xt ) fj (x)
xt x
=
=< fj (zj ),
>
t
t
t
n
X
G(y + tei ) G(y)
dfj
gk (y + tei ) gk (y)
=< fj (zj ),
>=
(zj )
t
dxi
t
k=1
Desarrollando cada ecuacion, para j=1,. . . ,i,. . . ,n, obtenemos un sistema de
ecuaciones

11

AVAVAR

df1
g1 (y + tei ) g1 (y)
df1
gn (y + tei ) gn (y)
0 =
(z1 )
+ +
(z1 )
dx1
t
dxn
t
..
..
..
.
.
. =
dfi
g1 (y + tei ) g1 (y)
dfi
gn (y + tei ) gn (y)
(zi )
+ +
(zi )
1 =
dx1
t
dxn
t
..
..
..
.
.
. =
g1 (y + tei ) g1 (y)
gn (y + tei ) gn (y)
dfn
dfn
(zn )
+ +
(zn )
0 =
dx1
t
dxn
t
G(y + tei ) G(y)
Es decir, el vector
es solucion del sistema de ecuaciones,
t
que tiene como matriz de coeficientes

df1
(z )
dx1 1

...
...

..
.
dfn
(z ) . . .
dxn n

df1
(z )
dxn 1

..

.
dfn
(z )
dxn n

cuyo determinante (z1 , . . . , zn ) es distinto de cero por la construccion de


B(a, r).
La regla de Cramer nos permite escribir cada coordenada de la solucion del
sistema de ecuaciones como un cociente de determinantes: el denominador es
el determinante de la matriz de coeficientes, y el numerador es el determinante
de la matriz que resulta de sustituir en la matriz de coeficientes la columna
correspondiente por la de terminos independientes, k (z1 , . . . , zn ).
gk (y + tei ) gk (y)
=
dft
1 (z1 ) . . . 0 . . .
dx1

..
..

.
dfi .

(z ) . . . 1 . . .
= dx1 . i
..
.

.
dfn .

.
.
0
...
(z
)
.
dxn n

(k)





..

.

dfi

(z
)
i
dxn


..

.

dfn

(z
)
n
dxn


df1
(z )
dxn 1

((z1 , . . . , zn ))1 =

= k (z1 , . . . , zn ) (z1 , . . . , zn )1
Y ahora, haciendo que t tienda a cero, como G es continua en B se tiene
que G(y + tei ) tiende a G(y), y por tanto los puntos zj que estan en el intervalo [xt , x] = [G(y + tei ), G(y)] tienden a x = G(y). Y como en F es de
12

AVAVAR
clase C 1 en U , k (z1 , . . . , zn ) tiende a k (x, . . . , x) = k (G(y), . . . , G(y)), y
(z1 , . . . , zn ) tiende a (x, . . . , x) = (G(y) . . . , G(y)) que es distinto de cero
(por la construccion de B(a, r) al principio de la demostracion).
gk (y + tei ) gk (y)
dgk
As pues, existe
limt0
=
(y) y vale
t
dyi
k (G(y), . . . , G(y))
dgk
(y) =
dyi
(G(y), . . . , G(y))
Ademas se deduce que G es de clase C 1 en B, ya que las derivadas parciales son
cociente de funciones continuas con denominador no nulo.
Para terminar la demostracion, sabiendo ya que F y G son diferenciables, y
utilizando la regla de la cadena, como G F (x) = I(x) = x para todo x A,
se tiene
dG(F (x)) dF (x) = dI(x) = I
luego
dG(F (x)) = (dF (x))1
para todo x A, y en particular dG(b) = (dF (a))1
J(Volver al enunciado)

Observaciones:
1. El teorema se puede resumir diciendo que en las condiciones dadas sobre
F y a, existe un entorno A de a en U en el que F es inyectiva, F (A) es
abierto, y la inversa de F , F 1 : F (A) A es tambien de clase C 1
2. Si F es de clase C p (U ), la inversa F 1 tambien es de clase C p (F (A))
3. El teorema no es cierto si se sustituye la condicion de que F sea de clase
C 1 por la condicion mas debil de que sea solamente diferenciable. Como
ejemplo, basta considerar la funcion

f (x) =

1
x
2

+ x2 sen x1

si
si

x 6= 0
x=0

f es continua y diferenciable en R, y f 0 (0) 6= 0, sin embargo no tiene


inversa y menos aun inversa diferenciable, en ningun entorno de x = 0, ya
que no es inyectiva en ningun entorno de x = 0
13

AVAVAR
Definici
on (Difeomorfismo). Dado un conjunto abierto U en Rn , se llama un
difeomorfismo en U a una funcion F : U Rn que es diferenciable en U ,
inyectiva, y con inversa diferenciable, F 1 : F (U ) U . Se dice que F es un
difeomorfismo de clase C p si F y F 1 son de clase C p en sus dominios.

Teorema de la Funci
on Implcita

Como la mayora de los teoremas del Analisis, el teorema de la funcion implcita


es tambien un teorema local. Se trata de ver como en un entorno de un punto,
se puede describir el conjunto de soluciones de un sistema de ecuaciones como
la grafica de una funcion.
Consideremos como ejemplo la ecuacion de la circunferencia de centro (0, 0)
y radio 1 en el plano
x2 + y 2 1 = 0
y un punto (a, b) de esa circunferencia con b > 0 En un entorno suficientemente
peque
no de (a, b) se puede despejar y como funcion de x mediante la formula
y = 1 x2 .
y=

1 x2

b
a

x=

1 y2
a

a
b

y = 1 x2

Si b < 0 se despejara y = 1 x2 . Y si b = 0, no
p podemos despejar
y, peropsi podemos despejar x, mediante la funcion x = 1 y 2 si a > 0, o
y = 1 y 2 si a < 0
La situacion general partira de un sistema de m ecuaciones con n + m
incognitas, y nos plantearemos la posibilidad de despejar m variables como
funcion de las otras n. Un caso tpico es la resolucion de sistemas lineales
compatibles indeterminados.
Consideremos por ejemplo el sistema de ecuaciones


3x +2y z +u = 0
3 2 1 1 0
1 0 1 1 0
x
+z +u = 0
14

AVAVAR
Habitualmente este sistema se resuelve buscando en la matriz de coeficientes un
menor de orden dos distinto de cero, como por ejemplo el correspondiente a las
dos ultimas columnas


1 1


1 1
y pasando las otras dos variables al otro lado de la igualdad, con lo que queda
un sistema dos por dos compatible determinado, que determina el valor de z y
u para cada valor de x e y
z + u = 3x 2y
z+u
= x

z =x+y
u = 2x y

Otra manera de resolver el sistema es convertirlo en un sistema compatible


determinado anadiendo ecuaciones, en vez de eliminar variables:
Consideremos el sistema de ecuaciones
x

=x
y
=y
3x 2y z +u = 0
x
+z +u = 0
que en forma matricial

1 0 0 0
0 1 0 0

3 2 1 1
1 0 1 1

es, para cada valor de x e y

x
y

0
0

La matriz de coeficientes tiene determinante distinto de cero, por lo que el sistema


es compatible determinado. Es decir, para cada valor de x e y, hay una unica
solucion del sistema, que nos permite escribir z y u como funcion de x e y
(aplicando por ejemplo la regla de Cramer).



1
u=
2

1
0
3
1

0
1
2
0

x
y
0
0

0
0
1
1




1
z=
2

1
0
3
1

0 0 x
1 0 y
2 1 0
0 1 0

De otra manera, enunciando el problema en terminos de aplicaciones lineales,


si H es la aplicacion lineal de R4 en R4 definida por la matriz anterior, el sistema
15

AVAVAR
queda

1
0
H(x, y, z, u) =
3
1

x
0 0 0

1 0 0 y
2 1 1 z
0 1 1
u

x
y
=
0
0

El hecho de que la matriz de coeficientes tenga determinante distinto de cero


implica que H es inversible, y que (x, u, z, u) = H 1 (x, y, 0, 0). Llamando
K = H 1 , K = (k1 , k2 , k3 , k4 ), tenemos z = k3 (x, y, 0, 0) y u = k4 (x, y, 0, 0).
Es decir las soluciones de nuestro sistema de ecuaciones se pueden expresar
poniendo z y u como funciones implcitas de x e y.
Vamos a ver ahora otro ejemplo concreto de como se puede despejar en
una ecuacion una variable en funcion de otra, con el caso de la ecuacion de la
circunferencia.
Consideremos de nuevo la ecuacion
x2 + y 2 1 = 0 , y (a, b) un punto
de la circunferencia, con b 6= 0. Consideramos la funcion F (x, y) = x2 + y 2 1,
de R2 en R, que es de clase C 1 en todo R2 ; y definamos la funcion
H(x, y) = (x, x2 + y 2 1)
de R2 en R2
H es una funcion de clase C 1 de R2 en R2 . Ademas


1 0
dH(x, y) =
2x 2y
luego JH(a, b) = 2b 6= 0
H verifica las condiciones del teorema de la funcion inversa, y por tanto existe
dos conjuntos abiertos V U , W H(U ), y una funcion K, tales que
(a, b) V ,
H(V ) = W ,
H es inyectiva en V ,
K : W R2 verifica K(W ) = V y K(H(x, y)) = (x, y) para todo
(x, y) V ,
y K es de clase C 1 en W

16

AVAVAR

(x, y)
(a, b)

H
W = H(V )

K = H 1

Si llamamos H(x, y) = (x, v), observando la formula de la funcion H,


los puntos de la circunferencia que estan en V se transforman justo en W
{(x, v); v = 0}, y recprocamente
V {(x, y) : F (x, y) = x2 + y 2 1 = 0} = K(W {v = 0})
Llamando A = {x R : (x, 0) W }, tenemos que para cada punto (x, y) en
el conjunto V {(x, y) : F (x, y) = x2 + y 2 1 = 0}, x A y (x, y) = K(x, 0),
de donde se deduce que y = k2 (x, 0) = g(x) (k2 la segunda componente de la
funcion K)
Es decir, la parte de la circunferencia que esta en V son los puntos (x, y) que
verifican y = g(x) con x A: la grafica de la funcion y = g(x) en A.
La demostracion del teorema en el caso general reproduce los pasos que
hemos dado en este ejemplo.
Observaciones:
Consideraremos funciones definidas en un abierto de Rn+m . Para describir los
puntos y la funcion, expresaremos Rn+m como el producto cartesiano Rn Rm ,
y sus puntos como pares (x, y) donde x = (x1 , . . . , xn ) e y = (y1 , . . . , ym ), y
escribiremos F (x, y).
La matriz de la diferencial de F quedara de la forma

dF (x, y) =

df1
(x, y)
dx1

...

..
.
dfm
(x, y) . . .
dx1

df1
(x, y)
dxn

..
.
dfm
(x, y)
dxn
17

df1
(x, y)
dy1

...

..
.
dfm
(x, y) . . .
dy1

df1
(x, y)
dym

..

.
dfm
(x, y)
dym

AVAVAR
Denotaremos por dY F (x, y) la submatriz de dF (x, y) correspondiente a las
columnas de las variables y = (y1 , . . . , ym ) (es decir, las ultimas m columnas de la
matriz de la diferencial de F en (x, y)). Y llamaremos JY F (x, y) al determinante
de esta matriz,




JY F (x, y) =

df1
(x, y)
dy1

...

..
.
dfm
(x, y) . . .
dy1

df1
(x, y)
dym





..

.

dfm
(x, y)
dym

Teorema (de la Funcion Implcita).


Sea U abierto en Rn+m y F : U Rm una funcion
de clase C 1 en U . Sea (a, b) U tal que F (a, b) =
0 y det(dY F (a, b) 6= 0. Entonces existen un abierto V
contenido en U , con (a, b) V , un abierto A en Rn, y
una funcion G : A Rm tales que:
i) a A
ii) G(a) = b
iii) {(x, G(x)), x A} = {(x, y) V, F (x, y) = 0}
iv) G es de clase C 1 en A.
Se dice que la ecuacion F (x, y) = 0 define implcitamente
y como funcion de x, y = G(x), en un entorno de (a, b).
Demostracion:
I (Saltar al final de la demostracion)
n+m
Definamos la funcion H : U R
por H(x, y) = (x, F (x, y)).
1
H es una funcion de clase C en U , pues cada una de sus componentes lo
es, y
1
.

0
dH(x, y) =
df1
dx
1
.

dfm
dx1

...
.
...
...
.
...

0
.
1

0
.
0

df1
dxn

df1
dy1

dfm
dxn

dfm
dy1

18

...
.
..
...
.
...

0
.

0
df1

dym
.
dfm
dym

(x,y)

AVAVAR
luego det(dH(a, b)) = det(dY F (a, b)) 6= 0
Aplicando a H el Teorema de la Funcion Inversa entorno a (a, b), existen
un entorno abierto V de (a, b), V U , un entorno abierto W de H(a, b) =
(a, F (a, b)) = (a, 0), W H(U ), y una funcion K : W V , de modo que H
es inyectiva en V , H(V ) = W , K(W ) = V , y K(H(x, y)) = (x, y) para todo
(x, y) V . Ademas K es de clase C 1 en W .
Definimos entonces
A = {x Rn : (x, 0) W } , y
G : A Rm
por
G(x) = (kn+1 (x, 0), . . . , kn+m (x, 0))
es decir, gi (x) = kn+i (x, 0) para todo x A.
Se verifican:
A es abierto: en efecto, si consideramos la inclusion In : Rn Rn+m
definida por
In (x1 , . . . , xn ) = (x1 , . . . , xn , 0, . . . , 0)
entonces A = In1 (W ), e In es continua, luego A es abierto.
Ademas a A, pues (a, 0) = H(a, b) H(V ) = W
Y G(a) = b: en efecto, como H(a, b) = (a, 0), aplicando K a ambos lados
de la igualdad se tiene


K(H(a, b)) = (a, b)


K(a, 0) = (k1 (a, 0), . . . , kn (a, 0), kn+1 (a, 0), . . . , kn+m (a, 0))

e igualando las m ultimas componentes,


b = (kn+1 (a, 0), . . . , kn+m (a, 0)) = G(a)
Por ultimo, hay que probar que {(x, G(x)), x A} = {(x, y) V, F (x, y) =
0}.
Tomamos en primer lugar x A; vamos a ver que (x, G(x)) V y que
F (x, G(x)) = 0.
x A equivale a que (x, 0) W = H(V ), y como H es inyectiva en V ,
existe un unico (x0 , y 0 ) V tal que H(x0 , y 0 ) = (x, 0).
Por definicion de H,
(x, 0) = H(x0 , y 0 ) = (x0 , F (x0 , y 0 ))
luego igualando las primeras componentes, x = x0 , e igualando las ultimas
F (x0 , y 0 ) = 0

19

AVAVAR
Por otro lado, aplicando K a ambos lados de la igualdad,

K(H(x0 , y 0 )) = (x0 , y 0 )
K(x, 0) = (k1 (x, 0), . . . , kn (x, 0), kn+1 (x, 0), . . . , kn+m (x, 0))
e igualando las ultimas componentes,
y 0 = (kn+1 (x, 0), . . . , kn+m (x, 0)) = G(x)
Por tanto (x, G(x)) = (x0 , y 0 ) V y F (x, G(x)) = F (x0 , y 0 ) = 0
Recprocamente, sea ahora (x, y) V con F (x, y) = 0. Aplicando H,
H(x, y) = (x, F (x, y)) = (x, 0) pertenece a H(V ) = W , luego x A.
Ademas, aplicado K,

K(H(x, y)) = (x, y)
K(H(x, y)) = K(x, 0) = (k1 (x, 0), . . . , kn (x, 0), kn+1 (x, 0), . . . , kn+m (x, 0))
e igualando las ultimas componentes, y = (kn+1 (x, 0), . . . , kn+m (x, 0)) = G(x)
Por tanto (x, y) = (x, G(x)) con x A
Para terminar, segun el teorema de la funcion inversa, K es de clase C 1 en
W , y por tanto lo sera cada componente kn+i , 1 i m. Y la inclusion In
que definimos antes tambien es evidentemente de clase C en Rn , luego cada
gi (x) = kn+i In (x) sera de clase C 1 en A, y por tanto G es de clase C 1 en A.
Esto termina la demostracion.
N
J(Volver al enunciado)

20

AVAVAR
Observaciones:
1. En el caso F : R2 R, el teorema nos indica que en las condiciones
del enunciado, en un entorno del punto (a, b) el conjunto de ceros de F
no puede tener la forma de un aspa, por ejemplo, ya que es ese caso no
podra ser la grafica de una funcion del tipo y = f (x) ni x = g(y).
Para poder ser, por ejemplo, la grafica de una funcion y = f (x) en un
entorno de (a, b), es necesario que en ese entorno de (a, b), para cada x
exista un unico valor y de modo que (x, y) V y F (x, y) = 0.
2. La ecuacion F (x, y) = 0, con F : U Rm y U Rn Rm es un
sistema de m ecuaciones (no lineales en general) con n + m incognitas

f1 (x1 , . . . , xn , y1 , . . . , ym ) = 0

..
..
.
.

fm (x1 , . . . , xn , y1 , . . . , ym ) = 0
En la demostracion se supone que las ultimas m incognitas determinan en la
matriz de dF (a, b) una submatriz con determinante no nulo. Igualmente
se puede demostrar el resultado para cualquier conjunto de m variables
xi1 , . . . , xim siempre que formen en dF (a, b) una submatriz de rango m.
Como en el caso de un sistema de ecuaciones lineal, pueden despejarse
esas m variables como funcion implcita del resto de las variables.
3. Si F es de clase C p en U , la funcion implcita G es tambien de clase C p
en A.
4. Consideremos de nuevo en caso U R2 y F : U R, y vamos a ver
como se puede calcular la derivada de la funcion implcita y = g(x)
Segun el teorema g es de clase C 1 en A, y F (x, g(x)) = 0 para todo
x A. As, la funcion h(x) = F (x, g(x)), definida en A, es identicamente
nula y de clase C 1 en A, luego para todo x A tiene que ser h0 (x) = 0
Ahora bien,
h0 (x) =

dF
dF
(x, g(x)) +
(x, g(x))g 0 (x) = 0
dx
dy

g 0 (x) =

dF
(x, g(x))
dx
dF
(x, g(x))
dy

luego

21

AVAVAR
(donde el denominador no se anula en A por las condiciones de las hipotesis
sobre F
Para calcular derivadas de orden superior de g, si F es de clase C p , basta
aplicar la derivacion de un cociente y la regla de la cadena.
Por simplificar las notaciones, se suele escribir y = y(x) en vez de y =
g(x), expresando mas concisamente que la coordenada y se puede definir
mediante una funcion implcita de x, definida en un entorno del punto a,
A, de modo que F (x, y(x)) = 0 para todo x A.
La formula anterior nos da la derivada de y(x),
y 0 (x) =

(x, y(x))
dF
dx
dF
(x, y(x))
dy

5. En el caso mas general de funciones F : U Rm donde U es un abierto


de Rn+m se escribe y = y(x), o yj = yj (x1 , . . . , xn ) para cada j = 1 . . . m.
Segun el apartado (iii), H(x) = F (x, y(x)) es identicamente nula en A,
es decir

f1 (x, y(x)) = f1 (x1 , . . . , xn , y1 (x1 , . . . , xn ), . . . , ym (x1 , . . . , xn )) = 0

..
..
..
.
.
.

fm (x, y(x)) = fm (x1 , . . . , xn , y1 (x1 , . . . , xn ), . . . , ym (x1 , . . . , xn )) = 0


para todo x A.
Derivando en cada ecuacion respecto de una de las variables xi , las derivadas
parciales seran tambien nulas

df1
(x, y(x))
dxi

df1
1
(x, y(x)) dy
(x)
dy1
dxi

df1
m
(x, y(x)) dy
(x)
dym
dxi

=0

..
..
.
.

dfm
dfm
dy1
dfm
dym
(x,
(x,
y(x))
+
y(x))
(x)
+

+
(x,
y(x))
(x)
=
0
dxi
dy1
dxi
dym
dxi
+

+ +

Este es un sistema de ecuaciones lineal, compatible determinado, del que


m
1
se pueden despejar las soluciones dy
(x), . . . , dy
(x) para cada x de A.
dxi
dxi

22

Vous aimerez peut-être aussi