Académique Documents
Professionnel Documents
Culture Documents
9.1. Introducción
191
192 El álgebra de los valores propios
En este primer tema sobre valores propios nos centraremos en los aspectos teóricos
que nos permitirán comprender mejor los algoritmos que veremos en el siguiente
tema. Empezaremos repasando los conceptos de Algebra Lineal relacionados con
los valores y vectores propios. Entre otras cosas veremos que el conjunto de las
matrices con valores propios distintos forman un conjunto denso en el espacio de las
matrices cuadradas; lo cual, desde un punto de vista numérico, hace prácticamente
indistinguibles las matrices con valores propios distintos de las que no tienen esta
propiedad. Por ello, las matrices que tienen valores propios repetidos se llaman
matrices defectuosas. Veremos que no ser defectuosa equivale a ser diagonalizable
por semejanza (o conjungación).
La mayor parte de los problemas en los que hay que calcular valores propios suelen
involucrar matrices de números reales. Pero como éstas pueden tener valores propios
complejos y la teorı́a básica es la misma para matrices reales o complejas, en todo
este tema, y salvo que se especifique lo contrario, F representará indistintamente el
cuerpo de los números reales o el de los complejos.
Sλ0 “ tx P Cn |Ax “ λ0 xu
asociado a λ0 . Como
x P Sλ0 ô pλ0 In ´ Aqx “ 0
resulta que el subespacio propio de A asociado a λ0 es Kerpλ0 In ´ Aq. Además si
x P Sλ0 entonces
pλ0 In ´ AqAx “ Apλ0 In ´ Aqx “ 0,
de modo que Ax P Sλ0 . Los subespacios que cumplen esta propiedad (x P S Ñ Ax P
S) se llaman subespacios invariantes por A. Ası́ pues, los subespacios propios de A
son invariantes por A (o A-invariantes).
0 “ pλj In ´Aqxj “ pλj In ´Aqpα1 xi1 `¨ ¨ ¨`αr xir q “ α1 pλj ´λi1 qxi1 `¨ ¨ ¨`αr pλj ´λir qxir
αk pλj ´ λik q “ 0, k “ 1, . . . , r.
Pero, por el apartado (a), los vectores v1 , . . . , vj´1 , vj`1 , . . . , vs son linealmente in-
dependientes. Por consiguiente λi “ λj para i “ 1, . . . , j ´ 1, j ` 1, . . . , s, lo que es
imposible porque son todos distintos.
Por otra parte, si A, B P Fnˆn son semejantes; i.e., A “ T ´1 BT para alguna matriz
T P Gln pFq, entonces tienen el mismo polinomio caracterı́stico, pA pλq “ pB pλq. En
efecto,
Una consecuendia de esta propiedad es que ΛpAq “ ΛpBq y para cada λ0 P ΛpAq “
ΛpBq, maA pλ0 q “ maB pλ0 q. También es cierto que mgA pλ0 q “ mgB pλ0 q porque
Ası́ „
pλ ´ λ0 qIr ´C
λIn ´ B “ .
0 λIn´r ´ D
Por lo tanto
detpλIn ´ Bq “ pλ ´ λ0 qr detpλIn´r ´ Dq.
Como A y B tienen para cada valor propio las mismas multiplicidades algebraicas y
geométricas y λ0 podrı́a ser valor propio de D, concluimos que r “ mgpλ0 q ď mapλ0 q.
(c) Los valores propios no defectuosos que no son simple se llaman semisimples.
La matriz A se dice que es semisimple si sus valores propios son simples o
semisimples.
9.2 Valores y vectores propios 197
Debe notarse que para una matriz es lo mismo ser semisimple o ser no defectuosa
y que las matrices simples tiene todos sus valores propios distintos. En el extremo
opuesto, las matrices cuyos valores propios tienen todos multiplicidad geométrica 1,
se llaman no derogatorias. Las matrices simples son a la vez no defectuosas y no
derogatorias.
detpλIn ´ Dq “ pλ ´ d1 qpλ ´ d2 q ¨ . . . ¨ pλ ´ dn q;
ası́ que d1 , . . . , dn son los valores propios (quizá repetidos) de D y, por lo tanto, de
A.
ΛpAq “ tλ1 , . . . , λs u
y
mapλi q “ mgpλi q “ mi , i “ 1, . . . , s.
198 El álgebra de los valores propios
“ ‰
AT “ “At11 ¨ ¨ ¨ At1m1 ¨ ¨ ¨ Ats1 ¨ ¨ ¨ Atsms “ ‰
“ λ1 t11 ¨ ¨ ¨ λ1 t1m1 ¨ ¨ ¨ λs ts1 ¨ ¨ ¨ »λs tsms “ fi
λ1
— .. ffi
— . ffi
— ffi
— λ1 ffi
“ ‰— ... ffi
“ t11 ¨ ¨ ¨ t1m1 ¨ ¨ ¨ ts1 ¨ ¨ ¨ tsms — — ffi “
ffi
— λs ffi
— ffi
— .. ffi
– . fl
λs
“ TD
Teorema 9.8 (Forma canónica de Jordan) Dada A P Fnˆn existe una matriz
no singular T P Cnˆn tal que T ´1 AT “ J es la forma canónica de Jordan de A. Es
decir, J es una matriz diagonal por bloques J “ DiagpJn1 pλ1 q, Jn2 pλ2 q, . . . , Jns pλs qq
9.2 Valores y vectores propios 199
Como λ P ΛpA ` Eq, existe un vector no nulo x P Cn tal que pA ` Eqx “ λx. Ası́
Pongamos
T ´1 x “ y.
Entonces
T ´1 Ex “ pλIn ´ Dqy
o
y “ pλIn ´ Dq´1 T ´1 Ex “ pλIn ´ Dq´1 T ´1 ET y.
Tomando normas de vector y las correspondientes normas de matriz inducidas
Como y ‰ 0
1 ď }pλIn ´ Dq´1 } }T ´1 } }E} }T } (9.1)
ˆ ˙
1 1
Ahora bien pλIn ´ Dq´1 “ Diag ,..., , y para cualquier matriz
λ ´ λ1 λ ´ λn
diagonal B “ Diagpb1 , . . . , bn q y para cualquier norma de matriz inducida por una
norma de vector `p se tiene que
En efecto
}B} “ máx }Bx}p
}x}p “1
pero » fi
b1 x 1
— b2 x2 ffi
— ffi
Bx “ — .. ffi
– . fl
bn x n
Ası́, para cualquier x P Fn unitario tenemos que
Por otra parte, si máx |bi | “ |bk | y tomamos x “ ek , el k-ésimo vector canónico,
1ďiďn
resulta que }Bx}p “ |bk |. En conclusión, para cualquier x P Fn unitario, }Bx}p ď
máx |bi | y hay un x de norma 1 tal que }Bx}p “ máx |bi |. Por consiguiente
1ďiďn 1ďiďn
mı́n |λ ´ λi | ď }T } }T ´1 } }E}
1ďiďn
Definición 9.12 Dos matrices A, B P Cnˆn se dice que son unitariamente seme-
jantes si existe una matriz unitaria U P Cnˆn tal que B “ U ˚ AU . Si A, B P Rnˆn y
existe una matriz ortogonal P P Rnˆn tal que B “ P T AP entonces se dice que A y
B son ortogonalmente semejantes.
Im
Demostración.- Hay que probar que dada A P Cnˆn y dado ε ą 0 existe una matriz
A1 P Cnˆn con todos sus valores propios distintos tal que }A ´ A1 } ă ε en alguna
norma. Usaremos la norma de Frobenius. Por el Teorema de Schur existe una matriz
unitaria U P Cnˆn tal que
U ˚ AU “ T “ rtij s.
Tal y como se muestra en la Figura 9.1 se pueden escoger n números complejos
e1 , . . . , en tales que:
ε
(a) |ei | ď ,y
n1{2
(b) t11 ` e1 , t22 ` e2 , . . . , tnn ` en sean todos números distintos
Este resultado nos muestra una vez más que sólo es razonable intentar calcular
numéricamente los valores propios de matrices diagonalizables y que con altı́sima
probabilidad los valores propios que puedan devolver los algoritmos van a ser todos
distintos.
Por otra parte, si A P Rnˆn es real se desearı́a poder reducir A a forma triangular
usando matrices ortogonales reales; i.e., usando aritmética real que es más “bara-
ta” desde el punto de vista del cálculo. Ahora bien, una matriz real puede tener
valores propios complejos aunque éstos deben aparecer en pares conjugados. Esto es
debido a que detpλIn ´ Aq se factoriza en R en factores lineales o cuadráticos; los
primeros corresponden a raı́ces reales y los segundos tienen raı́ces complejas pero
ambas conjugadas, debido a que los coeficientes de los factores son reales. Ası́ pues,
no es posible obtener una matriz triangular realizando transformaciones ortogonales
sobre una matriz real si ésta tiene valores propios complejos. A lo más que podemos
aspirar es a obtener una matriz triangular por bloques con bloques diagonales de
tamaño 2 ˆ 2 a lo más.
Teorema 9.15 (Teorema de Schur real) Si A P Rnˆn , existe una matriz orto-
gonal P P Rnˆn tal que P T AP “ T , con T una matriz cuasi triangular superior.
Es decir, T es una matriz triangular superior por bloques con bloques diagonales de
tamaño 1 ˆ 1 o 2 ˆ 2. Los valores propios de A son los valores propios de los bloques
diagonales de T . Los bloques de tamaño 1 ˆ 1 corresponden a valores propios de A
reales y los de tamaño 2 ˆ 2 a sus valores propios complejos conjugados.
Pongamos
u`us u´u s
uR “ uI “
2 2i
siendo“ i la unidad
‰ imaginaria. Ası́ uR , uI P Rnˆ1 y ă uR , uI ą“ă u, us ą. Sea
r r
U “ uR uI y U “ QR su factorización QR real (i.e., Q es real con columnas
r
ortonormales” y R esı real) Ası́ Im Q “ă uR , uI ą y podemos escoger una matriz Q
tal que U “ Q Q r es real y ortogonal. Ahora
„ T ” « ff
Q ı T T r
r “ Q AQ Q AQ
U T AU “ rT A Q Q rT AQ Q
rT AQ r
Q Q
Ahora bien
ˆ ˙
u`us
AuR “ A “ λ2 u ` λ̄2 u
s“
2
s R ´ iuI qq “ 1 ppλ ` λqu
“ 12 pλpuR ` iuI q ` λpu s R ` ipλ ´ λ̄quI q “
2
“ RepλquR ´ ImpλquI .
“ ‰
Como B “ QT AQ resulta que AQR “ QBR “ QRR´1 BR y QR “ uR uI . Por
consiguiente „
´1 Repλq Impλq
R BR “
´Impλq Repλq
s como valores propios.
y esta matriz tiene λ y λ
A los vectores propios, tal y como han sido definidos, se les suele llamar vectores
propios a la derecha. La razón es que, en ocasiones, se usan también vectores propios
a la izquierda y es necesario distinguirlos.
¿Qué pasa, finalmente, si λ0 es semisimple pero no simple?. En este caso hay más
de un bloque de Jordan de A asociado a λ0 , pero todos ellos son de tamaño 1 ˆ 1;
i.e., las mutiplicidades algebraicas y geométricas de λ0 son iguales y mayores que 1.
Hay vectores propios a la izquierda y a la derecha cuyo producto escalar es 1, pero
los hay también que son ortogonales.
Los vectores propios a la izquierda se pueden usar para proporcionar otra forma de
construir una forma de Schur de una matriz. El proceso serı́a el siguiente (se detalla
sólo el caso complejo, el real serı́a similar): Si A P Cnˆn y λ P ΛpAq sea u P Cnˆ1 un
vector propio a la izquierda de A de norma euclı́dea 1 asociado a λ. Con este vector
se construye una matriz unitaria U que tiene el vector u como última columna:
“ ‰
U “ U1 u .
Entonces „ ˚ „ ˚
˚ U1 “ ‰ U1 AU1 U1˚ Au
U AU “ ˚ A U1 u “ ˚ .
u u AU1 u˚ Au
9.5 Matrices unitariamente diagonalizables 209
Hemos visto que toda matriz compleja es unitariamente semejante a una matriz
triangular (teorema de Schur). Algunas tienen la propiedad más fuerte de ser se-
mejantes a una matriz diagonal. Son las matrices normales. Las introducimos, sin
embargo, de otra forma.
Definición 9.18 Una matriz A P Cnˆn se dice que es normal si conmuta con su
traspuesta conjugada. Es decir, si AA˚ “ A˚ A.
Con esta definición vemos que las matrices unitarias y las matrices hermı́ticas son
ejemplos de matrices normales. En efecto, si U P Cnˆn es unitaria entonces U ˚ U “
U U ˚ “ In . Y is H P Cnˆn es hermı́tica entonces H ˚ “ H y toda matriz conmuta
consigo misma.
Veamos ahora que las matrices normales ası́ definidas son precisamente las que son
unitariamente diagonalizables.
U ˚ AU “ D
A˚ “ U D˚ U ˚ “ U DU
s ˚
210 El álgebra de los valores propios
En consecuencia
A˚ A “ U DU
s ˚ U DU ˚ “ U DDU
s ˚
A˚ A “ U DDU
s ˚ s ˚ “ U DU ˚ U DU
“ U DDU s ˚ “ AA˚ ,
y A es normal.
Recı́procamente, por el teorema de Schur para cada A P Cnˆn existe una matriz
unitaria U P Cnˆn tal que U ˚ AU “ T , una matriz triangular superior. Si A es
normal entonces A˚ A “ AA˚ y esto equivale a que T ˚ T “ T T ˚ . Veamos, por
inducción sobre el tamaño de T , n, que esto sólo es posible si T es diagonal.
su vez, se expresa diciendo que una matriz A P Fnˆn es normal si y sólo si se puede
escribir en la forma
ÿn
A“ λi vi vi˚
i“1
“ λ1 v1 v1˚ ` ¨ ¨ ¨ ` λn vn vn˚ .
Hay dos tipos de matrices normales especialmente importantes: las matrices unita-
rias y las matrices hermı́ticas (ortogonales y simétricas en el caso real). Las matrices
unitarias (ortogonales) son las matrices normales cuyos valores propios están en la
circunferencia unidad (i.e., tienen módulo 1). Y las matrices hermı́ticas (simétricas)
son las matrices unitarias cuyos valores propios son números reales. SE deja como
ejercicio probar ambas caracterizaciones.
En el Ejemplo 9.9 hemos visto que, en general, la Forma de Jordan de una matriz
no depende continuamente de ésta. Este hecho implica que pequeños cambios en la
matriz dada pueden resultar en grandes modificaciones en su Forma de Jordan. Esto
no significa que no sea posible calcular numéricamente la forma de Jordan de ciertas
matrices (de hecho lo es) pero el diseño de cualquier algoritmo con este propósito
deberá tener en cuenta este problema de falta de continuidad y en particular el
hecho de que el conjunto de matrices simples es denso en Fnˆn (Corolario 9.14).
Tanto este Corolario como el Ejemplo 9.9 reflejan que el problema estriba en la
preservación de los tamaños de los bloques de Jordan por pequeñas perturbaciones.
Ahora nos proponemos mostrar que es ahı́ y sólo ahı́ donde están las dificultades
teóricas. Es decir, el objetivo es demostrar que los valores propios de una matriz
dependen continuamente de la matriz, y que en el caso de ser simples lo hacen
diferenciablemente. Este resultado nos permitirá definir el número de condición del
problema de calcular valores propios simples.
El problema que queremos abordar es el de calcular los valores propios de cada matriz
A P Fnˆn . La primera dificultad que nos encontramos para plantear la función que
define este problema es cuál es su conjunto de llegada. El conjunto de partida está
claro: Fnˆn (F “ R o C) pero hay una pequeña dificultad para definir correctamente
el conjunto de llegada. Por ejemplo, los valores propios de la matriz
„
1 3
A“
0 2
son tanto p1, 2q como p2, 1q. En otras palabras, mirando ΛpAq como una n-tupla
de números complejos (posiblemente repetidos), ésta está determinada salvo una
permutación de sus componentes. Esto nos conduce a considerar en el conjunto Cn
la siguiente relación de equivalencia:
f : Fnˆn Ñ Cn {„
A ; λ r “ rpλ1 , . . . , λn qs
9.6 Teorı́a de Perturbación 213
donde ΛpAq “ pλ1 , . . . , λn q son los valores propios de A en algún orden. A los
elementos de Cn {„ los llamaremos n-tuplas desordenadas de números complejos.
Nuestro objetvo es demostrar que f es una función continua. Para ello debemos
dotar a Cn {„ de una topologı́a. Lo más natural es considerar en Cn la topologı́a
habitual (la derivada de cualquier norma) y en Cn {„ la correspondiente topologı́a
cociente; es decir, la topologı́a más fina que hace que la proyección canónica
π : Cn Ñ Cn {„
r “ rpλ1 , . . . , λn qs
λ “ pλ1 , . . . , λn q ; λ
ryµ
donde pλ1 , . . . , λn q y pµ1 , . . . , µn q son dos representantes cualesquiera de λ r, res-
pectivamente, y Σn es el grupo simétrico de orden n (i.e., el grupo de permutaciones
de orden n).
Im Im
Γ
Γ2 Γ1
nº ceros de f= µ32 µ12
nº ceros de f+g µ33 λ3(triple) λ1(doble)
Re µ31 µ11
Re
µ23 µ21
z µ24 λ 2(cuadruple)
|f(z)|>|g(z)| µ22
Γ3
explı́ta de pA pλq es importante porque muestra que los coeficientes del polinomio
caracterı́stico de una matriz son funciones continuas de ésta. Veremos enseguida que
esta propiedad es crucial para demostrar que los valores propios, que son las raı́ces
del polinomio caracterı́stico, son funciones continuas de la matriz. Para lograr este
objetivo haremos uso de un importante resultado sobre funciones analı́ticas de una
variable compleja (ver Figura 9.2):
Ahora podemos demostrar que los valores propios son funciones continuas de la
matriz.
que a cada matriz le asocia la n-tupla desordenada de sus valores propios (contando
multiplicidades) es una función continua cuando en Fnˆn se considera la topologı́a
habitual y en Cn {„ la derivada de la distancia de emparejamiento óptimo.
9.6 Teorı́a de Perturbación 215
Supongamos fijado un ε ą 0 y denotemos por λi1 ,. . . ,λis los valores propios distintos
de A. Sea mj la multiplicidad algebraica de λij , j “ 1, . . . , s. Sea Bξ pλij q la bola con
centro en λij y radio ξ. Tomamos ξ de modo que ξ ă ε y que las bolas Bξ pλij q sean
disjuntas dos a dos (véase la Figura 9.3). Nuestro objetivo es demostrar que existe
un número real positivo δ tal que si }A ´ A} r ă δ entonces en el interior de cada
bola Bξ pλij q hay exactamente mj valores propios (quizá repetidos) de A r (véase de
nuevo la Figura 9.3). Ası́ pues, la distancia de λij a los mj valores propios de A r en
Bξ pλij q es menor que ξ. Esto implica que hay una forma de emparejar los valores
propios de A y A r (existe una permutación σ) tal que máx |λj ´ µσpjq | ă ξ. Es decir,
1ďjďn
r µ
dpλ, rq ă ε, que es lo que se quiere demostrar.
ř
n
Como Γj es compacto, la función |z|k alcanza su máximo en Γj , digamos Mj .
k“0
Escogiendo 0 ă ρj ă η{Mj concluı́mos que |gpzq ´ hpzq| ă ηj . Por consiguiente, si
ponemos qpzq “ hpzq ´ gpzq resulta que |qpzq| ă ηj “ mı́n |gpzq| ă |gpzq| para todo
zPΓj
z P Γj . Por el Teorema de Rouché, gpzq y gpzq ` qpzq “ hpzq tienen el mismo número
de ceros en el interior de Γj . Es decir, hpzq tiene mj ceros en el interior de Bξ pλij q.
216 El álgebra de los valores propios
ř
n
Teorema 9.23 (Teorema de Gerschgorin) Sea A P Cnˆn y ρi “ |aij |, i “
j“1
j‰i
1, . . . , n. Entonces todos los valores propios de A están localizados en la unión de
los n discos:
ďn
tz P C : |z ´ aii | ď ρi u “: GpAq.
i“1
Además, si la unión de k de estos n discos forma una región conexa que es disjunta
de los restantes n ´ k discos, entonces en dicha región hay precisamente k valores
propios de A.
9.6 Teorı́a de Perturbación 217
que es equivalente a
ÿ
n
xp pλ ´ app q “ apj xj .
j“1
j‰p
ř
n
ď |xp | |apj | “ |xp |ρp
j“1
j‰p
Ası́ pues, |λ ´ app | ď ρp para algún p; es decir, λ está en el disco cerrado con centro
en app y radio ρp . Puesto que no sabemos qué p corresponde a cada valor propio
λ (salvo que conozcamos un vector propio asociado, que es tanto como conocer el
propio valor propio, y entonces no estarı́amos interesados en localizarlo porque lo
conocerı́amos exactamente), sólo podemos concluir que cada valor propio λ está en
la unión de todos los posibles discos. Esto es GpAq.
por lo que
ď
n ď
n
GpBptqq “ tz P C : |z ´ bii ptq| ď ρi ptqu “ tz P C : |z ´ aii | ď tρi u
i“1 i“1
218 El álgebra de los valores propios
Por simplicidad vamos a suponer que la región conexa que es unión de k discos y
disjunta de los restantes es la formada por los primeros k discos. Denotemos a esta
región por Gk , i. e.
ď
k
Gk :“ tz P C : |z ´ aii | ď ρi u
i“1
Está claro que en Gk hay k valores propios de Ap0q “ D y los restantes n ´ k están
en Gck . Vamos a demostrar que esto mismo sucede para todo Aptq con t P r0, 1s.
Tomando un ε ą 0 para que la unión de los discos Dpaii , εq esté en Gk para i “
1, . . . , k y en Gck para i “ k ` 1, . . . , n, por la continuidad de los valores propios,
resulta que existe un δ ą 0 tal que si }E} ă δ entonces Ap0q ` E tiene k valores
propios en Gk y n ´ k en Gck . En particular existe un t0 ą 0 tal que para t P r0, t0 q,
k valores propios de Aptq están en Gk y n ´ k en Gck . Si t0 ą 1 ya hemos terminado.
Si no, para probar que Aptq tiene k valores propios en Gk y n ´ k en Gck para todo
t P r0, 1s procedemos por contradicción. Podemos suponer que existe t1 P rt0 , 1s tal
que Aptq tiene k valores propios en Gk y n ´ k en Gck para t P r0, t1 q y Apt1 q tiene
menos de k valores propios en Gk y más de n ´ k en Gck . Si fuera al revés; es decir, si
Apt1 q tuviera menos de n ´ k valores propios en Gck y más de k en Gk se procederı́a
de forma similar.
Veamos que esto conduce a una contradicción. En efecto, sean λ1 , . . . , λs los valores
propios no repetidos de Apt1 q en Gk y λs`1 , . . . , λr los que están en Gck . Sea ε ą 0 un
número real tal que la unión de los discos Dpλi , εq está en Gk para i “ 1, . . . , s y en
Gck para i “ s ` 1, . . . , r. Tal y como hemos razonado más arriba, por la continuidad
Ťs
de los valores propios, existe un δt ą 0 tal que Apt1 ´ δtq tiene en Dpλi , εq tantos
i“1
Ť
r
valores propios como Apt1 q y lo mismo en Dpλi , εq. Es decir, Apt1 ´ δtq tiene
i“s`1
menos de k valores propios en Gk y más de n ´ k en Gck ; lo que es una contradicción
porque t1 ´ δt ă t1 y para t ă t1 la suposición es que Aptq tiene exactamente k
valores propios en Gk y n ´ k en Gck .
puede verse como una perturbación de la matriz Diagp1, 2q. Sus valores propios
pueden calcularse a mano: 1 ´ 10´8 y 2 ` 10´8 . ¿Qué resultado nos proporciona el
Teorema de Gerschgorin? Según este teorema, los valores propios de A deben estar
en el intervalo r1 ´ 10´4 , 1 ` 10´4 s y r2 ´ 10´4 , 2 ` 10´4 s. ¿Por qué en la recta real?
El Teorema de Gerschgorin garantiza que hay un valor propio en la bola de centro
1 y radio 10´4 y otro en la de centro 2 y el mismo radio. Pero A es real de modo
que si sus valores propios fueran complejos deberı́an ser conjugado uno del otro y
no podrı́a uno estar en una bola y otro en la otra. Por lo tanto deben ser reales.
El teorema de Gerschgorin en el ejemplo anterior nos da una idea de que los valores
propios de A están próximos a 1 y 2 pero la precisión es escasa. Hay resultados que
mejoran el resultado de este teorema pero no proseguiremos en esa dirección. El
lector interesado puede consultar los libros [12, 26], por ejemplo.
f pA ` tEq ´ f pAq y ˚ Ex
“ ˚ ` Op|t|}E}2 q.
t y x
Por lo tanto
f pA ` tEq ´ f pAq y ˚ Ex
lı́m “ ˚
tÑ0 t y x
9.6 Teorı́a de Perturbación 221
y ˚ Ex
f 1 pAqpEq “
y˚x
es la diferencial de f en A.
Ası́ pues sólo debemos demostrar (9.3). Supongamos para ello que J “ T ´1 AT es
la forma de Jordan de A del Teorema 9.8. En realidad, nos interesa considerar una
leve variación de esta forma clásica de Jordan. Se trata de lo siguiente. Supongamos
que z ‰ 0 es un número complejo y que Jn pλq es un bloque de Jordan. Definamos
Dz “ Diagpz, z 2 , . . . , z n q. Esta matriz es invertible y Dz´1 Jn Dz difiere de Jn en que
los elementos en la subdiagonal superior son todos iguales a z en vez de ser todos
iguales a 1. Este procedimiento para un bloque de Jordan se puede generalizar a
cualquier matriz en forma de Jordan de modo que podemos suponer que la matriz
J “ T ´1 AT de más arriba es la forma de Jordan de A con δ{3 en vez de 1 en la
superdiagonal. Dado que δ es un número tal que las bolas centradas en los valores
propios de A y radio δ son disjuntas dos a dos, la distancia de λ0 a cualquier otro
valor propio de A es mayor que δ. Además, como x, y son vectores propios de A por
la derecha e izquierda, podemos suponer que el elemento en la posición p1, 1q de J
es λ0 , que x es la primera columna de T y que y ˚ es la primera fila de T ´1 . Si no
x
fuera ası́ podrı́mos sustituir x por x1 “ ˚ que también serı́a un valor propio de A
y x
por la derecha asociado a λ0 y tendrı́mos que y ˚ x1 “ 1, que es lo que se necesita.
r “ A ` E P Bε pAq y
Sea E una matriz tal que A
Jr “ T ´1 pA ` EqT
#
δ
` ii`1 si Jii`1 “ 1
Jrii`1 “ Jii`1 ` yi˚ Exi`1 “ 3
ii`1 si Jii`1 “ 0
Los valores propios de A r “ A ` E, Jr y Jrα son los mismos cualquiera que sea α ‰ 0.
Vamos a usar el Teorema de Gerschgorin para localizar los valores propios de Jrα en
el disco de centro λ0 ` 11 . El radio de este disco está acotado por pn ´ 1qα siendo
“ máxt|ij | : 1 ď i, j ď nu. Los demás discos de Gerschgorin están centrados en
λi ` ii y sus radios están acotados por
δ
α´1 ` ` ` pn ´ 3q. (9.4)
3
Nuestro objetivo es encontrar números reales ą 0 y α (que dependerá de ) tales
que el disco de centro λ0 `11 y radio pn´1qα sea disjunto de los discos con centro en
λi ` ii y radio la cantidad de (9.4). En estas condiciones el Teorema de Gerschgorin
asegurarı́a que en el disco con centro en λ0 ` 11 y radio |α|p|12 | ` ¨ ¨ ¨ ` |1n |q sólo
habrı́a un valor propio de Jrα ; i.e. de A ` E. El radio de este disco nos permitirı́a
valorar la distancia entre λ0 y ese valor propio de A ` E. Veremos que esa distancia
se corresponde con la expresión (9.3).
Para que los discos en cuestión sean disjuntos es suficiente que la suma de sus radios
sea menor que la distancia entre los correspondientes centros; es decir,
δ
|λ0 ` 11 ´ λi ´ ii | ą pn ´ 1qα ` α´1 ` ` ` pn ´ 3q.
3
Ahora bien
|λ0 ` 11 ´ λi ´ ii | ď |λ0 ´ λi | ` 2 ă δ ` 2.
9.6 Teorı́a de Perturbación 223
4
Por lo tanto, si cumple esta condición y α “ , el disco con centro en λ0 ` 11 y
δ
radio pn ´ 1qα tendrá intersección vacı́a con lo discos de centro λi ` ii y radio el
número de (9.4).
4
Con este y α “ , en el disco de centro λ0 ` y ˚ Ex y radio pn ´ 1qα hay un único
δ
r
valor propio de A “ A ` E. Pero,
4pn ´ 1q2
pn ´ 1qα “ “ Op}E}22 q “ Op}E}2 q,
δ
debido a la equivalencia de normas. En conclusión
˚
r0 “ λ0 ` y Ex ` Op}E}2 q
λ
y˚x
tal y como se deseaba demostrar.
Una vez que sabemos que los valores propios simples de una matriz son funciones
diferenciables de ésta, podemos calcular fácilmente el número de condición absoluto.
En efecto, sabemos que para A P Fnˆn el número de condición del problema de
calcular el valor propio simples λ0 es
κpλ0 q “ }f 1 pAq}
9.6 Teorı́a de Perturbación 225
f 1 pAq : Fnˆn ÝÑ C
y ˚ Ex
E ;
y˚x
la matriz Jacobiana, que seguimos denotando como f 1 pAq, es la matriz de esta
aplicación lineal cuando se toman las bases canócicas. Es decir, es una matriz 1 ˆ n2
que identificándola con una matriz n ˆ n, la pi, jq-ésima componente es
y ˚ Eij x
y˚x
siendo Eij la matriz cuyos elementos son todos cero excepto el de la posición pi, jq
que es 1. Ası́
y ˚ Eij x “ y i xj
y, en consecuencia, escrita la matriz Jacobiana 1 ˆ n2 en forma de matriz n ˆ n:
1 1
B“ ˚
yxT “ ˚ yx˚ .
y x y x
La norma euclı́dea de la matriz Jacobiana 1ˆn2 corresponde a la norma de Frobenius
de B. Es decir,
1 ` ˘ 1 ` ˘
}f 1 pAq}22 “ }B}2F “ trpB ˚ Bq “ tr xy ˚ yx˚ “ tr xx ˚
x˚ yy ˚ x |y ˚ x|2
donde hemos usado que y ˚ y “ }y}22 “ 1. Pero,
` ˘
tr xx˚ “ trpxx˚ q “ 1
1
κ2 pλ0 q “ “ sec θ
|y ˚ x|
donde hemos usado que por la desigualdad de Cauchy-Schwarz |x˚ Ex| ď }x}2 }Ex}2 “
}Ex}2 y por la compatibilidad de la norma euclı́dea y la espectral }Ex}2 ď }E}2 }x}2 “
}E}2 . No obstante, este resultado también es una consecuenca directa del Teorema
de Bauer-Fike.