Académique Documents
Professionnel Documents
Culture Documents
2.1
Definio 2.1 Seja L um conjunto no qual se definem duas operaes (fechadas em L):
(i) Uma operao binria designada soma vectorial
x, y L x + y L
(ii) Uma operao designada multiplicao escalar (real)
x L, IR x L
O conjunto L, com estas duas operaes designa-se um espao linear (ou vectorial) se se verificarem
as seguintes propriedades:
(S) A operao soma (vectorial) em L:
(S1) comutativa, isto , x + y = y + x, x, y L.
15
IR, x, y L
, IR, x L
Observaes:
1. Nesta definio, admitiu-se que os escalares envolvidos na multiplicao escalar so nmeros reais.
Tambm se definem espaos lineares em que os escalares so nmeros complexos, mas o facto de
no serem utilizados nesta disciplina aconselha a definio mais simples aqui utilizada.
2. Os elementos de um espao linear so designados vectores. Esta terminologia tem a sua origem no
facto dos espaos lineares mais frequentes se definirem nos habituais espaos euclidianos: L = Rn .
3. O inverso aditivo de um vector x L resulta da sua multiplicao escalar pelo nmero real -1:
x = (1)x, x L.
4. A operao da subtraco est implicitamente definida em qualquer espao linear: xy = x+(y),
x, y L.
5. O elemento nulo da operao soma num espao linear nico.
6. Cada vector de um espao linear tem um inverso aditivo nico.
7. A multiplicao escalar de qualquer vector x L pelo nmero real zero resulta no elemento nulo
da soma vectorial: 0x = 0, x L.
Exemplos de espaos lineares:
1. IRn (n IN), com as habituais operaes.
2. IMnp , o espao de todas as matrizes reais de tipo np , com a habitual operao de soma de
matrizes e de produto de uma matriz por um nmero real.
3. Sp , o espao de todas as matrizes simtricas de tipo pp .
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
16
17
1
2
2. IRn um espao n-dimensional. A base de IRn constituda pelos vectores {ei }ni=1 , onde ei um
vector com 1 na i-sima posio e os restantes elementos iguais a zero, designa-se a base cannica
de IRn .
3. IMnp um espao np-dimensional. A base cannica deste espao constituda pelas matrizes Eij
(i=1,...,n ; j=1,...,p), que tm um 1 na i-sima linha, j-sima coluna, e zero nas restantes posies.
4. Sp um espao p(p + 1)/2-dimensional. Uma base do espao 6-dimensional S3 dada por:
1 0
0 0
0 0
0
0 0
0 , 0 1
0
0 0
0
0 0
0 , 0 0
0
0 0
0
0 1
0 , 1 0
1
0 0
0
0 0
0 , 0 0
0
1 0
1
0 0
0 , 0 0
0
0 1
0
1
0
5. O espao linear dos polinmios de grau n de dimenso n+1. Uma base deste espao constituda
pelos polinmios {1, x, x2 , x3 , ..., xn }.
Notas:
1. O espao linear das funes contnuas em [a,b] de dimenso infinita.
2. Num espao linear de dimenso n, nenhum conjunto de menos de n vectores pode gerar o espao e
nenhum conjunto de mais de n vectores pode ser linearmente independente.
Definio 2.4 Um subconjunto M de um espao linear L diz-se um subespao linear se M tiver as
propriedades que definem um espao linear.
Mas existe uma caracterizao simples de subespaos lineares:
Teorema 2.3 Seja M um subconjunto no vazio dum espao linear L. Ento M um subespao linear
de L se e s se fr fechado para qualquer combinao linear dos seus elementos, i.e., se:
x + y M
x, y M, , IR
18
2.2
Transformaes Lineares
19
Figura 2.1: Os conjuntos Ncleo e Imagem, definidos por uma aplicao linear entre dois espaos lineares.
1111111111
0000000000
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
0000000000
1111111111
N (A)
111111
000000
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
000000
111111
C(A)
0
Aplicao Linear A
Espao Linear
Espao Linear
Teorema 2.5 Sejam L e M espaos lineares e A uma transformao linear de L em M. Ento, o ncleo
de A, N (A) um subespao de L, e o conjunto imagem, C(A), um subespao de M.
Exerccio 2.1 Demonstrar este Teorema.
Observao. Caso a transformao linear A seja uma aplicao dum espao L nele prprio, A define
dois subespaos em L: o conjunto imagem C(A) e o ncleo N (A).
Definio 2.7 Sejam L e M espaos lineares e A uma transformao linear de L em M. A dimenso do
subespao imagem C(A) diz-se a caracterstica da transformao A e representa-se por car(A). Assim,
car(A) = dim (C(A)).
Generalizemos agora um resultado j estudado no contexto das transformaes lineares entre espaos
euclidianos, ou seja, no contexto de matrizes, e que relaciona a caracterstica duma transformao linear
com as dimenses do seu ncleo e do subespao de partida.
Teorema 2.6 Seja A uma transformao linear entre os espaos lineares L e M. Ento
dim(L) = dim (N (A)) + dim (C(A)) .
(2.1)
20
Ax = A
i xi
i=1
k
X
= A
n
X
i xi +
i=1
i xi
i=k+1
Tendo em conta que A uma transformao linear e que o vector dado pelo primeiro dos dois somatrios
na expresso anterior pertence ao ncleo da aplicao A (uma vez que combinao linear dos vectores
duma base desse subespao N (A)), tem-se que qualquer imagem atravs de A se pode escrever como
!
n
n
k
X
X
X
i (Axi ) =
i (Axi ) .
i xi +
Ax = A
i=1
i=k+1
i=k+1
Por outras palavras, qualquer vector do espao imagem C(A) se pode escrever como combinao linear dos
n k vectores {Axi }ni=k+1 (isto , os n k vectores {Axi }ni=k+1 formam um conjunto gerador de C(A)),
pelo que a dimenso desse subespao no pode exceder n k. Falta confirmar que essa dimenso no
inferior a n k, ou seja que os n k vectores {Axi }ni=k+1 so linearmente independentes (constituindo,
por isso, uma base de C(A)). Isso equivale a mostrar que
n
X
i Axi = 0
i=k+1
Mas
n
P
i Axi = A
i=k+1
n
P
i xi
i=k+1
i = 0, i = k + 1, ..., n .
n
P
i xi pertence ao ncleo de A,
i=k+1
pelo que pode ser escrito como combinao linear dos k vectores da base desse subespao, {xi }ki=1 . Por
outras palavras, existem constantes {i }ki=1 , tais que
n
X
i=k+1
i xi =
k
X
i xi
i=1
n
X
i=k+1
i xi
k
X
i xi = 0 .
i=1
Mas o membro esquerdo desta igualdade uma combinao linear dos n vectores {xi }ni=1 que sabemos
constituirem uma base de L. Tratando-se duma base, esse conjunto de vectores linearmente independente, pelo que todos os coeficientes da referida combinao linear (de soma igual ao vector nulo) tero
de ser zero. Assim, em particular, i = 0, i, como se queria mostrar. Logo, dim (C(A)) = n k.
Encerramos esta discusso com um resultado interessante: as transformaes lineares entre espaos lineares formam, elas prprias, um espao linear.
Teorema 2.7 O conjunto T (L, M ) das transformaes lineares de L em M constitui um espao linear
com as operaes (A + B)x = Ax + Bx e (A)x = (Ax).
Observao. Em particular, tem-se uma transformao linear nula, 0, que elemento nulo para a
operao soma em T (L, M ), isto , tal que para qualquer outra aplicao linear A se verifica A + 0 = A.
Essa transformao linear nula sobre L caracteriza-se pelo facto de 0x = o, x L, e onde o designa
o elemento nulo do espao linear M. tambm consequncia deste Teorema que exista sempre uma
transformao linear que seja o inverso aditivo de uma dada transformao linear. Ou seja, dada uma
transformao linear de L em M, A, existe sempre outra transformao linear de L em M, A, tal que
A + (A) = 0.
Exerccio 2.2 Demonstrar este Teorema.
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
21
2.3
x, y L
[Simetria]
x1 , x2 , y L, 1 , 2 IR [Bilinearidade]
[Definida positiva]
Nota. Na disciplina de Complementos de lgebra e Anlise foi utilizada uma notao diferente para o
produto interno entre vectores de Rn : x|y ou x y, em vez de < x, y >.
Observaes:
1. A designao de bilinearidade resulta do facto, dada a simetria, a linearidade se aplicar a qualquer
dos argumentos do produto interno. Por outras palavras, tambm se verifica < x, 1 y1 + 2 y2 >=
1 < x, y1 > +2 < x, y2 >, y1 , y2 , x L, 1 , 2 IR.
2. Se 0L representa o elemento nulo do espao linear L, ento verifica-se necessariamente que o produto
interno de 0L com qualquer elemento de L igual a zero. De facto,
< x , 0L > =
=
< x, yy > ,
yL
onde a segunda igualdade resulta da simetria e bilinearidade do produto interno, juntamente com
o facto de y = (1) y (veja-se a observao 3, na pgina 16).
Definio 2.9 Uma norma (comprimento) uma funo real k k : L IR, que verifica as seguintes
propriedades:
1. (a) kxk 0,
(b) kxk = 0
x L
[Nao negatividade]
x=0
[Positividade]
2. kc xk = |c| kxk,
3. kx + yk kxk + kyk,
x L,
c IR
x, y L
[Homogeneidade]
[Desigualdade Triangular]
Observaes:
1. Um espao linear com uma norma diz-se um espao normado.
2. Um vector de norma 1 num espao normado diz-se um vector unitrio.
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
22
x, y L
2. kx yk kx zk + kz yk ,
x, y, z L
n
X
xi yi
i=1
Teorema 2.9 Se L um espao linear com a norma k k, induzida pelo produto interno < , >, tem-se:
kx yk2 = kxk2 2 < x, y > +kyk2 ,
x, y L .
Definio 2.11 Uma distncia num espao normado L uma funo real d : LL IR, definida
como:
d(x, y) = kx yk , x, y L
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
23
<x,y>
kxkkyk .
24
2.4. PROJECES
2.4
2.4.1
Projeces
Projeces em espaos lineares genricos
25
Teorema 2.14 Seja L um espao linear e M, N dois seus subespaos. Ento L=MN se e s se:
1. L=M+N
2. M N={0}
Demonstrao.
() Se L=MN, evidente que L=M+N. Falta provar que se x MN, ento x=0. Seja x MN.
Como x L, pode-se escrever de forma nica como x = xM + xN , com xM M e xN N. Mas se
x M, tem de ter-se x = xM , isto , xN = 0. E se x N, tem de ter-se x = xN , isto , xM = 0.
Logo, x MN x = 0.
() Se L=M+N, s falta provar que a decomposio de qualquer x L nica. Admita-se que existem
duas decomposies de x L, x = xM +xN e x = yM +yN . Ento, 0 = x x = (xM yM )+(xN
yN ), isto , (xM yM ) M o inverso aditivo de (xN yN ) N. Como M e N so subespaos,
tem de ter-se (xN yN ) M e (xM yM ) N, isto , (xM yM ),(xN yN ) MN. Mas essa
interseco s contm o elemento nulo 0, logo xM = yM e xN = yN .
Exemplo 2.5 A decomposio do espao de matrizes quadradas na soma do espao de matrizes simtrica
e o espao de matrizes anti-simtricas, discutido no exemplo 2.3 (pgina 25), uma decomposio em
soma directa. De facto, para que uma matriz p p fosse simultaneamento simtrica e anti-simtrica,
seria necessrio que, para qualquer i, j, se verificasse cij = cji = cji . Ora, o nico nmero real que
igual ao seu simtrico o zero, pelo que teria de ter-se cij = 0, i, j. Assim, apenas a matriz nula
pertence a Spp App , pelo que a soma referida no exemplo tem de ser directa.
O seguinte Teorema imediato, a partir das definies de soma directa, base e dimenso de um subespao.
Teorema 2.15 Seja L=MN. Ento:
1. A reunio de uma base de M com uma base de N constitui uma base de L.
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
26
2.4. PROJECES
2. dim(L)=dim(M)+dim(N)
Demonstrao. Se L=MN, qualquer vector x L se pode escrever de forma nica como a soma de
um vector xM M e outro vector xN N.
1. Dada uma base de M, xM pode ser escrito de forma nica como combinao linear dessa base.
De forma anloga, xN pode ser escrito de forma nica como combinao linear duma base de N.
Logo, qualquer vector x L pode ser escrito de forma nica como combinao linear do conjunto de
vectores que resulta de reunir as bases de M e N, pelo que esse conjunto uma base de L. Note-se
que no possvel que haja dependncia linear ao juntar os vectores das bases de M e N, uma vez
que apenas o vector nulo comum a esses dois espaos.
2. O nmero de vectores da base de L construda na alnea anterior a soma do nmero de vectores
das bases de M e N.
Teorema 2.16 Seja L um espao linear com produto interno e M qualquer subespao de L. Ento:
L = M M
(2.2)
Demonstrao. Pelo Teorema 2.14 sabemos que basta demonstrar que MM = {0} e que M+M =L.
1. Seja x M M . Ento x x < x, x >= 0 x = 0 (pela definio de produto interno).
Pk
2. Seja z L, qualquer. Seja {xi }ki=1 uma base ortonormada de M. Ento o vector x = i=1 i xi com
i =< z, xi > , i = 1, ..., k, pertence ao subespao M. Se provarmos que o vector z x M ,
teremos L=M+M . Ora, para qualquer vector xi da base, tem-se:
< z x, xi > = < z, xi > < x, xi > = i
k
X
j=1
j < xj , xi > = i i = 0
j que < xi , xj >= 0 se i 6= j, uma vez que a base ortonormada. Assim, z x ortogonal a todos
os vectores da base de M, pelo que tem de ser ortogonal a qualquer vector de M.
Observaes:
1. Isto significa que qualquer vector de L se pode sempre escrever de forma nica como a
soma de um vector em M e de outro vector de M , i.e., ortogonal a M.
2. O facto de L=MM no invalida que L=MN para outros subespaos N6=M .
Definio 2.17 Seja L um espao linear e M, N dois seus subespaos tais que L=MN. Uma aplicao
P que associa a cada z L a sua componente nica em M (i.e., tal que se z = x + y, com x M e y N,
se tem Pz = x) diz-se uma projeco de L sobre M, ao longo de N. Se N=M , diz-se que P a
projeco ortogonal de L sobre M.
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
27
Demonstrao. Para verificar que P uma aplicao linear, haver que mostrar que , IR
e x, y L, se verifica P(x + y) = Px + Py. Ora, como L=MN, temos, de forma nica,
x = xM + xN e y = yM + yN . Logo, como M e N so subespaos, x + y = (xM + yM ) +
(xN + yN ), sendo esta a decomposio nica de x + y nas suas componentes em M e N. Assim,
P(x + y) = xM + yM = Px + Py.
Verifica-se ento o seguinte resultado, que permite falar sempre em o projector sobre um subespao, ao
longo de outro.
Teorema 2.18 Dado um espao linear L e uma soma directa L=MN, o projector sobre M ao longo de
N nico.
Demonstrao. Seja P um projector sobre M ao longo de N, isto , P uma aplicao linear tal que,
z L, e dada a decomposio nica de z = zM + zN , verifica: Pz = zM . Admita-se que existia outra
aplicao linear Q que tambm projectasse sobre M ao longo de N. Ento Pz = Qz, z L. Mas nesse
caso Pz Qz = (P Q)z = 0L , z L, onde 0L representa o elemento aditivo nulo em L. Logo (tendo
em conta as observaes feitas na pgina 21) P Q tem de ser a aplicao nula, o que implica que P =
Q.
Definio 2.18 Uma aplicao linear P num espao linear L diz-se:
1. uma aplicao idempotente se P2 = P, onde por P2 se entende a aplicao P2 (x) = P(P(x)).
2. uma aplicao identidade se Px = x, x L.
Observao. usual indicar uma aplicao identidade utilizando a letra I.
Teorema 2.19 Seja P uma aplicao linear no espao linear L, e I a aplicao identidade. Ento:
1. P uma projeco em L se e s se P idempotente.
2. Se P idempotente, P projecta sobre o seu subespao imagem, C(P), ao longo do seu ncleo, N (P).
3. Se P idempotente, I P projecta sobre o ncleo de P, N (P), ao longo da subespao imagem de
P, C(P).
Munindo o espao linear L dum produto interno, e sendo M um subespao de L, verifica-se ainda
4. Se P projeco ortogonal sobre M, ento I P projeco ortogonal sobre M .
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
28
2.4. PROJECES
Demonstrao.
1. () Se P uma projeco sobre um subespao M ao longo de outro subespao N (com L=MN),
um vector arbitrrio z L, pode-se escrever de forma nica como z = zM + zN para zM
M, zN N, e P devolve a componente (nica) de z em M: Pz = zM . Nesse caso:
P2 z = P(Pz) = PzM
Mas PzM = zM , pois se zM M, ento zM = zM + 0 a sua decomposio (nica), e P
uma projeco sobre M ao longo de N. Logo:
P2 z = Pz (= zM ), z L
o que equivale a dizer que P2 = P.
() Seja P2 = P, N o ncleo de P e M o conjunto de vectores x L tais que Px = x. Sabe-se
que N um subespao. M tambm o (verifique que no-vazio e fechado para combinaes
lineares dos seus elementos). Vamos provar que L=MN, isto , que MN={0} e M+N=L.
(a) Vamos mostrar que se z MN = z = 0. Seja z N, ento Pz = 0. Seja z M, ento
Pz = z. Ento z pertence a MN se e s se z = 0.
(b) Tem-se, z L, z = Pz + z Pz = Pz + (I P)z, onde I a aplicao identidade
em L. Mas Pz M (pois P(Pz) = Pz, pela idempotncia de P), e (I P)z N, (pois
P[I P]z = Pz P2 z = 0). Assim, qualquer z L decomponvel, pelo que L=M+N.
Observaes:
1. Repare-se que na demonstrao do primeiro ponto do Teorema anterior mostrou-se que se P
uma aplicao idempotente, P projecta sobre o conjunto de vectores que permanecem
invariantes sob o seu efeito (isto , o conjunto de vectores x L tais que Px = x), ao longo
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
29
Teorema 2.20 Seja L um espao linear com produto interno e k k a norma induzida pelo produto
interno. Seja M um subespao de L, e P o projector ortogonal sobre M. Dado qualquer vector (nonulo) z L, verifica-se:
1. (Teorema de Pitgoras.) O quadrado da norma de z a soma dos quadrados das normas
das suas componentes em M e em M , isto : kzk2 = kPzk2 + k(I P)zk2 .
2. O cosseno do ngulo entre um vector z M
/ e a sua projeco ortogonal sobre M dada por:
cos(z, Pz) =
kPzk
kzk
Demonstrao.
1. Tem-se: kzk2 = kPz + (I P)zk2 = kPzk2 + 2 < Pz, (I P)z > +k(I P)zk2 . Mas a parcela
intermdia anula-se, pois Pz M, e (I P)z M .
2. Se Pz 6= 0 (i.e., z
/ M ), pela definio de cosseno de ngulo entre vectors no-nulos (p. 24) vem:
cos(z, Pz) =
30
2.4. PROJECES
A segunda parcela do numerador anula-se, enquanto que a primeira kPzk2 .
3. Queremos determinar o vector z M que minimiza kz zk ou, o que equivalente, que minimiza
kz zk2 . Ora, como L=MM , o vector z tem decomposio nica z = zM + zM , com zM M
e zM M . Logo,
kz zk2
=
=
Mas a segunda parcela do lado direito anula-se, uma vez que o vector zM z pertence ao subespao
M, e o vector zM pertence ao complemento ortogonal de M. Por outro lado, a terceira parcela
no depende de z. Assim, minimizar kz zk2 corresponde a minimizar a primeira parcela do lado
direito. Mas isso faz-se tomando z = zM , como queramos demonstrar.
4. Minimizar ngulos corresponde a maximizar cossenos desses ngulos. Assim, procuramos os vectores
<z,
z>
z de M que maximizam o quociente kzkk
z k . Utilizando a decomposio nica do vector genrico z,
isto , considerando z = zM + zM , temos < z, z > = < zM , z > + < zM , z >. Por consideraes
anlogas s das alneas anteriores, a segunda parcela anula-se. E pelo Teorema de Cauchy-SchwarzBuniakovski, sabemos que | < zM , z > | kzM k k
z k, verificando-se a igualdade quando z um
mltiplo escalar de zM , isto , de Pz. Para poder ignorar os mdulos, h que exigir que o escalar
desse mltiplo escalar seja positivo, isto , que z aponte no mesmo sentido que Pz.
z
@
I
@
@ kzk
@
@
@
k(I P)zk
@
@
@
@
x3
@
kPzk
@0
M
@
z = Pz
?R
x2 @
x4
)
x1
Figura 2.2: Ilustrao do Teorema de Pitgoras. O ngulo o ngulo cujo cosseno referido no Teorema
da pgina 30
31
2.4.2
Projeces em IRk
Consideremos agora os espaos reais, IRk , munidos do habitual produto interno Euclidiano: < x, y > =
xt y. Sabemos, da disciplina de Complementos de lgebra e Anlise que a cada matriz do tipo n m
corresponde uma aplicao linear de IRm em IRn , e viceversa (fixando as bases de cada espao). As
aplicaes lineares em IRk correspondem a matrizes de tipo kk . Assim, a cada aplicao linear (e
admitindo que se convenciona trabalhar apenas com as bases cannicas de IRk ) corresponde uma matriz
A Mkk . Pela caracterizao feita anteriormente de projeces, as projeces em IRk correspondem a
matrizes idempotentes. Mas pode-se demonstrar um resultado mais forte, que caracteriza completamente
as matrizes de projeco ortogonal nos espaos vectoriais IRk : as matrizes de projeco ortogonal em IRk
so as matrizes simtricas (At = A) e idempotentes (A2 = A) de tipo kk , como mostram os seguintes
Teoremas.
Teorema 2.21 Seja IRk =MM , com M um subespao em IRk de dimenso r. Considere o produto
interno usual em IRk . Ento, a matriz P de projeco ortogonal sobre M nica e tem a forma:
P = B(Bt B)1 Bt ,
onde B uma matriz kr cujas r colunas formam uma qualquer base de M.
Notas:
1. A matriz B no nica, mas a matriz de projeco P = B(Bt B)1 Bt tem de o ser, pelo Teorema
2.18 (pg. 28).
2. No caso de se escolher uma base ortonormada do subespao M sobre o qual se projecta, ento as
colunas da matriz B so ortonormadas e pode escrever-se apenas PB = BBt .
Demonstrao. Se IRk =MM , qualquer vector x IRk se pode escrever de forma nica como
x = x1 + x2 , com x1 M e x2 M . Como as colunas de B formam uma base de M, x1 pode
escrever-se por sua vez, de forma nica, como combinao linear dessas colunas, isto , x1 = Bc para
um e um s vector c IRr . Simultaneamente, se x2 M , x2 ortogonal a qualquer vector de M,
logo ortogonal a todas as colunas de B, pelo que Bt x2 = 0. Assim, Px = (B(Bt B)1 Bt )(x1 + x2 )
= (B(Bt B)1 Bt )(Bc) + 0 = Bc = x1 . Assim, a imagem de qualquer vector de IRk por P a sua
componente nica no subespao M. Assinale-se que a existncia da inversa de Bt B garantida pelo
facto de esta matriz r r ter caracterstica igual caracterstica de B (ver apontamentos de Estatstica
Multivariada), e a caracterstica de B ter de ser r, j que as suas colunas formam uma base dum subespao
de dimenso r.
Exemplo 2.6 Consideremos o exemplo trivial de projeco ortogonal, em R3 , sobre o plano coordenado x0y. Em R3 , um ponto genrico tem coordenadas (x, y, z) e a sua projeco ortogonal sobre o
plano (subespao) referido o ponto de coordenadas (x, y, 0). Para construir a respectiva matriz de projeco ortogonal, escolhemos uma base (por sinal, ortonormada) do subespao x0y, dada pelos vectores
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
32
2.4. PROJECES
0
1
1 e PB = B(Bt B)1 Bt = 0
0
0
1
(1, 0, 0) e (0, 1, 0). Temos B = 0
0
PB [x, y, z]t = [x, y, 0]t .
0 0
1 0 . Facilmente se v que
0 0
Exemplo 2.7 Em R3 , a equao x = y define um plano vertical, constituido pelos pontos de coordenadas
(a, a, b), a, b R. Este plano (subespao) gerado, por exemplo, pelos vectores [1, 1, 0]t e [0, 0, 1]t. Logo,
1 1
0
1 0
2
2
podemos tomar B = 1 0 e a matriz de projeco ortogonal : PB = B(Bt B)1 Bt = 21 12 0 .
0 0 1
0 1
A projeco ortogonal de, por exemplo, o vector [1, 2, 3]t dada por PB [1, 2, 3]t = [ 23 , 23 , 3]t .
Nota: Seja y IRk um vector e M um subespao linear r-dimensional de IRk com uma base constituda
pelas colunas da matriz B. A projeco ortogonal de y sobre M (com o produto interno usual) o vector:
= Py = B(Bt B)1 Bt y
y
O vector (de tipo r 1):
(Bt B)1 Bt y
M
o vector dos r coeficientes da combinao linear que define de forma nica o vector projectado y
em termos dos vectores da base B de M.
M
y
@
I
@
@
@
@
@
@
@
@
x2P
iP
PP @
PP@
P@
P
P
0
= Py P
y
P
)P
x1
Figura 2.3: Projeco do vector y sobre o subespao M, gerado pelos vectores x1 e x2 . As coordenadas
do vector projectado nos eixos x1 e x2 so dadas pelos elementos do vector (Bt B)1 Bt y, onde a matriz
B a matriz cujas duas colunas so os vectores da base, x1 e x2 .
33
Teorema 2.22 Seja P uma matriz de dimenso k k. Ento P matriz de projeco ortogonal
sobre algum subespao de Rk se e s se P uma matriz simtrica e idempotente.
Demonstrao.
(=) Imediata: trivial verificar que P = B(Bt B)1 Bt uma matriz simtrica e idempotente.
(=) Se P idempotente, j sabemos que projeco sobre o seu espao imagem C(P), ao longo do
seu ncleo N (P). Para que a projeco seja ortogonal, preciso que N (P) = C(P) . J sabemos,
da disciplina de Complementos de lgebra e Anlise que, como para qualquer matriz P, se tem
34
2.4. PROJECES
imediata da primeira, uma vez que (Teorema A.1, Apndice A) uma matriz simtrica semi-definida
positiva se e s se todos os seus valores prprios forem no-negativos.
2.4.3
No estudo do Modelo Linear, vrios resultados importantes dizem respeito a situaes em que se comparam projeces de vectores sobre subespaos encaixados noutros subespaos, ou seja, subespaos contidos noutros subespaos. Vejamos dois resultados relativos a projeces sobre subespaos encaixados.
Vejamos ainda outro resultado envolvendo projeces e subespaos encaixados, que ser de grande utilidade posteriormente.
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
35
Teorema 2.25 Seja M um subespao prprio de IRk e N M um seu subespao prprio. Seja
Q=MN . Sejam PM e PN as matrizes de projeco ortogonal sobre M e N, respectivamente. Ento:
1. Q e N so subespaos ortogonais.
2. M = N Q.
3. A matriz de projeco ortogonal sobre o subespao Q PM PN .
Demonstrao.
1. Q subespao pois a interseco de dois subespaos. Que ortogonal ao subespao N imediato,
uma vez que Q = MN N .
2. Uma vez que N e Q so ortogonais, o nico elemento que lhes pode ser comum a origem de IRk
(se x NQ, x ortogonal a si prprio, mas < x, x > = 0 x = 0). Falta apenas provar que
M = N + Q (isto , que qualquer elemento de M se pode escrever como a soma de um elemento
de N e outro de Q) para se poder aplicar o Teorema 2.14 (pg.26) e concluir que M = NQ. Ora N
subespao de IRk , pelo que possvel decompr IRk em soma directa de N e o seu complemento
ortogonal (veja-se o Teorema 2.16, pg. 27), isto , IRk = N N . Isto significa que todos os
elementos de IRk se podem escrever, de forma nica, como soma de um elemento de N mais um
elemento de N . Em particular, os elementos de M IRn podem ser decompostos desta forma.
Logo, x M, x = xN + xN , com xN N e xN N . Mas NM, logo xN = x xN a
diferena de dois elementos de M, pelo que tem de pertencer a M. Assim, existe pelo menos uma
forma de escrever qualquer elemento de M como soma de um elemento de N com outro que, alm
de estar em N , tem de estar tambm em M, i.e., est em Q. Assim, M = N + Q.
3. A matriz de projeco ortogonal sobre o subespao Q = M N tem de ser uma matriz PQ
simtrica e idempotente (Teorema 2.22, p. 34) cujo espao de colunas Q (Teorema 2.19, pgina
28). fcil de verificar que a diferena de duas matrizes simtricas simtrica. Por outro lado,
(PM PN ) (PM PN ) = P2M PM PN PN PM + P2N = PM PN , j que, quer PM , quer
PN , so idempotentes, e, pelo Teorema 2.24 (pgina 35), PM PN = PN PM = PN . Falta verificar
que C(PM PN ) = Q. Ora, fcil de ver que o subespao Q est contido no subespao-coluna de
PM PN . De facto, x Q, (PM PN )x = PM x PN x = x 0 = x, j que x Q implica
que x M e que x ortogonal a qualquer vector de N. Tem-se ainda que a dimenso do subespao
sobre o qual a matriz (PM PN ) projecta o trao dessa matriz (Teorema 2.23, pg. 34). Ora
tr(PM PN ) = tr(PM ) tr(PN ) = dim(M ) dim(N ). Essa tambm a dimenso do subespao
Q, j que, pela alnea anterior, e pelo Teorema 2.15 (que relaciona a dimenso dum espao linear
com a dimenso dos subespaos que constituem uma sua soma directa, p. 26) tem-se dim(Q) =
dim(M ) dim(N ). Mas a argumentao relativa s dimenses desses dois subespaos impe agora
36
2.4. PROJECES
2.4.4
Alguns dos resultados anteriores so de fcil generalizao para situaes em que um espao linear
decomposto em soma directa de k (k > 2) subespaos. A definio deste conceito e alguns resultados
preliminares sero agora enunciados.
Definio 2.19 Seja L um espao linear, e M1 , M2 , ... , Mk seus subespaos. Diz-se que L soma
directa desses k subespaos se cada vector de L se pode escrever, de forma nica, como a soma de k
parcelas, uma em cada um dos subespaos Mi (i = 1 : k). Nesse caso, escreve-se
L = M1 M2 ... Mk .
Exemplo 2.8 O espao IR3 pode ser decomposto na soma directa dos seus trs eixos coordenados. De
facto, qualquer vector (x, y, z) IR3 se pode escrever, de forma nica, como a soma dum vector no eixo
dos xx (o vector (x, 0, 0)), um vector no eixo dos yy (o vector (0, y, 0)) e um vector no eixo dos zz (o
vector (0, 0, z)).
de demonstrao imediata o seguinte Teorema, que generaliza o Teorema 2.15 (p. 26).
Teorema 2.26 Seja L = M1 M2 ... Mk . Ento:
1. A reunio de um conjunto de bases dos subespaos {Mi }ki=1 constitui uma base de L.
2. dim(L)=
k
P
dim(Mi )
i=1
37
Y IRn ,
2. P = P1 + P2 + ... + Pk
3. kPYk2 = kP1 Yk2 + kP2 Yk2 + ... + kPk Yk2
Demonstrao.
1. Considere-se um vector genrico de IRn , z. Sabemos que, para qualquer subespao L IRn , se
verifica IRn = L L (Teorema 2.16), ou seja, z decompe-se de forma nica numa soma do tipo
z = zL + zL , com zL = PL z L e zL = (I PL )z L . Mas o subespao L, por hiptese
deste Teorema, soma directa dos k subespaos Mi (i = 1 : k). Logo, zL = PL z pode-se escrever,
de forma nica, como combinao linear de k vectores, um escolhido em cada espao Mi :
zL = zM1 + zM2 + ... + zMk .
(2.3)
(2.4)
Ora, zM1 um vector de M1 . Se mostrarmos que a soma das restantes parcelas pertence ao
complemento ortogonal de M1 , podemos afirmar que zM1 o vector de M1 resultante da projeco
ortogonal de z sobre M1 , isto , que P1 z = zM1 . Ora, cada uma das restantes parcelas em (2.4)
um vector que pertence a M
1 , uma vez que cada subespao Mi (com i > 1) a que pertencem
as parcelas zMi (i > 1) mutuamente ortogonal a M1 , e o subespao L (ao qual pertence a
ltima parcela) ortogonal a L, de que M1 subespao. Assim, a soma dessas parcelas tem de
pertencer a M
1 . Logo, a equao (2.4) d-nos uma decomposio da forma z = zM1 + zM1 (onde
zM1 = zM2 + ... + zMk + zL ). Como IRn = M1 M1 (Teorema 2.16), essa decomposio nica
e zM1 tem de ser a projeco ortogonal de z sobre M1 , ou seja, P1 z = zM1 . Um raciocnio anlogo
leva concluso que Pi z = zMi , i = 1 : k. Logo, a equao (2.3) pode re-escrever-se como
zL = P1 z + P2 z + ... + Pk z.
(2.5)
k
X
< Pi z , Pi z > +
k
X
i=1
< Pi z , Pj z >
i6=j j=1
i=1
k
XX
kPi zk2
38
2.4. PROJECES
uma vez que todas as parcelas do duplo somatrio se anulam, tratando-se de produtos internos de
vectores em espaos mutuamente ortogonais.
Um caso particularmente frequente de decomposio dum espao linear em soma directa de trs seus
subespaos resulta de considerar dois subespaos encaixados em Rn .
Teorema 2.28 Seja M um subespao de Rn e N um subespao de M (tendo-se, pois, N M Rn ).
Tem-se ento a seguinte decomposio de R em soma directa de trs subespaos mutuamente ortogonais:
Rn
N (M N ) M .
(2.6)
Nota: O enunciado diz que possvel decompor, de forma nica, qualquer vector de Rn em trs parcelas:
uma em N , outra em M (que contm N ) mas ortogonal a N , e finalmente uma terceira ortogonal a M .
Demonstrao. Sabemos que, como para qualquer subespao M de IRn , se tem (Teorema 2.16, p. 27):
IRn = M M .
(2.7)
Ora o subespao M pode ser decomposto na seguinte soma directa (Teorema 2.25, pgina 36):
M = N
M N
Assim, o elemento nico de qualquer vector em Rn associado decomposio em soma directa (2.7) pode,
por sua vez, ser decomposto, de forma nica, na soma dum elemento em N e outro em M N , pelo
que qualquer vector de Rn se pode escrever, de forma nica, como a soma de trs vectores: um em N ,
outro em M N e outro em M . Pela Definio 2.19 (pg. 37), isso significa que
Rn
N (M N ) M .
Sabemos ainda que os subespaos N e M N so ortogonais entre si (ainda o Teorema 2.25). Alm
disso, quer o subespao N, quer o subespao M N esto contidos no espao M , logo so ortogonais
ao subespao M . Assim, os trs subespaos de IRn envolvidos na decomposio (2.6) so mutuamente
ortogonais.
(2.8)
Nota: O enunciado diz que possvel decompor, de forma nica, qualquer vector de Rn em k + 1
parcelas: uma em M1 , outra em M2 (que contm M1 ) mas ortogonal a M1 , e assim sucessivamente, com
a penltima parcela em Mk , mas ortogonal a Mk1 e a ltima ortogonal a Mk .
ISA/UTL Mestrado em Matemtica Modelao Estatstica I 2009/2010
39
2.5
Aplicaes Estatsticas
2.5.1
Quando temos n observaes de uma varivel, podemos represent-las por um vector x IRn , xt =
[x1 , x2 , x3 , ..., xn ]. Em Estatstica univariada ou bivariada, habitual representar n observaes de uma
ou duas variveis como n pontos sobre um eixo ou um plano definido por um par de eixos, eixos esses
representativos da(s) varivel(eis) observada(s). A esta representao chamaremos daqui em diante representao em IRp ou representao no espao das variveis. Mas igualmente possvel adoptar uma
outra representao, no espao IRn , em que cada conjunto de n observaes de uma varivel representada por um ponto/vector em IRn cujas coordenadas so as n observaes. Esta representao, menos
frequente quando se considerem apenas duas ou trs variveis, devido bvia perda de visibilidade que
ela representa, no entanto de grande utilidade quando se consideram vrias variveis. A representao
em IRn tambm pode ser designada representao no espao dos indivduos. Como veremos na seco
seguinte, ela permite traduzir importantes conceitos estatsticos numa linguagem geomtrica.
2.5.2
Logo, P1n x =
t
1
n 1n 1n x
= 1n
1
P1n = 1n (1n t 1n )1 1n t = 1n 1n t
n
Pn
1
i=1 xi = x1n . (ver a Figura (2.4).
n
Note-se que usual centrar as variveis em torno da sua mdia em muitos indicadores estatsticos
(varincia, covarincia, coeficiente de correlao). Essa centragem torna os resultados invariantes a
translaes da origem (i.e., se xi xi + a, os valores xi x no sofrem alterao).
n
X
i=1
xi2 x2 k1n k2 =
n
X
i=1
x2i n x2
40
C(1n )
x1n
@
@
@ @
@
@
@
*
x
0
Considerem-se agora n pares de observaes sobre duas variveis, {(xi , yi )}i=1 . Tem-se:
4. A covarincia das observaes de x e y o produto interno dos vectores projectados sobre C(1n ) :
n
cov(x, y) =
1X
1
(xi x)(yi y) = < (I P1n )x, (I P1n )y >
n i=1
n
2.5.3
Em modelos com vrias variveis preditoras, torna-se til a representao matricial dos dados observados
e de conceitos estatsticos associados. Designe-se por X a matriz cujas colunas representam as observaes
de uma dada varivel xi . Defina-se:
x1
x2
..
.
xp
= Xt 1n (1n t 1n )1
41
C(1n )
x1n
@
@
@ @ kx 1n xk = n1/2 sx
@
@
@
*
kx1n k = (n |x|)1/2
x
kxk = (n m2 )1/2
0
Registe-se que a projeco da matriz X sobre o subespao gerado pelo vector dos uns, P1n , a
matriz P1n X, de dimenses n p, cuja i-sima coluna repete n vezes a mdia xi da varivel i.
2. Matriz (pxp) das varincias-covarincias:
var1 cov1,2
cov
var2
2,1
cov3,1 cov3,2
=
..
..
.
.
covp,1 covp,2
cov1,3
cov2,3
var3
..
.
covp,3
...
...
...
..
.
...
cov1,p
cov2,p
cov3,p
..
.
varp
1
t
n Y Y.
r
2,1
r
R=
3,1
..
.
rp,1
r1,2
1
r3,2
..
.
rp,2
r1,3
r2,3
1
..
.
rp,3
...
...
...
..
.
...
r1,p
r2,p
r3,p
..
.
1
1 t
n Z Z.
Notas:
(a) = DRD onde D a matriz diagonal (pp ) dos desvios padro.
(b) R = D1 D1 onde D1 a inversa da matriz D, isto , a matriz (diagonal) dos recprocos
dos desvios padro.
42