Vous êtes sur la page 1sur 14

Estatstica Multivariada 1

Jose Carlos Fogo


Marco, 2008
Estatstica Multivariada 1
1 Conceitos Basicos
1.1 Aplicac oes das tecnicas multivariadas
a) redu cao ou simplica cao dos dados;
b) agrupamento e ordena cao de indivduos ou tens;
c) investiga cao da dependencia (correla cao) entre variaveis ;
d) predi cao e modelagem;
e) testar hipoteses (multivariadas).
(a e b) - estao mais no escopo de estatstica multivariada 2.
(c, d e e) - envolvem explora cao dos dados (gracos, descritivas, correla coes...), inferencia
e distribui cao normal mutivariada (com suas derivadas T
2
-Hotteling e Wishart), modelagem
(regressao e analise de variancia multivariadas).
Alguns exemplos em Johnson & Wichern, 3
a
ed.
medicina e sa ude; meio ambiente;
sociologia; meteorologia;
economia e negocios; geologia;
educa cao; psicologia;
biologia; esportes.
1.2 Vetores aleatorios
Um vetor X, dado por:
X =
_

_
X
1
X
2
.
.
.
X
p
_

_
,
e um vetor aleatorio se X
1
, X
2
, . . . , X
p
forem variaveis aleatorias (vas).
Nota: Da mesma maneira, uma matriz aleatoria e uma matriz cujos elementos sao
variaveis aleatorias.
Como um vetor aleatorio Xe uma representa cao generalizada para uma variavel aleatoria,
aqui tambem iremos representa-lo por va.
2
Estatstica Multivariada 1
1.2.1 Valor esperado de um vetor aleatorio
O valor esperado de um vetor aleatorio e dado por:
E(X) =
_

_
E(X
1
)
E(X
2
)
.
.
.
E(X
p
)
_

_
,
em que E(X
i
), i = 1, 2, . . . , p, e o valor esperado da i-esima va.
Propriedades:
a) Sejam um va X e a um vetor de coecientes lineares, entao a combina cao linear a

X
tem valor esparado
E(a

X) = a

E(X).
Se temos k combina coes lineares com coecientes dados pelas linhas da matriz A
kp
,
entao:
E(AX) = AE(X).
Exemplos:
1.1) Sejam X

=(X
1
, X
2
, X
3
) e E

(X)=(2, -1, 1). Se a

=(4, 3, 3), entao


E(a

X) =
_
4, 3, 3
_
_

_
2
1
1
_

_
= 8 3 + 3 = 8.
1.2) Se temos k = 4 combina coes lineares com coecientes dados pela matriz
A =
_

_
2 1 1
0.5 0 1
1 2 1
1 1 2
_

_
entao E(AX) =
_

_
2 1 1
0.5 0 1
1 2 1
1 1 2
_

_
_

_
2
1
1
_

_
=
_

_
4 + 1 + 1
1 + 0 + 1
2 2 + 1
2 1 + 2
_

_
=
_

_
6
2
1
1
_

_
.
3
Estatstica Multivariada 1
b) Se X e Y sao vetores alatorios com mesmas dimensoes, entao
E(X+Y) = E(X) + E(Y).
Ainda, se a e b sao vetores de coecientes lineares, entao a combina cao linear a

X+b

Y
tem valor esparado
E(a

X+b

Y) = a

E(X) +b

E(Y).
Nota: Normalmente o vetor de medias e denotado por , isto e,
=
_

_
E(X
1
)
E(X
2
)
.
.
.
E(X
p
)
_

_
=
_

2
.
.
.

p
_

_
,
em que

i
=
_

_
_
x
i
x
i
f
i
(x
i
)dx
i
, se x
i
e contnua,

x
i
x
i
p
i
(x
i
), se x
i
e discreta,
i = 1, 2, . . . , p.
1.2.2 Matriz de variancias e covariancias de um va
Pela deni cao a matriz de variancias e covariancias de um va X, e dada por
= Cov(X) = E [(X)(X)

] =
= E
_
_
_
_
_
_
_

_
(X
1

1
)
(X
2

2
)
.
.
.
(X
p

p
)
_

_
_
(X
1

1
), (X
2

2
), , (X
p

p
)
_
_
_
_
_
_
_
=
= E
_

_
(X
1

1
)
2
(X
1

1
)(X
2

2
) (X
1

1
)(X
p

p
)
(X
2

2
)(X
1

1
) (X
2

2
)
2
(X
2

2
)(X
p

p
)
.
.
.
.
.
.
.
.
.
.
.
.
(X
p

p
)(X
1

1
) (X
p

p
)(X
2

2
) (X
p

p
)
2
_

_
.
4
Estatstica Multivariada 1
Como podemos ver, cada termo de e da forma

ij
= E [(X
i

i
)(X
j

j
)] , i, j = 1, 2, . . . , p,
em que,
ij
= Cov(X
i
, X
j
) e,
ii
= V ar(X
i
), logo,
=
_

11

12

1p

21

22

2p
.
.
.
.
.
.
.
.
.
.
.
.

p1

p2

pp
_

_
.
Exemplo:
1.3) Considere dois vas X
1
e X
2
com a fun cao de probabilidade conjunta representada pela
tabela (Johnson & Wichern, 3
a
ed., p. 71)
x
2
x
1
0 1 p
1
(x
1
)
-1 0.24 0.06 0.30
0 0.16 0.14 0.30
1 0.40 0.00 0.40
p
2
(x
2
) 0.80 0.20 1.00
Calculando dos valores esperados:

1
=

x
1
x
1
p
1
(x
1
) = (1)(0.30) + (0)(0.30) + (1)(0.40) = 0.10

2
=

x
2
x
2
p
2
(x
2
) = (0)(0.80) + (1)(0.20) = 0.20
Calculando as variancias e covariancias:

11
= E
_
(X
1

1
)
2

x
1
(x
1
0.1)
2
p
1
(x
1
) =
= (1 0.1)
2
(0.30) + (0 0.1)
2
(0.30) + (1 0.1)
2
(0.40) = 0.69

22
= E
_
(X
2

2
)
2

x
2
(x
2
0.2)
2
p
2
(x
2
) =
= (0 0.2)
2
(0.80) + (1 0.2)
2
(0.20) = 0.16
5
Estatstica Multivariada 1

12
= E [(X
1

1
)(X
2

2
)] =

x
1
,x
2
(x
1
0.1)(x
2
0.2) p
12
(x
12
) =
= (1 0.1)(0 0.2)(0.24) + (0 0.1)(0 0.2)(0.16) + (1 0.1)(0 0.2)(0.40) +
+(1 0.1)(1 0.2)(0.06) + (0 0.1)(1 0.2)(0.14) + (1 0.1)(1 0.2)(0.00)
= 0.08

21
= E [(X
2

2
)(X
1

1
)] =
12
Desta forma, temos:
=
_
0.10
0.20
_
, =
_
0.69 0.08
0.08 0.16
_
.
1.2.3 Matriz de correlacoes de um va
A correla cao entre duas vas X
i
e X
j
, i, j = 1, 2, . . . , p, e denida por
Corr(X
i
, X
j
) =
ij
=

ij

ii

jj
.
Assim sendo, a matriz de correla coes do va e, portanto,
=
_

_
1
12

1p

21
1
2p
.
.
.
.
.
.
.
.
.
.
.
.

p1

p2
1
_

_
.
Fazendo
V = diag() =
_

11
0 0
0
22
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0
pp
_

_
,
entao,
V
1/2
=
_

11
0 0
0

22
0
.
.
.
.
.
.
.
.
.
.
.
.
0 0

pp
_

_
.
6
Estatstica Multivariada 1
Desta forma, podemos escrever:
= (V
1/2
)
1
(V
1/2
)
1
,
ou ainda,
= V
1/2
V
1/2
.
A matriz de covariancias, portanto, e dada pela seguinte rela cao:
= V
1/2
V
1/2
.
Exemplos:
1.4) Considerando o exemplo anterior, temos que
V = diag() =
_
0.69 0
0 0.16
_
,
e, portanto, a matriz de correla cao e dada por
=
_
1/

0.69 0
0 1/

0.16
__
0.69 0.08
0.08 0.16
__
1/

0.69 0
0 1/

0.16
_
=
_
1 0.2408
0.2408 1
_
1.5) Considere um vetor aleatorio com matriz de covariancias
=
_

_
4 1 2
1 9 3
2 3 25
_

_
.
A matriz de variancias diagonal e dada por
V =
_

_
4 0 0
0 9 0
0 0 25
_

_
,
7
Estatstica Multivariada 1
e a matriz de correla cao, obtida de
=
_

_
1/2 0 0
0 1/3 0
0 0 1/5
_

_
_

_
4 1 2
1 9 3
2 3 25
_

_
_

_
1/2 0 0
0 1/3 0
0 0 1/5
_

_
=
_

_
1 1/6 1/5
1/6 1 1/5
1/5 1/5 1
_

_
.
Propriedades:
a) Seja um va X
p1
, com matriz de covariancias
pp
e seja a
p1
um vetor de coecientes
lineares, entao a combina cao linear a

X tem variancia dada por


V ar(a

X) = a

Cov(X)a
= a

a.
Se temos k combina coes lineares com coecientes dados pelas linhas da matriz A
kp
,
entao, a matriz de covariancias dessas combina coes lineares e calculada por
Cov(AX) = ACov(X)A

= AA

.
Exemplos:
1.6) Conforme exemplo anterior, seja X

=(X
1
, X
2
, X
3
) com
Cov(X) =
_

_
4 1 2
1 9 3
2 3 25
_

_
.
Se a

=(4, 3, 3), entao


Cov(a

X) =
_
4, 3, 3
_
_

_
4 1 2
1 9 3
2 3 25
_

_
_

_
4
3
3
_

_
= 388.
8
Estatstica Multivariada 1
1.7) Se temos k = 4 combina coes lineares com coecientes dados pela matriz
A =
_

_
2 1 1
0.5 0 1
1 2 1
1 1 2
_

_
entao:
Cov(AX) =
_

_
2 1 1
0.5 0 1
1 2 1
1 1 2
_

_
_

_
4 1 2
1 9 3
2 3 25
_

_
_

_
2 0.5 1 1
1 0 2 1
1 1 1 2
_

_
Cov(AX) =
_

_
60.0 36.5 21.0 45.0
36.5 28.0 25.0 45.5
21.0 25.0 61.0 50.0
45.0 45.5 50.0 91.0
_

_
.
Nesse caso, a matriz de correla coes e dada por
=
_

_
1.000 0.891 0.347 0.609
0.891 1.000 0.605 0.901
0.347 0.605 1.000 0.671
0.609 0.901 0.671 1.000
_

_
.
Nota: Seja o va X
p1
e um vetor de constantes b
p1
, entao,
Cov(X+b) = Cov(X) = .
Ainda, se A e uma matriz de coecientes k p e b um vetores de constantes k 1,
entao, as combina coes lineares AX + b tem matriz de covariancias
Cov(AX + b) = ACov(X)A

= AA

.
1.2.4 Particionando um va
O vetor aleatorio X pode ser particionado em grupos de variaveis de acordo com as suas
naturezas. Por exemplo:
9
Estatstica Multivariada 1
i ) Medidas de ossos de frangos num estudo antropometrico das aves.
X =
_

_
X
(1)
X
(2)
X
(3)
_

_
=
_

_
X
1
= X
(1)
1
X
2
= X
(1)
2
X
3
= X
(2)
1
X
4
= X
(2)
2
X
5
= X
(3)
1
X
6
= X
(3)
2
_

_
=
_

_
extensao do cranio
largura do cranio
comprimento do femur
comprimento da tbia
comprimento do umero
comprimento da ulna
No exemplo acima, temos tres grupos de variaveis: X
(1)
: medidas da cabe ca; X
(2)
:
medidas das patas; X
(3)
: medidas das asas.
ii ) Estudo do efeito da estrutura organizacional sobre a satisfa c ao no trabalho.
X =
_
X
(1)
X
(2)
_
=
_

_
X
(1)
1
X
(1)
2
X
(1)
3
X
(1)
4
X
(1)
5
X
(2)
1
X
(2)
2
X
(2)
3
X
(2)
4
X
(2)
5
X
(2)
6
X
(2)
7
_

_
=
_

_
feedback/retorno
siginicancia das tarefas
variedades das tarefas
identica cao com as tarefas
autonomia
satisfa cao com a supervisao
satisfa cao com o futuro da carreira
satisfa cao nanceira
satisfa cao com a carga de trabalho
identica cao com a companhia
satisfa cao com o tipo de trabalho
satisfa cao geral
Nesse outro exemplo, sao dois os grupos de variaveis: X
(1)
: caractersticas do trabalho e
X
(2)
: medidas da satisfa cao do funcionario.
Parti cao do vetor de medias:
Seja o vetor aleatorio particionado em dois grupos X
(1)
e X
(2)
com q e (p q) variaveis,
respectivamente
X =
_
X
(1)
X
(2)
_
Entao, o vetor de medias deve acompanhar a parti cao,
E(X) =
_
E(X
(1)
)
E(X
(2)
)
_
=
_

(1)

(2)
_
,
10
Estatstica Multivariada 1
em que,

(1)
=
_

(1)
1

(1)
2
.
.
.

(1)
q
_

_
e
(2)
=
_

(2)
1

(2)
2
.
.
.

(2)
pq
_

_
.
Parti cao da matriz de covariancias:
Considere, ainda, a mesma parti cao X
(1)
e X
(2)
do vetor aleatorio X, entao a matriz de
covariancias pode ser escrita na forma
=
_

11

12

21

22
_
em que
ij
= (X
(i)

(i)
)(X
(j)

(j)
)

, i, j = 1, 2.
Notas: Assim sendo, temos
i )
11
= cov(X
(1)
);
ii )
22
= cov(X
(2)
);
iii )
12
= cov(X
(1)
, X
(2)
), e a matriz de covariancias entre os componentes de X
(1)
e X
(2)
,
sendo que
12
nao e necessariamente simetrica, nem quadrada;
iv)
21
=

21
.
De fato, pode ser calculada por:
= E [(X)(X)

] =
= E
_ _
(X
(1)

(1)
)
(X
(2)

(2)
)
_
_
(X
(1)

(1)
) (X
(2)

(2)
)
_
_
=
= E
_
(X
(1)

(1)
)(X
(1)

(1)
)

(X
(1)

(1)
)(X
(2)

(2)
)

(X
(2)

(2)
)(X
(1)

(1)
)

(X
(2)

(2)
)(X
(2)

(2)
)

_
.
11
Estatstica Multivariada 1
Calculando a matriz de correla coes:
A matriz decorrela coes deve ser calculada da mesma forma como no caso anterior levando
em conta, agora, a parti cao de X.
Denindo:
V
11
= diag(
11
)
e
V
22
= diag(
22
)
temos que a matriz variancias-diagonal e particionada por
V =
_
V
11
0
0 V
22
_
.
As correla coes dos grupos X
(1)
e X
(2)
sao calculadas pelas expressoes

11
= V
1/2
11

11
V
1/2
11

22
= V
1/2
22

22
V
1/2
22
.
A correla cao entre os grupos, dada pela matriz
12
, por sua vez, e dada por

12
= V
1/2
11

12
V
1/2
22
.
Essas expressoes podem obtidas diretamente do produto das matrizes e V particiona-
das, isto e,
= V
1/2
V
1/2
=
_
V
1/2
11
0
0 V
1/2
22
__

11

12

21

22
__
V
1/2
11
0
0 V
1/2
22
_
=
_
V
1/2
11

11
V
1/2
11

12
V
1/2
22

21
V
1/2
22

22
__
V
1/2
11
0
0 V
1/2
11
_
=
_
V
1/2
11

11
V
1/2
11
V
1/2
11

12
V
1/2
22
V
1/2
22

21
V
1/2
11
V
1/2
22

22
V
1/2
22
_
=
_

11

12

21

22
_
12
Estatstica Multivariada 1
Exemplo: 1.8) Sejam as vas X
1
, X
2
, X
3
, X
4
, X
5
tal que
X
(1)
=
_

_
X
1
X
2
X
3
_

_
e X
(2)
=
_
X
4
X
5
_
.
Conhecendo
=
_

_
25 1 2 4 1
1 9 3 2 0
2 3 4 1 1
4 2 1 9 6
1 0 1 6 16
_

_
,
temos que as matrizes de covariancias sao

11
=
_

_
25 1 2
1 9 3
2 3 4
_

_
,
22
=
_
9 6
6 16
_
e
12
=
_

_
4 1
2 0
1 1
_

_
.
Desta forma, as matrizes de correla coes dos grupos e entre grupos sao

11
=
_

_
1/5 0 0
0 1/3 0
0 0 1/2
_

_
_

_
25 1 2
1 9 3
2 3 4
_

_
_

_
1/5 0 0
0 1/3 0
0 0 1/2
_

_
=
_

_
1 1/15 2/10
1/15 1 1/2
2/10 1/2 1
_

_
,

22
=
_
1/3 0
0 1/4
__
9 6
6 16
__
1/3 0
0 1/4
_
=
_
1 1/2
1/2 1
_
,

12
=
_

_
1/5 0 0
0 1/3 0
0 0 1/2
_

_
_

_
4 1
2 0
1 1
_

_
_
1/3 0
0 1/4
_
=
_

_
4/15 1/20
2/9 0
1/6 1/16
_

_
.
13
Estatstica Multivariada 1
A matriz de correla coes global, e, portanto, dada por:
=
_

_
1 1/15 1/5 4/15 1/20
1/15 1 1/2 1/9 0
1/5 1/2 1 1/12 1/16
4/15 1/9 1/12 1 1/2
1/20 0 1/16 1/2 1
_

_
.
14