Académique Documents
Professionnel Documents
Culture Documents
Resumo
A Estatstica Multivariada permite o estudo de fenmenos complexos, pois realiza o tratamento de
diversas variveis simultaneamente, mesmo quando no se conhece o modelo terico das relaes
entre as variveis. A Anlise Fatorial, uma das tcnicas da estatstica multivariada, pode ser
aplicada quando h uma grande quantidade de dados e busca-se a sua sumarizao com fatores
latentes, que so definidos atravs de comportamento semelhantes entre as variveis. Este artigo
tem como objetivo fazer uma reviso da literatura sobre a Estatstica Multivariada de dados e
mostrar a aplicao dessa tcnica de anlise na Engenharia de Produo. O Inventrio de Estresse
em Enfermeiros, composto por 44 variveis, foi aplicado a 391 indivduos. A aplicao da Anlise
Fatorial extraiu oito fatores determinantes para o estresse, que pode servir como subsdio para seu
gerenciamento.
Palavras-chave: estatstica multivariada; anlise fatorial; engenharia de produo.
1. Introduo
Atualmente, h uma vasta quantidade de dados que cobrem vrios aspectos das atividades
humanas e que dizem respeito s diferentes reas de conhecimento. A complexidade de vrios
fenmenos requer uma anlise de muitas variveis diferentes. Alm disso, o avano da tecnologia
computacional tem proporcionado avanos e facilidades no que diz respeito anlise destes dados
em diversas reas. Assim, percebe-se uma necessidade de procedimentos de anlise e interpretao
adequados para a extrao das informaes, principalmente para tomada correta de decises de
forma a possibilitar um gerenciamento mais eficiente e um crescimento na produtividade.
2
Revista Gesto Industrial
X 11
X
21
X
X i1
X p1
X 12
X 21
X i2
X p2
X1j
X2j
X ij
X pj
X 1n
X 2 n
X in
X pn
onde X a matriz que contm todas as observaes de todas as variveis. Quanto maior o nmero
de variveis, mais complexa a anlise atravs de tcnicas univariadas.
Um vetor aleatrio aquele cujos elementos integrantes so variveis aleatrias. De forma
semelhante, uma matriz aleatria composta por variveis aleatrias. O valor esperado de uma
matriz (ou vetor) aleatria, segundo Johnson e Wichern (1992), a matriz que consiste dos valores
esperados de cada um de seus elementos. Assim, sendo X um vetor aleatrio, o vetor de mdias de
X pode ser representado por:
E X 1 1
E X
2
2
E X
E X p p
onde i=E(Xi) denota a mdia, ou esperana, da varivel aleatria Xi, i=1, 2, ..., p. Esta medida
bastante utilizada para sintetizar a tendncia central da distribuio de valores da varivel Xi
(MINGOTI, 2005).
Cada varivel, segundo Mingoti (2005), pode ser analisada separadamente no vetor aleatrio
atravs do comportamento de sua distribuio de probabilidades. Ressalva-se, no entanto, a
importncia da anlise do vetor como um todo devido possibilidade da existncia de
relacionamentos entre as p-variveis.
A varincia do i-simo componente do vetor X obtida por Var(X1) = i2 = ii , assim
como a varincia entre os valores da i-sima e j-sima variveis do vetor X definida por
3
Revista Gesto Industrial
11 12
21 22
Cov(X) E X X
p1 p 2
1p
2 p
pp
Ademais, de acordo com Hrdle e Simar (2007), a correlao uma medida mais adequada para
avaliar o grau de relacionamento linear entre variveis estatsticas. A vantagem de sua utilizao
inclui a ausncia de escalas, o que significa que a mudana nas escalas de medidas no altera o
valor da correlao, alm de estar relacionada com a independncia de variveis aleatrias. Assim,
para um vetor p-dimensional (X1... Xp), a matriz de correlao denotada por:
21
P 31
p1
12
1
32
p2
13
23
1
p3
1 p
2 p
3 p
Johnson (1998) apud Mingoti (2005) afirma que, para que sejam estimadas as matrizes de
covarincias e correlaes, necessrio ter-se um tamanho de amostra n maior que p. Desta forma,
a estimao das matrizes ocorre com p+1 observaes amostrais. Todavia, deve-se evitar trabalhar
com este nmero mnimo de n.
O constructo da anlise multivariada a varivel estatstica, uma combinao linear de
variveis s quais so atribudos pesos empiricamente determinados. As variveis so determinadas
pelo pesquisador, e os pesos pela tcnica multivariada para atingir o objetivo almejado. Assim, de
acordo com Hair et al. (2005), uma varivel estatstica de n variveis (X1 Xn) pode ser definida da
seguinte forma:
Valor da varivel estatstica w1 X 1 w2 X 2 w3 X 3 ... wn X n
onde Xn a varivel observada e wn o peso que foi determinado atravs da tcnica multivariada.
Com isso, obtm-se um nico valor que representa uma combinao de todo o conjunto das
variveis que melhor representa o objetivo da anlise multivariada especfica. Combinaes lineares
tm um importante papel na anlise de dados multivariados, pois, assim, pode-se sumarizar as
informaes das p-variveis originais (MINGOTI, 2005).
2.1 Tipos de tcnicas Multivariadas
A anlise de dados multivariados conta com diversas tcnicas. Dentre elas, pode-se citar a
(a) anlise fatorial, (b) a regresso mltipla e correlao mltipla, (c) a anlise discriminante
4
Revista Gesto Industrial
mltipla, (d) a anlise multivariada de varincia e covarincia, (e) a anlise conjunta, (f) a
correlao cannica, (g) a anlise de agrupamentos e (h) escalonamento.
a) Anlise fatorial: inclui a anlise de componentes principais e anlise dos fatores
comuns. aplicada quando h um nmero grande de variveis e correlacionadas entre
si, com o objetivo de identificar um nmero menor de novas variveis alternativas, no
correlacionadas e que, de algum modo, sumarizem as informaes principais das
variveis originais encontrando os fatores ou variveis latentes (MINGOTI, 2005);
b) Regresso mltipla: o mtodo de anlise adequado quando h uma nica varivel
dependente mtrica relacionada a duas ou mais variveis independentes. O principal
objetivo de sua aplicao prever as mudanas na varivel dependente de acordo com
as variaes nas variveis independentes (HAIR et al., 2005);
c) Anlise discriminante mltipla: este tipo de anlise utilizado quando os grupos so
conhecidos a priori. A anlise discriminante composta por um conjunto de mtodos e
ferramentas utilizados para distinguir grupos de populaes e classificar as novas
observaes nos grupos determinados (HRDLE; SIMAR, 2007);
d) Anlise multivariada de varincia e covarincia: tambm conhecidas como
MANOVA (anlise multivariada de varincia) e MANCOVA (anlise multivariada de
covarincia), tm o objetivo de verificar a semelhana entre grupos multivariados
explorando simultaneamente as relaes entre diversas variveis independentes e duas
ou mais variveis dependentes mtricas (HAIR et al, 2005);
e) Anlise conjunta: segundo Hair et al. (2005), esta uma tcnica de dependncia que
vem sendo utilizada na avaliao de objetos, tais como produtos novos, servios ou
idias. A aplicao mais direta no desenvolvimento de novos produtos e servios,
permitindo a avaliao de produtos complexos e mantendo um contexto realista de
deciso para o respondente;
f)
Correlao cannica: tem como objetivo principal o estudo das relaes lineares
existentes entre dois conjuntos de variveis. A aplicao desta anlise resume a
informao de cada conjunto de variveis-resposta em combinaes lineares buscandose maximizar a correlao entre os dois conjuntos (MINGOTI, 2005);
5
Revista Gesto Industrial
Z p l p1 F1 l p 2 F2 ... l pm Fm p
Neste modelo, ainda segundo a autora, Fmx1 um vetor aleatrio que contem m fatores (variveis
latentes), onde lmp, ou seja, no podem ser medidos a priori. Portanto, o modelo de anlise
6
Revista Gesto Industrial
fatorial assume que as variveis esto relacionadas linearmente com novas variveis aleatrias Fj,
j=1, 2,..., m, que devero ser identificados. O vetor px1 representa os erros aleatrios de medida e
variao de Zi, que no explicada pelos fatores comuns Fj do modelo. O coeficiente lij,
denominado de loading, corresponde ao grau de relacionamento linear entre Zi e Fj. Assim, pode-se
dizer que a informao das p-variveis originais padronizadas (Z1, Z2,..., Zp) representada por
(p+m) variveis aleatrias no observveis, isto , (1, 2,..., p) e (F1, F2,..., Fp).
Para a continuao da anlise fatorial necessrio estimar a matriz de correlao terica
Ppxp, atravs de uma matriz de correlao amostral Rpxp. Para estimar m, basta extrair os autovalores
da matriz Rpxp e orden-los em ordem decrescente. Assim, segundo Mingoti (2005) para a seleo
do nmero de fatores pode-se utilizar os critrios:
a) Anlise da proporo da varincia total: permanecem aqueles que representam
maiores porpores da varincia total e, portanto, m ser igual ao nmero de autovalores
retidos. Malhotra (2001) recomenda que o nmero de fatores escolhidos corresponda a,
no mnimo, 60% da varincia;
b) Autovalores: o valor de m ser igual ao nmero de autovalores maiores ou igual a 1.
Esse critrio mantm no sistema dimenses que representam pelo menos a informao
de varincia de uma varivel original;
c) Scree-plot: representao grfica onde prure-se um ponto de salto, que represente um
decrscimo de importncia em relao varincia total. O valor de m seria, ento, igual
ao nmero de autovalores anteriores ao ponto de salto.
A matriz de componentes inicial indica a relao entre os fatores e as variveis individuais,
no entanto, esta raramente resulta em fatores que possam ser interpretados. A Anlise Fatorial
mais ou menos til em funo da sua capacidade de produzir tais fatores, e isto feito atravs da
rotao, que transforma a matriz de fatores em uma matriz rotacionada mais simples e fcil de
interpretar (MALHOTRA, 2001). De acordo com Hair et al. (2005), o efeito final de rotacionar a
matriz fatorial redistribuir a varincia dos primeiros fatores para os ltimos com o objetivo de
atingir um padro fatorial mais simples e mais significativo. H diferentes tipos de rotaes
possveis de aplicao. A rotao ortogonal inclui a QUARTIMAX, EQUIMAX, e a VARIMAX,
que a mais utilizada por se concentrar na mxima simplificao das colunas da matriz fatorial
atravs da maximizao da soma de varincias de cargas exigidas da matriz fatorial. Os mtodos de
rotao oblqua permitem fatores correlacionados em vez de manterem independncia entre os
fatores rotacionados, mas h apenas escolhas limitadas nos pacotes estatsticos.
De acordo com Hair et al. (2005) o pesquisador deve buscar minimizar o nmero de
variveis includas, mas manter um nmero razovel de variveis por fator. A fora da anlise
fatorial consiste na definio de padres entre grupos de variveis, tornando-se de pouco utilidade
7
Revista Gesto Industrial
na identificao de fatores compostos por uma nica varivel. Alm disso, deve-se dar cuidado
especial ao tamanho da amostra. Como regra geral, o mnimo ter pelo menos cinco vezes mais
observaes do que o nmero de variveis a serem analisadas, e a proporo mais aceitvel de dez
para um.
As principais estatsticas-chaves associadas anlise fatorial esto listados no Quadro 1.
Quadro 1: Estatsticas da Anlise Fatorial
Teste de Esfericidade de Bartlett
Matriz de Correlao
Comunalidade
Autovalor (Eigenvalue)
Cargas dos fatores
Grfico de cargas dos fatores
Matriz de Fatores
Escores fatoriais
Medida de Adequao de KaiserMeyer- Olkin (KMO)
Percentagem de varincia
Resduos
Scree plot
Todavia, um fator crucial que deve anteceder a aplicao da anlise fatorial a anlise de
confiabilidade do constructo utilizado para obteno dos dados. A confiabilidade o grau em que
uma escala produz resultados consistentes entre medidas repetidas ou equivalentes de um mesmo
objeto, relevando-se a ausncia do erro. Trata-se da anlise das escalas de mensurao, que permite
determinar a extenso em que os itens esto relacionados com os demais e a fidedignidade do
constructo. De acordo com Corrar et al. (2007), um modelo bastante utilizado o Alfa de Cronbach,
que trata da consistncia interna baseada na correlao mdia entre os intens. Este modelo pode ser
obtido atravs da seguinte frmula:
8
Revista Gesto Industrial
cov
k
var
cov
1 (k 1)
var
onde k= nmero de variveis consideradas; cov a mdia das covarincias e var a mdia das
varincias. Alfa pode assumir valores entre 0 e 1, e quanto mais prximo ao 1, maior a
fidedignidade das dimenses do constructo. H divergncias sobre qual o valor mnimo aceitvel
para o Alfa de Crobach, no entanto Hair (1998) apud Corrar et al. (2007) sugere o mnimo ideal de
0,7 para pesquisas aplicadas e 0,6 para pesquisas exploratrias.
3.1 Aplicao da Tcnica Multivariada Anlise Fatorial
O Inventrio de Estresse em Enfermeiros proposto por Stacciarini and Trocoli (2000),
composto por 44 questes de mltipla escolha e sete de identificao, foi aplicado a 391
profissionais mdicos que trabalham em hospitais na cidade de Joo Pessoa (PB). As questes
fechadas apresentavam como alternativas de respostas: nunca, raramente, algumas vezes, muitas
vezes e sempre, s quais foram atribudas os valores, 1, 2, 3, 4, 5 respectivamente.
Analisando-se a estrutura do Inventrio utilizado para obteno dos dados atravs do modelo
de Alfa de Cronbach, percebe-se que o constructo e a escala utilizada apresentam uma boa
confiabilidade interna e, portanto, so adequados para o propsito para o qual foram designados
(Quadro 2).
Quadro 2 Teste Alfa de Cronbach para as 44 variveis
Cronbach's Alpha
0,914
44
Para verificar a aplicao da Anlise Fatorial (AF) utilizou-se o teste KMO de medida de
adequao da amostra. O resultado expresso neste teste (0,881) demonstra um bom grau de ajuste
para aplicao da tcnica multivariada Anlise Fatorial, sendo ratificado pelo teste Bartlett de
Esfericidade ao nvel de significncia 0,000 (Quadro 3).
9
Revista Gesto Industrial
0,881
Approx. Chi-Square
6240,701
df
946
Sig.
0,000
10
Revista Gesto Industrial
VARIVEIS
CARGA
0,881
0,865
0,819
0,806
0,711
0,518
0,517
0,488
0,816
0,808
0,703
0,659
0,560
0,485
0,425
0,796
0,684
0,674
0,619
0,545
0,479
0,455
0,711
0,692
0,664
0,571
0,465
0,668
0,626
0,595
0,465
0,702
0,689
0,808
0,618
0,680
0,664
0,514
ALFA DE
CRONBACH ()
0,886
0,822
0,816
0,747
0,710
0,645
0,611
0,606
Tendo em vista que os fatores podem ser representados pelo relacionamento linear das
variveis, os fatores determinantes para o surgimento do estresse que resultaram deste estudo
podem ser expressos pelas seguintes equaes:
F1 0,881REM 0,865 RCM 0,819TE 0,806 RC 0,711PAP 0,518MA 0,517 EQT 0,488 DEP
11
Revista Gesto Industrial
12
Revista Gesto Industrial
verificar com exatido o quanto uma varivel ter influncia em fatores associados ao estresse em
mdicos.
Abstract
Multivariate Statistics allows the study of complex phenomena due to the possibility of treatment of
many variables simultaneously, even when the theoretic model of intervariable relations isnt
known. Factorial Analysis, one of the techniques of multivariate statistics, can be used when there is
a large number of data and the summarization is sought through latent factors that are defined
according to the behavior within the variables. This article has the objective of making a literature
review about Multivariate Statistics and demonstrating the Factorial Analysis technique application
in Production Engineering. The Inventrio de Estresse em Enfermeiros is composed of 44 variables
and was applied to 391 individuals. The Factorial Analysis extracted eight determining stress
factors that can assist its management.
Keywords: multivariate statistics, factorial analysis, production engineering.
Referncias
CORRAR, L. J.; PAULO, E.; DIAS FILHO, J. M. Anlise multivariada. FIPECAFI: Atlas, 2007.
CRIVISQUI, E. M. Anlisis factorial de correspondencias: um instrumento de investigacin em cincias socialies.
Universidad Catlica de Assuncin: Ed. Laboratrio de Informtica Social, 1993.
ESCOFIER, B.; PAGS, J. Anlisis factorialies simples y multiples: objetctivo, mtodos y interpretacin. Bilbao.
Ed. Universidad del Pais Vasco, 1992.
HAIR JUNIOR, J. F.; ANDERSON, R. E.; TATHAM, R. L.; BLACK, W. C. Anlise multivariada de dados. 5. ed.
Porto Alegre: Bookman, 2005.
HRDLE, W.; SIMAR, L. Applied multivariate statistical analysis. 2. ed. Berlin: Springer, 2007.
JOHSON, R. A.; WICHERN, D. W. Applied multivariate statistical analysis. 3. ed. Englewood Cliffs: Prentice Hall,
1992.
MALHOTRA, N. K. Pesquisa de marketing: uma orientao aplicada. 3 ed. Porto Alegre: Ed. Bookman, 2001.
MINGOTI, S. A. Anlise de dados atravs de mtodos de estatstica multivariada: uma abordagem aplicada. Belo
Horizonte: Editora UFMG, 2005.
MORRISON, D. F. Multivariate statistical methods. New York: McGraw-Hill, 1976.
STACCIARINI, J. M. R.; TROCOLI, B. T. Instrumento para mensurar o estresse ocupacional: inventrio de estresse
em enfermeiros (IEE). Revista Latino-am. Enfermagem. 2000; 8(6): 40-49.
13
Revista Gesto Industrial
14
Revista Gesto Industrial