Vous êtes sur la page 1sur 117

Análise de Equações

Estruturais:
teoria e prática
José  O.  Siqueira    
Ins1tuto  de  Psicologia  -­‐  USP  
B1MC2:  Bloco  1  –  Minicurso  2  –  4  horas  
Resumo
•  O   obje1vo   do   minicurso   é   apresentar   os   fundamentos   teóricos,   soKwares   e  
aplicações  da  análise  de  equações  estruturais  (AEE).    
•  A   AEE   é   uma   técnica   estaTs1ca   mul1variada   inferencial   que   testa   modelos  
“causais”   com   indicadores   (variáveis   observáveis)   e   variáveis   latentes   (não-­‐
observáveis).  
•  SEM   (Structural   Equa+on   Modeling),   análise   de   estruturas   de   covariância,  
modelagem  de  equações  simultâneas,  “modelagem  causal”  
•  A   AEE   introduz   uma   perspec1va   rela1vamente   nova   à   testagem   de   hipótese  
estaTs1ca  com  uma  abordagem  baseada  na  “confirmação”  do  modelo.    
•  Além  disso,  a  AEE  promove  um  rigor  maior  na  pesquisa  aplicada  quan1ta1va.    
•  Subjacente  à  AEE  está  um  conjunto  de  ideias  sobre  o  que  cons1tui  a  boa  prá1ca  
cienTfica.    
Referências

•  BREAKWELL,  G.  M.  et  al.  (2010)  Métodos  de  pesquisa  em  Psicologia.  Cap.  
21:  Introdução  à  modelagem  de  equação  estrutural.  3ª  ed.  Porto  Alegre:  
Bookman.  
•  MARÔCO,  J.  (2010)  Análise  de  equações  estruturais.  Lisboa:  
ReportNumber.  
•  PUGESEK,  B.  H.  et  al.  (Org.)  (2003)  Structural  equa:on  modeling:  
Applica:ons  in  ecological  and  evolu:onary  biology.  UK:  Cambridge  Univ.  
Press.  
•  GRACE,  J.  B.  (2006)  Structural  equa:on  modelling  and  natural  systems.  
UK:  Cambridge  Univ.  Press  
Introdução
•  Oferece  um  potencial  imenso  para  os  psicólogos,  pois,  em  geral,  
grande   parte   das   coisas   nas   quais   os   psicólogos   estão  
interessados   são   variáveis   latentes/   inobserváveis/   fatores:   o  
pesquisador   deve   tornar   explícitas   suas   teorias   ou   modelos   de  
relações   entre   medidas   observadas   (indicadores)   e   variáveis  
latentes,   de   um   lado,   e   as   relações   que   ele   espera   encontrar  
entre  as  variáveis  latentes,  de  outro  
•  Correlação   não   implica   causação:   no   melhor   dos   casos,   a   AEE  
pode   mostrar   apenas   que   um   modelo   “causal”   sugerido   é  
consistente   com   as   variâncias   e   covariâncias   (momentos)  
observadas  
Introdução
• Relações   lineares   entre   as   variáveis  
quan1ta1vas  
• Suposições:    
• normalidade  mul1variada  dos  indicadores  
• independência  entre  as  observações  
Introdução
•  AEE   é   um   conjunto   de   procedimentos   estaTs1cos   que   podem   ser  
aplicados   a   dados   quan1ta1vos   e   qualita1vos   e   que   permite   ao  
pesquisador  
•  Testar   modelos   teoricamente   especificados   das   relações   entre   variáveis  
observadas/   indicadores   (e.g.,   escores   de   teste)   e   variáveis   inobserváveis/    
latentes/   fatores,   por   vezes   chamados   modelos   de   mensuração   (análise   de  
fatores  comuns  confirmatória)  e  
•  Testar   modelos   teóricos   das   relações   entre   conjuntos   de   variáveis   latentes,  
chamados  modelos  estruturais  
•  Testar  modelos  teóricos  das  relações  entre  conjuntos  de  indicadores    
(path  analysis)  
Introdução
• História,  literatura,  arte:  conhecimento  idiográfico    
• Ciência:  relações  causais,  conhecimento  nomoté1co    
• EstaTs1ca   é   parte   integrante   do   método   cienTfico  
moderno  
• Técnicas  estaTs1cas  teoré1cas  (theory-­‐driven)  
•   AEE,  AFC  
• Técnicas  estaTs1cas  ateoré1cas  (data-­‐driven)  
•  Análise  de  séries  temporais:  VAR  
• A  prá1ca  da  estaTs1ca  é  soCware-­‐driven  
Erro de mensuração
•  Como   em   muitas   variáveis   psicológicas,   as   medidas   que   temos  
(indicadores)   são   índices   imperfeitos   dos   construtos   latentes   que,   em  
princípio,   poderíamos   nunca   mensurar   de   um   modo   totalmente  
preciso  
•  A   MEE   oferece   a   oportunidade   de   levar   em   consideração   o   erro   de  
mensuração  ao  es1mar  os  parâmetros  de  nosso  modelo  por  meio  dos  
termos   de   erro   (variáveis   latentes   exógenas   associadas   aos  
indicadores)  
Erro de mensuração
•  Trabalha-­‐se  com  um  conjunto  de  variáveis  observáveis  que  são  indicadores  do  impacto  de  uma  
variável  latente  
•  Não  se  mensura  na  perfeição  um  fenômeno  latente  
•  Variáveis/indicadores  observáveis    de  uma  variável  latente  frequentemente  contém  erros  de  
mensuração  
•  Erro  mensuração  do  indicador:  variável  latente  exógena  específica  (unique),  fator  único  (em  
contraposição  ao  fator  comum),  termo  de  erro,  resíduo    
•  Esses  resíduos  sempre  são  mo1vo  de  preocupação  e  as  análises  que  trabalham  com  medidas  latentes  
permitem  calcular  a  variância  residual  para  cada  um  dos  indicadores  
•  Variância  residual  representa  a  variância  que  não  é  explicada  pelo  fator/traço  latente  
•  Parte  dessa  variância  não  explicada  pelo  traço  latente  é  devida  aos  erros  de  mensuração  aleatórios  ou  escore  
não  confiáveis  (Kline,  2009,  p.9)  
•  O  termo  de  erro  pode  compreender  componentes  de  variância  específica  sistemá1ca  em  acréscimo  ao  
erro  randômico.  A  comunalidade  ou  R2    tem  que  ser  considerado  o  limite  inferior  da  es1ma1va  da  
confiabilidade  do  indicador.  (Arbuckle  &  Wothke  (1999),  p.  192))  
Etapas da modelagem
• Formulação  do  Modelo    
• Modelo  de  mensuração  
• Modelo  estrutural  
• Iden1ficação  do  Modelo  
• Es1mação  do  Modelo  
• Avaliação  do  Modelo  
• Modificação  do  Modelo    
Símbolos e seus significados
•  Variável  latente                                                                  Relação  recursiva  “causal”  

•  Variável  observável                                                  Relação  correlacional    

•  Relação  não-­‐recursiva  “causal”  


(retroalimentação)  
 
Modelo  híbrido  =    
Modelo  psicométrico    
(measurement  model)  +    
Modelo  econométrico  
(structural  model)  
Tipos de variáveis
• Exógena:  variável  que  causa,  mas  não  é  causada  
• Endógena:  variável  que  é  causada  
• Mediadora:  variável  que  causa  e  é  causada  

• Endogenous   variables   are   those   that   have   single-­‐headed  


arrows  poin1ng  to  them;  they  depend  on  other  variables.  
• Exogenous   variables   are   those   that   do   not   have   single-­‐
headed   arrows   poin1ng   to   them;   they   do   not   depend   on  
other  variables.  
Diagrama
Análise de trajetória (path analysis)

β  de  regressão  

Termo  de  erro  


VM  Endógena  (VD)  

VM  Exógena  (VI)  
Exemplo 6 de ARBUCKLE (2012)
Exemplo 6 de ARBUCKLE (2012)
•  Observed, endogenous variables
•  anomia67
•  powles67
•  anomia71
•  powles71
•  educatio
•  SEI
•  Unobserved, endogenous variables
•  71_alienation
•  67_alienation
•  Unobserved, exogenous variables —  Variable  counts    
•  eps1 —  Number  of  variables  in  your  model:  17    
•  eps2
—  Number  of  observed  variables:  6    
•  eps3
•  eps4 —  Number  of  unobserved  variables:  11    
•  ses —  Number  of  exogenous  variables:  9    
•  delta1
•  zeta1 —  Number  of  endogenous  variables:  8    
•  zeta2
•  delta2
Covariância e correlação
Gráfico de dispersão
Modelo:  
y  =  a  +  b1*x1  +  ey  
var(ey)  
 
Suposições:  
ey  
1   Cov(x1,  ey)  =  0  
performance   mo1va1on  

Solução:  
b1  =  0,71  
var(ey)  =  6,70    
R2  =  0,37  
Variáveis manifestas centradas
𝑦:performance  (dado  bruto)  (VD)  
​𝑥↓1 :motivation  (dado  bruto)  (VI)  
Modelo:  ​𝑦↑′ =​𝑏↓1 ​𝑥↓1↑′ +​𝑒↓𝑦 ,  ​𝑒↓𝑦 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(​𝑒↓𝑦 ))  𝑒  𝐶𝑜𝑣(​𝑥↓1 ,​
𝑒↓𝑦 )=0  
​𝑦 =6,02  e  ​𝑥↓1  =5,97  
​𝑦↑′ =𝑦−​𝑦 =𝑦−6,02  
​𝑥↓1↑′ =​𝑥↓1 −​𝑥↓1  =​𝑥↓1 −5,97  
𝐶𝑜𝑣(​𝑦↑′ ,​𝑥↓1↑′ )=𝐶𝑜𝑣(𝑦,​𝑥↓1 )=5,54  
𝑉𝑎𝑟(​𝑦↑′ )=𝑉𝑎𝑟(𝑦)=10,61  
𝑉𝑎𝑟(​𝑥↓1↑′ )=𝑉𝑎𝑟(​𝑥↓1 )=7,78  
𝑟=​𝐶𝑜𝑣(​𝑦↑′ ,​𝑥↓1↑′ )/√⁠𝑉𝑎𝑟(​𝑦↑′ ) √⁠𝑉𝑎𝑟(​𝑥↓1↑′ )  =0,61
Variáveis manifestas padronizadas
𝑦:performance  (dado  bruto)  (VD)  
​𝑥↓1 :motivation  (dado  bruto)  (VI)  
Modelo:  𝑧=​𝛽↓1 𝑤+​𝑒↓𝑧 ,  ​𝑒↓𝑧 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(​𝑒↓𝑧 ))  𝑒  𝐶𝑜𝑣(𝑤,​𝑒↓𝑧 )=0  
 
𝑧=​𝑦↑′ ∕√⁠𝑉𝑎𝑟(​𝑦↑′ )  =​(𝑦−6,02)∕3,28   
𝑤=​𝑥↓1↑′ ∕√⁠𝑉𝑎𝑟(​𝑥↓1↑′ )  =​(​𝑥↓1 −5,97  )∕2,79 
𝑉𝑎𝑟(𝑧)=𝑉𝑎𝑟(𝑤)=1  
𝑟=​𝐶𝑜𝑣(𝑧,𝑤)/√⁠𝑉𝑎𝑟(𝑧) √√𝑉𝑎𝑟(𝑤)  =𝐶𝑜𝑣(𝑧,𝑤)=​𝐶𝑜𝑣(​𝑦↑′ ,​𝑥↓1↑′ )/
√⁠𝑉𝑎𝑟(​𝑦↑′ ) √⁠𝑉𝑎𝑟(​𝑥↓1↑′ )  =0,61  
​𝛽↓1 =​𝐶𝑜𝑣(𝑧,𝑤)/𝑉𝑎𝑟(𝑤) =𝐶𝑜𝑣(𝑧,𝑤)=𝑟=0,61  
​𝑅↑2 =​𝑟↑2 =0,37
Exemplo com 2 fatores
comuns
Variância  

Termo  de  erro  


ou  fator  
idiossincrá1co  

Indicador  

𝜆:  carga  fatorial  

Fator  comum  
Covariância  
Modelo psicométrico reflexivo recursivo
unidimensional de ordem 1
Modelo psicométrico reflexivo
recursivo bidimensional de ordem
1
Software

• O   acesso   a   pacotes   estaTs1cos   amigáveis  


provocam   um   desastroso   efeito   colateral   de  
aumentar  o  número  de  usos  acrí1cos  da  MEE  em  
que  a  técnica  é  usada  simplesmente  porque  pode  
ser   facilmente   u1lizada   e   impressiona,   e   não  
porque  ela  é  a  análise  apropriada  a  ser  realizada  
Software de análise de equações
estruturais
• Comercial  
•  Mplus  (Muthen  &  Muthen)  
•  AMOS  (Analysis  of  MOments  Structures):  Arbuckle,  J.  L.    
•  LISREL  (LInear  Structural  RELa1ons):  Jöreskog,  K.  G.  &  Sörbom,  D.  
(Primeiro)  
•  EQS  (structural  EQua1ons  System):  Bentler,  P.  M.    
•  SAS:  CALIS    
•  STATISTICA:  SEPATH  
•  SYSTAT:  RAMONA  
•  STATA  >=  12  
•  Latent  GOLD:  Latent  Class  Modeling  
Software de análise de equações
estruturais
•  Pacotes  do  R  (soKware  livre)  
•  {psytabs}  {lavaan}  {OpenMx}  {semTools}  {simsem}  
•  {sem}    
•  Includes  cfa()  ,  linearEqua1ons()  ,  and  mul1groupModel()  
•  With  raw  data  input,  sem  provides  robust  es1mates  of  standard  erros  and  robust  tests  
•  Can  accommodate  missing  data,  via  full-­‐informa1on  maximum  likelihood  (FIML)  
•  miSem()  generates  mul1ple  imputa1ons  of  missing  data  using  the  {mi}  
•  bootSem()  provides  nonparametric  bootstrap  es1mates  by  independente  random  sampling  
•  A  given  model  can  be  easily  modified  via  edit()  and  update()  methods  
•  Mul1ple-­‐group  analyses  and  tests  of  factorial  invariance:  mul1groupModel()  
•  {graphviz}:  path  diagrams  
•  {semPlot}:  lovely,  flexible,  pub.  quality  path  diagrams  
•  {metaSEM}    
•  provides  func1ons  to  conduc1ng  univariate  and  mul1variate  meta-­‐analysis  using  a  structural  equa1on  modeling  approach  via  
the   OpenMx   package.   It   also   implemented   the   two-­‐stage   structural   equa1on   modeling   (TSSEM)   approach   to   conduc1ng   fixed-­‐  
and  random-­‐effects  meta-­‐analy1c  structural  equa1on  modeling  (MASEM)  on  correla1on/covariance  matrices.  
Identificação do Modelo
•  Atribuição  de  unidade  de  medida  ao  fator  
•  O  fator  tem  a  mesma  unidade  de  medida  do  indicador  com  carga  fatorial  não-­‐
padronizada  igual  a  1  por  conveniência;  pode  ser  qualquer  valor  não  nulo  
•  Esse  indicador  é  denominado  marcador  ou  indicador  de  referência    
•  Mplus:   a   primeira   variável   causada   pelo   fator   tem   carga   fatorial   não-­‐
padronizada  unitária  
•  Obtenção  de  es1ma1vas  únicas  dos  parâmetros  do  modelo  
•  Graus  de  liberdade  maior  ou  igual  a  zero  
•  Offending  es+mates:  é  possível  obter  variância  nega1va  ou  correlação  
com  valor  absoluto  maior  que  1:  modelo  mal-­‐especificado  ou  
amostra  pequena  
Identificação do Modelo
•  Estado  de  iden1ficação  dos  modelos  
•  Modelos  indeterminados    
•  O  número  de  parâmetros  a  es1mar  é  superior  a  informação  presente  nas  variáveis  
manifestas  
•  Graus  de  liberdade  <  0  
•  X  +    Y  =  6  
•  Modelos  determinados  (saturados)  
•  O  número  de  parâmetros  a  es1mar  é  igual  ao  número  de  elementos  não  redundantes  da  
matriz  de  covariância  
•  Grau  de  liberdade  =  0  
•  X  +    Y  =  6  
•  X    –    Y  =  2  
•  Modelo  só  tem  uma  solução    
•  Por  isso,  não  é  possível  avaliar  hipóteses  estaTs1cas  rela1vas  à  qualidade  do  ajustamento  
Identificação do Modelo
•  Modelos  sobre-­‐iden1ficados  /  sobre-­‐saturados  
•  Número  de  parâmetros  a  es1mar  é  inferior  ao  número  de  elementos  não  
redundantes  da  matriz  de  covariância    
•  Graus  de  liberdade  >  0  
•  Podemos  avaliar  a  qualidade  de  ajustamento  (por  exemplo,  sistema  de  3  equações  com  2  
incógnitas)    
•  2X  –  Y  =  3  
•  3X  +  Y  =  11  
•  X  +  Y  =  6  
•  Esse  sistema  não  tem  solução  exata!  (X  =  2,816;    Y  =  2,789)  
•  Solução  imperfeita  
A ideia de ajuste de modelo e de
comparação de modelo
•  A   essência   do   procedimento   é   confrontar   o   modelo   teórico   com  
alguns  dados  confiáveis  e  ver  em  que  grau  o  modelo  é  consistente  
com  esses  dados  
•  Se  o  modelo  é  consistente  com  os  dados,  então  o  pesquisador  pode  
proceder   provisoriamente   com   ele:   o   pesquisador   fracassou   em  
refutá-­‐lo  
•  Infelizmente,  ter  encontrado  um  modelo  consistente  com  os  dados  
não  significa  que  o  pesquisador  encontrou  “o  modelo  verdadeiro”;  
podem  exis1r  outros  modelos  alterna1vos  que  ele  não  testou  e  que  
são  tão  bons  ou  melhores  do  que  o  modelo  encontrado  
A ideia de ajuste de modelo e de
comparação de modelo
•  Em   geral,   há   pouco   interesse   em   fazer   um   modelo   altamente   complexo   de  
modo   que   ele   se   torna   tão   complexo   quanto   os   dados   que   está   tentando  
explicar;  a  tarefa  do  analista  de  AEE  é  decidir  qual  a  melhor  maneira  de  a1ngir  
esse  equilíbrio  (modelo  parcimonioso)  
•  dados  da  realidade  =  modelo  +  erro    
•  erro  =  dados  –  modelo  
•  Na   prá1ca,   em   vez   de   tentar   predizer   escores   brutos   para   casos,   a   AEE   tenta   predizer   as  
variâncias  das  e  as  covariâncias  entre  as  variáveis  observadas  (indicadores);  embora  isso  soe  (e  
é)   diferente   de   predizer   o   escore   bruto,   trata-­‐se   fundamentalmente   da   mesma   ideia;   quando  
tentamos   explicar   a   variância,   estamos   essencialmente   tentando   explicar   porque   o   escore   de  
um  caso  par1cular  desvia  do  escore  médio?  
Avaliação Estatística da Qualidade do
Modelo
•  Significância   estaTs1ca:   Índice   de   discrepância   populacional:   avalia   se   o  
modelo  ajustado  é  aproximadamente  correto  (em  oposição  ao  exatamente  
correto   do   teste   qui-­‐quadrado)   comparando   o   ajustamento   ob1do   na  
amostra   com   o   ajustamento   que   se   obteria   se   o   mínimo   da   função   de  
discrepância   fosse   ob1do   a   par1r   dos   momentos   (covariâncias)  
populacionais  
•  Root  Mean  Square  Error  of  Approxima1on  (RMSEA)    
•  Significância   prá1ca:   Índice   de   parcimônia:   índice   rela1vo   ajustado   pela  
complexidade   do   modelo   (“R2   da   regressão   linear”):   explica   a   proporção  
da   covariância,   observada   entre   as   variáveis   manifestas,   explicada   pelo  
modelo  ajustado.  
•  Parsimony  Goodness  of  Fit  Index  (PGFI)  
Significância estatística: teste omnibus
valor-p
• Quanto  maior  o  tamanho  da  amostra,  maior  o  RMSEA  
e  menor  o  valor-­‐p  associado  
• Teste  de  ajuste  exato  do  modelo  aos  dados  
• Não  rejeitar  modelo  se  valor-­‐p  >  0,05  (H0:  rmsea  =  0)  
• Valor-­‐p  preferível  com  correção  de  Satorra-­‐Bentler  
• Teste  de  ajuste  aproximado  (restrito)  do  modelo  aos  
dados  
• Não  rejeitar  modelo  se  valor-­‐p  >  0,05  (H0:  rmsea  ≤  0,05)  
• U1lização  mais  frequente  e  mais  realista  
Significância prática: omnibus
tamanho de efeito
• Não  depende  do  tamanho  da  amostra  
• Varia  entre  0  e  1  
• Quanto  maior,  melhor  
• Expressa  a  porcentagem  da  variância  das  VIs  
explicada  pelas  VDs  
• GFI  >  0,9  
• AGFI  >  0,9  
• PGFI  >  0,5  
Significâncias estatística e prática de
parâmetro
• Significância  estaTs1ca  de  parâmetro  
• valor-­‐p  <  0,05:  parâmetro  significante  
• Significância  prá1ca  de  parâmetro  
• Carga  fatorial  >  0,6  
• R2  ou  confiabilidade  ou  comunalidade  >  0,25  
• Variância  residual  <  0,75  
​𝜒↑2 (8)=0,00  
Valor-­‐p  =  ?  
Magnitude da variável latente quantitativa
• As   variáveis   latentes   quan1ta1vas   são   mensuráveis,   têm  
magnitude,   i.e.,   são   es1máveis   esta1s1camente   para   cada  
unidade  experimental  por  meio  de  escores  fatoriais  usando,  
em  geral,  métodos  computacionais  itera1vos  
• Escore  fatorial  
•  Não  é  a  soma  dos  indicadores  
•  Não  é  a  média  ponderada  dos  indicadores  pelas  respec1vas  cargas  
fatoriais  
•  Escore  z  de  cada  par1cipante  
Métodos de estimação dos parâmetros
•  Maximum  likelihood  (ML)  
•  Todas  as  variáveis  latentes  e  manifestas  devem  ser  quan1ta1vas  (pelo  menos  intervalares)  
•  A  unidade  experimental  é  eliminada  da  análise  se  pelo  menos  um  indicador  1ver  valor  faltante  (missing),  violando  o  
princípio  “inten1on  to  treat”  
•  Suposição  de  normalidade  mul1variada  das  variáveis  manifestas,  mas  é  válido  se    
n  ≥  30  +  m  (m  é  o  número  de  variáveis  manifestas)  e  poucos  outliers  
•  Full  Informa1on  Maximum  Likelihood  (FIML)  
•  Método  de  es1mação  default  do  Mplus  e  AMOS  se  todas  as  variáveis  latentes  e  manifestas  devem  ser  quan1ta1vas  
(pelo  menos  intervalares)  
•  A  unidade  experimental  não  é  eliminada  da  análise  se  pelo  menos  um  indicador  1ver  valor  faltante  (missing)  ,  não  
violando  o  princípio  “inten1on  to  treat”  
•  Kline  (1998)  classifica  níveis  de  até  10%  de  valores  faltantes  como  baixos,  ao  passo  que  níveis  acima  de  30%  são  
considerados  altos  
•  Não  há  a  necessidade  de  imputação  de  dados  na  presença  de  até  30%  de  missings  
•  Segundo  Arbuckle  e  Wothke  (1999),  o  método  é  robusto,  mesmo  quando  os  dados  faltantes  não  são  completamente  
aleatórios  (MCAR).  
•  Se  não  há  missings,  então  FIML    se  transforma  em  ML  
•  Suposição  de  normalidade  mul1variada  das  variáveis  manifestas,  mas  é  válido  se    
n  ≥  30  +  m  (m  é  o  número  de  variáveis  manifestas)  e  poucos  outliers  
Métodos de estimação dos parâmetros
•  Robust  Weighted  Least  Squares  (WLSMV)  
•  Método  de  es1mação  default  do  Mplus  se  pelo  menos  uma  variável  endógena  (dependente)  
for  qualita1va  (nominal  ou  ordinal)  
•  Weighted  least  square  parameter  es1mates  using  a  diagonal  weight  matrix  (W)  and  robust  
standard  errors  and  a  mean-­‐  and  variance  adjusted  χ2  test  sta1s1c  
•  When   at   least   one   factor   indicator   is   categorical   (i.e.,   dichotomous,   polytomous,   ordinal),  
ordinary   ML   should   not   be   used   to   es1mate   CFA   models.   The   poten1al   consequences   of  
trea1ng   categorical   variables   as   con1nuous   variables   in   CFA   are   mul1fold,   including   that   it  
can   (1)   produce   a•enuated   es1mates   of   the   rela1onships   (correla1ons)   among   indicators,  
especially  when  there  are  floor  or  ceiling  effects;    
(2)   lead   to   “pseudofactors”   that   are   ar1facts   of   item   difficulty   or   extremeness;   and   (3)  
produce   incorrect   test   sta1s1cs   and   standard   errors.   ML   can   also   produce   incorrect  
parameter   es1mates,   such   as   in   cases   where   marked   floor   or   ceiling   effects   exist   in  
purportedly   interval-­‐level   measurement   scales   (i.e.,   because   the   assump1on   of   linear  
rela1onships  does  not  hold).  Thus,  it  is  important  that  an  es1mator  other  than  ML  be  used  
with  categorical  outcomes  or  severely  non-­‐normal  data.  (Brown)  
Análise fatorial confirmatória
Exemplo 8 de ARBUCKLE (2012)
•  Modelo  psicométrico  recursivo  com  dois  fatores  comuns  de  ordem  1  
Estimativas
•  Measurement   weights,   which   is   short   for   regression   weights   in   the  
measurement   part   of   the   model.   In   the   case   of   a   factor   analysis  
model,  these  are  the  factor  loadings.  
•  Structural  covariances,  which  is  short  for  variances  and  covariances  in  
the   structural   part   of   the   model.   In   a   factor   analysis   model,   these   are  
the  factor  variances  and  covariances.  
•  Measurement  residuals,  which  is  short  for  variances  and  covariances  
of  residual  (error)  variables  in  the  measurement  part  of  the  model.  
Beta  não-­‐padronizado:     Variância  do  
fator  comum  spa1al  tem   termo  de  
a  unidade  de  medida  do   erro  
indicador  visperc  

Covariância  
posi1va  entre  
os  fatores  
comuns   Beta  não-­‐padronizado:  
spa1al  e   fator  específico  err_w    
verbal   tem  a  unidade  de  
medida  do  indicador  
wordmean  
Comunalidade:  %  da  
variância  do  
indicador  explicada  
Correlação   pelo  fator  comum  =  
entre  os   0,7^2  
fatores   0,51  =  1  –  0,49  
comuns  

Variância  
residual:  %  da  
variância  do  
indicador  não  
explicada  pelo  
fator  comum  

Carga  fatorial  
ou  correlação  
entre  o  fator  
comum  e  o  
indicador  
Exemplo 8 de ARBUCKLE (2012)
•  Número  de  parâmetros  =  13  
•  Número  de  momentos  (variâncias  e  covariâncias)  =  (6  x  7)  /  2  =  21  
•  Graus  de  liberdade  =  21  –  13  =  8  
Análise fatorial confirmatória

•  Uma   quan1dade   denominada   índice   de   ajuste   exato   pode   ser  


calculado  para  indicar  o  quão  mal  Σ  se  ajusta  a  S;  o  mais  conhecido  
desses   índices   é   o   qui-­‐quadrado   (CMIN   com   distribuição   assintó1ca  
qui-­‐quadrado)  
•  Contrariamente   ao   que   as   pessoas   geralmente   esperam   quando  
efetuam   análises   estaTs1cas,   o   pesquisador   quer   um   valor   de   qui-­‐
quadrado   não-­‐significa1vo   e   pequeno   que   indique   que   o   que   ele  
observa  em  seus  dados  (a  matriz  S)  não  é  significa1vamente  diferente  
do   que   ele   esperaria   ser   o   caso   na   população   se   o   modelo   fosse  
verdadeiro  (i.e.,  Σ)  
Análise fatorial confirmatória

•  Os  dados  de  entrada  para  análise  é  uma  matriz  de  variância-­‐covariância  S  


de   dimensão   6x6   (simétrica)   que   mostra   como   os   escores   de   cada  
indicador   (variável   observada)   estão   relacionados   com   todas   todos   os  
outros   indicadores   da   amostra;   essa   matriz   de   covariância   observada   é  
conhecida  como  S  
•  O  pesquisador  deve  lembrar  que  o  obje1vo  do  seu  modelo  é  explicar  por  
que  os  dados  são  como  são  (i.e.,  estar  apto  a  predizê-­‐los)  e  ele  quer  que  
seu   modelo   seja   rela1vamente   simples   e   comedido   (parcimonioso);   aqui,  
ele   quer   explicar   porque   as   variáveis   estão   correlacionadas   uma   com   a  
outra   do   modo   como   estão,   e   o   modelo   propõe   que   a   razão   seja   que   os  
escores   observados   sejam   “causados”   por   duas   variáveis   latentes  
correlacionadas  
Análise fatorial confirmatória
•  Em  essência,  e  com  o  risco  de  simplificar  demais  as  coisas,  a  MEE  toma  S  como  
o  ponto  de  par1da  e  pergunta  a  que  a  matriz  de  covariância  corresponderia  na  
população  se  fossem  impostas  se  fossem  impostas  restrições  no  modelo  (i.e.,  se  
o  modelo  fosse  “correto”);    
•  A  matriz  de  covariância  gerada  pela  MEE  é  conhecida  como   Σ  (modelo  default)  
da   mesma   dimensão   que   S,   sendo   que   as   variâncias   e   covariâncias   são  
expressos   em   função   dos   parâmetros   de   carga   fatorial   𝜆,   variância   do   termo   de  
erro  𝛿  e  correlação  entre  fatores  𝜙;    
•  O   MEE   calcula   es1ma1vas   desses   parâmetros   do   modelo   e   gradualmente   as  
refina  até  que  não  possa  fazer  nada  melhor;    
•  Em  cada  etapa  da  elaboração  das  es1ma1vas  dos  parâmetros,  a  MEE  compara  S  
e  Σ  e  tenta  valores  de  parâmetros  alterna1vos  a  fim  de  aumentar  a  similaridade  
entre  essas  duas  matrizes.  
Análise fatorial confirmatória
•  Se  não  houvesse  nenhuma  restrição  imposta  pelo  modelo,  S  
e  Σ  seriam  exatamente  o  mesmo  (modelo  saturado)  
•  Se   a   diferença   entre   S   e   Σ   é   aceitavelmente   pequena,   então  
é  provável  que  as  es1ma1vas  dos  parâmetros    sejam  boas  e  
que  digam  alguma  coisa  significa1va  sobre  as  relações  entre  
as  variáveis  observáveis  (indicadores)  e  as  latentes    
Análise Fatorial Restringida
•  Um   termo   melhor   para   descrever   esses   métodos   é   restringido,   em  
vez  de  confirmatório.    
•  Isso  ocorre  porque  os  dados  são  restringidos  para  se  ajustarem,  tão  
bem  quanto  possível  ao  modelo  em  questão.    
•  Certamente,  em  muitos  casos,  uma  análise  restringida  é  apropriada.    
•  A   confirmação,   por   outro   lado,   vem   a   com   a   replicação   e   com   a  
acumulação  dos  resultados  da  pesquisa  (metanálise).  
Estratégia de análise
1.  Deve-­‐se   começar   com   um   modelo   compacto   inicial   gerado  
teoricamente.   O   modelo   deve   ser   o   mais   simples   possível,   com   poucos  
parâmetros   que   precisem   ser   es1mados.   Deve-­‐se   começar   com   um  
modelo   simples   que   se   possa   tornar   mais   complexo,   e   não   com   um  
modelo   complexo   que   se   pretenda   simplificar.   É   necessário   ter  
algumas  ideias  sobre  quais  modificações  no  modelo  podem  não  fazer  
sen1do  para  a  teoria  em  questão.  
2.  As  medidas-­‐chave  do  modelo  devem  ser  feitas  em  amostras  extraídas  
da   população-­‐alvo.   Deve-­‐se   verificar   se   as   mensurações   que   estão  
sendo   feitas   estão   baseadas   em   bons   modelos   de   mensuração  
conduzindo   AFCs.   Se   esses   modelos   de   mensuração   são   frágeis   ou   mal  
especificados,  então  há  pouca  chance  de  que  o  modelo  estrutural  em  
questão  se  ajuste  bem.  
3.  Os   principais   dados   de   amostra   devem   ser   coletados   u1lizando   as  
melhores  estratégias  de  coleta  de  dados  disponíveis.  
Estratégia de análise
4.  As   dis1ntas   subpartes   do   modelo   inicial   devem   ser   conceitualmente  
testadas.  Se  essas  subpartes  não  estão  OK,  então  que  se  passe  à  etapa  
5;  se  elas  estão  OK,  que  se  passe  à  etapa  6.  
5.  O  submodelo  (ou  submodelos)  deve(m)  ser  reespecificado(s)  relaxando  
as   restrições   de   modo   a   elaborar   um   submodelo   (ou   submodelos)  
ampliado(s).   Devem   ser   liberadas   as   restrições   que   estão  
conceitualmente   OK   e   que,   portanto,   podem   ser   liberadas.   Deve-­‐se  
liberá-­‐las   especificamente   ou   em   pequenas   quan1dades;   não   se   deve  
reespecificar   radicalmente   o   modelo   original,   a   menos   que   se   tenham  
boas  razões  para  fazê-­‐lo.  
6.  Os  submodelos  devem  ser  combinados  em  um  teste  geral.  Fazer  novas  
modificações  somente  se  houver  alguma  razão  teórica  para  fazê-­‐lo.  
7.  A   especificação   do   modelo   final   deve   ser   confirmada   em   uma   nova  
amostra  de  dados.  
Exemplo 8 de ARBUCKLE (2012)

CMIN
Model   NPAR   CMIN   DF   P   CMIN/DF  
Default   13   7,853   8   ,448   ,982  
Saturated   21   ,000   0  
Independence   6   187,718   15   ,000   12,515  
Índices de modificação e buscas de
especificação
•  Busca  de  especificação:  se  o  pesquisador  considera  que  o  modelo  não  
é   aceitável   esta1s1camente,   pode   tentar   modificar   o   modelo   para  
obter  um  ajuste  melhor  
•  O  uso  de  índices  de  modificação  (MI)  ou  mul1plicadores  de  Lagrange  
é  uma  forma  de  busca  de  especificação  
•  MI   é   o   valor   do   qual   o   índice   de   ajuste   exato   qui-­‐quadrado   será  
diminuído  (modificado)  se  uma  determinada  correlação  (covariância)  
ou  betas  (regression  weights)    for  adicionada  ao  modelo,  i.e.,  se  uma  
nova  restrição  for  imposta  aos  dados  
Exemplo 6 de ARBUCKLE (2012)
Exemplo 6 de ARBUCKLE
(2012)
Covariances:
Group number 1 - Default model

Par
M.I.
Change
eps2 <--> delta1 5,905 -,424
eps2 <--> eps4 26,545 ,825
eps2 <--> eps3 32,071 -,988
eps1 <--> delta1 4,609 ,421
eps1 <--> eps4 35,367 -1,069
eps1 <--> eps3 40,911 1,253
Modelo não-recursivo ou bidirecional
• A   model   with   these   feedback   loops   is   called  
nonrecursive    
• Modelo  de  causação  mútua  ou  recíproca  
• If   the   stability   index   falls   between   –1   and   +1,   the  
system  is  stable;  otherwise,  it  is  unstable.    
Depressão pós-parto e conflito conjugal
•  Par:cipantes  
•  Quatrocentas   mães   de   baixa   renda   atendidas   pelo   sistema   público   de   saúde   da   região   do   Butantã,  
par1cipantes   do   Projeto   Temá1co   FAPESP   Depressão   pós-­‐parto   (DPP)   como   um   fator   de   risco   para   o  
desenvolvimento   do   bebê:   estudo   interdisciplinar   dos   fatores   envolvidos   na   gênese   do   quadro   e   em   suas  
consequências   no   qual   essa   pesquisa   se   insere.   No   projeto   estão   sendo   acompanhadas   famílias,   desde   a  
gestação   até   o   terceiro   ano   da   criança,   com   a   construção   de   um   banco   de   dados   sobre   as   caracterís1cas  
familiares,   gestação,   apoio   social   e   familiar,   parto   e   indicadores   do   desenvolvimento   da   criança.   A   idade  
média  das  mães  foi  de  25,2  com  as  idades  variando  de  13  a  43  anos.    
•  Medidas  
•  Escala  de  Depressão  Pós-­‐natal  de  Edinburgh  (EDPE),  de  Cox,  Holden  &  Sagovsky  (1987),  validado  no  Brasil  
por  Santos  et  al.  (1999)  foi  usada  para  avaliar  a  incidência  da  depressão  maternal.  A  EDPE  é  um  instrumento  
de   auto-­‐preenchimento   composto   por   10   enunciados   (ex.   Eu   tenho   sido   capaz   de   rir   e   achar   graça   nas  
coisas;  Eu  tenho  me  sen+do  triste  ou  arrasado,  entre  outras)  cujas  opções  são  pontuadas  (0  a  3)  de  acordo  
com  a  intensidade  do  sintoma.  A  EDPE  foi  aplicada  no  puerpério,  aos  8  e  aos  24  meses  da  criança.  As  mães  
que  ob1veram  escore  igual  ou  superior  a  12  foram  consideradas  potencialmente  deprimidas.        
Percepção   da   mãe   sobre   a   relação   conjugal.   Foi   pedido   às   mães   que   dessem   uma   nota   de   1   a   7   à   qualidade  
do  seu  relacionamento  com  o  seu  parceiro  aos  4,  8,  12  e  24  meses  da  criança.  
Histórico  de  depressão  anterior.  Na  primeira  entrevista  feita  na  Unidade  Básica  de  Saúde,  foi  pedido  à  mãe  
que  relatasse  a  ocorrência  ou  não  de  depressão  anterior  não  relacionada  à  gestação.  
Modelo de mensuração não recursivo para análise de dados
longitudinais cruzados e defasados

 
Análise
•  Foram   atendidas   as   condições   de   aceitabilidade   quanto   à   presença   de   todas   as  
variâncias  posi1vas  e  à  possibilidade  de  es1ma1va  de  todos  os  betas.  Para  este  
teste  foi  usado  o  método  de  es1mação,  que  aceitou  (ao  nível  5%)  a  hipótese  de  
que   a   matriz   de   covariâncias   é   expressável   pelo   modelo   proposto   na   Figura   1   (a),  
pois   χ2(11)=17,78   e   p=0,086,   bem   como   a   da   estabilidade   dos   índices   de  
estabilidade  em  cada  período,  que  é  menor  do  que  1  em  valor  absoluto  (índices  
de  estabilidade  são  0,22  e  0,1  para  os  períodos  4  e  8  meses),  concluindo-­‐se  que  o  
modelo  é  aceitável  esta1s1camente.    
•  O   segundo   passo   foi   testar   um   modelo   parcimonioso   derivado   do   anterior  
denominado   trimmed   model   (Klem,   1994),   isto   é,   um   modelo   ainda   aceitável  
apenas   com   betas   padronizados   significa1vos   para   simplificar   a   visualização   do  
modelo   previamente   aceito.   A   Figura   1   (b)   representa   o   modelo   aceitável  
parcimonioso.   Os   valores   numéricos   das   setas   são   os   betas   padronizados  
es1mados   significa1vos   e   os   dos   retângulos   são   as   es1ma1vas   dos   coeficientes  
de   determinação   (R2)   diretos   de   cada   VD.   O   novo   modelo   é   aceitável,   pois  
χ2(22)=33,26  e  p=0,058.  
Estimativas dos efeitos diretos (betas)
padronizados e seus valores-p do modelo
aceitável parcimonioso

Beta  
VD       VI   Valor  p  
padronizado  
DPP4   <-­‐-­‐-­‐   DepreAnt   ,259   0,001  
CC4ln   <-­‐-­‐-­‐   DPP4   ,454   <0,001  
CC8ln   <-­‐-­‐-­‐   CC4ln   ,677   <0,001  
DPP8   <-­‐-­‐-­‐   DPP4   ,585   <0,001  
CC12ln   <-­‐-­‐-­‐   CC8ln   ,519   <0,001  
CC24ln   <-­‐-­‐-­‐   DPP24   ,466   <0,001  
Efeitos indiretos padronizados
•  Os   efeitos   indiretos   padronizados   são   calculados   pelo   produto   dos  
betas   de   um   determinado   caminho   originado   numa   determinada   VI  
cujo   des1no   é   uma   determinada   VD.   Por   exemplo,   se   consideramos  
DepreAnterior   como   VI   e   DPP8   como   VD,   então   há   apenas   uma  
caminho   que   as   liga   no   sen1do   DepreAnterior   para   DPP8,   isto   é,  
passando  pela  variável  DPP8.    
•  Se,   por   exemplo,   o   efeito   total   padronizado   de   DepreAnterior   em  
DPP8  é  0,26×0,58  =  0,16,  i.e.,  se  a  DepreAnterior  aumentar  1  desvio-­‐
padrão,   então   a   DPP8   aumentará,   pois   o   beta   é   posi1vo,   0,16   desvio-­‐
padrão.   Note   que   os   efeitos   indiretos   padronizados   são   es1ma1vas  
pontuais   e   não   foram   realizados   testes   para   avaliar   suas  
significâncias.    
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO

• Autores:  
• R.  Zwicker,  FEA-­‐USP  
• C.  A.  Souza,  FEA-­‐USP  
• A.  Vidal,  FEA-­‐USP  
• J.  O.  Siqueira,  FEA-­‐USP  
• Periódico:  RAE-­‐eletrônica,  6(2),  2007  
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
•  RESUMO  
•  A  difusão  do  uso  da  Tecnologia  de  Informação  (TI)  é  evidenciada  por  meio  de  um  
processo,   que   pode   ser   denominado   informa1zação   e   que   permeia   nossa  
sociedade   e   negócios.   Com   relação   aos   negócios,   os   gestores   necessitam   de  
instrumentos   para   avaliar   o   uso   organizacional   da   TI.   O   ar1go   apresenta   um  
modelo   de   avaliação   com   base   na   mensuração   do   construto   Grau   de  
Informa1zação   (GI).   Cinco   dimensões   (fatores)   de   avaliação   foram   consideradas  
no   modelo   final:   uso   organizacional   da   TI,   impactos   da   TI,   atributos   das  
aplicações   da   TI,   infra-­‐estrutura   da   TI   e   governança   da   TI.   O   modelo   foi  
desenvolvido   a   par1r   do   levantamento   de   dados   de   uma   amostra   de   830  
empresas  industriais  do  estado  de  São  Paulo.  Nele,  a  modelagem  por  equações  
estruturais   foi   u1lizada   para   desenvolver   e   validar   o   GI.   O   construto   sa1sfez   os  
requisitos   de   consistência   e   validade   interna   e   demonstrou   possuir   validade  
externa   na   medida   em   que   as   proposições   em   relação   ao   tamanho   da   empresa   e  
não  quanto  aos  níveis  de  inves1mentos  em  TI  foram  confirmadas.  
MEE de ordem 3
•  Modelo   estrutural   composto   por   um   fator   de   terceira   ordem   (GI),   6  
fatores  de  segunda  ordem  (dimensões  do  GI),  24  fatores  de  primeira  
ordem   (subdimensões   do   GI)   e   71   variáveis   indicadoras,   elaboradas   a  
par1r  das  316  questões  do  ques1onário.  
MEE de ordem 3
Missings
•  A   porcentagem   geral   de   dados   faltantes,   rela1vos   às   66   variáveis  
indicadoras,  foi  de  17,3%.    
•  Kline   (1998)   classifica   níveis   de   até   10%   de   valores   faltantes   como  
baixos,  ao  passo  que  níveis  acima  de  30%  são  considerados  altos.    
•  Para   a   es1mação   do   modelo   estrutural   foi   u1lizado   o   método   FIML,  
disponível  no  AMOS  4.    
•  Segundo   Arbuckle   e   Wothke   (1999),   o   método   é   robusto,   mesmo  
quando  os  dados  faltantes  não  são  completamente  aleatórios.  
MEE de ordem 3
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
Modelos aninhados
Exemplo 6 de ARBUCKLE (2012)
CMIN

Model   NPAR   CMIN   DF   P   CMIN/DF  

A:  No  Autocorrela1on   15   71,544   6   ,000   11,924  

B:  Most  General   16   6,383   5   ,271   1,277  

C:  Time-­‐Invariance   13   7,501   8   ,484   ,938  

D:  A  and  C  Combined   12   73,077   9   ,000   8,120  

Saturated   21   ,000   0  

Independence   6   2131,790   15   ,000   142,119  


Assuming model Model B: Most General to be correct:

Model   DF   CMIN   P  

A:  No  Autocorrela1on   1   65,160   ,000  

C:  Time-­‐Invariance   3   1,117   ,773  

D:  A  and  C  Combined   4   66,693   ,000  


Aplicações
Biometria
Lista de exercícios

Vous aimerez peut-être aussi