Arq Apoio 5 1439146250 PDF

Análise de Equações
Estruturais:
teoria e prática
José O. Siqueira
Ins1tuto de Psicologia -‐ USP
B1MC2: Bloco 1 – Minicurso 2 – 4 horas
Resumo
•  O obje1vo do minicurso é apresentar os fundamentos teóricos, soKwares e
aplicações da análise de equações estruturais (AEE).
•  A AEE é uma técnica estaTs1ca mul1variada inferencial que testa modelos
“causais” com indicadores (variáveis observáveis) e variáveis latentes (não-‐
observáveis).
•  SEM (Structural Equa+on Modeling), análise de estruturas de covariância,
modelagem de equações simultâneas, “modelagem causal”
•  A AEE introduz uma perspec1va rela1vamente nova à testagem de hipótese
estaTs1ca com uma abordagem baseada na “confirmação” do modelo.
•  Além disso, a AEE promove um rigor maior na pesquisa aplicada quan1ta1va.
•  Subjacente à AEE está um conjunto de ideias sobre o que cons1tui a boa prá1ca
cienTfica.
Referências
•  BREAKWELL, G. M. et al. (2010) Métodos de pesquisa em Psicologia. Cap.
21: Introdução à modelagem de equação estrutural. 3ª ed. Porto Alegre:
Bookman.
•  MARÔCO, J. (2010) Análise de equações estruturais. Lisboa:
ReportNumber.
•  PUGESEK, B. H. et al. (Org.) (2003) Structural equa:on modeling:
Applica:ons in ecological and evolu:onary biology. UK: Cambridge Univ.
Press.
•  GRACE, J. B. (2006) Structural equa:on modelling and natural systems.
UK: Cambridge Univ. Press
Introdução
•  Oferece um potencial imenso para os psicólogos, pois, em geral,
grande parte das coisas nas quais os psicólogos estão
interessados são variáveis latentes/ inobserváveis/ fatores: o
pesquisador deve tornar explícitas suas teorias ou modelos de
relações entre medidas observadas (indicadores) e variáveis
latentes, de um lado, e as relações que ele espera encontrar
entre as variáveis latentes, de outro
•  Correlação não implica causação: no melhor dos casos, a AEE
pode mostrar apenas que um modelo “causal” sugerido é
consistente com as variâncias e covariâncias (momentos)
observadas
Introdução
• Relações lineares entre as variáveis
quan1ta1vas
• Suposições:
• normalidade mul1variada dos indicadores
• independência entre as observações
Introdução
•  AEE é um conjunto de procedimentos estaTs1cos que podem ser
aplicados a dados quan1ta1vos e qualita1vos e que permite ao
pesquisador
•  Testar modelos teoricamente especificados das relações entre variáveis
observadas/ indicadores (e.g., escores de teste) e variáveis inobserváveis/
latentes/ fatores, por vezes chamados modelos de mensuração (análise de
fatores comuns confirmatória) e
•  Testar modelos teóricos das relações entre conjuntos de variáveis latentes,
chamados modelos estruturais
•  Testar modelos teóricos das relações entre conjuntos de indicadores
(path analysis)
Introdução
• História, literatura, arte: conhecimento idiográfico
• Ciência: relações causais, conhecimento nomoté1co
• EstaTs1ca é parte integrante do método cienTfico
moderno
• Técnicas estaTs1cas teoré1cas (theory-‐driven)
•  AEE, AFC
• Técnicas estaTs1cas ateoré1cas (data-‐driven)
•  Análise de séries temporais: VAR
• A prá1ca da estaTs1ca é soCware-‐driven
Erro de mensuração
•  Como em muitas variáveis psicológicas, as medidas que temos
(indicadores) são índices imperfeitos dos construtos latentes que, em
princípio, poderíamos nunca mensurar de um modo totalmente
preciso
•  A MEE oferece a oportunidade de levar em consideração o erro de
mensuração ao es1mar os parâmetros de nosso modelo por meio dos
termos de erro (variáveis latentes exógenas associadas aos
indicadores)
Erro de mensuração
•  Trabalha-‐se com um conjunto de variáveis observáveis que são indicadores do impacto de uma
variável latente
•  Não se mensura na perfeição um fenômeno latente
•  Variáveis/indicadores observáveis de uma variável latente frequentemente contém erros de
mensuração
•  Erro mensuração do indicador: variável latente exógena específica (unique), fator único (em
contraposição ao fator comum), termo de erro, resíduo
•  Esses resíduos sempre são mo1vo de preocupação e as análises que trabalham com medidas latentes
permitem calcular a variância residual para cada um dos indicadores
•  Variância residual representa a variância que não é explicada pelo fator/traço latente
•  Parte dessa variância não explicada pelo traço latente é devida aos erros de mensuração aleatórios ou escore
não confiáveis (Kline, 2009, p.9)
•  O termo de erro pode compreender componentes de variância específica sistemá1ca em acréscimo ao
erro randômico. A comunalidade ou R2 tem que ser considerado o limite inferior da es1ma1va da
confiabilidade do indicador. (Arbuckle & Wothke (1999), p. 192))
Etapas da modelagem
• Formulação do Modelo
• Modelo de mensuração
• Modelo estrutural
• Iden1ficação do Modelo
• Es1mação do Modelo
• Avaliação do Modelo
• Modificação do Modelo
Símbolos e seus significados
•  Variável latente Relação recursiva “causal”
•  Variável observável Relação correlacional
•  Relação não-‐recursiva “causal”

(retroalimentação)

Modelo híbrido =
Modelo psicométrico
(measurement model) +
Modelo econométrico
(structural model)
Tipos de variáveis
• Exógena: variável que causa, mas não é causada
• Endógena: variável que é causada
• Mediadora: variável que causa e é causada
• Endogenous variables are those that have single-‐headed

arrows poin1ng to them; they depend on other variables.
• Exogenous variables are those that do not have single-‐
headed arrows poin1ng to them; they do not depend on
other variables.
Diagrama
Análise de trajetória (path analysis)
β de regressão
Termo de erro

VM Endógena (VD)
VM Exógena (VI)
Exemplo 6 de ARBUCKLE (2012)
•  Observed, endogenous variables
•  anomia67
•  powles67
•  anomia71
•  powles71
•  educatio
•  SEI
•  Unobserved, endogenous variables
•  71_alienation
•  67_alienation
•  Unobserved, exogenous variables   Variable counts
•  eps1   Number of variables in your model: 17
•  eps2
  Number of observed variables: 6
•  eps3
•  eps4   Number of unobserved variables: 11
•  ses   Number of exogenous variables: 9
•  delta1
•  zeta1   Number of endogenous variables: 8
•  zeta2
•  delta2
Covariância e correlação
Gráfico de dispersão
Modelo:
y = a + b1*x1 + ey
var(ey)

Suposições:
ey
1 Cov(x1, ey) = 0
performance mo1va1on
Solução:
b1 = 0,71
var(ey) = 6,70
R2 = 0,37
Variáveis manifestas centradas
𝑦:performance (dado bruto) (VD)
𝑥↓1 :motivation (dado bruto) (VI)
Modelo: 𝑦↑′ =𝑏↓1 𝑥↓1↑′ +𝑒↓𝑦 , 𝑒↓𝑦 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(𝑒↓𝑦 )) 𝑒 𝐶𝑜𝑣(𝑥↓1 ,
𝑒↓𝑦 )=0
𝑦 =6,02 e 𝑥↓1  =5,97
𝑦↑′ =𝑦−𝑦 =𝑦−6,02
𝑥↓1↑′ =𝑥↓1 −𝑥↓1  =𝑥↓1 −5,97
𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )=𝐶𝑜𝑣(𝑦,𝑥↓1 )=5,54
𝑉𝑎𝑟(𝑦↑′ )=𝑉𝑎𝑟(𝑦)=10,61
𝑉𝑎𝑟(𝑥↓1↑′ )=𝑉𝑎𝑟(𝑥↓1 )=7,78
𝑟=𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )/√⁠𝑉𝑎𝑟(𝑦↑′ ) √⁠𝑉𝑎𝑟(𝑥↓1↑′ )  =0,61
Variáveis manifestas padronizadas
𝑦:performance (dado bruto) (VD)
𝑥↓1 :motivation (dado bruto) (VI)
Modelo: 𝑧=𝛽↓1 𝑤+𝑒↓𝑧 , 𝑒↓𝑧 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(𝑒↓𝑧 )) 𝑒 𝐶𝑜𝑣(𝑤,𝑒↓𝑧 )=0

𝑧=𝑦↑′ ∕√⁠𝑉𝑎𝑟(𝑦↑′ )  =(𝑦−6,02)∕3,28 
𝑤=𝑥↓1↑′ ∕√⁠𝑉𝑎𝑟(𝑥↓1↑′ )  =(𝑥↓1 −5,97 )∕2,79 
𝑉𝑎𝑟(𝑧)=𝑉𝑎𝑟(𝑤)=1
𝑟=𝐶𝑜𝑣(𝑧,𝑤)/√⁠𝑉𝑎𝑟(𝑧) √√𝑉𝑎𝑟(𝑤)  =𝐶𝑜𝑣(𝑧,𝑤)=𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )/
√⁠𝑉𝑎𝑟(𝑦↑′ ) √⁠𝑉𝑎𝑟(𝑥↓1↑′ )  =0,61
𝛽↓1 =𝐶𝑜𝑣(𝑧,𝑤)/𝑉𝑎𝑟(𝑤) =𝐶𝑜𝑣(𝑧,𝑤)=𝑟=0,61
𝑅↑2 =𝑟↑2 =0,37
Exemplo com 2 fatores
comuns
Variância
Termo de erro

ou fator
idiossincrá1co
Indicador
𝜆: carga fatorial
Fator comum
Covariância
Modelo psicométrico reflexivo recursivo
unidimensional de ordem 1
Modelo psicométrico reflexivo
recursivo bidimensional de ordem
1
Software
• O acesso a pacotes estaTs1cos amigáveis

provocam um desastroso efeito colateral de
aumentar o número de usos acrí1cos da MEE em
que a técnica é usada simplesmente porque pode
ser facilmente u1lizada e impressiona, e não
porque ela é a análise apropriada a ser realizada
Software de análise de equações
estruturais
• Comercial
•  Mplus (Muthen & Muthen)
•  AMOS (Analysis of MOments Structures): Arbuckle, J. L.
•  LISREL (LInear Structural RELa1ons): Jöreskog, K. G. & Sörbom, D.
(Primeiro)
•  EQS (structural EQua1ons System): Bentler, P. M.
•  SAS: CALIS
•  STATISTICA: SEPATH
•  SYSTAT: RAMONA
•  STATA >= 12
•  Latent GOLD: Latent Class Modeling
Software de análise de equações
estruturais
•  Pacotes do R (soKware livre)
•  {psytabs} {lavaan} {OpenMx} {semTools} {simsem}
•  {sem}
•  Includes cfa() , linearEqua1ons() , and mul1groupModel()
•  With raw data input, sem provides robust es1mates of standard erros and robust tests
•  Can accommodate missing data, via full-‐informa1on maximum likelihood (FIML)
•  miSem() generates mul1ple imputa1ons of missing data using the {mi}
•  bootSem() provides nonparametric bootstrap es1mates by independente random sampling
•  A given model can be easily modified via edit() and update() methods
•  Mul1ple-‐group analyses and tests of factorial invariance: mul1groupModel()
•  {graphviz}: path diagrams
•  {semPlot}: lovely, flexible, pub. quality path diagrams
•  {metaSEM}
•  provides func1ons to conduc1ng univariate and mul1variate meta-‐analysis using a structural equa1on modeling approach via
the OpenMx package. It also implemented the two-‐stage structural equa1on modeling (TSSEM) approach to conduc1ng fixed-‐
and random-‐effects meta-‐analy1c structural equa1on modeling (MASEM) on correla1on/covariance matrices.
Identificação do Modelo
•  Atribuição de unidade de medida ao fator
•  O fator tem a mesma unidade de medida do indicador com carga fatorial não-‐
padronizada igual a 1 por conveniência; pode ser qualquer valor não nulo
•  Esse indicador é denominado marcador ou indicador de referência
•  Mplus: a primeira variável causada pelo fator tem carga fatorial não-‐
padronizada unitária
•  Obtenção de es1ma1vas únicas dos parâmetros do modelo
•  Graus de liberdade maior ou igual a zero
•  Offending es+mates: é possível obter variância nega1va ou correlação
com valor absoluto maior que 1: modelo mal-‐especificado ou
amostra pequena
•  Estado de iden1ficação dos modelos
•  Modelos indeterminados
•  O número de parâmetros a es1mar é superior a informação presente nas variáveis
manifestas
•  Graus de liberdade < 0
•  X + Y = 6
•  Modelos determinados (saturados)
•  O número de parâmetros a es1mar é igual ao número de elementos não redundantes da
matriz de covariância
•  Grau de liberdade = 0
•  X + Y = 6
•  X – Y = 2
•  Modelo só tem uma solução
•  Por isso, não é possível avaliar hipóteses estaTs1cas rela1vas à qualidade do ajustamento
•  Modelos sobre-‐iden1ficados / sobre-‐saturados
•  Número de parâmetros a es1mar é inferior ao número de elementos não
redundantes da matriz de covariância
•  Graus de liberdade > 0
•  Podemos avaliar a qualidade de ajustamento (por exemplo, sistema de 3 equações com 2
incógnitas)
•  2X – Y = 3
•  3X + Y = 11
•  X + Y = 6
•  Esse sistema não tem solução exata! (X = 2,816; Y = 2,789)
•  Solução imperfeita
A ideia de ajuste de modelo e de
comparação de modelo
•  A essência do procedimento é confrontar o modelo teórico com
alguns dados confiáveis e ver em que grau o modelo é consistente
com esses dados
•  Se o modelo é consistente com os dados, então o pesquisador pode
proceder provisoriamente com ele: o pesquisador fracassou em
refutá-‐lo
•  Infelizmente, ter encontrado um modelo consistente com os dados
não significa que o pesquisador encontrou “o modelo verdadeiro”;
podem exis1r outros modelos alterna1vos que ele não testou e que
são tão bons ou melhores do que o modelo encontrado
A ideia de ajuste de modelo e de
comparação de modelo
•  Em geral, há pouco interesse em fazer um modelo altamente complexo de
modo que ele se torna tão complexo quanto os dados que está tentando
explicar; a tarefa do analista de AEE é decidir qual a melhor maneira de a1ngir
esse equilíbrio (modelo parcimonioso)
•  dados da realidade = modelo + erro
•  erro = dados – modelo
•  Na prá1ca, em vez de tentar predizer escores brutos para casos, a AEE tenta predizer as
variâncias das e as covariâncias entre as variáveis observadas (indicadores); embora isso soe (e
é) diferente de predizer o escore bruto, trata-‐se fundamentalmente da mesma ideia; quando
tentamos explicar a variância, estamos essencialmente tentando explicar porque o escore de
um caso par1cular desvia do escore médio?
Avaliação Estatística da Qualidade do
Modelo
•  Significância estaTs1ca: Índice de discrepância populacional: avalia se o
modelo ajustado é aproximadamente correto (em oposição ao exatamente
correto do teste qui-‐quadrado) comparando o ajustamento ob1do na
amostra com o ajustamento que se obteria se o mínimo da função de
discrepância fosse ob1do a par1r dos momentos (covariâncias)
populacionais
•  Root Mean Square Error of Approxima1on (RMSEA)
•  Significância prá1ca: Índice de parcimônia: índice rela1vo ajustado pela
complexidade do modelo (“R2 da regressão linear”): explica a proporção
da covariância, observada entre as variáveis manifestas, explicada pelo
modelo ajustado.
•  Parsimony Goodness of Fit Index (PGFI)
Significância estatística: teste omnibus
valor-p
• Quanto maior o tamanho da amostra, maior o RMSEA
e menor o valor-‐p associado
• Teste de ajuste exato do modelo aos dados
• Não rejeitar modelo se valor-‐p > 0,05 (H0: rmsea = 0)
• Valor-‐p preferível com correção de Satorra-‐Bentler
• Teste de ajuste aproximado (restrito) do modelo aos
dados
• Não rejeitar modelo se valor-‐p > 0,05 (H0: rmsea ≤ 0,05)
• U1lização mais frequente e mais realista
Significância prática: omnibus
tamanho de efeito
• Não depende do tamanho da amostra
• Varia entre 0 e 1
• Quanto maior, melhor
• Expressa a porcentagem da variância das VIs
explicada pelas VDs
• GFI > 0,9
• AGFI > 0,9
• PGFI > 0,5
Significâncias estatística e prática de
parâmetro
• Significância estaTs1ca de parâmetro
• valor-‐p < 0,05: parâmetro significante
• Significância prá1ca de parâmetro
• Carga fatorial > 0,6
• R2 ou confiabilidade ou comunalidade > 0,25
• Variância residual < 0,75
𝜒↑2 (8)=0,00
Valor-‐p = ?
Magnitude da variável latente quantitativa
• As variáveis latentes quan1ta1vas são mensuráveis, têm
magnitude, i.e., são es1máveis esta1s1camente para cada
unidade experimental por meio de escores fatoriais usando,
em geral, métodos computacionais itera1vos
• Escore fatorial
•  Não é a soma dos indicadores
•  Não é a média ponderada dos indicadores pelas respec1vas cargas
fatoriais
•  Escore z de cada par1cipante
Métodos de estimação dos parâmetros
•  Maximum likelihood (ML)
•  Todas as variáveis latentes e manifestas devem ser quan1ta1vas (pelo menos intervalares)
•  A unidade experimental é eliminada da análise se pelo menos um indicador 1ver valor faltante (missing), violando o
princípio “inten1on to treat”
•  Suposição de normalidade mul1variada das variáveis manifestas, mas é válido se
n ≥ 30 + m (m é o número de variáveis manifestas) e poucos outliers
•  Full Informa1on Maximum Likelihood (FIML)
•  Método de es1mação default do Mplus e AMOS se todas as variáveis latentes e manifestas devem ser quan1ta1vas
(pelo menos intervalares)
•  A unidade experimental não é eliminada da análise se pelo menos um indicador 1ver valor faltante (missing) , não
violando o princípio “inten1on to treat”
•  Kline (1998) classifica níveis de até 10% de valores faltantes como baixos, ao passo que níveis acima de 30% são
considerados altos
•  Não há a necessidade de imputação de dados na presença de até 30% de missings
•  Segundo Arbuckle e Wothke (1999), o método é robusto, mesmo quando os dados faltantes não são completamente
aleatórios (MCAR).
•  Se não há missings, então FIML se transforma em ML
•  Suposição de normalidade mul1variada das variáveis manifestas, mas é válido se
n ≥ 30 + m (m é o número de variáveis manifestas) e poucos outliers
Métodos de estimação dos parâmetros
•  Robust Weighted Least Squares (WLSMV)
•  Método de es1mação default do Mplus se pelo menos uma variável endógena (dependente)
for qualita1va (nominal ou ordinal)
•  Weighted least square parameter es1mates using a diagonal weight matrix (W) and robust
standard errors and a mean-‐ and variance adjusted χ2 test sta1s1c
•  When at least one factor indicator is categorical (i.e., dichotomous, polytomous, ordinal),
ordinary ML should not be used to es1mate CFA models. The poten1al consequences of
trea1ng categorical variables as con1nuous variables in CFA are mul1fold, including that it
can (1) produce a•enuated es1mates of the rela1onships (correla1ons) among indicators,
especially when there are floor or ceiling effects;
(2) lead to “pseudofactors” that are ar1facts of item difficulty or extremeness; and (3)
produce incorrect test sta1s1cs and standard errors. ML can also produce incorrect
parameter es1mates, such as in cases where marked floor or ceiling effects exist in
purportedly interval-‐level measurement scales (i.e., because the assump1on of linear
rela1onships does not hold). Thus, it is important that an es1mator other than ML be used
with categorical outcomes or severely non-‐normal data. (Brown)
Análise fatorial confirmatória
•  Modelo psicométrico recursivo com dois fatores comuns de ordem 1
Estimativas
•  Measurement weights, which is short for regression weights in the
measurement part of the model. In the case of a factor analysis
model, these are the factor loadings.
•  Structural covariances, which is short for variances and covariances in
the structural part of the model. In a factor analysis model, these are
the factor variances and covariances.
•  Measurement residuals, which is short for variances and covariances
of residual (error) variables in the measurement part of the model.
Beta não-‐padronizado: Variância do
fator comum spa1al tem termo de
a unidade de medida do erro
indicador visperc
Covariância
posi1va entre
os fatores
comuns Beta não-‐padronizado:
spa1al e fator específico err_w
verbal tem a unidade de
medida do indicador
wordmean
Comunalidade: % da
variância do
indicador explicada
Correlação pelo fator comum =
entre os 0,7^2
fatores 0,51 = 1 – 0,49
comuns
Variância
residual: % da
variância do
indicador não
explicada pelo
fator comum
Carga fatorial
ou correlação
entre o fator
comum e o
indicador
•  Número de parâmetros = 13
•  Número de momentos (variâncias e covariâncias) = (6 x 7) / 2 = 21
•  Graus de liberdade = 21 – 13 = 8
•  Uma quan1dade denominada índice de ajuste exato pode ser

calculado para indicar o quão mal Σ se ajusta a S; o mais conhecido
desses índices é o qui-‐quadrado (CMIN com distribuição assintó1ca
qui-‐quadrado)
•  Contrariamente ao que as pessoas geralmente esperam quando
efetuam análises estaTs1cas, o pesquisador quer um valor de qui-‐
quadrado não-‐significa1vo e pequeno que indique que o que ele
observa em seus dados (a matriz S) não é significa1vamente diferente
do que ele esperaria ser o caso na população se o modelo fosse
verdadeiro (i.e., Σ)
•  Os dados de entrada para análise é uma matriz de variância-‐covariância S

de dimensão 6x6 (simétrica) que mostra como os escores de cada
indicador (variável observada) estão relacionados com todas todos os
outros indicadores da amostra; essa matriz de covariância observada é
conhecida como S
•  O pesquisador deve lembrar que o obje1vo do seu modelo é explicar por
que os dados são como são (i.e., estar apto a predizê-‐los) e ele quer que
seu modelo seja rela1vamente simples e comedido (parcimonioso); aqui,
ele quer explicar porque as variáveis estão correlacionadas uma com a
outra do modo como estão, e o modelo propõe que a razão seja que os
escores observados sejam “causados” por duas variáveis latentes
correlacionadas
•  Em essência, e com o risco de simplificar demais as coisas, a MEE toma S como
o ponto de par1da e pergunta a que a matriz de covariância corresponderia na
população se fossem impostas se fossem impostas restrições no modelo (i.e., se
o modelo fosse “correto”);
•  A matriz de covariância gerada pela MEE é conhecida como Σ (modelo default)
da mesma dimensão que S, sendo que as variâncias e covariâncias são
expressos em função dos parâmetros de carga fatorial 𝜆, variância do termo de
erro 𝛿 e correlação entre fatores 𝜙;
•  O MEE calcula es1ma1vas desses parâmetros do modelo e gradualmente as
refina até que não possa fazer nada melhor;
•  Em cada etapa da elaboração das es1ma1vas dos parâmetros, a MEE compara S
e Σ e tenta valores de parâmetros alterna1vos a fim de aumentar a similaridade
entre essas duas matrizes.
•  Se não houvesse nenhuma restrição imposta pelo modelo, S
e Σ seriam exatamente o mesmo (modelo saturado)
•  Se a diferença entre S e Σ é aceitavelmente pequena, então
é provável que as es1ma1vas dos parâmetros sejam boas e
que digam alguma coisa significa1va sobre as relações entre
as variáveis observáveis (indicadores) e as latentes
Análise Fatorial Restringida
•  Um termo melhor para descrever esses métodos é restringido, em
vez de confirmatório.
•  Isso ocorre porque os dados são restringidos para se ajustarem, tão
bem quanto possível ao modelo em questão.
•  Certamente, em muitos casos, uma análise restringida é apropriada.
•  A confirmação, por outro lado, vem a com a replicação e com a
acumulação dos resultados da pesquisa (metanálise).
Estratégia de análise
1.  Deve-‐se começar com um modelo compacto inicial gerado
teoricamente. O modelo deve ser o mais simples possível, com poucos
parâmetros que precisem ser es1mados. Deve-‐se começar com um
modelo simples que se possa tornar mais complexo, e não com um
modelo complexo que se pretenda simplificar. É necessário ter
algumas ideias sobre quais modificações no modelo podem não fazer
sen1do para a teoria em questão.
2.  As medidas-‐chave do modelo devem ser feitas em amostras extraídas
da população-‐alvo. Deve-‐se verificar se as mensurações que estão
sendo feitas estão baseadas em bons modelos de mensuração
conduzindo AFCs. Se esses modelos de mensuração são frágeis ou mal
especificados, então há pouca chance de que o modelo estrutural em
questão se ajuste bem.
3.  Os principais dados de amostra devem ser coletados u1lizando as
melhores estratégias de coleta de dados disponíveis.
Estratégia de análise
4.  As dis1ntas subpartes do modelo inicial devem ser conceitualmente
testadas. Se essas subpartes não estão OK, então que se passe à etapa
5; se elas estão OK, que se passe à etapa 6.
5.  O submodelo (ou submodelos) deve(m) ser reespecificado(s) relaxando
as restrições de modo a elaborar um submodelo (ou submodelos)
ampliado(s). Devem ser liberadas as restrições que estão
conceitualmente OK e que, portanto, podem ser liberadas. Deve-‐se
liberá-‐las especificamente ou em pequenas quan1dades; não se deve
reespecificar radicalmente o modelo original, a menos que se tenham
boas razões para fazê-‐lo.
6.  Os submodelos devem ser combinados em um teste geral. Fazer novas
modificações somente se houver alguma razão teórica para fazê-‐lo.
7.  A especificação do modelo final deve ser confirmada em uma nova
amostra de dados.
CMIN
Model NPAR CMIN DF P CMIN/DF
Default 13 7,853 8 ,448 ,982
Saturated 21 ,000 0
Independence 6 187,718 15 ,000 12,515
Índices de modificação e buscas de
especificação
•  Busca de especificação: se o pesquisador considera que o modelo não
é aceitável esta1s1camente, pode tentar modificar o modelo para
obter um ajuste melhor
•  O uso de índices de modificação (MI) ou mul1plicadores de Lagrange
é uma forma de busca de especificação
•  MI é o valor do qual o índice de ajuste exato qui-‐quadrado será
diminuído (modificado) se uma determinada correlação (covariância)
ou betas (regression weights) for adicionada ao modelo, i.e., se uma
nova restrição for imposta aos dados
Exemplo 6 de ARBUCKLE
(2012)
Covariances:
Group number 1 - Default model
Par
M.I.
Change
eps2 <--> delta1 5,905 -,424
eps2 <--> eps4 26,545 ,825
eps2 <--> eps3 32,071 -,988
eps1 <--> delta1 4,609 ,421
eps1 <--> eps4 35,367 -1,069
eps1 <--> eps3 40,911 1,253
Modelo não-recursivo ou bidirecional
• A model with these feedback loops is called
nonrecursive
• Modelo de causação mútua ou recíproca
• If the stability index falls between –1 and +1, the
system is stable; otherwise, it is unstable.
Depressão pós-parto e conflito conjugal
•  Par:cipantes
•  Quatrocentas mães de baixa renda atendidas pelo sistema público de saúde da região do Butantã,
par1cipantes do Projeto Temá1co FAPESP Depressão pós-‐parto (DPP) como um fator de risco para o
desenvolvimento do bebê: estudo interdisciplinar dos fatores envolvidos na gênese do quadro e em suas
consequências no qual essa pesquisa se insere. No projeto estão sendo acompanhadas famílias, desde a
gestação até o terceiro ano da criança, com a construção de um banco de dados sobre as caracterís1cas
familiares, gestação, apoio social e familiar, parto e indicadores do desenvolvimento da criança. A idade
média das mães foi de 25,2 com as idades variando de 13 a 43 anos.
•  Medidas
•  Escala de Depressão Pós-‐natal de Edinburgh (EDPE), de Cox, Holden & Sagovsky (1987), validado no Brasil
por Santos et al. (1999) foi usada para avaliar a incidência da depressão maternal. A EDPE é um instrumento
de auto-‐preenchimento composto por 10 enunciados (ex. Eu tenho sido capaz de rir e achar graça nas
coisas; Eu tenho me sen+do triste ou arrasado, entre outras) cujas opções são pontuadas (0 a 3) de acordo
com a intensidade do sintoma. A EDPE foi aplicada no puerpério, aos 8 e aos 24 meses da criança. As mães
que ob1veram escore igual ou superior a 12 foram consideradas potencialmente deprimidas.
Percepção da mãe sobre a relação conjugal. Foi pedido às mães que dessem uma nota de 1 a 7 à qualidade
do seu relacionamento com o seu parceiro aos 4, 8, 12 e 24 meses da criança.
Histórico de depressão anterior. Na primeira entrevista feita na Unidade Básica de Saúde, foi pedido à mãe
que relatasse a ocorrência ou não de depressão anterior não relacionada à gestação.
Modelo de mensuração não recursivo para análise de dados
longitudinais cruzados e defasados

Análise
•  Foram atendidas as condições de aceitabilidade quanto à presença de todas as
variâncias posi1vas e à possibilidade de es1ma1va de todos os betas. Para este
teste foi usado o método de es1mação, que aceitou (ao nível 5%) a hipótese de
que a matriz de covariâncias é expressável pelo modelo proposto na Figura 1 (a),
pois χ2(11)=17,78 e p=0,086, bem como a da estabilidade dos índices de
estabilidade em cada período, que é menor do que 1 em valor absoluto (índices
de estabilidade são 0,22 e 0,1 para os períodos 4 e 8 meses), concluindo-‐se que o
modelo é aceitável esta1s1camente.
•  O segundo passo foi testar um modelo parcimonioso derivado do anterior
denominado trimmed model (Klem, 1994), isto é, um modelo ainda aceitável
apenas com betas padronizados significa1vos para simplificar a visualização do
modelo previamente aceito. A Figura 1 (b) representa o modelo aceitável
parcimonioso. Os valores numéricos das setas são os betas padronizados
es1mados significa1vos e os dos retângulos são as es1ma1vas dos coeficientes
de determinação (R2) diretos de cada VD. O novo modelo é aceitável, pois
χ2(22)=33,26 e p=0,058.
Estimativas dos efeitos diretos (betas)
padronizados e seus valores-p do modelo
aceitável parcimonioso
Beta
VD VI Valor p
padronizado
DPP4 <-‐-‐-‐ DepreAnt ,259 0,001
CC4ln <-‐-‐-‐ DPP4 ,454 <0,001
CC8ln <-‐-‐-‐ CC4ln ,677 <0,001
DPP8 <-‐-‐-‐ DPP4 ,585 <0,001
CC12ln <-‐-‐-‐ CC8ln ,519 <0,001
CC24ln <-‐-‐-‐ DPP24 ,466 <0,001
Efeitos indiretos padronizados
•  Os efeitos indiretos padronizados são calculados pelo produto dos
betas de um determinado caminho originado numa determinada VI
cujo des1no é uma determinada VD. Por exemplo, se consideramos
DepreAnterior como VI e DPP8 como VD, então há apenas uma
caminho que as liga no sen1do DepreAnterior para DPP8, isto é,
passando pela variável DPP8.
•  Se, por exemplo, o efeito total padronizado de DepreAnterior em
DPP8 é 0,26×0,58 = 0,16, i.e., se a DepreAnterior aumentar 1 desvio-‐
padrão, então a DPP8 aumentará, pois o beta é posi1vo, 0,16 desvio-‐
padrão. Note que os efeitos indiretos padronizados são es1ma1vas
pontuais e não foram realizados testes para avaliar suas
significâncias.
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
• Autores:
• R. Zwicker, FEA-‐USP
• C. A. Souza, FEA-‐USP
• A. Vidal, FEA-‐USP
• J. O. Siqueira, FEA-‐USP
• Periódico: RAE-‐eletrônica, 6(2), 2007
•  RESUMO
•  A difusão do uso da Tecnologia de Informação (TI) é evidenciada por meio de um
processo, que pode ser denominado informa1zação e que permeia nossa
sociedade e negócios. Com relação aos negócios, os gestores necessitam de
instrumentos para avaliar o uso organizacional da TI. O ar1go apresenta um
modelo de avaliação com base na mensuração do construto Grau de
Informa1zação (GI). Cinco dimensões (fatores) de avaliação foram consideradas
no modelo final: uso organizacional da TI, impactos da TI, atributos das
aplicações da TI, infra-‐estrutura da TI e governança da TI. O modelo foi
desenvolvido a par1r do levantamento de dados de uma amostra de 830
empresas industriais do estado de São Paulo. Nele, a modelagem por equações
estruturais foi u1lizada para desenvolver e validar o GI. O construto sa1sfez os
requisitos de consistência e validade interna e demonstrou possuir validade
externa na medida em que as proposições em relação ao tamanho da empresa e
não quanto aos níveis de inves1mentos em TI foram confirmadas.
MEE de ordem 3
•  Modelo estrutural composto por um fator de terceira ordem (GI), 6
fatores de segunda ordem (dimensões do GI), 24 fatores de primeira
ordem (subdimensões do GI) e 71 variáveis indicadoras, elaboradas a
par1r das 316 questões do ques1onário.
MEE de ordem 3
Missings
•  A porcentagem geral de dados faltantes, rela1vos às 66 variáveis
indicadoras, foi de 17,3%.
•  Kline (1998) classifica níveis de até 10% de valores faltantes como
baixos, ao passo que níveis acima de 30% são considerados altos.
•  Para a es1mação do modelo estrutural foi u1lizado o método FIML,
disponível no AMOS 4.
•  Segundo Arbuckle e Wothke (1999), o método é robusto, mesmo
quando os dados faltantes não são completamente aleatórios.
MEE de ordem 3
Modelos aninhados
CMIN
Model NPAR CMIN DF P CMIN/DF
A: No Autocorrela1on 15 71,544 6 ,000 11,924
B: Most General 16 6,383 5 ,271 1,277
C: Time-‐Invariance 13 7,501 8 ,484 ,938
D: A and C Combined 12 73,077 9 ,000 8,120
Saturated 21 ,000 0
Independence 6 2131,790 15 ,000 142,119

Assuming model Model B: Most General to be correct:
Model DF CMIN P
A: No Autocorrela1on 1 65,160 ,000
C: Time-‐Invariance 3 1,117 ,773
D: A and C Combined 4 66,693 ,000

Aplicações
Biometria
Lista de exercícios

Arq Apoio 5 1439146250 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Arq Apoio 5 1439146250 PDF

Transféré par

Droits d'auteur :

Formats disponibles

Análise de Equações

•  Variável observável Relação correlacional

•  Relação não-‐recursiva “causal”

• Endogenous variables are those that have single-‐headed

Termo de erro

Termo de erro

• O acesso a pacotes estaTs1cos amigáveis

•  Uma quan1dade denominada índice de ajuste exato pode ser

•  Os dados de entrada para análise é uma matriz de variância-‐covariância S

Model NPAR CMIN DF P CMIN/DF

A: No Autocorrela1on 15 71,544 6 ,000 11,924

B: Most General 16 6,383 5 ,271 1,277

C: Time-‐Invariance 13 7,501 8 ,484 ,938

D: A and C Combined 12 73,077 9 ,000 8,120

Independence 6 2131,790 15 ,000 142,119

A: No Autocorrela1on 1 65,160 ,000

C: Time-‐Invariance 3 1,117 ,773

D: A and C Combined 4 66,693 ,000

Vous aimerez peut-être aussi

Arq Apoio 5 1439146250 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Arq Apoio 5 1439146250 PDF

Transféré par

Droits d'auteur :

Formats disponibles

Análise de Equações

• Variável observável Relação correlacional

• Relação não-­‐recursiva “causal”

• Endogenous variables are those that have single-­‐headed

Termo de erro

Termo de erro

• O acesso a pacotes estaTs1cos amigáveis

• Uma quan1dade denominada índice de ajuste exato pode ser

• Os dados de entrada para análise é uma matriz de variância-­‐covariância S

Model NPAR CMIN DF P CMIN/DF

A: No Autocorrela1on 15 71,544 6 ,000 11,924

B: Most General 16 6,383 5 ,271 1,277

C: Time-­‐Invariance 13 7,501 8 ,484 ,938

D: A and C Combined 12 73,077 9 ,000 8,120

Independence 6 2131,790 15 ,000 142,119

A: No Autocorrela1on 1 65,160 ,000

C: Time-­‐Invariance 3 1,117 ,773

D: A and C Combined 4 66,693 ,000

Vous aimerez peut-être aussi

•  Variável observável Relação correlacional

•  Relação não-‐recursiva “causal”

• Endogenous variables are those that have single-‐headed

• O acesso a pacotes estaTs1cos amigáveis

•  Uma quan1dade denominada índice de ajuste exato pode ser

•  Os dados de entrada para análise é uma matriz de variância-‐covariância S

C: Time-‐Invariance 13 7,501 8 ,484 ,938

C: Time-‐Invariance 3 1,117 ,773