Académique Documents
Professionnel Documents
Culture Documents
Estruturais:
teoria e prática
José
O.
Siqueira
Ins1tuto
de
Psicologia
-‐
USP
B1MC2:
Bloco
1
–
Minicurso
2
–
4
horas
Resumo
• O
obje1vo
do
minicurso
é
apresentar
os
fundamentos
teóricos,
soKwares
e
aplicações
da
análise
de
equações
estruturais
(AEE).
• A
AEE
é
uma
técnica
estaTs1ca
mul1variada
inferencial
que
testa
modelos
“causais”
com
indicadores
(variáveis
observáveis)
e
variáveis
latentes
(não-‐
observáveis).
• SEM
(Structural
Equa+on
Modeling),
análise
de
estruturas
de
covariância,
modelagem
de
equações
simultâneas,
“modelagem
causal”
• A
AEE
introduz
uma
perspec1va
rela1vamente
nova
à
testagem
de
hipótese
estaTs1ca
com
uma
abordagem
baseada
na
“confirmação”
do
modelo.
• Além
disso,
a
AEE
promove
um
rigor
maior
na
pesquisa
aplicada
quan1ta1va.
• Subjacente
à
AEE
está
um
conjunto
de
ideias
sobre
o
que
cons1tui
a
boa
prá1ca
cienTfica.
Referências
• BREAKWELL,
G.
M.
et
al.
(2010)
Métodos
de
pesquisa
em
Psicologia.
Cap.
21:
Introdução
à
modelagem
de
equação
estrutural.
3ª
ed.
Porto
Alegre:
Bookman.
• MARÔCO,
J.
(2010)
Análise
de
equações
estruturais.
Lisboa:
ReportNumber.
• PUGESEK,
B.
H.
et
al.
(Org.)
(2003)
Structural
equa:on
modeling:
Applica:ons
in
ecological
and
evolu:onary
biology.
UK:
Cambridge
Univ.
Press.
• GRACE,
J.
B.
(2006)
Structural
equa:on
modelling
and
natural
systems.
UK:
Cambridge
Univ.
Press
Introdução
• Oferece
um
potencial
imenso
para
os
psicólogos,
pois,
em
geral,
grande
parte
das
coisas
nas
quais
os
psicólogos
estão
interessados
são
variáveis
latentes/
inobserváveis/
fatores:
o
pesquisador
deve
tornar
explícitas
suas
teorias
ou
modelos
de
relações
entre
medidas
observadas
(indicadores)
e
variáveis
latentes,
de
um
lado,
e
as
relações
que
ele
espera
encontrar
entre
as
variáveis
latentes,
de
outro
• Correlação
não
implica
causação:
no
melhor
dos
casos,
a
AEE
pode
mostrar
apenas
que
um
modelo
“causal”
sugerido
é
consistente
com
as
variâncias
e
covariâncias
(momentos)
observadas
Introdução
• Relações
lineares
entre
as
variáveis
quan1ta1vas
• Suposições:
• normalidade
mul1variada
dos
indicadores
• independência
entre
as
observações
Introdução
• AEE
é
um
conjunto
de
procedimentos
estaTs1cos
que
podem
ser
aplicados
a
dados
quan1ta1vos
e
qualita1vos
e
que
permite
ao
pesquisador
• Testar
modelos
teoricamente
especificados
das
relações
entre
variáveis
observadas/
indicadores
(e.g.,
escores
de
teste)
e
variáveis
inobserváveis/
latentes/
fatores,
por
vezes
chamados
modelos
de
mensuração
(análise
de
fatores
comuns
confirmatória)
e
• Testar
modelos
teóricos
das
relações
entre
conjuntos
de
variáveis
latentes,
chamados
modelos
estruturais
• Testar
modelos
teóricos
das
relações
entre
conjuntos
de
indicadores
(path
analysis)
Introdução
• História,
literatura,
arte:
conhecimento
idiográfico
• Ciência:
relações
causais,
conhecimento
nomoté1co
• EstaTs1ca
é
parte
integrante
do
método
cienTfico
moderno
• Técnicas
estaTs1cas
teoré1cas
(theory-‐driven)
•
AEE,
AFC
• Técnicas
estaTs1cas
ateoré1cas
(data-‐driven)
• Análise
de
séries
temporais:
VAR
• A
prá1ca
da
estaTs1ca
é
soCware-‐driven
Erro de mensuração
• Como
em
muitas
variáveis
psicológicas,
as
medidas
que
temos
(indicadores)
são
índices
imperfeitos
dos
construtos
latentes
que,
em
princípio,
poderíamos
nunca
mensurar
de
um
modo
totalmente
preciso
• A
MEE
oferece
a
oportunidade
de
levar
em
consideração
o
erro
de
mensuração
ao
es1mar
os
parâmetros
de
nosso
modelo
por
meio
dos
termos
de
erro
(variáveis
latentes
exógenas
associadas
aos
indicadores)
Erro de mensuração
• Trabalha-‐se
com
um
conjunto
de
variáveis
observáveis
que
são
indicadores
do
impacto
de
uma
variável
latente
• Não
se
mensura
na
perfeição
um
fenômeno
latente
• Variáveis/indicadores
observáveis
de
uma
variável
latente
frequentemente
contém
erros
de
mensuração
• Erro
mensuração
do
indicador:
variável
latente
exógena
específica
(unique),
fator
único
(em
contraposição
ao
fator
comum),
termo
de
erro,
resíduo
• Esses
resíduos
sempre
são
mo1vo
de
preocupação
e
as
análises
que
trabalham
com
medidas
latentes
permitem
calcular
a
variância
residual
para
cada
um
dos
indicadores
• Variância
residual
representa
a
variância
que
não
é
explicada
pelo
fator/traço
latente
• Parte
dessa
variância
não
explicada
pelo
traço
latente
é
devida
aos
erros
de
mensuração
aleatórios
ou
escore
não
confiáveis
(Kline,
2009,
p.9)
• O
termo
de
erro
pode
compreender
componentes
de
variância
específica
sistemá1ca
em
acréscimo
ao
erro
randômico.
A
comunalidade
ou
R2
tem
que
ser
considerado
o
limite
inferior
da
es1ma1va
da
confiabilidade
do
indicador.
(Arbuckle
&
Wothke
(1999),
p.
192))
Etapas da modelagem
• Formulação
do
Modelo
• Modelo
de
mensuração
• Modelo
estrutural
• Iden1ficação
do
Modelo
• Es1mação
do
Modelo
• Avaliação
do
Modelo
• Modificação
do
Modelo
Símbolos e seus significados
• Variável
latente
Relação
recursiva
“causal”
β de regressão
VM
Exógena
(VI)
Exemplo 6 de ARBUCKLE (2012)
Exemplo 6 de ARBUCKLE (2012)
• Observed, endogenous variables
• anomia67
• powles67
• anomia71
• powles71
• educatio
• SEI
• Unobserved, endogenous variables
• 71_alienation
• 67_alienation
• Unobserved, exogenous variables Variable
counts
• eps1 Number
of
variables
in
your
model:
17
• eps2
Number
of
observed
variables:
6
• eps3
• eps4 Number
of
unobserved
variables:
11
• ses Number
of
exogenous
variables:
9
• delta1
• zeta1 Number
of
endogenous
variables:
8
• zeta2
• delta2
Covariância e correlação
Gráfico de dispersão
Modelo:
y
=
a
+
b1*x1
+
ey
var(ey)
Suposições:
ey
1
Cov(x1,
ey)
=
0
performance
mo1va1on
Solução:
b1
=
0,71
var(ey)
=
6,70
R2
=
0,37
Variáveis manifestas centradas
𝑦:performance (dado bruto)
(VD)
𝑥↓1 :motivation (dado bruto)
(VI)
Modelo:
𝑦↑′ =𝑏↓1 𝑥↓1↑′ +𝑒↓𝑦 ,
𝑒↓𝑦 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(𝑒↓𝑦 )) 𝑒 𝐶𝑜𝑣(𝑥↓1 ,
𝑒↓𝑦 )=0
𝑦 =6,02 e 𝑥↓1 =5,97
𝑦↑′ =𝑦−𝑦 =𝑦−6,02
𝑥↓1↑′ =𝑥↓1 −𝑥↓1 =𝑥↓1 −5,97
𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )=𝐶𝑜𝑣(𝑦,𝑥↓1 )=5,54
𝑉𝑎𝑟(𝑦↑′ )=𝑉𝑎𝑟(𝑦)=10,61
𝑉𝑎𝑟(𝑥↓1↑′ )=𝑉𝑎𝑟(𝑥↓1 )=7,78
𝑟=𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )/√𝑉𝑎𝑟(𝑦↑′ ) √𝑉𝑎𝑟(𝑥↓1↑′ ) =0,61
Variáveis manifestas padronizadas
𝑦:performance (dado bruto)
(VD)
𝑥↓1 :motivation (dado bruto)
(VI)
Modelo:
𝑧=𝛽↓1 𝑤+𝑒↓𝑧 ,
𝑒↓𝑧 ~𝑁𝐼𝐼𝐷(0,𝑉𝑎𝑟(𝑒↓𝑧 )) 𝑒 𝐶𝑜𝑣(𝑤,𝑒↓𝑧 )=0
𝑧=𝑦↑′ ∕√𝑉𝑎𝑟(𝑦↑′ ) =(𝑦−6,02)∕3,28
𝑤=𝑥↓1↑′ ∕√𝑉𝑎𝑟(𝑥↓1↑′ ) =(𝑥↓1 −5,97 )∕2,79
𝑉𝑎𝑟(𝑧)=𝑉𝑎𝑟(𝑤)=1
𝑟=𝐶𝑜𝑣(𝑧,𝑤)/√𝑉𝑎𝑟(𝑧) √√𝑉𝑎𝑟(𝑤) =𝐶𝑜𝑣(𝑧,𝑤)=𝐶𝑜𝑣(𝑦↑′ ,𝑥↓1↑′ )/
√𝑉𝑎𝑟(𝑦↑′ ) √𝑉𝑎𝑟(𝑥↓1↑′ ) =0,61
𝛽↓1 =𝐶𝑜𝑣(𝑧,𝑤)/𝑉𝑎𝑟(𝑤) =𝐶𝑜𝑣(𝑧,𝑤)=𝑟=0,61
𝑅↑2 =𝑟↑2 =0,37
Exemplo com 2 fatores
comuns
Variância
Indicador
𝜆: carga fatorial
Fator
comum
Covariância
Modelo psicométrico reflexivo recursivo
unidimensional de ordem 1
Modelo psicométrico reflexivo
recursivo bidimensional de ordem
1
Software
Covariância
posi1va
entre
os
fatores
comuns
Beta
não-‐padronizado:
spa1al
e
fator
específico
err_w
verbal
tem
a
unidade
de
medida
do
indicador
wordmean
Comunalidade:
%
da
variância
do
indicador
explicada
Correlação
pelo
fator
comum
=
entre
os
0,7^2
fatores
0,51
=
1
–
0,49
comuns
Variância
residual:
%
da
variância
do
indicador
não
explicada
pelo
fator
comum
Carga
fatorial
ou
correlação
entre
o
fator
comum
e
o
indicador
Exemplo 8 de ARBUCKLE (2012)
• Número
de
parâmetros
=
13
• Número
de
momentos
(variâncias
e
covariâncias)
=
(6
x
7)
/
2
=
21
• Graus
de
liberdade
=
21
–
13
=
8
Análise fatorial confirmatória
CMIN
Model
NPAR
CMIN
DF
P
CMIN/DF
Default
13
7,853
8
,448
,982
Saturated
21
,000
0
Independence
6
187,718
15
,000
12,515
Índices de modificação e buscas de
especificação
• Busca
de
especificação:
se
o
pesquisador
considera
que
o
modelo
não
é
aceitável
esta1s1camente,
pode
tentar
modificar
o
modelo
para
obter
um
ajuste
melhor
• O
uso
de
índices
de
modificação
(MI)
ou
mul1plicadores
de
Lagrange
é
uma
forma
de
busca
de
especificação
• MI
é
o
valor
do
qual
o
índice
de
ajuste
exato
qui-‐quadrado
será
diminuído
(modificado)
se
uma
determinada
correlação
(covariância)
ou
betas
(regression
weights)
for
adicionada
ao
modelo,
i.e.,
se
uma
nova
restrição
for
imposta
aos
dados
Exemplo 6 de ARBUCKLE (2012)
Exemplo 6 de ARBUCKLE
(2012)
Covariances:
Group number 1 - Default model
Par
M.I.
Change
eps2 <--> delta1 5,905 -,424
eps2 <--> eps4 26,545 ,825
eps2 <--> eps3 32,071 -,988
eps1 <--> delta1 4,609 ,421
eps1 <--> eps4 35,367 -1,069
eps1 <--> eps3 40,911 1,253
Modelo não-recursivo ou bidirecional
• A
model
with
these
feedback
loops
is
called
nonrecursive
• Modelo
de
causação
mútua
ou
recíproca
• If
the
stability
index
falls
between
–1
and
+1,
the
system
is
stable;
otherwise,
it
is
unstable.
Depressão pós-parto e conflito conjugal
• Par:cipantes
• Quatrocentas
mães
de
baixa
renda
atendidas
pelo
sistema
público
de
saúde
da
região
do
Butantã,
par1cipantes
do
Projeto
Temá1co
FAPESP
Depressão
pós-‐parto
(DPP)
como
um
fator
de
risco
para
o
desenvolvimento
do
bebê:
estudo
interdisciplinar
dos
fatores
envolvidos
na
gênese
do
quadro
e
em
suas
consequências
no
qual
essa
pesquisa
se
insere.
No
projeto
estão
sendo
acompanhadas
famílias,
desde
a
gestação
até
o
terceiro
ano
da
criança,
com
a
construção
de
um
banco
de
dados
sobre
as
caracterís1cas
familiares,
gestação,
apoio
social
e
familiar,
parto
e
indicadores
do
desenvolvimento
da
criança.
A
idade
média
das
mães
foi
de
25,2
com
as
idades
variando
de
13
a
43
anos.
• Medidas
• Escala
de
Depressão
Pós-‐natal
de
Edinburgh
(EDPE),
de
Cox,
Holden
&
Sagovsky
(1987),
validado
no
Brasil
por
Santos
et
al.
(1999)
foi
usada
para
avaliar
a
incidência
da
depressão
maternal.
A
EDPE
é
um
instrumento
de
auto-‐preenchimento
composto
por
10
enunciados
(ex.
Eu
tenho
sido
capaz
de
rir
e
achar
graça
nas
coisas;
Eu
tenho
me
sen+do
triste
ou
arrasado,
entre
outras)
cujas
opções
são
pontuadas
(0
a
3)
de
acordo
com
a
intensidade
do
sintoma.
A
EDPE
foi
aplicada
no
puerpério,
aos
8
e
aos
24
meses
da
criança.
As
mães
que
ob1veram
escore
igual
ou
superior
a
12
foram
consideradas
potencialmente
deprimidas.
Percepção
da
mãe
sobre
a
relação
conjugal.
Foi
pedido
às
mães
que
dessem
uma
nota
de
1
a
7
à
qualidade
do
seu
relacionamento
com
o
seu
parceiro
aos
4,
8,
12
e
24
meses
da
criança.
Histórico
de
depressão
anterior.
Na
primeira
entrevista
feita
na
Unidade
Básica
de
Saúde,
foi
pedido
à
mãe
que
relatasse
a
ocorrência
ou
não
de
depressão
anterior
não
relacionada
à
gestação.
Modelo de mensuração não recursivo para análise de dados
longitudinais cruzados e defasados
Análise
• Foram
atendidas
as
condições
de
aceitabilidade
quanto
à
presença
de
todas
as
variâncias
posi1vas
e
à
possibilidade
de
es1ma1va
de
todos
os
betas.
Para
este
teste
foi
usado
o
método
de
es1mação,
que
aceitou
(ao
nível
5%)
a
hipótese
de
que
a
matriz
de
covariâncias
é
expressável
pelo
modelo
proposto
na
Figura
1
(a),
pois
χ2(11)=17,78
e
p=0,086,
bem
como
a
da
estabilidade
dos
índices
de
estabilidade
em
cada
período,
que
é
menor
do
que
1
em
valor
absoluto
(índices
de
estabilidade
são
0,22
e
0,1
para
os
períodos
4
e
8
meses),
concluindo-‐se
que
o
modelo
é
aceitável
esta1s1camente.
• O
segundo
passo
foi
testar
um
modelo
parcimonioso
derivado
do
anterior
denominado
trimmed
model
(Klem,
1994),
isto
é,
um
modelo
ainda
aceitável
apenas
com
betas
padronizados
significa1vos
para
simplificar
a
visualização
do
modelo
previamente
aceito.
A
Figura
1
(b)
representa
o
modelo
aceitável
parcimonioso.
Os
valores
numéricos
das
setas
são
os
betas
padronizados
es1mados
significa1vos
e
os
dos
retângulos
são
as
es1ma1vas
dos
coeficientes
de
determinação
(R2)
diretos
de
cada
VD.
O
novo
modelo
é
aceitável,
pois
χ2(22)=33,26
e
p=0,058.
Estimativas dos efeitos diretos (betas)
padronizados e seus valores-p do modelo
aceitável parcimonioso
Beta
VD
VI
Valor
p
padronizado
DPP4
<-‐-‐-‐
DepreAnt
,259
0,001
CC4ln
<-‐-‐-‐
DPP4
,454
<0,001
CC8ln
<-‐-‐-‐
CC4ln
,677
<0,001
DPP8
<-‐-‐-‐
DPP4
,585
<0,001
CC12ln
<-‐-‐-‐
CC8ln
,519
<0,001
CC24ln
<-‐-‐-‐
DPP24
,466
<0,001
Efeitos indiretos padronizados
• Os
efeitos
indiretos
padronizados
são
calculados
pelo
produto
dos
betas
de
um
determinado
caminho
originado
numa
determinada
VI
cujo
des1no
é
uma
determinada
VD.
Por
exemplo,
se
consideramos
DepreAnterior
como
VI
e
DPP8
como
VD,
então
há
apenas
uma
caminho
que
as
liga
no
sen1do
DepreAnterior
para
DPP8,
isto
é,
passando
pela
variável
DPP8.
• Se,
por
exemplo,
o
efeito
total
padronizado
de
DepreAnterior
em
DPP8
é
0,26×0,58
=
0,16,
i.e.,
se
a
DepreAnterior
aumentar
1
desvio-‐
padrão,
então
a
DPP8
aumentará,
pois
o
beta
é
posi1vo,
0,16
desvio-‐
padrão.
Note
que
os
efeitos
indiretos
padronizados
são
es1ma1vas
pontuais
e
não
foram
realizados
testes
para
avaliar
suas
significâncias.
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
• Autores:
• R.
Zwicker,
FEA-‐USP
• C.
A.
Souza,
FEA-‐USP
• A.
Vidal,
FEA-‐USP
• J.
O.
Siqueira,
FEA-‐USP
• Periódico:
RAE-‐eletrônica,
6(2),
2007
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
• RESUMO
• A
difusão
do
uso
da
Tecnologia
de
Informação
(TI)
é
evidenciada
por
meio
de
um
processo,
que
pode
ser
denominado
informa1zação
e
que
permeia
nossa
sociedade
e
negócios.
Com
relação
aos
negócios,
os
gestores
necessitam
de
instrumentos
para
avaliar
o
uso
organizacional
da
TI.
O
ar1go
apresenta
um
modelo
de
avaliação
com
base
na
mensuração
do
construto
Grau
de
Informa1zação
(GI).
Cinco
dimensões
(fatores)
de
avaliação
foram
consideradas
no
modelo
final:
uso
organizacional
da
TI,
impactos
da
TI,
atributos
das
aplicações
da
TI,
infra-‐estrutura
da
TI
e
governança
da
TI.
O
modelo
foi
desenvolvido
a
par1r
do
levantamento
de
dados
de
uma
amostra
de
830
empresas
industriais
do
estado
de
São
Paulo.
Nele,
a
modelagem
por
equações
estruturais
foi
u1lizada
para
desenvolver
e
validar
o
GI.
O
construto
sa1sfez
os
requisitos
de
consistência
e
validade
interna
e
demonstrou
possuir
validade
externa
na
medida
em
que
as
proposições
em
relação
ao
tamanho
da
empresa
e
não
quanto
aos
níveis
de
inves1mentos
em
TI
foram
confirmadas.
MEE de ordem 3
• Modelo
estrutural
composto
por
um
fator
de
terceira
ordem
(GI),
6
fatores
de
segunda
ordem
(dimensões
do
GI),
24
fatores
de
primeira
ordem
(subdimensões
do
GI)
e
71
variáveis
indicadoras,
elaboradas
a
par1r
das
316
questões
do
ques1onário.
MEE de ordem 3
Missings
• A
porcentagem
geral
de
dados
faltantes,
rela1vos
às
66
variáveis
indicadoras,
foi
de
17,3%.
• Kline
(1998)
classifica
níveis
de
até
10%
de
valores
faltantes
como
baixos,
ao
passo
que
níveis
acima
de
30%
são
considerados
altos.
• Para
a
es1mação
do
modelo
estrutural
foi
u1lizado
o
método
FIML,
disponível
no
AMOS
4.
• Segundo
Arbuckle
e
Wothke
(1999),
o
método
é
robusto,
mesmo
quando
os
dados
faltantes
não
são
completamente
aleatórios.
MEE de ordem 3
GRAU DE INFORMATIZAÇÃO DE EMPRESAS:
UM MODELO ESTRUTURAL APLICADO
AO SETOR INDUSTRIAL DO ESTADO DE SÃO PAULO
Modelos aninhados
Exemplo 6 de ARBUCKLE (2012)
CMIN
Saturated 21 ,000 0
Model DF CMIN P