Vous êtes sur la page 1sur 49

Modelagem com Equaes Estruturais:

Princpios Bsicos e Aplicaes

Leila Denise Alves Ferreira Amorim , Rosemeire Leovigildo Fiaccone ,


2

Carlos Antnio de Souza Teles Santos , Lia Terezinha Lana Pimenta de Moraes ,
2

Nelson Fernandes de Oliveira , Silvano Barbosa Oliveira ,


1

Tereza Nadya Lima dos Santos .

1
2

Departamento de Estatstica, Universidade Federal da Bahia,


Universidade Estadual de Feira de Santana, Feira de Santana, Bahia.

Salvador, 2012

Agradecimentos

Esse projeto foi financiado pela Fundao de Amparo Pesquisa do Estado da Bahia
(FAPESB), Termo de Outorga n.0082/2006. Agradecemos ainda a equipe coordenada pelo
Prof. Dr.Maurcio L. Barreto, do Instituto de Sade Coletiva da UFBA, pela disponibilidade
dos dados utilizados neste relatrio. Parte desses dados proveniente do estudo Avaliao
do Impacto Epidemiolgico do Programa de Saneamento Ambiental da Baa de Todos os
Santos - Bahia Azul, que teve suporte do Programa de Ncleo de Excelncia (PRONEXCNPq/MCT, Brazil), Contrato num. 66.1086/1998-4 e da Secretaria de Desenvolvimento
Urbano, Bahia.

LISTA DE ILUSTRAES

Figura 1: Filosofia da Modelagem com Equaes Estruturais

Figura 2: Elementos bsicos utilizados na construo de um diagrama de


caminhos

12

Figura 3: Relaes toricas em SEM

13

Figura 4: Relaes causais representadas em diagramas de caminhos

14

Figura 5: Diagrama de caminhos para um modelo convencional em SEM

15

Figura 6: Exemplo de um modelo recursivo

18

Figura 7: Exemplo de um modelo no recursivo

19

Figura 8: Etapas para a construo de um modelo de equaes estruturais

32

Figura 9: Diagrama de caminhos referente ao consumo alimentar em crianas


menores de 12 meses

37

Figura 10: Diagrama de caminhos referente ao consumo alimentar em crianas


de 12 a 24 meses

39

Figura 11: Anlise fatorial confirmatria para desenvolvimento cognitivo em


menores de 48 meses

41

Figure 12: Modelo de equaes estruturais para desenvolvimento cognitivo em


menores de 48 meses

42

Figura 13: Diagrama de caminhos para SEM mais complexo para descrever o
desenvolvimento cognitivo infantil

43

Figura 14: Estimativas para SEM mais complexo para descrever o


desenvolvimento cognitivo infantil

44

SUMRIO

1 Introduo

2 Modelagem com Equaes Estruturais

2.1 Viso histrica da Modelagem com Equaes Estruturais

2.2 Tipos de variveis nos modelos de equaes estruturais

10

2.3 Diagramas de caminhos

12

2.4 Submodelos da SEM

14

2.5 Modelos recursivos e no recursivos

15

2.6 Especificao matemtica do modelo de mensurao e do modelo estrutural

16

2.7 Estimao do modelo

19

2.8 Identificabilidade do modelo estrutural

22

2.9 Avaliao dos critrios de qualidade do ajuste

24

2.10 Efeitos direto, indireto e total

26

2.11 Estimao padronizada

27

2.12 Especificao do Modelo de Equaes Estruturais Generalizado

29

2.13 Etapas da implementao da SEM

32

2.14 Softwares estatsticos

33

3 Aplicaes da SEM

36

3.1 Padres de consumo alimentar no interior da Bahia

36

3.2 Desenvolvimento cognitivo em menores de 48 meses

40

4. Consideraes finais

45

Referncias bibliogrficas

46

1 Introduo
A modelagem com equaes estruturais (SEM, em ingls) considera vrios tipos de
procedimentos estatsticos para avaliar relaes entre variveis observadas, com o objetivo de
permitir a realizao de anlises quantitativas sobre modelos tericos hipotetizados pelo
pesquisador. A SEM tem-se mostrado um mtodo flexvel e poderoso para estimao de
parmetros em uma extensa famlia de modelos lineares incluindo o teste t de Student,
ANOVA, MANOVA e modelos de regresso mltipla. O aspecto mais importante da SEM,
no entanto, sua extenso para permitir a estimao de erros de medidas atravs do uso de
fatores ou variveis latentes mltiplas. Nesses modelos podem-se incluir variveis que no
so medidas diretamente, mas atravs de seus efeitos, denominados indicadores, ou de suas
causas observveis. Essas variveis no mensurveis so conhecidas por variveis latentes,
construtos ou fatores. Mais especificamente, vrios modelos tericos podem ser testados sob
a abordagem da SEM para avaliar como conjuntos de variveis observadas definem
construtos e como esses construtos relacionam-se entre si (Schumacker e Lomax, 2004).
Alm disto, este mtodo permite a avaliao de mecanismos mediadores complexos atravs
da decomposio dos efeitos (Bollen, 1987).
Nesta abordagem uma srie de equaes definida para descrever as estruturas hipotetizadas
nas relaes entre as diversas variveis includas na modelagem. Este mtodo consiste
basicamente na definio de modelos para a varivel latente e para as medidas observadas.
Uma caracterstica interessante dessa metodologia a possibilidade de que uma mesma
varivel seja resposta em uma equao e aparea como varivel explanatria em outra
equao. ainda possvel a especificao de um efeito recproco, ou seja, aquele no qual
duas variveis afetam uma outra atravs de um feedback loop. A aplicao desta
metodologia baseada na teoria utilizada pelo pesquisador para explicao das interrelaes
entre um conjunto de variveis, que podem ser classificadas como endgenas (dependentes)
ou exgenas (independentes). Este modelo terico pode ser ainda expresso por meio de
diagramas, que resumem um conjunto de hipteses.
Os mtodos modernos referentes SEM representam a confluncia de trabalhos que foram
realizados em vrias disciplinas, incluindo bioestatstica, econometria, psicometria e
estatstica social. Neste trabalho os conceitos fundamentais relacionados aos modelos de
equaes estruturais so apresentados, considerando-se os mtodos mais comumente
descritos na literatura (Bollen, 1989; Kaplan, 2000; Farias, 2000). Na seo 2 deste trabalho

so apresentados um panorama histrico de seu desenvolvimento, definio da terminologia,


especificao matemtica do modelo, discusso do procedimento de estimao, bem como a
definio de critrios para avaliao da bondade do ajuste. A seo 3, por sua vez, apresenta
exemplos de aplicao da SEM em pesquisas relacionadas sade da criana, com discusso
e interpretao dos resultados correspondentes. Na seo 4 so apresentadas as consideraes
finais.
2 Modelagem com Equaes Estruturais
A modelagem com equaes estruturais, denominada SEM - Structural Equation Modeling,
em ingls, abrange tcnicas multivariadas de anlise de dados que combinam aspectos de
regresso mltipla e de anlise fatorial para estimar simultaneamente uma srie de relaes
de dependncia. Para construir um modelo de equaes estruturais parte-se de um modelo
terico previamente definido que permitir determinar as mltiplas relaes de dependncia
(ou relaes causais) entre as variveis do modelo. Um modelo terico consiste em um
conjunto sistemtico de relaes que fornecem explicaes consistentes e abrangentes dos
fenmenos. O modelo terico que serve de apoio construo de um modelo de equaes
estruturais no restrito a uma teoria definida no mbito acadmico, mas pode ser alicerado
na experincia e na prtica obtidas a partir da observao do comportamento real, no sentido
estrito do termo. A idia geral da SEM pode ser representada pelo esquema apresentado na
Figura 1.

Figura 1: Filosofia da Modelagem com Equaes Estruturais.

Quando existem mltiplas relaes de dependncia entre as variveis, a combinao das


tcnicas de regresso mltipla e de anlise fatorial permite definir procedimentos que visam
incorporao dos erros de medida diretamente no modelo. As variveis utilizadas em SEM

podem ser variveis observadas ou variveis construdas (chamadas de construtos ou


variveis latentes) a partir das variveis observadas. Segundo Codes (2005), essa uma das
diferenas mais importantes entre SEM e as demais tcnicas de modelagem, pois os
procedimentos clssicos de anlise de dados modelam apenas as mensuraes observveis.
A SEM diz respeito no apenas a um modelo, mas a uma famlia de modelos. Alm da
terminologia modelos de equaes estruturais, essa famlia tambm conhecida por: anlise
de caminhos (path analysis, em ingls), anlise de estrutura de covarincia, anlise de
variveis latentes, anlise fatorial confirmatria, anlise LISREL e modelo LISREL. Os
nomes anlise LISREL e modelo LISREL decorrem do nome de um dos primeiros
softwares utilizados para ajustar SEM chamado LISREL (Linear Structural Relationships),
desenvolvido por Jreskog e Sorbon em 1993. Outros softwares teis para implementao
dos SEM so EQS (Bentler, 1989), AMOS (Arbuckle, 1997; SPSS, 1998), MPLUS, LVPLS,
MX GRAPH, CoSan, RAMONA e SEPATH. Existem ainda pacotes no SAS, R e STATA
para implementar esses modelos. As tcnicas estatsticas multivariadas mais conhecidas dentre as quais regresso mltipla, anlise fatorial e anlise multivariada da varincia permitem o exame de apenas uma nica relao de dependncia de cada vez entre as
variveis independentes e as dependentes do modelo. Nestas tcnicas, um modelo fixado e
ajustado com base em dados observados e so realizados testes de significncia ou a
estimao dos parmetros de interesse.
A SEM, enquanto tcnica multivariada, tem como base um conjunto de relaes, sendo cada
uma com variveis dependentes e independentes, apresentando algumas vantagens em
relao s demais tcnicas, a citar:
i)

Permite a incorporao dos erros de medio no processo de estimao do modelo;

ii) Consiste na estimao simultnea de diversas relaes de dependncia interrelacionadas;


iii) Permite que uma varivel dependente em uma etapa do modelo se torne uma varivel
independente nas subsequentes relaes de dependncia;
iv) A capacidade de definir suposies elaboradas com base no suporte torico e inclulas no modelo d SEM flexibilidade no exame de questes analticas dos dados.
Mais recentemente, os avanos na SEM permitiram a incluso de novos mtodos de
estimao para lidar com distribuies no-normais. Devido ao trabalho de Browne (1984),
Muthn (1978, 1984) e outros, agora possvel estimar os parmetros complexos da SEM
quando os dados so no-normais, incluindo a mistura de variveis dicotmicas, categricas,

ordinais e contnuas. Nesse trabalho, no entanto, discutiremos a SEM apenas para avaliao
de relaes envolvendo variveis contnuas.
2.1 Viso Histrica da Modelagem com Equaes Estruturais
Segundo Kaplan (2000), o modelo de equaes estruturais originou-se da aproximao de
duas reas distintas de aplicaes da Estatstica: a anlise fatorial, utilizada pela psicologia e
pela psicometria; e o modelo de equaes simultneas, utilizado inicialmente na econometria
e posteriormente aplicado gentica.
A anlise fatorial tem sua origem no trabalho de Galton (1869 apud Kaplan, 2000) e no de
Pearson (Pearson e Lee, 1904 apud Kaplan, 2000), porm no trabalho de Spearman (1904
apud Kaplan, 2000) que foi proposto o modelo de fatores comuns. Spearman props o uso de
um fator de capacidade geral para representar as habilidades mentais dos indivduos devido
existncia de interrelaes entre os testes de aptido e capacidade especficas. De forma
consistente com a definio geral da SEM dada por Kaplan (2000), a proposta de Spearman
(1904, apud Kaplan, 2000) considera a correlao entre os termos de um conjunto de
parmetros estruturais. Spearman e outros pesquisadores compem a chamada escola
britnica de anlise fatorial. A idia bsica da anlise fatorial que se existe um conjunto de
itens correlacionados, as respostas individuais a cada um desses itens podem ser somadas
para definir um escore que, por sua vez, estabeleceria ou implicaria em um construto
(Schumacker e Lomax, 2004).
Na dcada de 1930, na Universidade de Chicago, Thurstone e colaboradores questionaram as
definies de Spearman, argumentando a existncia de um nmero maior de fatores referidos
como habilidade mental primria (Thurstone, 1935 apud Kaplan, 2000). Muito debate
surgiu em torno dessa questo, motivado pelo princpio da parcimnia (Mulaik, 1972 apud
Kaplan, 2000). Pesquisadores da escola britnica, como Mulaik (1972 apud Kaplan, 2000),
utilizaram a correlao existente entre os fatores para validar suas pretenses sobre um fator
de habilidade geral unitrio. Durante as dcadas de 1950 e 1960, o acesso mais amplo
computao

fez

com

que

anlise

fatorial

ganhasse

enorme

popularidade,

concomitantemente com seu desenvolvimento terico. Os trabalhos de Jreskog (1967 apud


Kaplan, 2000), Jreskog e Lawley (1968 apud Kaplan, 2000), Lawley (1958, 1967 apud
Kaplan, 2000) e Lawley e Maxwell (1971 apud Kaplan, 2000) levaram ao uso da estimao
de mxima verossimilhana na anlise fatorial, o que permitiu aos pesquisadores testar a
hiptese da existncia de um determinado nmero de fatores e descrever suas

intercorrelaes. A minimizao da funo ajustada de mxima verossimilhana levou ao


teste de hiptese qui-quadrado para verificar se o modelo proposto se adequa aos dados. Uma
aproximao por mnimos quadrados generalizados foi posteriormente desenvolvida por
Jreskog e Goldberger (1972 apud Kaplan, 2000). Outras pesquisas realizadas por Anderson
e Rubin (1956 apud Kaplan, 2000) e mais tarde por Jreskog (1969 apud Kaplan, 2000)
levaram construo da metodologia denominada anlise fatorial confirmatria, que
permite testar as hipteses sobre o nmero de fatores e o padro de carga. De uma
perspectiva histrica, essas metodologias permitiram uma aproximao estatstica rigorosa s
idias de estrutura simples de Thurstone. Foi possvel, a partir desses desenvolvimentos,
especificar um modelo em que certos fatores representavam as correlaes de apenas um
subconjunto especfico de variveis observadas. As anlises fatoriais exploratria e
confirmatria permanecem at hoje como metodologias muito populares em pesquisas da
rea de cincias sociais quantitativas.
Em relao SEM, a anlise fatorial constitui parte de uma metodologia mais ampla. A
SEM, em sua forma mais simples, rene a anlise fatorial e a anlise de caminhos em um
modelo onde esto contidas relaes de dependncia.
A anlise de caminhos teve origem histrica economtrica e biomtrica, sendo apresentada
pelo bilogo Sewell Wright (1918, 1921, 1934, 1960 apud Kaplan, 2000). Wright mostrou
como as correlaes entre variveis constituem os parmetros do modelo representado pelo
diagrama de caminhos, que consiste em um dispositivo pictrico que foi creditado a Wright.
Este pesquisador tambm mostrou como o modelo de equaes estruturais poderia estimar os
efeitos diretos, os indiretos e os totais. A anlise de caminhos usa coeficientes de correlao e
anlise de regresso para modelar relaes mais complexas entre variveis observadas
(Schumacker e Lomax, 2004). Inicialmente Wright (1918 apud Kaplan, 2000) aplicou a
anlise de caminhos ao problema da estimao do nmero de componentes das medies dos
ossos. Essa primeira aplicao da anlise de caminhos foi estatisticamente equivalente
anlise fatorial e existem indcios de que tenha sido desenvolvida sem conhecimento do
trabalho de Spearman (Bollen, 1989). A anlise de caminhos tambm foi utilizada por Wright
na estimao das equaes de oferta e demanda, que ainda abordou o problema de
identificabilidade do modelo. Estas questes constituram o ncleo inicial da contribuio
economtrica na SEM (Goldberger, 1972 apud Kaplan, 2000). As equaes simultneas
foram tambm utilizadas em 1918 para estudar as influncias genticas atravs de geraes.
No campo da econometria, o uso de modelos matemticos para descrio de fenmenos

econmicos comeou com Petty, em 1676 (Spanos, 1986 apud Kaplan, 2000). Porm, com
respeito SEM, a contribuio inicial encontra-se no trabalho de Haavelmo (1943 apud
Kaplan, 2000). Haavelmo utilizou o sistema de equaes simultneas para modelar a
interdependncia entre variveis econmicas utilizando a expresso y = y + x + , onde y
o vetor de variveis endgenas que o modelo pretende explicar; x o vetor de variveis
exgenas, que so propostas para explicar y mas cujo comportamento no explicado; o
vetor que representa a perturbao; e B e representam as matrizes dos coeficientes do
modelo. Este modelo foi a maior inovao na modelagem economtrica. Seu
desenvolvimento e refinamento foi objeto de pesquisa de estatsticos e econometricistas na
Universidade de Chicago, em 1945, e depois em Yale (Berndt, 1991 apud Kaplan, 2000),
com nfase no estudo do recm-desenvolvido modelo de equaes simultneas com o mtodo
de estimao de mxima verossimilhana, associado s metodologias de testes de hipteses
(Hood e Koopmans, 1953; Koopmans, 1950 apud Kaplan, 2000). Nos 25 anos seguintes, as
pesquisas economtricas caminharam no sentido do refinamento dos procedimentos de uso
das equaes simultneas (Fisher, 1966 apud Kaplan, 2000). O modelo de equaes
simultneas apresentado, embora utilizado por um tempo longo, foi objeto de diversas
crticas. Seus crticos afirmavam que um grave problema com grandes modelos
macroeconmicos de equaes simultneas era que no poderiam competir com mtodos de
distribuies livres nos modelos de sries temporais de Box-Jenkins para previses precisas
(Cooper, 1972 apud Kaplan, 2000).
SEM definida pela combinao das duas tcnicas brevemente historiadas. A combinao
dessas metodologias na forma corrente teve incio no trabalho de Jreskog (1973 apud
Kaplan, 2000), Keesling (1972 apud Kaplan, 2000) e Wiley (1973 apud Kaplan, 2000). O
modelo geral de equaes estruturais, delineado por Jreskog (1973, apud Kaplan, 2000),
consiste em dois submodelos: (a) o modelo de medio, onde as variveis observadas so
relacionadas s variveis latentes atravs de anlise fatorial confirmatria; e (b) o modelo
estrutural, que se refere parte do modelo que relaciona as variveis latentes umas as outras
por meio de sistemas de equaes simultneas. Esses modelos so discutidos mais
detalhadamente nas sees 2.4 e 2.6.
O avano nos modelos de equaes estruturais levou ampliao de sua aplicao para
diferentes reas do conhecimento. Atualmente tem-se observado o uso da SEM em:

Gentica comportamental - bastante utilizada na observao de variveis fenotpicas


com o objetivo de obter estimativas seguras das contribuies genticas no-

10

observadas e de fatores ambientais para as variaes nas variveis resposta observadas.

Cincias sociais - a justificativa de seu uso baseia-se no argumento de que a SEM


permite a formulao e teste de modelos de estruturas causais correlacionadas. Entretanto, existem diversas crticas a esta justificativa argumentando que a existncia
de correlao no implica em relao causal entre variveis e, portanto, no seria
possvel realizar uma inferncia causal. Vale salientar que correlao uma condio
necessria mas no suficiente para a existncia de uma relao causal. Argumenta-se
ainda que as inferncias causais s poderiam ser obtidas a partir de experimentos
controlados. Apesar das posies crticas, a SEM tem sido utilizada em cincias sociais em problemas relacionados teoria do comportamento, em anlises de padres
de estabilidade e em mudanas em dados longitudinais.

Na rea educacional - diversos pesquisadores tm utilizado SEM para a anlise de


questes importantes no campo da educao, como a reforma escolar, por exemplo
(Kaplan, 2000).

A crescente popularidade da SEM est relacionada a diversos fatores, incluindo o fato dos
pesquisadores estarem tornando-se mais conscientes da necessidade de uso de mltiplas
variveis observadas para entender melhor sua rea de investigao cientfica. Os mtodos
estatsticos tradicionais podem ser utilizados apenas para um nmero limitado de variveis,
que podem no ser capazes de dar conta das sofisticadas teorias que vm sendo
desenvolvidas. Outra razo refere-se ao crescente reconhecimento da validade e
confiabilidade de escores observados a partir de instrumentos de mensurao, sendo que o
SEM permite a incluso explcita de erros de mensurao. Alm disso, a disponibilidade de
vrios softwares de fcil uso pelos pesquisadores, permitindo a implementao desde os
modelos mais simples at SEM mais sofisticada, tem sido um motivo adicional para o amplo
uso dessas metodologias nos dias atuais.
2.2 Tipos de variveis nos modelos de equaes estruturais
As variveis na SEM podem ser classificadas em relao a diversos aspectos do modelo.
Quanto ao aspecto de serem mensurveis ou no, elas podem ser classificadas como variveis
latentes, variveis de medio e variveis indicadoras. Variveis que no so mensurveis
diretamente so chamadas de variveis latentes ou construtos e dizem respeito a conceitos
toricos que no podem ser observados diretamente. Se construtos forem observados

11

diretamente, no ser possvel medi-los sem a ocorrncia de erros. Na abordagem com SEM
os construtos permitem a formao das relaes causais a serem estimadas pelos modelos e
so medidos, aproximadamente, por um conjunto de variveis observadas. Segundo Hair e
colaboradores (2005), construtos ou variveis latentes podem tambm estar relacionados com
variveis de medio (ou variveis observadas) em uma relao de dependncia. Em SEM,
convencionalmente, assume-se que as variveis de medio so dependentes dos construtos.
Assim, em um diagrama de caminhos a seta apresenta o seguinte sentido: parte do construto
em direo s variveis de medio que foram utilizadas para a construo da varivel
latente. Uma varivel latente ou construto resultado da combinao de diversas variveis de
medio. Assim, aquelas variveis observadas que so utilizadas para a construo de uma
varivel latente so chamadas de variveis indicadoras. O pesquisador deve justificar a base
torica das variveis indicadoras porque a SEM examina apenas as caractersticas empricas
das variveis. Para cada construto que aparece no modelo necessrio determinar quais so
as variveis indicadoras que esto relacionadas com ele.
O uso de variveis latentes em SEM permite a melhoria da estimao estatstica por dois
motivos: representa os conceitos toricos de forma mais adequada; e incorpora o erro de
mensurao. Os erros de mensurao resultam de respostas imprecisas e do uso de conceitos
toricos - construtos. Entretanto, se a magnitude dos problemas que geram os erros
conhecida, possvel incorporar a confiabilidade na estimao do modelo. Na estimao das
relaes entre variveis dependentes e independentes, o modelo de medio permite avaliar a
contribuio de cada item da escala de mensurao, bem como incorporar ao modelo a escala
que melhor mede o conceito.
Quanto influncia que uma varivel exerce sobre outras, as variveis so classificadas como
exgenas e endgenas. So chamadas de variveis exgenas aquelas variveis que no so
influenciadas ou no sofrem efeito de outras variveis do modelo, sendo tambm chamadas
de independentes ou preditoras. Como no modelo de regresso tradicional, assume-se que
essas variveis so mensuradas sem erro. Essas variveis podem ser quantitativas ou
qualitativas. As variveis endgenas ou variveis dependentes so aquelas que recebem
influncia de outras variveis presentes no modelo. Os erros estruturais (ou disturbances)
representam as causas omitidas agregadas das variveis endgenas, juntamente com o erro de
mensurao. Assim, haver um erro associado a cada varivel endgena do modelo. Para os
modelos discutidos neste trabalho estaremos considerando que essas variveis so contnuas.

12

2.3 Diagramas de caminhos


Como em SEM, em geral, os modelos so bastante complexos, muitos pesquisadores acham
mais conveniente retrat-los
los na forma de um diagrama. O diagrama permite a rpida
r
visualizao das relaes, consistindo em um gr
grfico pictrico
rico que representa as relaes de
interdependncia
ncia consideradas no modelo. Esta apresentao visual chamada de diagrama
de caminhos (path diagram).
). O modelo torico, que a base da SEM, deve primeiramente
ser explicitado atravss de um diagrama de caminhos.
O diagrama de caminhos representado
epresentado por um conjunto de figuras geomtricas
tricas e setas que
servem para evidenciar o tipo de varivel (observada ou latente) e o tipo de relao entre elas.
A Figura 2 ilustra as convenes usadas para representao das relaes entre um construto e
uma ou mais variveis de medio e a relao entre construtos.

Figura 2: Elementos bsicos utilizados na construo de um diagrama


de caminhos.

Os princpios bsicoss na construo de um diagrama de caminhos no modelo de medio, so


os seguintes:

Representa-se por X as variveis indicadoras dos construtos exgenos


exgeno e por Y as
variveis indicadoras de construtos endgenos;
end

Construtos so representados normalmente por ccrculos ou figuras ovais;

As variveis de medio so representadas por ret


retngulos ou quadrados;

As variveis indicadoras X e/ou Y so associadas com seus respectivos construtos


constru por
uma seta que parte do construto para a varivel de medio (ou variveis indicadoras).

13

necessaria
Quando duas variveis no esto ligadas atravs de uma seta no implica necessariamente
que uma no afete a outra. Essa relao pode ocorrer indiretamente, podendo ser identificada
identi
atravs de caminhos mais complexos.

Figura 3: Relaes toricas em SEM.

A Figura 3 ilustra diversas formas de representao das relaes entre um construto


truto e uma ou
mais variveis de medio e a relao entre construtos. Na Figura 4 so ilustrados trs
tr tipos
de relao que podem ser descritos atrav
atravss de um diagrama de caminhos e suas
correpondentes equaes:

Figura (a): um modelo


lo simples que mostra a relao entre duas variveis exgenas
(independentes) X1 e X2 e a varivel endgena ou dependente Y1. A curva entre X1 e
X2 identifica a correlao existente entre essas variveis.
vari veis. Esta relao pode ser
mostrada com uma nica equao, de forma similar a uma equao de regresso.

Figura (b): Uma segunda varivel dependente Y2 foi adicionada ao modelo descrito
em (a). Alm da equao de
definida para (a), ser necessria uma segunda equao para
representar a relao entre X2 e Y1 (variveis exgenas) com a varivel endgena Y2.
Observa-se
se que a varivel X2 compartilhada pelas duas equaes e que Y1 varivel
endgena
gena na primeira equao e varivel exgena
ex
na segunda.

Figura (c): Nesta figura so


s apresentadas trs variveis dependentes
entes ou endgenas, Y1,

14

Y2 e Y3, que se relacionam entre si e com as variveis independentes X1, X2 e X3.


Observa-se
se ainda uma relao de reciprocidade entre Y2 e Y3, isto ,, em uma equao
Y2 aparece como varivel preditora ((exgena) de Y3 e em outra equao como varivel
dependente de Y3. Para representar todas as relaes apresentadas nesta figura so
necessrias diversas equaes, uma para cada varivel dependente.

Figura 4: Relaes causais representadas em diagramas de caminhos.


caminhos

ncia e as relaes correlacionais que foram explicitadas na Figura 4


As relaes de dependncia
ilustram a importncia
ncia dos modelos de equaes estruturais como mtodo
m todo para estimar
simultaneamente um conjunto grande de equaes com as caracter
caractersticas
sticas citadas (Hair et al,
2005).
Na construo de um diagrama de caminhos duas suposies so assumidas. A primeira que
todas as relaes causais so mostradas no diagrama, e a escolha dessas relaes
rela
est de
acordo com a teoria que d suporte construo do modelo a ser ajustado.. O objetivo da
SEM modelar as relaes com o menor nnmero de caminhos causais ou correlaes
relaes entre as
variveis que possam ser justi
justificadas teoricamente. A segunda suposio diz respeito
natureza das relaes entre as vari
variveis, latentes ou observadas, que so assumidas como
lineares ou podem ser linearizadas por transformao.
2.4 Submodelos da SEM
Um modelo completo na terminologia SEM composto por dois submodelos: o modelo de
medio e o modelo estrutural. O modelo de medio mostra como as variveis de medio

15

representam construtos ou variveis latentes. Esta parte do modelo est relacionada ao uso de
anlise fatorial confirmatria, que determina a forma como as variveis latentes so
construdas a partir das variveis observadas. O modelo de medio oferece ainda uma
descrio das propriedades de mensurao (validade e confiabilidade) dessas variveis.
O modelo estrutural, por sua vez, mostra como os construtos esto associados uns com os
outros. Seu desenvolvimento fundamenta-se no clculo de sistemas de equaes simultneas.
Nessa etapa da SEM esto os procedimentos de especificao e estimao das associaes
das variveis latentes entre si ou com outras variveis observveis, descrevendo seus efeitos e
suas magnitudes. Incluem tambm as informaes sobre a varincia explicada e a no
explicada de cada termo endgeno presente no modelo.
Ambos os submodelos podem ser bastante complexos. O esquema de um modelo convencional de SEM na forma de diagrama de caminhos apresentado na Figura 5. O modelo
de medio pode ser especificado em termos das variveis exgenas ou em termos das
variveis endgenas. No diagrama de caminhos existem uma ou mais setas que conduzem at
uma varivel endgena.

Figura 5: Diagrama de caminhos para um modelo convencional em SEM.

2.5 Modelos recursivos e no recursivos


Os modelos toricos especificados na SEM e apresentados em diagramas de caminhos podem
ser classificados em dois tipos a depender do sentido das relaes causais representadas por

16

setas no diagrama de caminhos: modelo recursivo e modelo no recursivo.


Nos modelos recursivos as covarincias so nulas entre os termos de perturbao do modelo
e as relaes causais entre as variveis endgenas so propostas em uma nica direo, isto ,
cada varivel tem efeito direto nas outras (Figura 6). Algumas vezes os requerimentos para a
causalidade unidirecional e erros independentes so apropriados para subconjuntos ou blocos
de variveis endgenas e seus erros associados, mas no entre todas as variveis includas no
modelo. Nesse caso, o modelo dito bloco recursivo. Quando a relao causal apresenta mais
de uma direo o modelo denominado no recursivo. Na rea da Economia os modelos no
recursivos so denominados modelos de equaes simultneas. Neste modelo existe um
movimento de ida e volta (feedback loop) entre duas variveis endgenas especificadas e as
covarincias so no nulas entre os termos de perturbao das variveis endgenas do
modelo, representadas pela seta curva entre 1 e 2 na Figura 7. Os modelos no recursivos
so teis na anlise da maioria dos sistemas dinmicos presentes nas cincias sociais. Esses
modelos so ilustrados e discutidos em termos do processo de estimao na seo 2.6.
2.6 Especificao matemtica do modelo de mensurao e do modelo estrutural
Na modelagem por equaes estruturais, deseja-se descrever mdias, varincias e
covarincias atravs de um conjunto de variveis em termos de um reduzido nmero de
parmetros estruturais. Os conceitos sobre esses parmetros estruturais podem ser
introduzidos pelo seu significado a respeito das interrelaes entre um conjunto de variveis
observadas, que usualmente denomina-se anlise de caminhos (path analysis).
O sistema de equaes estruturais para a path analysis pode ser representado compactamente
por:
y = + y + x +

(1)

onde y um vetor p 1 de variveis endgenas observadas, x um vetor q 1 de variveis


exgenas observadas; um vetor p 1 de interceptos estruturais; uma matriz p p que
relaciona as variveis endgenas entre si, uma matriz p q de coeficientes que relaciona
variveis endgenas a variveis exgenas; e um vetor p 1 de termos de rudos
(disturbances), sendo cov() = a matriz de covarincia entre os termos de rudo. Assume-se
que os erros tm esperana zero e so independentes em relao (ou pelo menos no
correlacionados com) s variveis exgenas. Os erros para diferentes observaes so
considerados independentes entre si, com varincia constante entre as observaes. Considere

17

cov(x) = a matriz q q de covarincia para as variveis exgenas (Kaplan, 2000).


Pode-se distinguir trs tipos de parmetros a serem estimados para representar as
interrelaes entre as variveis. O primeiro tipo de parmetro denominado parmetro
livre e refere-se a aqueles parmetros que sero estimados pelo modelo. O segundo conjunto
de parmetros refere-se a aqueles que sero considerados constantes (ou com valores fixados
a priori) durante o procedimento de estimao. Geralmente os parmetros fixos so aqueles
que representam ausncia de relao, logo so considerados fixos e iguais a zero. No entanto,
outro valor pode ser considerado como fixo se houver teoria para suportar tal escolha. O
ltimo grupo de parmetros denominado parmetros restritos (constraint parameters),
referindo-se a aqueles que so considerados iguais a outros parmetros do modelo. Por
exemplo, pode-se requerer que os efeitos de duas relaes representadas no diagrama de
caminhos sejam iguais.
A equao (1) pode ser reescrita isolando-se as variveis exgenas e endgenas em lados
diferentes da equao, de modo que:
y y = + x +

(2)

y (I - ) = + x +

(3)

Assumindo-se que (I - ) no singular, ento sua inversa pode ser definida e a equao (3)
pode ser reescrita como:
y = ( - )-1 + ( - )-1x + ( - )-1
= 0 + 1x + * ,

(4)
(5)

sendo 0 = ( - )-1 o vetor de interceptos na forma reduzida; 1 = ( - )-1 o vetor de

coeficientes angulares (slopes) na forma reduzida e * = ( - )-1 o vetor de rudos na forma


reduzida, tal que cov(*)= *. Note que a expresso anterior representa diretamente um
modelo de regresso multivariado de y em x.
O sistema de equaes em (5) pode ser representado em termos de modelagem de mdias,
varincias e covarincias. Os parmetros estruturais a serem modelados podem ser
representados pelo vetor = ( , , , ) , onde contm as varincias e covarincias das
variveis exgenas; as varincias e covarincias dos termos de rudo; e os coeficientes
de regresso. Alm disso, considera-se E(x)= x o vetor de mdias para x; cov(x) = E(x'x)=
e E() = 0. Assim,

18

E ( y ) = E[( - )-1 + ( - )-1x + ( - )-1 ]


= ( - )-1 + ( - )-1E ( x) + ( - )-1 E ( )
= ( - )-1 + ( - )-1 x

(6)

e
E ( y, x) = yx

E ( y' y)
=
E ( x' y )

E ( yx' )

E ( x'x)

( - )-1( '+ )[( - )-1] '


=

' [( - )-1] '

( - )-1

(7)

onde (6) e (7) mostram que a modelagem por equaes estruturais representa o vetor de
mdia e a matriz de covarincia. Essa estrutura definida em termos dos parmetros do
modelo.
Usualmente para simplificar as equaes estruturais, considera-se o uso de variveis
centradas em sua mdia (Fox, 2008; Mueller, 1999). Com isso, os termos contendo os
interceptos nas equaes anteriores tornam-se zero, reduzindo-se a forma matricial desse
modelo para:
y = y + x +

(8)

Para facilitar a notao, considere de agora em diante o uso de variveis centradas.


A especificao dos elementos da matriz permitir a distino entre duas classificaes
analticas dos modelos de caminhos (path analysis): (a) recursivos e (b) no recursivos ou
simultneos, conforme discutido na seo 2.5. Para ilustrar atravs de diagramas de caminhos
a diferena entre esses dois tipos de modelos, considere as Figuras 6 e 7.

Figura 6: Exemplo de um modelo recursivo.

Uma caracterstica dos sistemas recursivos que os elementos de que representam as


relaes entre as variveis endgenas do modelo encontram-se na poro triangular inferior

19

de . Alm disso, esse modelo no contm covarincias entre os termos de rudo. Assim,
uma matriz diagonal cujos elementos representam as varincias dos rudos. Tipicamente os
coeficientes estruturais das matrizes e contm alguns zeros, e os elementos da diagonal
de so iguais a 1. Pode-se escrever esse modelo para a Figura 6 como:

x1
y1 0 0 y1 11 12 13 e1
=
+
x2 +
y2 21 0 y2 0 0 0 x e2
3

(9)

Nos modelos no recursivos, por sua vez, existe um loop entre variveis endgenas do
modelo, o que implica que no triangular inferior. Alm disso, muitas vezes considera-se
a existncia de um termo de covarincia entre os rudos das variveis endgenas envolvidas
no loop. Nesse caso, uma matriz simtrica, com elementos no nulos fora da diagonal
principal. Este tipo de modelo implica em uma especificao dinmica do modelo estrutural,
que pode causar problemas de instabilidade do procedimento de estimao. O modelo para a
Figura 7 pode ser definido como:

y1 0 12 y1 11
=
+
y2 21 0 y2 0

12
0

x1
0 e1
x2 +
23 e2
x3

(10)

Figura 7: Exemplo de um modelo no recursivo.

2.7 Estimao do modelo


O procedimento de estimao em SEM tem como objetivo obter estimativas para o vetor de
, que minimizem a funo de discrepncia F ( S , ) . Os
parmetros , denominado

parmetros a serem estimados pelo modelo so:

as varincias e covarincias das variveis exgenas em ;

as varincias e covarincias dos termos de rudo em ;

os coeficientes de regresso em e .

20

Assim, deseja-se estimar os parmetros contidos no vetor = ( , , , ) atravs do es ) a matriz de


que minimize a funo de discrepncia F ( S , ) , onde = (
timador
covarincia baseada nas estimativas obtidas pelo modelo (matriz de covarincia ajustada)
(Kaplan, 2000).
A funo F ( S , ) um escalar que mensura a distncia entre a matriz de covarincia

) ). Essa funo pode ser caracterizada


amostral (S) e a matriz de covarincia ajustada ( (

pelas seguintes propriedades:

F ( S , ) 0 ,

F ( S , ) = 0 , se e apenas se = S ,

F ( S , ) uma funo contnua em e S.

Os dois mtodos de estimao mais comumente utilizados so o mtodo de mxima


verossimilhana (ML, em ingls) e os mnimos quadrados generalizados (GLS, em ingls).
Para discusso do mtodo de mxima verossimilhana no contexto da modelagem com
equaes estruturais considere um vetor de respostas z (que contm y e x), baseado em uma
amostra com n = N 1 observaes, com matriz de covarincia amostral no-viciada S, onde
N representa o nmero total de observaes. Para os desenvolvimentos desse mtodo,
assume-se que as observaes provenientes da populao seguem uma distribuio normal
multivariada, cuja funo de densidade dada por:
1
1

f ( z ) = ( 2) ( p + q ) / 2 2 exp z ' 1z
2

Assumindo-se que N observaes so independentes entre si, a funo de densidade conjunta


pode ser escrita como o produto de suas densidades individuais:
f ( z1, z2 ,..., z N ) = f ( z1) f ( z2 )... f ( z N )
A verossimilhana da amostra pode ser ento definida por:
L ( ) = ( 2 ) N ( p + q ) / 2 ( )

N
1 '
1
2 exp zi ( ) zi
2

Para facilitar o processo de derivao, considere o logartmo da verossimilhana dado por:


log L ( ) =

N ( p + q)
N
1 N
log( 2) log tr[ zi' ( ) 1 zi ]
2
2
2 i =1

N ( p + q)
N
N N
log( 2) log tr[ N 1zi zi' ( ) 1]
2
2
2 i =1

21

N ( p + q)
N
N N
log(2) log tr[( ) 1]
2
2
2 i =1

onde a matriz de covarincia amostral baseada em N observaes no lugar de n = N 1.


No processo da maximizao de log L() alguns termos que no possuem os parmetros de
interesse podem ser ignorados. Alm disso, salienta-se que a diferena entre T (baseada em
N) e S (baseada em n = N 1) negligencivel em amostras grandes. Assim, a expresso
anterior pode ser reescrita como:

log L( ) =

N
log + tr[ S( )1]
2

Um problema com esta expresso que no possui as propriedades referentes funo de


discrepncia conforme descrito anteriormente. Para que a expresso anterior possa ser
considerada uma funo de discrepncia apropriada, ser necessrio adicionar termos que no
dependam dos parmetros do modelo. Alm disso, o termo

N
ser removido, o que
2

significa que a funo ser minimizada invs de maximizada. Assim, tem-se:

FML = log + tr[ S()1] log S s


onde s o nmero total de variveis em y e x, tal que ( p + q ) = s . Nesse caso, se o modelo
ajustar perfeitamente, o primeiro e terceiro termos somam zero, ao mesmo tempo em que o
segundo e quarto termos somam zero, o que resulta em uma funo de ajuste apropriada.
Alm das estimativas dos parmetros do modelo, pode-se ainda estimar a matriz de
covarincia dos estimadores dos parmetros. Assim, a matriz de covarincia assinttica para

r1 pode ser escrita por:

) = E log L( )
cov (
'

2
) = log L( ) a matriz de informao de Fisher. Os erros padro podem ser
onde I (
'

obtidos pela raiz quadrada dos elementos da diagonal principal da matriz de covarincia
assinttica das estimativas.
O estimador de mnimos quadrados generalizados (GLS) tambm assume que os dados so
provenientes de uma distribuio normal multivariada. A forma geral da funo de
discrepncia ajustada pelo GLS dada por:

22

FGLS = [S ( )]W 1[S ( )]


onde W 1 uma matriz de pesos que pondera os desvios S (
) em termos de suas
varincias e covarincias com outros elementos.
O estimador GLS parte do grupo de estimadores de mnimos quadrados ponderados (WLS,
em ingls). As duas escolhas mais comuns para W so a matriz identidade, W 1 = , e a
matriz de covarincia amostral, W 1 = S 1 . Quando W 1 = S 1 , ento a funo de
discrepncia ajustada pelo GLS pode ser definida por:

1
FGLS = tr[ S 1 ( S )]2
2
1
= tr ( S 1)2
2
Sob a suposio de normalidade multivariada, o estimador GLS assintoticamente normal e
eficiente.
Um nmero mnimo de observaes deve ser requerido para que SEM possa ser utilizado. De
acordo com Mueller (1996), recomenda-se que a razo entre o tamanho da amostra e o
nmero de parmetros a ser estimado pelo modelo seja de 10:1 ou mesmo de 20:1, se testes
de significncia estatstica so de interesse.

2.8 Identificabilidade do modelo estrutural


O problema de identificabilidade do modelo refere-se existncia de soluo nica na
estimao dos parmetros. Logo, se os parmetros do modelo no so identificveis, sua
estimao no pode ser realizada. Embora o problema de identificabilidade do modelo exista
em quase todos os modelos estatsticos, o seu papel talvez mais claro nos modelos de
equaes estruturais (Kaplan, 2000).
Um modelo dito identificado quando teoricamente possvel obter uma nica estimativa
para cada parmetro. Dentro da abordagem com equaes estruturais, a definio de
identificabilidade est relacionada modelagem da estrutura de covarincia. Assim, a
identificabilidade do modelo geralmente ocorre quando o nmero de elementos da matriz de
covarincia entre as variveis observadas for maior ou igual ao nmero de parmetros a
serem estimados (Kline, 2005). Os modelos identificados que possuem o mesmo nmero de
parmetros e observaes so chamados de exatamente identificados, enquanto que os
modelos que possuem menos parmetros que observaes so chamados de super-

23

identificados.
De modo geral, algumas restries precisam ser impostas aos modelos para que no haja
problemas de identificabilidade. Essas restries incluem:

Normalizao: requer que os elementos da diagonal de sejam zero (ou seja, uma
varivel endgena no pode ter um efeito direto sobre ela mesma);

Definio de uma mtrica para os termos de rudo . A forma mais comum feita
fixando-se os coeficientes que relacionam as variveis endgenas aos termos de rudo
em 1 (um).

Vale lembrar que em SEM os parmetros do modelo contidos no vetor = ( , , , ) so


estimados com base na matriz de varincia-covarincia .
Existem na literatura algumas regras para verificao da identificabilidade do modelo, que
incluem a regra da contagem (counting rule) e a regra recursiva (recursive rule). A primeira
regra geralmente usada em aplicaes da rea de cincias sociais, enquanto que a outra
regra mais comum em aplicaes economtricas com uso de modelos no recursivos.
A regra da contagem a mais simples para avaliao da identificabilidade do modelo. Seja

s = p + q o nmero total de variveis, onde p e q representam o nmero de variveis


endgenas e exgenas, respectivamente. Assim, o nmero de elementos no redundantes em
igual a

1
s( s + 1) . Considere ainda que seja t o nmero de parmetros a serem estimados
2

pelo modelo. Dessa forma, uma condio necessria para a identificabilidade do modelo
que t

1
s ( s + 1) .
2

Pela regra da contagem, tem-se que:

Se t =

1
s( s + 1) ento o modelo dito just identified [exatamente identificvel];
2

Se t <

1
s( s + 1) ento o modelo dito overidentified [super-identificvel];
2

Se t >

1
s( s + 1) ento o modelo dito not identified [no identificvel].
2

Para ilustrao do uso da regra da contagem, suponha, por exemplo, que os parmetros a
serem estimados pelo modelo so 10 varincias e covarincias de variveis exgenas e 8
coeficientes de regresso (t = 18). Nesse exemplo, considere que s = 7 e o nmero de
elementos no redundantes em igual a 28. Nesse caso, como t < 28, o modelo super-

24

identificvel.
A maior vantagem da regra da contagem sua simplicidade. No entanto, essa regra
necessria, mas no suficiente. Nesse caso, pode-se considerar a regra recursiva para a qual
uma condio suficiente que B seja triangular e que seja uma matriz diagonal. Isso
implica que todo modelo recursivo identificvel, pois no contm covarincia entre os
termos de rudo. Verifique que estas condies so satisfeitas no exemplo apresentado em
(9).
Outra condio que necessria e suficiente para identificabilidade do modelo denominada
condio de posto da matriz (rank condition). De acordo com esse procedimento, para que o
modelo de equao estrutural seja identificvel necessrio ter pelo menos o mesmo nmero
de variveis exgenas e parmetros a serem estimados na equao.
Suponha que existam q variveis exgenas no modelo. Pela condio anterior tem-se que:

Se um modelo tem exatamente q parmetros estruturais ento o modelo dito just

identified [exatamente identificvel];

Se um modelo tem menos que q parmetros estruturais ento o modelo dito

overidentified [super-identificvel];

Se um modelo tem mais que q parmetros estruturais ento o modelo dito not

identified [no identificvel] e no pode ser estimado.


Assim, os modelos recursivos podem ser apenas de dois tipos: exatamente identificveis ou
super-identificveis. Outros tipos de restries devem ser definidos para os modelos norecursivos, mas no so descritos neste trabalho.

2.9 Avaliao dos critrios de qualidade do ajuste


Vrios critrios podem ser usados para avaliao da bondade do ajuste do modelo. A
determinao do ajuste do modelo complicada nesse contexto porque vrios critrios de
bondade do ajuste foram desenvolvidos para avaliao dos modelos de equaes estruturais
sob diferentes suposies. Segundo Strumacker e Lomax (2004), a determinao da bondade
do ajuste na SEM no to direta quanto em outros procedimentos multivariados porque
nesses mtodos assume-se que as variveis observadas so mensuradas sem erro e existem
testes estatsticos com distribuies conhecidas. Os ndices de ajuste da SEM, por sua vez,
no tm um teste de significncia estatstica que identifique o modelo correto considerandose os dados amostrais.
O qui-quadrado o nico teste estatstico usado para avaliao do modelo terico. Neste

25

caso, o valor do qui-quadrado varia entre zero, quando se considera o modelo saturado, e um
valor mximo, quando no se considera nenhuma relao entre as variveis (modelo
independente). Um resultado estatisticamente no significante para o qui-quadrado indica que
a matriz de covarincia amostral e a matriz de covarincia estimada pelo modelo so
similares. Muitos dos critrios de ajuste so calculados com base no conhecimento do modelo
saturado, no modelo independente, no tamanho amostral, nos graus de liberdade e nos valores
do qui-quadrado para formular um ndice que varia entre 0 (ajuste inadequado) e 1 (ajuste
perfeito).
Tabela 1. Principais critrios de ajuste para o SEM.
Medida de ajuste

Critrio para avaliao

Comentrios

Qui-quadrado

p > 0,05

Com amostras grandes e menor


desvios, o ajuste pode ser
estatisticamente significante.

Qui-quadrado/gl

< 2: excelente ajuste


3 a 5: ajuste bom
> 5: ajuste pobre

Compensa para amostras grandes

Jrskog Sorbom
ndice de Bondade (GFI)

1 refere-se ao ajuste perfeito


Objetivo > 0,9

Refere-se

proporo
da
covarincia observada que
explicada pela covarincia do
modelo

Jrskog Sorbom
1 refere-se ao ajuste perfeito
ndice de Bondade Ajustado
Objetivo > 0,9
(AGFI)
ndice de Comparao do 1 refere-se ao ajuste perfeito
Ajuste de Bentler (CFI)
Objetivo > 0,9
ndice de Tucker-Lewis

1 refere-se ao ajuste perfeito


Objetivo > 0,9

Raiz do Erro Quadrtico


Mdio de Aproximao < 0,05
(RMSEA)
Hoelters n

> 200

Inclui ajuste
complexos

para

modelos

Corresponde melhor ajuste do


modelo aos dados quando as
variveis so independentes
Inclui ajuste para modelos
complexos
Reflete a diferena mdia entre a
covarincia observada e a do
modelo
Estima o tamanho da amostra
suficiente para ajuste adequado do
modelo

Recomenda-se que vrios critrios de bondade do ajuste sejam usados em combinao como
medida de ajuste global (Hair et al, 2005). Dentre os critrios de bondade de ajuste,
ressaltam-se:

o ndice de qualidade do ajuste (GFI, em ingls): valor 1 indica ajuste perfeito,

a raiz do erro quadrtico mdio (RMSEA, em ingls), em que valores inferiores a 0,05
indicam um bom ajuste do modelo,

26

o ndice de ajuste comparativo (CFI, em ingls), para o qual se esperam valores


superiores a 0,9.

Matematicamente, esses critrios podem ser definidos como:

2
2modelo glmodelo
, RMSEA =
GFI = 1 modelo
( N 1) glmodelo
2nulo

2
glmodelo
e CFI = 1 modelo
2
nulo glnulo

onde gl denota os graus de liberdade do modelo.


A Tabela 1 sintetiza alguns dos principais critrios para avaliao da qualidade do ajuste
segundo Jackson e colaboradores (2005).

2.10 Efeitos direto, indireto e total


As suposies estatsticas, as equaes e as interpretaes associadas aos coeficientes em
uma anlise de caminhos so similares s dos modelos de regresso tradicionais, mas as
relaes estruturais so especificadas a priori.
Na terminologia associada path analysis, os elementos em e em representam os efeitos
diretos do modelo. Nesse caso, a interpretao feita similarmente a qualquer tipo de
coeficiente de regresso. Alm dos efeitos diretos, a path analysis permite a decomposio
dos efeitos em totais e indiretos.
O efeito indireto definido quando uma varivel exgena influencia uma varivel endgena
atravs da mediao de pelo menos uma outra varivel. Na existncia de efeito indireto, o
efeito total definido pela soma do efeito direto e de todos os efeitos indiretos.
Considere para a path analysis o modelo definido por:
y = y + x +

J vimos que assumindo-se que (I - B) no singular e com alguma manipulao algbrica,


esse modelo pode ser reescrito como:

y = ( )1 x + ( )1
Nesse caso, tem-se:

O efeito total definido por ( )1 ;

a matrix de efeitos diretos das variveis exgenas sobre as endgenas;

( )1 contm os efeitos indiretos.

Geralmente os softwares estatsticos provm os efeitos totais. No entanto, a modelagem de


equaes estruturais permite a estimao automtica de todos os efeitos que estejam

27

contemplados no diagrama de caminhos correspondente.

2.11 Estimao padronizada


A interpretao dos coeficientes estimados pelos modelos de regresso, bem como em
modelos mais complexos, como os modelos de equaes estruturais, fundamental para o
entendimento do pesquisador sobre as relaes existentes no fenmeno em estudo. A
complexidade dos fatores que influenciam esses coeficientes geralmente dificulta a
interpretao dos mesmos. Uma questo interessante diz respeito a diferentes tipos de
coeficientes que podem ser obtidos durante a modelagem e suas correspondentes
interpretaes (Grace, Bollen, 2005).
Quando as variveis observadas provm de diferentes escalas arbitrrias, geralmente
necessrio o uso de coeficientes padronizados para ajudar na interpretao dos resultados.
Uma forma de resolver o problema de mtricas distintas e/ou arbitrrias das variveis
padronizar os parmetros estruturais do modelo.
No caso da regresso linear simples, sabe-se que os coeficientes no padronizados
representam a inclinao da reta, enquanto que o coeficiente padronizado representa a raiz
quadrada da varincia explicada da varivel resposta. No contexto da modelagem com
equaes estruturais, os coeficientes padronizados so amplamente utilizados, sendo
disponibilizados por todos os softwares estatsticos.
Na literatura encontram-se descritos diversos mtodos para obteno de coeficientes
padronizados para modelos de regresso lineares, incluindo mtodos usando medidas de
variabilidade, usando correlaes e usando variveis padronizadas. Considerando-se o
modelo de regresso linear mltiplo:
y = 0 + 1x1i + 2 x2i + ... + p x pi + i ; i ~ N (0, 2 ) ,
onde = (0 , 1,..., p ) representa o vetor de parmetros ou coeficientes no padronizados
do modelo. O coeficiente padronizado para a k-sima varivel independente, usando o
primeiro mtodo, definido multiplicando-se a estimativa no padronizada pela razo entre o
desvio padro da varivel independente e da varivel resposta (Kaplan, 2000):
S
k = k xk
Sy
onde k representa o k-simo coeficiente padronizado no modelo de regresso linear
mltiplo. Neste caso, o erro padro do coeficiente padronizado dado por:

28

S
Sbk = Sbk xk
Sy

2
1 RYH

(1 RX2 G ) ( N K 1)
k k

onde H representa todas as variveis independentes, Gk representa o grupo de todas as


2

variveis X exceto a varivel Xk e R o coeficiente de determinao do modelo.


Outro mtodo utiliza as correlaes entre as variveis resposta e independentes e as
correlaes entre as variveis independentes (Grace e Bollen, 2005). No modelo de regresso
linear mltiplo com apenas duas variveis independentes, os coeficientes padronizados
podem ser definidos por:

ry1 (r12 ry 2 )
1 =
2
1 r12
ry 2 (r12 ry1)
2 =
2
1 r12
onde ry1 e ry2 representam os coeficientes de correlao de Pearson entre as variveis
independentes e dependentes e r12 representa o coeficiente de correlao de Pearson entre as
variveis independentes. No caso bivariado (modelo linear simples), ou seja, quando s existe
uma varivel independente, o coeficiente padronizado pode ser definido por:

= rxy ,
onde rxy o coeficiente de correlao de Pearson entre a varivel independente e a varivel
dependente.
Um terceiro mtodo consiste em padronizar todas as variveis includas na anlise atravs da
estatstica xzi dada por:
x X
.
x zi = i
S

O ajuste do modelo feito ento utilizando-se as variveis padronizadas. O modelo de


regresso linear mltiplo com variveis padronizadas pode ser definido por:
y zi = 1 xz1i + 2 xz + ... + p x z pi + i ; i ~ N (0,1) ,
2i
onde k representa o k-simo coeficiente padronizado.
Vale lembrar que quando feita a padronizao o parmetro 0 torna-se igual a zero, sendo
por este motivo retirado da equao do modelo. A equao anterior pode ser escrita da
seguinte forma:

29

x pi X p
yi Y
x X1
x X2
= 1 1i
+ 2 2i
+ ... + p
+ i ;
Sy
S x1
S x2
Sx p

i ~ N (0,1)

No contexto de path analysis, considere que pq representa um dos coeficientes no


padronizados para um elemento de . O coeficiente padronizado obtido, ento, por:
*pq =

xq

pq
y p

onde y p e xq so as varincias de yp e xq, respectivamente. Note que y p obtido atravs


do elemento estimado na diagonal superior esquerda da matriz yx , dado por

( )1( + )( )1 ; enquanto xq obtido pelo elemento estimado na diagonal


inferior direita da matriz yx . Analogamente, para cada elemento de B, o coeficiente
padronizado dado por:
xq
*q =
q
y
p

Coeficientes padronizados tambm podem ser obtidos para efeitos diretos e indiretos do
modelo.

2.12 Especificao do Modelo de Equaes Estruturais Generalizado


Nesta seo o modelo de equaes estruturais generalizado, que consiste dos submodelos de
mensurao e estrutural, definido. Esse modelo foi introduzido por Karl Jreskog e
colaboradores, sendo uma generalizao do modelo discutido previamente. O modelo
estrutural similar a aquele definido para variveis observadas, sendo denotado por:
= + +

(11)

onde representa um vetor m 1 de variveis latentes endgenas, representa um vetor

k 1 de variveis latentes exgenas, B uma matriz m m de coeficientes relacionando as


variveis latentes endgenas entre si; uma matriz m k de coeficientes relacionando
variveis endgenas a variveis exgenas; e um vetor m 1 de rudos (disturbances)
estruturais. Usando-se essa notao B apresenta zeros em sua diagonal principal (Kaplan,
2000).
As variveis latentes so relacionadas com as variveis observadas atravs do modelo de
mensurao, que definido separadamente para variveis endgenas e exgenas por:

30

y = y + e

x = x +

onde y e x so matrizes p m e q k, respectivamente, de cargas fatoriais, e e so


vetores p 1 e q 1, respectivamente, de erros de mensurao em y e em x. Cada coluna das
matrizes geralmente contm um valor que fixado em 1 para estabelecer a escala da
varivel latente correspondente. Alternativamente, isso pode ser feito fixando-se em 1 as
varincias das variveis latentes exgenas em .
Nesse modelo assume-se que os erros de mensurao e tm esperana zero, cada um com
distribuio normal multivariada, independentes entre si e independentes das variveis
exgenas latentes (), das variveis endgenas latentes () e dos rudos (). Alm disso,
assume-se que as observaes so amostradas independentemente e que as variveis
exgenas latentes () tm distribuio normal multivariada. Essa ltima suposio
desnecessria para variveis exgenas que so medidas sem erro.
Os rudos estruturais () tm esperana zero, tm distribuio normal multivariada e so
independentes das variveis exgenas latentes (). Sob essas suposies, os indicadores
observados, x e y, tm uma distribuio normal multivariada
x
~ N p + q (0, )
y

onde representa a matriz de covarincia populacional dos indicadores. Essa matriz


funo dos parmetros do modelo = (, , x , y , , e ) , podendo ser expressa
por:
-1
-1
xx xy y ( - ) ( '+ )[( - ) ] ' y +

=
=
yx yy
y ( - )-1x

y ( - )-1 x

x x +

onde a matrix de covarincia k k das variveis exgenas latentes, a matriz de


covarincia m m de termos de rudo, e e so as matrizes de covarincia dos erros de
mensurao e , respectivamente.
A anlise de caminhos clssica, conforme discutida na seo 2.6, pode ser vista como um
submodelo nessa estrutura mais geral, considerando-se x = , = 0 , y = , = 0 .
Substituindo esses resultados em obtm-se a mesma estrutura definida em (7).
Similarmente, para obteno da matriz associada anlise fatorial confirmatria, considere

B = 0, = 0, = 0, y = 0 e = 0 .
Em qualquer modelo em particular sero necessrias algumas restries em alguns elementos

31

dessa matriz. Mais comumente, algumas restries incluem fixar alguns desses parmetros
como zeros. Alm disso, algumas das matrizes contm valores fixos conforme discutido
anteriormente. Se as restries desse modelo so suficientes, ento estimativas de mxima
verossimilhana podem ser obtidas para esses parmetros.
A log-verossimilhana associada a esse modelo dada por:

loge L(, , x , y , , , ; ) =

N ( p + q)
N
loge 2 [loge det + trace( S 1)]
2
2

(12)

onde S a matriz de covarincia amostral entre as variveis observadas. Como o logartmo da


verossimilhana pode ser pensado como uma medida de proximidade entre e S, ento as
estimativas de mxima verossimilhana dos parmetros so definidas de modo que essas duas
matrizes sejam o mais prximo possvel. Novamente os erros padro assintticos para as
estimativas dos parmetros podem ser obtidos pela raiz quadrada das diagonais da matriz de
informao. Assume-se neste contexto que as relaes estruturais entre as variveis latentes
exgenas e endgenas so lineares, bem como as relaes entre as variveis indicadoras
(observadas) e os construtos associados s mesmas.
A verificao da identificabilidade desses modelos com variveis latentes um problema
complexo que no tem soluo simples. Uma condio geral necessria para
identificabilidade o nmero de parmetros livres no modelo, que no pode ser superior ao
nmero de varincias e covarincias entre as variveis observveis, que dado por:

( p + q) ( p + q + 1)
2
Esta condio, no entanto, no suficiente. fcil atender a esta condio e ainda ter um
modelo no identificvel. Uma regra que s vezes pode ajudar na verificao da
identificabilidade do modelo a seguinte:

todos os erros de mensurao so no correlacionados com os outros,

existem pelo menos dois indicadores exclusivos para cada varivel latente, ou se h
apenas um nico indicador para uma varivel latente, essa mensurada sem erro,

o modelo estrutural contm apenas variveis observadas.

Os softwares estatsticos geralmente detectam as tentativas de ajuste de um modelo


subidentificado. Neste caso, a matriz de informao ser singular. Outra forma de verificar
problemas de identificabilidade do modelo observar se as estimativas das varincias so
muito grandes.

32

2.13 Etapas da implementao da SEM


A Figura 8 ilustra as etapas para a construo de um modelo de equaes estruturais. De
acordo com esse esquema, primeiramente identifica-se uma teoria que ser utilizada como
base para a especificao do modelo. A especificao do modelo consiste na definio das
relaes causais. De posse do modelo e a partir de dados de uma amostra, obtm-se as
medidas referentes s variveis observveis do modelo, que permitiro a construo das
variveis latentes especificadas no modelo. Com essas medidas (das variveis observadas e
dos construtos) so estimados os parmetros do modelo de medio e do estrutural.
Geralmente os modelos de mensurao e estrutural so ajustados simultaneamente, podendo,
no entanto, ser o modelo de mensurao estimado inicialmente. A avaliao da bondade do
ajuste pode ser feita aps a estimao dos parmetros da SEM. ndices de modificao do
modelo so produzidos pela maioria dos softwares, podendo servir de suporte para potenciais
alteraes do modelo torico. Com o modelo definitivo, aps as modificaes necessrias e a
estimao final dos parmetros, segue uma discusso sobre o modelo encontrado.

Figura 8: Etapas para a construo de um modelo de


equaes estruturais.

Essas etapas foram sumarizadas por Hair e colaboradores (2005) em estgios sequenciados,
que podem ser descritos como:

33

Estgio 1. Desenvolvimento do modelo torico - consiste no pesquisador expressar


suas hipteses baseando-se nas relaes causais entre as variveis selecionadas para a
pesquisa com fundamentos toricos. O investigador precisa basear-se em pesquisas e
teorias prvias para escolher e especificar um modelo plausvel. A especificao do
modelo envolve determinar cada relao e parmetro do modelo de interesse. Alguns
autores afirmam que essa a etapa mais rdua da SEM (Strumacker e Lomax, 2004).
Estgio 2. Construo do diagrama de caminhos das relaes definidas - expresso
grfica de causa e efeito desenvolvida no modelo torico.
Estgio 3. Converso do diagrama de caminhos em modelo de mensurao e modelo
estrutural - consiste na formao do modelo torico atravs das equaes propostas.
Esta etapa envolve tambm a validao dos construtos por intermdio da anlise
fatorial confirmatria. A partir do modelo torico so criadas as hipteses a serem
testadas na aplicao dos sistemas de equaes estruturais.
Estgio 4. Verificao da identificabilidade do modelo estrutural - consiste em
verificar a existncia de limitaes explanatrias do modelo para gerar solues
nicas.
Estgio 5. Avaliao dos critrios de ajuste do modelo - etapa responsvel pela
avaliao da adequao e ajuste geral do modelo atravs do uso das medidas de
adequao absolutas, medidas de ajuste incremental e medidas de ajustes de
parcimnia.
Estgio 6. Interpretao e modificao do modelo - consiste na comparao dos
resultados obtidos no desenvolvimento do modelo com os objetos e hipteses
estabelecidas no estudo a partir da teoria, comparando estatisticamente essas
afirmaes. Podem tambm ser estabelecidos parmetros para a reespecificao do
modelo, com a incluso ou no dos parmetros estimados no modelo torico original.

2.14 Softwares estatsticos


Existem diversos programas estatsticos que implementam os modelos de equaes
estruturais. Esses programas podem ser: programveis - o pesquisador necessita conhecer a
linguagem de programao para efetuar suas anlises; ou no programveis - que tm uma
apresentao interativa com o usurio. A seguir alguns desses programas so descritos,
apresentando-se suas caractersticas principais e um pouco de sua histria.

34

AMOS (Analysis of Moment Structures)


O Amos um mdulo de extenso do programa estatstico SPSS, desenvolvido para
aplicao de SEM. Ele subdividido em dois mdulos: Amos Graphics e Amos Basic.
No Amos Graphics o usurio pode especificar o modelo atravs de diagramas de
caminhos, no precisando fazer nenhum tipo de programao devido existncia de
um grupo de ferramentas disponveis para analisar, modificar ou alinhar elementos do
modelo. O Amos Basic utiliza a linguagem de programao, ou seja, o modelo e os
dados so especificados por sintaxe em todas as anlises. A vantagem deste modo a
possibilidade de programao adicional no disponvel no Amos Graphic (Kline,
2005).
LISREL (Linear Structural Relationships)
O LISREL considerado sinnimo de SEM por ter sido desenvolvido
especificamente para o emprego desta tcnica e por ser o pioneiro em sua aplicao.
Atualmente o LISREL inclui outras aplicaes como manipulao de dados,
estatsticas bsicas, modelos lineares generalizados e ainda modelos multinveis. Foi
desenvolvido h cerca de 30 anos para permitir a avaliao emprica das teorias de
pesquisadores da rea de cincias sociais atravs do uso da SEM. O LISREL
subdividido em trs mdulos: PRELIS, SIMPLIS e Path Diagram. O PRELIS
responsvel pela manipulao dos dados e clculos de medidas estatsticas. O
SIMPLIS o modo de programao, onde o usurio necessita especificar suas
anlises atravs de sintaxe. O Path Diagram o modo que o usurio utiliza para
realizar a anlise a partir do diagrama de caminhos, consistindo em desenhar as
relaes entre as variveis e a partir da criar a sintaxe para posteriormente ser
executada.
MPLUS
O MPlus tambm um programa desenvolvido para a implementao da Modelagem
de Equaes Estruturais, que foi desenvolvido h cerca de 10 anos pelos
pesquisadores L. Muthn e B. Muthn na verso do Windows. Atualmente encontrase na verso 6.1. um pacote de anlise de dados poderoso no sentido que foi
construdo sobre a estrutura de modelagem geral, mas com flexibilidade para usar
combinaes de variveis latentes contnuas e categricas. Tal estrutura integrada
considera como casos especiais a SEM, os modelos de curva de crescimento misto e
latente e os modelos multinveis. Recentemente incorporou a questo de lidar com

35

amostras complexas nesses modelos. O MPlus possui a desvantagem de no construir


o diagrama de caminhos, dificultando a visualizao das relaes entre as variveis,
necessitando dessa forma que o diagrama seja construdo separadamente para servir
como base (Kline, 2004). O MPlus foi desenvolvido na forma de linguagem de
programao, mas caso o usurio desconhea o uso de sintaxes poder, atravs do uso
das ferramentas do programa, obter as sintaxes apenas direcionando ao tipo de anlise
escolhida.
MX GRAPH
At o momento foram apresentados programas que so pagos (AMOS, LISREL,
MPlus), mas o Mx Graph um programa completamente livre, podendo ser obtido
pela internet sem a necessidade de licena. O Mx Graph considerado um
processador de matriz e um otimizador numrico que pode analisar modelos de
equaes estruturais e outros tipos de modelos estatsticos multivariados. Existem
dois tipos de mdulos de utilizao do Mx Graph (Kline, 2004): o primeiro refere-se
ao uso de linguagem de programao para descrever os dados e definir o modelo a ser
utilizado na anlise. Sua sintaxe representa o modelo de equao estrutural em trs
tipos de matrizes: a simtrica (para anlise de associaes), a assimtrica (para efeitos
diretos) e a filtrada (para identificar as variveis observadas). Para o uso do segundo
mdulo no necessrio o conhecimento de linguagem de programao, pois as
relaes so estabelecidas atravs do diagrama de caminhos utilizando as ferramentas
do Mx Graph. Uma caracterstica especial do Mx Graph para SEM sua habilidade
em calcular intervalos de confiana e poder estatstico para estimar parmetros
individuais, e em analisar modelos com variveis contnuas ou categricas.
R
O R um programa estatstico livre desenvolvido em ambiente de linguagem de
programao R. Foi criado por Ross Ihaka e Robert Gentleman com a colaborao de
vrios pesquisadores ao redor do mundo. muito utilizado por pesquisadores,
especialmente pelos Estatsticos. Atualmente encontra-se na verso 2.15, estando
disponvel tanto para Windows quanto para Mac e Unix. O R tambm altamente
expansvel com o uso dos seus pacotes, que so bibliotecas com funes especficas
ou reas de estudo especficas, como o pacote SEM. O pacote do R com aplicao em
SEM possibilita ajuste de modelos com variveis observadas e latentes atravs do uso
da tcnica da mxima verossimilhana, assumindo multinormalidade (Fox, 2006).

36

3 Aplicaes da SEM
Para ilustrao da aplicabilidade dos mtodos discutidos neste trabalho so apresentadas duas
anlises que foram conduzidas usando esta metodologia. Essas aplicaes incluem desde o
uso do modelo mais simplificado na abordagem SEM, contendo apenas anlise fatorial
confirmatria, at situaes mais complexas envolvendo modelos no recursivos. A
interpretao dos resultados em cada uma das aplicaes enfatizada.

3.1 Padres de consumo alimentar no interior da Bahia


Utilizou-se anlise fatorial confirmatria (AFC) para definir grupos de alimentos (construtos)
baseados no consumo de itens alimentares individualizados por crianas residentes na zona
urbana de municpios do interior da Bahia em duas faixas etrias: menor de 12 meses (Figura
9) e entre 12 e 24 meses (Figura 10). Anlise fatorial confirmatria frequentemente usada
no processo de avaliao de modelos de equaes estruturais mais gerais. Contudo, AFC, por
ela mesma, tem se tornado uma ferramenta poderosa para avaliao da validade e
confiabilidade de instrumentos acadmicos, do comportamento e da personalidade, por
exemplo (Mueller, 1996). No contexto dessa aplicao estaremos usando-a para avaliao de
dados nutricionais.
O objetivo do estudo, denominado VIDACRI, definir perfis de consumo alimentar em
crianas das mencionadas faixas etrias na populao de estudo. Este estudo foi conduzido
por pesquisadores da Escola de Nutrio da UFBA. Nas anlises apresentadas neste relatrio
considerou-se somente informaes das crianas que tinham dados sobre hemoglobina
(n = 1116), sendo aproximadamente 26,97% menores de 12 meses. As variveis observadas
utilizadas na anlise foram as calorias provenientes do consumo de: acares e doces, leite e
derivados, leite materno, cereais, feijo, carne e arroz. Usando AFC testou-se se o modelo de
consumo alimentar hipotetizado pelos pesquisadores confirmado pelos dados do estudo
VIDACRI. Essas anlises foram realizadas usando-se o software LISREL.
Nas Figuras 9 e 10 esto representadas as relaes toricas entre os fatores e as variveis
observadas (indicadores). Essas relaes so interpretadas como cargas fatoriais. Os erros de
mensurao esto representados pelas setas ao lado esquerdo dos indicadores e indicam qual
a poro de cada indicador que est mensurando alguma outra coisa alm do fator
hipotetizado. Para avaliar o erro de mensurao, a varincia de cada erro de mensurao
estimada.

37

Figura 9: Diagrama de caminhos referente ao consumo alimentar


em crianas menores de 12 meses.

Para verificar a identificabilidade dos modelos representados pelos diagramas de caminhos


das Figuras 9 e 10, vamos utilizar a regra da contagem atravs da qual temos

7(7 + 1)
= 28
2

elementos distintos na matriz de covarincia S. O nmero de parmetros a ser estimado


dado por 7 cargas fatorias, 7 varincias dos erros de mensurao e uma correlao entre os
construtos, resultando em um total de 15 parmetros livres. Como o nmero de elementos em
S maior do que o de parmetros livres, ento tem-se gl = 28 15 = 13 graus de liberdade
para o modelo especificado. De acordo com este critrio o modelo dito superidentificvel.
Vale lembrar que esta condio necessria, mas no suficiente para estabelecer a
identificabilidade do modelo. No entanto, considerando-se as condies listadas na seo
2.12, pode-se corroborar a identificabilidade deste modelo.
O modelo de mensurao representado da Figura 9 pode ser definido por:
x = x +
que neste caso dado por:

38

x1 11 0
1



x2 12 0
2


x
0
3 13
1 3
x4 = 14 0 + 4

2
x5 0 25
5
6
x6 0 26

x7 0 27
7
Analisando-se a Figura 9, pode-se notar que a varivel observada leite e derivados (carga
fatorial padronizada 12 = 0,84 ), referente ao consumo de calorias em crianas com menos
de 12 meses, possui a maior contribuio na formao do construto Fator 1 ( 1 ), enquanto
que no construto Fator 2 ( 2 ) a varivel que exerce a maior contribuio o arroz (carga
fatorial padronizada 27 = 0,77 ). Pode-se ainda perceber que existe uma correlao positiva
entre os Fatores 1 e 2 (r = 0,24).
Modelo de mensurao similar ao definido anteriormente considerado para ajuste usando
dados de consumo de calorias na dieta de crianas com faixa etria de 12 a 24 meses,
conforme apresentado na Figura 10. Nesse caso, verifica-se que a formao do construto
Fator 1 ( 1* ) deve-se principalmente ao consumo de leite e derivados (carga fatorial
padronizada *12 = 0,65 ), enquanto que no construto Fator 2 ( *2 ) novamente o consumo de
arroz (carga fatorial padronizada = *27 = 0,61 ) o que exerce uma maior contribuio na
formao do mesmo. Nota-se, no entanto, que existe uma fraca correlao negativa entre os
construtos Fator 1 e Fator 2 (r = 0,05).
Tabela 2. Estimativas no padronizadas para os dois modelos de perfil de
consumo alimentar segundo a faixa etria das crianas.
< 12 meses
12 - 24 meses
Variveis observadas
t
t
se( )
se( )

Acar e doces
Leite e derivados
Leite materno
Cereais
Carne
Feijo
Arroz

58,1
163,6
-56,6
70,8
15,8
15,3
32,0

5,6
12,2
4,5
8,6
2,6
2,5
4,6

10,3
13,4
12,5
8,3
6,2
6,2
7,0

80,2
213,3
-141,0
73,8
4,4
5,9
22,3

6,7
13,6
10,0
8,8
0,8
0,9
3,0

12,0
15,7
14,1
8,4
5,5
6,6
7,4

39

Comparando as Figuras 9 e 10, pode-se notar que apesar das distintas faixas etrias das
crianas, no parece haver diferena nos seus perfis alimentares, sendo que os fatores
definidos indicam dieta lctea (Fator 1) e uma dieta tradicional (Fator 2).
A Tabela 2 apresenta as estimativas no padronizadas dos modelos apresentados nas Figuras
9 e 10. De acordo com esses resultados, todos os parmetros estruturais (os coeficientes no
padronizados) na matriz x so significativos, bem como as varincias dos erros de
mensurao associadas aos indicadores do modelo (dados no apresentados). Contudo, as
correlaes mltiplas ao quadrado ( R 2 ) para os indicadores variaram entre 0,15 e 0,70 para
os dados de crianas menores de 12 meses, e entre 0,13 e 0,42 para os dados de crianas entre
12 e 24 meses, indicando confiabilidade questionvel para o padro alimentar nessas
amostras.

Figura 10: Diagrama de caminhos referente ao consumo


alimentar em crianas de 12 a 24 meses.

Critrios de ajuste do modelo so apresentados na Tabela 3 para os dados das crianas das
duas faixas etrias. Pode-se verificar que o modelo encontra-se bem ajustado considerando-se
os critrios definidos na Tabela 1.

40

Tabela 3. Critrios de bondade de ajuste para os dois


modelos de padro de consumo alimentar.
Valor das estatsticas
Medida de ajuste
<12 meses 12-24 meses
Qui-quadrado/gl
1,92
2,14
GFI
0,98
0,99
AGFI
0,95
0,98
CFI
0,98
0,97
NFI
0,95
0,94
RMSEA
0,05
0,04

3.2 Desenvolvimento cognitivo em menores de 48 meses


Estudo foi realizado para descrever a relao entre o estado antropomtrico, as condies
socioeconmicas, a qualidade do lar e o desenvolvimento cognitivo de 320 crianas de 20 a
42 meses de idade residentes na cidade de Salvador - Bahia (Santos et al, 2008). Um critrio
de incluso foi selecionar as crianas com menos de 42 meses nascidas no perodo de janeiro
a julho de 1999. O desenvolvimento cognitivo (IDM) das crianas foi medido utilizando-se a
escala de Bayley e as caractersticas do lar (HOME) foram mensuradas pelos objetos nele
existentes. Para avaliar o estado antropomtrico, utilizaram-se os escores antropomtricos
peso/idade e altura/idade, alm do peso ao nascer. Os dados socioeconmicos foram
coletados atravs de um questionrio padro. O SEM foi utilizado nessa aplicao para:
i) definir construtos (variveis latentes) que representem caractersticas do ambiente em
que a criana vive, alm de caractersticas relacionais e nutricionais da criana;
ii) avaliar o impacto desses construtos no desenvolvimento cognitivo da criana.
Para a implementao do SEM foram utilizadas as seguintes variveis: responsividade
emocional e verbal (homei), ausncia de punio e restrio (homeii), organizao do
ambiente fsico e temporal (homeiii), disponibilidade de brinquedos (homeiv), envolvimento
materno com a criana (homev), oportunidade de variao na estimulao (homevi), escore
altura/idade (haz), peso ao nascer, em quilogramas (peso), sexo, idade em meses (idmes), e
escore do desenvolvimento cognitivo infantil (IDM).
Conforme o diagrama de caminhos que representa a AFC considerada nesta aplicao, o
construto psico-social formado pelas variveis observadas que se referem responsividade
emocional e verbal, ausncia de punio e restrio e ao envolvimento materno com a
criana (Figura 11). O construto fsico-ambiental formado pelas variveis referentes
organizao do ambiente fsico e temporal, disponibilidade de brinquedos e oportunidade
de variao na estimulao, enquanto que o construto nutricional formado pelas variveis

41

referentes ao escore altura/idade e ao peso da criana ao nascer. A implementao dessas


anlises foi realizada no software Amos.
De acordo com resultados apresentados na Figura 11, pode-se notar que a varivel referente
ao envolvimento materno com a criana (carga fatorial padronizada 13 = 0,74 ) exerce uma
maior contribuio na formao do construto psico-social. A varivel referente
disponibilidade de brinquedos (carga fatorial padronizada 22 = 0,73 ) a que exerce uma
maior contribuio na formao do construto relacionado ao ambiente da criana, enquanto
que no construto nutricional a varivel com maior contribuio o peso ao nascer (carga
fatorial padronizada 32 = 0,95 ). Pode-se tambm notar na Figura 11 que os construtos
psico-social e fsico-ambiental apresentam uma correlao positiva significativa ( r = 0,67 ),
os construtos fsico-ambiental e nutricional apresentam uma correlao positiva fraca
( r = 0,08 ), enquanto que os construtos psico-social e fsico-ambiental se correlacionam
negativamente ( r = 0,04 ).

Figura 11: Anlise fatorial confirmatria para desenvolvimento


cognitivo em menores de 48 meses.

A anlise das estimativas no padronizadas desse modelo indica que a maior parte dos
parmetros estruturais da matriz x so significativos (dados no apresentados). Ressalta-se,
no entanto, o fato dos parmetros associados ao construto nutricional no serem
significativos, indicando potencialmente a necessidade de melhor definio deste construto.
As varincias dos erros de mensurao associadas aos indicadores do modelo foram todas

42

significativas (dados no apresentados). Diversos critrios indicam um adequado ajuste dos


dados a este modelo (dados no apresentados).
Diferentemente do exemplo anterior, a varivel endgena observada e mensurada
diretamente, referindo-se ao escore de desempenho cognitivo da criana (IDM). Aqui o
modelo pode ser definido pelas seguintes equaes:
x = x +

x1 11

x2 12
x
3 13
x4 0
=
x5 0
x6 0

x7 0
x 0
8

(20)

0
1

0
0
2

0
0
1 3
24 0 4
2 +
25 0 5
3
26 0 6

0 37
7

0 38
8

Figure 12: Modelo de equaes estruturais para desenvolvimento cognitivo


em menores de 48 meses.

O desempenho cognitivo modelado pela equao


IDM = 11 + 22 + 33 + 1SEXO + 2 IDADE + 1
A Figura 12 representa o diagrama de caminhos que foi utilizado para avaliao do
desempenho cognitivo infantil atravs da modelagem de equaes estruturais utilizando o

43

software Amos. Pode-se identificar que a varivel observada IDM est sendo explicada pelas
variveis latentes fsico-ambiental, psico-social e nutricional e ainda pelas variveis
observadas idade e sexo, sendo que a varivel latente fsico-ambiental ( 2 padronizada =
0,49) aquela que exerce a maior influncia no desenvolvimento cognitivo infantil (IDM),
enquanto que a varivel latente psico-social no se encontra significativamente associada ao
IDM (p = 0, 69).

Figura 13: Diagrama de caminhos para SEM mais complexo para


descrever o desenvolvimento cognitivo infantil.

Considerando-se uma estrutura um pouco mais complexa dessas interrelaes e usando a


notao da SEM, pode-se definir o diagrama de caminhos representado pela Figura 13.
Matricialmente, essas relaes podem ser definidas por:
x = x +

x1 11

x2 12
x = 1
3
x4 0

x5 0

(13)

0
1

0 1 2

0 2 + 3

0 3 4

1
5

0
0
1
0
e

y = y +

(14)

44

y1 21

y2 1
y
3 = 23
y4 0

y5 0
y 0
6

0
1

0
0
2
1

1
0 3
2 +
31 0 4
3
1
0
5


0
1
6

As relaes estruturais do SEM podem ser representadas por:

0 0 1 11 12 0 1 1
1 0



0 0 2 + 0
0 23 2 + 2
2 = 0



3 31 32 0 3 31 32 33 3 3

(15)

As estimativas padronizadas para o SEM descrito em (13), (14) e (15) so apresentadas na


Figura 14. De acordo com esses resultados, o indicador fsico ambiental o que mais
fortemente influencia o ndice de desenvolvimento cognitivo (IDM) de crianas menores de
48 meses ( 31 padronizado = 0,51). Alm do fator ambiental, o fator nutricional e sexo
encontram-se significativamente associados com IDM.

Figura 14: Estimativas para SEM mais complexo para descrever o


desenvolvimento cognitivo infantil.

Analisando-se os critrios de ajuste do modelo apresentados na Tabela 4, pode se notar que

45

ambos os modelos encontram-se bem ajustados, no havendo diferenas importantes nos dois
modelos.
Tabela 4. Critrios de bondade de ajuste para os dois SEMs sobre
desenvolvimento cognitivo.
Valor das estatsticas
Medida de ajuste
Modelo 1 (simples)
Modelo 2 (complexo)
Qui-quadrado/gl
GFI
AGFI
CFI
NFI
RMSEA

1,576
0,967
0,943
0,930
0,837
0,043

1,667
0,967
0,940
0,924
0,837
0,046

4. Consideraes finais
Este trabalho abordou a modelagem com equaes estruturais envolvendo variveis
endgenas contnuas, que possui teoria estatstica j consolidada e tem sido amplamente utilizada em diversas reas do conhecimento. No entanto, vale ressaltar que existe tambm
literatura a respeito de SEM para respostas binrias ou, de maneira mais abrangente,
envolvendo contextos em que o pressuposto de multinormalidade no se aplica (Muthn,
1984).
Outra rea em crescente expanso o uso de SEM para situaes envolvendo estruturas
complexas de dados e que muitas vezes envolve correlao entre mltiplas observaes de
um mesmo indivduo ou entre indivduos pertencentes a um mesmo grupo ou cluster. A
aplicao do SEM em curvas de crescimento (Fergusson, 1997) ou usando a abordagem de
modelagem multinvel (Bauer, 2003) objeto de investigao deste grupo de pesquisa.

46

Referncias Bibliogrficas
AMORIM, Leila D. A. F. Structural equation modeling in epidemiology. Cadernos de Sade
Pblica, Rio de Janeiro, v. 26, n. 12, p. 2251-2262, 2010.
BAUER, Daniel J.. Estimating Multilevel Linear Models as Structural Equation Models,
Journal of Educacional and Behavioral Statistics, [S.l.], n. 28, 135-167, 2003.
BOLLEN, Kenneth. Total, Direct and Indirect Effects in Structural Equation Models,
Sociological Methodology, [S.l.], n. 17, 37-69, 1987.
______. Structural equations with latent variables. New York: Wiley, 1989.
CODES, Ana Luiza Machado de. Modelagem de equaes estruturais: um mtodo para a
anlise de fenmenos complexos. Caderno CRH, Salvador, v. 18, n. 45, p. 471-484, set./dez.
2005.
FARIAS, Salomo A.; SANTOS, Rubens da C. Modelagem de Equaes Estruturais e
Satisfao do Consumidor: uma Investigao Torica e Prtica. RAC, v. 4, n. 3, 107-132,
2000.
FERGUSSON, David M. Annotation: structural equation models in developmental research.
Great Britain: Cambridge University Press, 1997.
FERREIRA, H. S. et al. Sade de populaes marginalizadas: desnutrio, anemia e
enteroparasitoses em crianas de uma favela do Movimento dos Sem Teto, Macei,
Alagoas. Revista Brasileira de Sade Materno Infantil, Recife, n. 2, 177-185, 2002.

FOX, John. Structural Equation Modeling with the SEM package in R. Structural
Equation Modeling: A Multidisciplinary Journal. v.13, n. 3, 465-486, 2006.
HAIR Jr., JOSEPH F.; Anderson, ROLPH E.; TATHAN, Ronald L.; BLACK, William C.
Anlise multivariada de dados. Traduo Adonai Schlup SantAnna e Anselmo Chaves Neto.
5. ed. Porto Alegre: Bookman, 2005.
JACKSON, J. A.; DEZEE, K.; DOUGLAS, K.; SHIMEALL, W. Introduction to Structural
Equation Modeling (Path Analysis). [S.l.]: SGIM Precourse PA08, 2005.
KAPLAN, David. Structural equation modeling. Foundations and extensions. USA: Sage
Publications, 2000. Advanced Quantitative Techniques in the Social Sciences Series, v. 10.
KLINE, Rex B. Principles and practice of structural equation modeling. 2. ed. New York:
The Guilford Press, 2004.
MATOS, Sheila M. A. Prevalncia de enteroparasitoses e sua relao com o estado
antropomtrico na infncia, Salvador-BA. Salvador: ISC/UFBA, 2006. Dissertao de
mestrado em Sade Coletiva. Instituto de Sade Coletiva. Universidade Federal da Bahia.
MUELLER, R. O. Basic principles of structural equation modeling: An introduction to
LISREL and EQS. New York: Springer-Verlag, 1996.
MUTHN, B. O. A general structural equation model with dichotomous, ordered categorical
and continuous latent indicators. Psychometrika, [S.l.], n. 49, 115-132, 1984.
SANTOS, L. M. dos et al. Determinantes do desenvolvimento cognitivo na primeira infncia:
anlise hierarquizada de um estudo longitudinal. Cadernos de Sade Pblica, Rio de Janeiro,
v. 24, n. 2, 427-437, fev. 2008.

47

SCHURMACKER, R. E.; LOMAX, R. G. A Beginners Guide to Structural Equation


Modeling. 2nd ed. New Jersey: Lawrence Erlbaum Associates, 2004.
SOARES, F. Modelo de equaes estruturais. Rio de Janeiro: PUC, 2008. Certificao digital
no 0321214/CA. Disponvel em: <http://www.maxwell.lambda.ele.puc-rio.br/7630/7630_7.PDF>.
Acesso em 27 de julho de 2012.

48

Vous aimerez peut-être aussi