Vous êtes sur la page 1sur 13

QUESTES METODOLGICAS METHODOLOGICAL ISSUES 1

Utilizao de diagramas causais em epidemiologia:


um exemplo de aplicao em situao
de confuso

Use of causal diagrams in Epidemiology:


application to a situation with confounding

Utilizacin de diagramas causales en epidemiologa:


un ejemplo de su aplicacin en situacin
de confusin
Tasa Rodrigues Cortes 1
Eduardo Faerstein 1
Claudio Jos Struchiner 1,2

Resumo

Apesar do crescente reconhecimento de seu potencial, os diagramas cau- 1 Instituto de Medicina Social, Correspondncia
Universidade do Estado do T. R. Cortes
sais ainda so pouco utilizados na investigao epidemiolgica. Uma das Rio de Janeiro, Rio de Janeiro, Instituto de Medicina Social,
possveis razes que muitos programas de investigao envolvem temas Brasil. Universidade do Estado do
2 Programa de Computao Rio de Janeiro.
sobre o qual h certo grau de incerteza sobre os mecanismos dos processos Cientfica, Fundao Oswaldo Rua So Francisco Xavier 524,
que geram os dados. Neste trabalho, a relao entre estresse ocupacional e Cruz, Rio de Janeiro, Brasil. Bloco D, 7 o andar, sala 7012,
Rio de Janeiro, RJ
obesidade utilizada como um exemplo de aplicao de diagramas cau-
20559-900, Brasil.
sais em questes relacionadas ao confundimento. So apresentadas eta- taisacortes@gmail.com
pas da seleo de variveis para ajuste estatstico e da derivao das im-
plicaes estatsticas de um diagrama causal. A principal vantagem dos
diagramas causais tornar explcitas as hipteses adjacentes ao modelo
considerado, permitindo que suas implicaes possam ser analisadas cri-
ticamente, facilitando, dessa forma, a identificao de possveis fontes de
vis e incerteza nos resultados de um estudo epidemiolgico.

Causalidade; Mtodos Epidemiolgicos; Vis (Epidemiologia);


Modelos Estatsticos

http://dx.doi.org/10.1590/0102-311X00103115 Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


2 Cortes TR et al.

Introduo presentam as variveis aleatrias e por arestas


que denotam uma relao entre um par de vari-
Os diagramas causais tm tido uso crescente co- veis. Um grfico direcionado quando todas as
mo uma tcnica unificada para lidar com uma arestas so representadas por uma seta nica e
srie de questes na pesquisa epidemiolgica 1. acclico quando nenhuma ligao entre variveis
Esses modelos grficos proporcionaram novas forma um circuito fechado.
formalizaes para alguns conceitos epidemio- Em um DAG, cada seta possui uma origem
lgicos importantes, como a noo de confundi- (vrtice inicial) e um destino (vrtice final). A va-
mento 2, vis de seleo 3 e vis de informao 4. rivel origem denominada de varivel pai e a
Alm disso, tm sido utilizados como ferramen- varivel de destino chamada de filha. Um ca-
tas auxiliares na anlise de dados faltantes 5 e na minho uma sequncia de arestas adjacentes,
anlise de mediao 6. ou seja, uma sequncia de setas em qualquer di-
Apesar do crescente reconhecimento de seu reo. Se cada aresta em um caminho representa
potencial, os diagramas causais ainda so pouco uma seta que aponta do primeiro para o segun-
utilizados na investigao epidemiolgica. Uma do vrtice, temos um caminho direto. Variveis
das possveis razes que muitos programas de que interceptam o caminho direto entre dois
investigao envolvem temas sobre o qual h vrtices so chamadas de variveis mediadoras.
certo grau de incerteza sobre os mecanismos dos Uma varivel chamada de colisor quando, em
processos que geram os dados. Neste artigo, a um mesmo caminho, duas setas apontam para
relao entre estresse no trabalho e obesidade essa varivel.
utilizada como um exemplo de aplicao dos Se existe um caminho entre dois vrtices re-
diagramas causais em questes relacionadas ao presentados no grfico, ento os vrtices esto
confundimento; seu objetivo no validar ou conectados; caso contrrio, esto desconecta-
contestar hipteses especficas sobre as relaes dos. Se h um caminho direto de A at B, dizemos
entre essas variveis, mas sim utilizar os diagra- que A um ancestral de B, e B um descendente
mas causais para discutir implicaes de diferen- de A.
tes conjuntos de hipteses. So apresentadas eta-
pas da seleo de variveis para ajuste estatstico DAG e causalidade
e da derivao das implicaes estatsticas de um
diagrama causal. Espera-se fornecer subsdios e A utilizao de um DAG na modelagem causal
colaborar para divulgao da tcnica ainda pou- refora a noo de que a causalidade implica
co explorada por pesquisadores brasileiros. direcionalidade de influncia. Vale dizer, que a
relao causal uma relao assimtrica em que
a causa influencia o desfecho e no o oposto. Em
A teoria dos diagramas causais um DAG, a presena de uma seta entre duas va-
riveis X e Y representa a possibilidade de uma re-
Componentes da teoria dos diagramas causais lao causal direta entre essas variveis. Vale res-
foram desenvolvidos em diferentes momentos saltar que qualquer mecanismo causal pode ser
da histria de diferentes reas de conhecimento decomposto em mecanismos mais detalhados e,
7,8. No entanto, a popularizao desses modelos assim, uma causa ser direta ou indireta com
grficos na anlise causal teve incio, especial- relao s outras variveis que compem um
mente, com trabalhos no campo da Inteligncia modelo causal. Por outro lado, as principais hi-
Artificial, desenvolvidos por Pearl 9,10, e na Filo- pteses causais esto codificadas pelas ligaes
sofia 11. (setas) ausentes no diagrama. A ausncia de uma
Os diagramas causais so grficos acclicos seta entre duas variveis X e Y representa a hip-
direcionados que codificam hipteses qualita- tese mais definitiva de efeito causal direto nulo.
tivas sobre os processos causais que geram os Em situaes em que a causao mtua
dados. A seguir so apresentados a terminolo- (ciclos causais) entre eventos possvel, a dire-
gia dos grficos acclicos direcionados, a repre- cionalidade causal pode ser restaurada se a se-
sentao das hipteses causais no grfico e os quncia temporal dos eventos for definida. Por
pressupostos que permitem avaliar como essas exemplo, o ciclo causal entre duas variveis X e Y,
hipteses causais se relacionam com os dados representado na Figura 1a, pode ser decomposto
observados. como uma cadeia de causaes sucessivas entre
instncias dessas variveis no tempo (Figura 1b)
Grfico acclico direcionado e essas representaes podem ser expandidas
para diferentes conjuntos de variveis e diferen-
Um grfico acclico direcionado (Directed Acyclic tes perodos de tempo. Porm, dependendo do
Graph DAG) composto por vrtices que re- sistema causal em estudo e dos objetivos da mo-

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 3

Figura 1 Desse modo, a interpretao causal de um


DAG refere-se capacidade de a estrutura gr-
(1a) Grfico representando o ciclo causal entre duas variveis
fica descrever no somente como o modelo se
X e Y; (1b) Grfico acclico direcionado representando as
comporta em condies normais (ausncia de
relaes entre as variveis X(t) e Y(t) no tempo t.
interveno), mas tambm como o modelo rea-
ge a certas intervenes impostas s variveis
no diagrama.

DAG, causalidade e probabilidade:


a condio causal de Markov

Para que um diagrama tenha alguma finalidade


na epidemiologia, so necessrios pressupostos
que conectem a estrutura causal, representada
pelo DAG, aos dados obtidos em um estudo epi-
demiolgico 15. Essa relao entre causalidade
e probabilidades dada pela condio causal
de Markov 10,11.
Seja G um DAG que representa as relaes
causais entre um conjunto de variveis V e P
uma distribuio de probabilidades para as va-
riveis em V, G e P satisfazem a condio causal
de Markov se cada varivel em V independente
de seus no descendentes (i.e., no efeitos em G)
dado o conjunto de seus pais (i.e., causas diretas
em G).
Assim, a condio casual de Markov impe
restries (na forma de relaes de independn-
delagem, diferentes estratgias de representao cia condicional) sobre a distribuio de proba-
de ciclos causais podem ser adotadas 11,12,13,14. bilidades que pode ser considerada compatvel
O significado dessas noes causais codi- com a estrutura grfica. Ressalta-se que a capa-
ficadas em um diagrama dado pelo conceito cidade de um DAG e uma distribuio de proba-
de interveno. Uma interveno definida em bilidades (P) de satisfazerem a condio casual
Pearl 10 como uma cirurgia atmica que remove de Markov depende de um conjunto de proprie-
inteiramente os mecanismos que determinam dades compartilhadas por ambos. A seguir so
uma varivel, enquanto preserva as demais rela- apresentadas as noes implcitas na condio
es no modelo. Isso , uma interveno imposta casual de Markov:
a uma varivel X aquela que interrompe com- (i) a condio casual de Markov uma genera-
pletamente o relacionamento entre X e seus pais lizao do princpio da causa comum descrito
(causas diretas) e define um novo valor constante por Reichenbach 16. Tal princpio sugere que, se
(X = x). Alm disso, essa interveno cirrgi- duas variveis so probabilisticamente depen-
ca, pois no altera as demais relaes causais dentes, ento uma a causa da outra ou essas
no diagrama. Na linguagem grfica, esse tipo de duas variveis compartilham uma causa em co-
interveno chamado de interveno ideal e mum. Em outras palavras, ignorando a variao
denotado por do (X = x) 10. amostral, no h correlao entre variveis sem
A noo expressa por do (X = x), anloga causalidade;
noo de experimento ideal, tem a funo de (ii) a condio casual de Markov implica a noo
um operador matemtico que permite formali- de localidade da relao causal. De forma geral,
zar e derivar implicaes de diferentes noes essa noo sugere que dado o conhecimento das
causais. Em geral, os parmetros causais envol- causas diretas (mais proximais) de uma varivel,
vem a comparao entre diferentes distribuies as suas causas indiretas (distais) se tornam irre-
de probabilidade para o desfecho sob diferentes levantes para se determinar a sua probabilidade.
intervenes em X. Por exemplo, para dois con- Isso , ignorando os seus efeitos, toda a informa-
juntos disjuntos de variveis X e Y, o efeito causal o probabilstica relevante sobre uma varivel
de X em Y, denotado por Pr(Y | do (X = x)), dado pode ser obtida pelo conjunto contendo todas
pela distribuio de probabilidade de Y quando as suas causas diretas 11. Contudo, na prtica, di-
uma interveno do tipo X = x aplicada sobre ficilmente se tem acesso a todas as causas que
a populao. afetam diretamente uma determinada varivel.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


4 Cortes TR et al.

Em vez disso, sempre que uma causa direta influenciar o desfecho dos demais indivduos
representada em um modelo, um nmero incon- na populao 18.
tvel de causas intermedirias omitida 17. E Outra situao que impe dificuldades a
medida que essas abstraes so feitas, precisa- presena de ciclos causais entre variveis. Uma
se decidir em que fase as propriedades teis pa- das noes implcitas na condio casual de
ra a causalidade so perdidas 10. Desse modo, a Markov que o comportamento dinmico do
condio casual de Markov serve como um guia sistema pode ser decomposto em uma cadeia de
para avaliar quando o conjunto de pais de uma causaes sucessivas entre as variveis no tempo.
varivel considerado completo porque inclui Muitos fenmenos de interesse na epidemiologia
todas as suas causas diretas relevantes; consistem em mltiplos mecanismos interagin-
(iii) um conjunto de variveis considerado cau- do entre si, em diferentes nveis e ao longo do
salmente completo se todas as causas comuns tempo. Considerando que a especificao desses
(mensuradas ou no) entre duas ou mais vari- modelos substancialmente mais exigente, em
veis (no grfico) esto representadas no DAG. alguns casos, poder no ser possvel represen-
Ou seja, se pode-se assumir que as variveis tar a dinmica dessas relaes de causa e efei-
(exgenas) omitidas no grfico so mutuamente to por meio dos DAG. Outras tcnicas baseadas
independentes, ento possvel assegurar que em simulao computacional e modelagem de
as demais relaes causais no codificadas no sistemas oferecem alternativas para o estudo e
DAG no influenciam a distribuio de proba- representao desses fenmenos 19.
bilidades para as variveis no DAG. Desse modo,
o modelo causal (o DAG e o conjunto de distri-
buio de probabilidades) pode ser considera- Resultados: um exemplo de aplicao de
do completo no sentido de ser capaz de explicar diagramas causais em epidemiologia
todas as associaes entre variveis causalmente
independentes (no conectadas por uma seta) A seguir so apresentados DAG hipotticos para
por meio de suas causas comuns. Ou seja, que exemplificar as etapas da derivao das implica-
a estrutura grfica representa todos os determi- es estatsticas de um diagrama causal e da sele-
nantes causais das associaes estatsticas entre o de variveis para controle de confundimento.
as variveis no grfico. Por outro lado, se duas va- Como simplificao, neste exemplo, o cons-
riveis (X e Y) no esto conectadas por uma seta, tructo estresse no trabalho ser considerado co-
espera-se que essas variveis sejam probabilis- mo uma exposio dicotmica e representado
ticamente independentes, dadas as suas causas graficamente por um nico vrtice. No entanto,
comuns. Se X e Y esto associadas na populao, em alguns casos, as variveis mensuradas no
postula-se que h uma relao causal direta (no estudo no correspondero s variveis hipot-
representada) entre essas variveis, ou h uma ticas em uma cadeia causal de interesse. Opera-
causa comum oculta. Vale dizer, que a estrutura cionalmente, pode-se escolher indicadores para
causal considerada incompleta; representar uma varivel de interesse que no
(iv) a condio casual de Markov definida no seja empiricamente observvel ou que no tenha
somente em relao a um conjunto de variveis sido mensurada. Nesses casos, deve-se incluir no
(causalmente completo), mas tambm distri- grfico a varivel latente e seus substitutos.
buio populacional. As relaes probabilsticas Alm disso, assume-se aqui a ausncia de
ditadas pela condio casual de Markov podem erros de mensurao da exposio, desfecho e
ou no ser satisfeitas na distribuio amostral, es- demais covariveis. Entretanto, essa hiptese
pecialmente na presena de vis de seleo. Outra pouco plausvel em estudos epidemiolgicos.
situao que impe restries condio casual Desse modo, diagramas causais realistas devem
de Markov a presena de indivduos com dife- incluir vrtices adicionais para cada varivel
rentes estruturas causais para as variveis do mo- mensurada com erro 4. Em muitos casos tambm
delo. Nesses casos, a distribuio de probabilida- ser necessrio incluir um vrtice no grfico para
de P ser uma mistura de distintas distribuies representar o processo de seleco dos indivduos
resultantes de diferentes estruturas causais 11. (incluindo os procedimentos de seleo no estu-
Por exemplo, em geral, a condio casual de do, perdas de seguimento, no resposta etc.) e in-
Markov no estar satisfeita quando h interfe- dicar as variveis que explcita ou implicitamente
rncia (ou contgio) entre unidades, isso , quan- afetam a seleo 3,20.
do os valores de uma varivel para uma unidade Em muitos casos ser indicado construir mais
influenciam (os valores das variveis de) outras de um grfico acclico direcionado para revelar as
unidades na populao. Como ocorre, por exem- principais incertezas sobre as relaes entre as
plo, quando o desfecho uma doena infecciosa, variveis, incluindo a presena ou ausncia de
e o status da exposio para um indivduo pode setas e a direo das relaes 21.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 5

Na Figura 2a, assume-se, por exemplo, que ligadas por muitos caminhos em um grfico. X e
o efeito do sexo na exposio ao estresse no tra- Y so d-conectadas se houver qualquer caminho
balho mediado por fatores socioeconmicos aberto entre essas variveis. Ento, X e Y so d-
e ocupacionais, como escolaridade, renda e ti- separadas se todos os caminhos que as conectam
po de ocupao. Essas noes esto codificadas esto bloqueados. Um caminho dito bloqueado
no grfico por meio de diferentes caminhos (por por um conjunto de vrtices Z:
exemplo: o caminho entre sexo escolaridade 1) se o caminho contm uma conexo em cadeia
renda estresse no trabalho). (X b Y) ou uma conexo divergente (X b
Na Figura 2b, foi includa uma seta entre cor Y), no qual o vrtice central (b) est contido
da pele/discriminao racial e o estresse no tra- em Z, ou
balho para representar a hiptese causal de que 2) se o caminho contm uma conexo conver-
a cor/raa tem um efeito sobre a exposio ao gente (X c Y) no qual nem o vrtice central
estresse ocupacional. Essa relao putativa pode (c) e nenhum de seus descendentes esto em Z.
ser derivada do aumento dos nveis de estresse, Considere as relaes entre trs variveis, X,
por exemplo, por meio de processos envolven- Y e Z, representadas a seguir. Aplicando o critrio
do discriminao racial no ambiente de traba- de d-separao pode-se concluir se a varivel X
lho. Note-se aqui que alguns autores apontam d-separada de Y, dado Z.
limitaes acerca da varivel cor da pele como X Z Y
marcadora de experincias de discriminao 22. X Z Y
Logo, a escolha inadequada de variveis ou indi- X Z Y
cadores para a representao de constructos (co- Nos dois primeiros casos, X e Y so d-sepa-
mo discriminao racial) tem implicaes para a radas por Z, pois o caminho entre X e Y blo-
validade do modelo considerado. queado quando se condiciona pela varivel
Tambm hipottico que certos traos de intermediria nesse caminho (em 1) ou pela
personalidade podem influenciar escolhas pro- causa comum (em 2). Em outras palavras, uma
fissionais, como tipo de ocupao, e comporta- associao marginal entre duas variveis pode
mentos de sade associados obesidade, como refletir duas estruturas causais distintas ou
a prtica de atividade fsica de lazer e alimenta- h uma relao causal entre essas variveis ou
o. A nova seta ligando escolaridade e estres- essas duas variveis compartilham uma causa
se no trabalho representa a hiptese causal de comum. Todavia, o fluxo de dependncia esta-
que a escolaridade tem um efeito sobre a expo- tstica entre essas variveis bloqueado quando
sio que no mediada pelas demais variveis se condiciona pela varivel intermediria ou pe-
no grfico. la causa comum Z.
Ressalta-se que esses diagramas causais Por outro lado, o caminho representado (em
no so modelos inteiramente adequados para 3) converge em Z, ou seja, Z um vrtice colisor
o tema de pesquisa. As simplificaes adotadas no caminho entre X e Y, e, portanto, esse cami-
visaram facilitar o entendimento da aplicao nho bloqueado. Assim, X e Y so marginalmen-
dos critrios grficos. No entanto, h ferramen- te independentes, j que o nico caminho entre
tas computacionais disponveis 23,24, como o eles bloqueado por um vrtice colisor. Porm,
DAGitty (http://www.dagitty.net), que facilitam quando se condiciona pelo colisor Z (ou por seu
a aplicao desses critrios grficos mesmo em descendente), induz-se uma associao entre as
modelos mais complexos. variveis anteriores das quais ele dependente
(efeito). Portanto, X e Y so d-conectadas por Z.
Implicaes estatsticas de um diagrama Ou seja, uma associao entre duas variveis no
causal: o critrio de d-separao pode ser explicada por um evento no futuro (o
seu efeito), mas quando se condiciona por um
Na seo anterior, foi apresentada a principal efeito comum de duas causas independentes le-
condio (CCM) que permite avaliar como uma va essas causas a se tornarem probabilisticamen-
estrutura causal se relaciona com os dados ob- te associadas, pois se se possui informao sobre
servados. No entanto, uma maneira mais conve- uma das causas, a outra se torna mais ou menos
niente de verificar essa compatibilidade listar provvel, dado que o efeito j ocorreu 10.
as relaes de independncia condicional im- Como demonstrado em Pearl 10, se duas va-
plcitas no DAG, por meio de um critrio grfico riveis X e Y so d-separadas por Z em um DAG
chamado de d-separao 10. G, isso implica que X e Y so condicionalmente
A ideia principal do conceito de d-separao independentes dado Z em toda distribuio de
verificar se o fluxo de dependncia estatsti- probabilidades compatvel com G. Por outro la-
ca est ativo ao longo dos caminhos que ligam do, se X e Y so d-conectadas por Z em um DAG
as variveis 17. Duas variveis X e Y podem estar G, ento X e Y so condicionalmente dependen-

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


6 Cortes TR et al.

Figura 2

(2a) Grfico acclico direcionado representando hipteses sobre as relaes entre exposio, desfecho e demais covariveis;
(2b) Grfico acclico direcionado representando hipteses alternativas.

Nota: crculo indica que a varivel no foi mensurada.

tes dado Z em, pelo menos, uma distribuio de do diagrama causal da Figura 2a, por meio dos
probabilidades compatvel com G. critrios de d-separao. Em seguida, essas re-
A aplicao do critrio de d-separao pode laes estatsticas podem ser avaliadas pelo uso
se tornar uma tarefa difcil quando a estrutura de alguma classe de teste de independncia
grfica contm um grande nmero de vrtices condicional 11.
e ligaes (setas). Nesses casos, recomendado Se as implicaes testveis no so validadas
a utilizao de softwares especficos, como o pelos dados, ento o DAG pode no ser uma re-
DAGitty, que permitem verificar as implicaes presentao acurada dos processos causais que
estatsticas do modelo 23. geram os dados. Uma vez que a estrutura cau-
A Figura 3 apresenta as relaes de inde- sal correta no pode ser inferida por meio de
pendncia condicional definidas pela estrutura informaes puramente probabilsticas, o pes-

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 7

Figura 3

Relaes de independncia condicional implcitas no diagrama da Figura 2a.

Implicaes testveis

Estresse no trabalho cor da pele/discriminao racial | idade, renda, ocupao


Obesidade cor da pele/discriminao racial | escolaridade, estresse no trabalho, idade, renda, sexo
Obesidade cor da pele/discriminao racial | escolaridade, idade, renda, sexo, ocupao
Ocupao cor da pele/discriminao racial | escolaridade, sexo
Estresse no trabalho escolaridade | idade, renda, ocupao
Estresse no trabalho sexo | idade, renda, ocupao
Renda idade | cor da pele/discriminao racial, escolaridade, sexo
Obesidade ocupao | escolaridade, estresse no trabalho, idade, renda, sexo
Ocupao idade | escolaridade, sexo

Nota: o smbolo indica independncia estatstica.

quisador deve avaliar cuidadosamente as estra- Seleo de variveis para ajuste estatstico:
tgias de modificao do modelo. Ou seja, alm o critrio da porta de trs
das questes relacionadas aos testes de hipte-
ses, em especial a possibilidade de erros do tipo I Pearl 10 sugere a notao Pr(Y | do(X = x)) e Pr(Y |
e tipo II, deve-se considerar que um mesmo con- X = x) para distinguir entre a distribuio de pro-
junto de relaes de independncia condicional babilidade condicional dada uma interveno
consistente com mltiplos grficos. em X e dada a observao passiva de X, respecti-
Como descrito em Greenland 20, para cada vamente. O primeiro reflete como a distribuio
par de vrtices (X e Y) representado no grfico, de Y deve ser modificada, dada a informao de
assume-se um conjunto de hipteses nulas que que X tenha sido manipulado, por alguma inter-
inclui: (i) ausncia de causas em comuns entre veno externa, a assumir o valor x, enquanto a
X e Y no representadas no DAG; (ii) ausncia de segunda reflete como a distribuio de Y deve ser
associao induzida entre X e Y devido ao condi- modificada, dado que se verifica que X = x.
cionamento por um efeito em comum no repre- Em geral, no se espera que uma interveno
sentado no DAG; e (iii) se X e Y no so adjacentes no fator de exposio produza o mesmo efeito
(nem X Y ou X Y), ento no h efeito causal que a observao da exposio. Uma das razes
direto entre essas variveis. para essa distino refere-se presena de ca-
Nenhum desses pressupostos pode ser tes- minhos no causais que ligam a exposio (E) e
tado isoladamente por meio dos dados. Desse o desfecho (D). Em um diagrama, os caminhos
modo, a ausncia de suporte emprico para es- diretos entre E e D representam a associao cau-
sas hipteses representadas em um diagrama sal entre essas variveis, enquanto os caminhos
implica, muitas vezes, a necessidade de re- no diretos entre essas variveis podem repre-
laxamento dos pressupostos causais. Assim, sentar uma fonte de associao espria. Esses ca-
muitos temas de investigao podem exigir minhos no causais so chamados de caminhos
diagramas causais complexos, incluindo um pela porta de trs (i.e., caminhos que comeam
grande nmero de ligaes (setas) e vrtices pa- com uma causa direta de E seta pela porta de
ra representar variveis latentes, erros de men- trs e terminam em D). O fluxo de dependncia
surao e seleo nas anlises 20. Como conse- estatstica entre esses caminhos estar ativo se,
quncia, a avaliao prvia desses modelos (e a e somente se, esses caminhos contm um an-
identificao dos parmetros causais) pode se cestral (causa) comum de E e D 2,10. Ou seja, h
tornar difcil. confundimento quando a exposio e o desfecho
compartilham uma ou mais causas em comum.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


8 Cortes TR et al.

Para o controle de confundimento neces- geralmente resultar em uma associao entre


srio selecionar um conjunto de covariveis que essas duas variveis. Essa associao entre E e D
permita bloquear todos os caminhos pela porta induzida por S considerada como vis por con-
de trs, enquanto mantm desbloqueados todos ta do condicionamento por um colisor (collider
os caminhos causais que ligam a exposio e o stratification bias) 28;
desfecho. b) Em seguida, junte com uma linha pontilhada
As principais estratgias tradicionais de se- quaisquer variveis que apresentam uma filha
leo dessas covariveis envolvem combinaes em comum que esteja contida em S, ou que te-
de critrios tericos e estatsticos, como os crit- nha um descendente em S. Ou seja, a ligao en-
rios tradicionais para definio de confundido- tre duas variveis por meio da linha pontilhada
res 25, abordagens baseadas em procedimentos representa as associaes induzidas em razo do
automticos de seleo de variveis, como as ajuste por S. Essas associaes induzidas repre-
tcnicas do tipo stepwise e outros critrios que sentam novos caminhos que ligam a exposio
envolvem a noo de no colapsibilidade de uma ao desfecho e, portanto, devem ser includos no
medida de efeito 25. novo grfico;
Alguns autores tm demonstrado que todas c) No novo grfico, verifique se existe um cami-
as trs estratgias podem levar a concluses nho aberto de E para D, que no passa atravs
inadequadas, devido omisso de importantes de um elemento de S. Ser considerado como
fatores de confuso ou devido ao ajuste impr- um conjunto suficiente se essas variveis con-
prio para no confundidores 3,15,26. Diferentes tidas em S bloqueiam todos os caminhos (no
tipos de variveis, como variveis intervenien- causais) que ligam a exposio ao desfecho. Para
tes e colisores, podem comportar-se estatistica- isso, todos os caminhos abertos (caminhos que
mente como fatores de confuso, ainda que, de no contm colisores) que ligam a exposio ao
fato, no o sejam. Por tal razo, a compreenso desfecho devem ser interceptados por uma va-
da estrutura causal um passo essencial quando rivel que esteja contida em S.
pretendemos determinar se a incluso de uma Considerando-se os diagramas causais na
determinada covarivel no conjunto para ajuste Figura 2, pode-se testar, por exemplo, se as vari-
passvel de reduzir ou aumentar o vis na esti- veis idade, sexo e renda so suficientes para con-
mativa de efeito 27. trole de confundimento. Nas Figuras 4, 5 e 6 so
Neste trabalho, considerada apenas a ava- apresentados novos grficos para cada aplicao
liao do efeito total de uma exposio e um do critrio da porta de trs.
desfecho. No entanto, esses critrios podem ser Na Figura 4, verifica-se que o ajuste por es-
generalizados para considerar mais de uma ex- sas variveis insuficiente para o controle de
posio e/ou desfecho. Anlises de efeitos dire- confundimento, pois alguns dos caminhos pela
tos e indiretos necessitam de regras adicionais porta de trs que ligam a exposio ao desfecho
descritas em Pearl 6. permaneceriam desbloqueados. Nota-se que al-
Como descrito em Pearl 10, um conjunto de guns dos caminhos bloqueados (por exemplo,
variveis S satisfaz o critrio da porta de trs estresse no trabalho ocupao renda cor
com relao a uma exposio (E) e um desfecho da pele/discriminao racial escolaridade
(D) em um DAG se: (i) S no contm nenhum obesidade) se tornam ativos por causa do ajuste
descendente de E; e (ii) as variveis em S blo- por um vrtice colisor (renda). Como todos es-
queiam todos os caminhos entre E e D que con- ses caminhos passam pelos vrtices escolarida-
tm uma seta apontando para E. Essas noes de e ocupao, ento a incluso de apenas uma
podem ser identificadas por meio do seguinte dessas covariveis no conjunto para ajuste ser
algoritmo grfico 2: suficiente para o controle de confundimento.
a) Remova todas as setas que se originam da Alm disso, se a cor da pele/discriminao ra-
exposio. Em primeiro lugar, o conjunto S no cial est relacionada com o estresse no trabalho
deve conter nenhum descendente da exposio, apenas atravs de seus efeitos sobre a renda e
isto porque, ao condicionar por algum efeito da escolaridade, ento o ajuste para esta covarivel
exposio que seja interveniente na relao entre ser desnecessrio.
a exposio (E) e desfecho (D) ser bloqueado Ou seja, mesmo que um conjunto de vari-
algum dos caminhos causais que ligam E a D. veis seja considerado suficiente para o controle
Alm disso, ao condicionar por efeitos da exposi- de confundimento, em algumas situaes pode
o, pode-se desbloquear ou criar caminhos que ser desnecessrio controlar por todas as variveis
no fazem parte do efeito de E em D, podendo, selecionadas 2. Dessa forma, pode-se verificar se
portanto, introduzir vis. Por exemplo, se uma existe um conjunto com menor nmero de vari-
covarivel em S um efeito comum da exposi- veis e que tambm seja suficiente para o controle
o e do desfecho, a anlise condicionada por S de confundimento.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 9

Figura 4

Grfico representando a aplicao do critrio da porta de trs no diagrama da Figura 2a. O conjunto para ajuste contm as
variveis idade, sexo e renda.

Nota: setas em negrito, destacam-se os caminhos pela porta de trs desbloqueados.

Um conjunto mnimo suficiente o menor tes para bloquear todos os caminhos pela porta
conjunto de variveis capaz de bloquear todos os de trs que ligam a exposio ao desfecho. Alguns
caminhos pela porta de trs que ligam a exposi- desses caminhos incluem a varivel escolaridade
o ao desfecho 10. Uma forma de determinar se (por exemplo, estresse no trabalho escolari-
existe tal conjunto mnimo e suficiente excluir dade personalidade obesidade), os demais
algumas variveis do conjunto candidato para o caminhos so interceptados pelo vrtice cor da
ajuste e aplicar novamente os passos anteriores. pele/discriminao racial (por exemplo, estresse
No diagrama da Figura 2a, com a aplicao no trabalho cor da pele/discriminao racial
do critrio da porta de trs, so obtidos quatro personalidade obesidade). Assim, a incluso
conjuntos suficientes para controle de confun- dessas duas covariveis no conjunto para ajuste
dimento S1 = idade, sexo, renda, escolaridade, ser suficiente para controle de confundimento.
ocupao e cor da pele/discriminao racial; S2 Da mesma maneira, o ajuste para as variveis
= idade, renda, escolaridade, ocupao e cor da em Sm2 no mais suficiente para controle de
pele/discriminao racial; S3 = idade, sexo, renda, confuso (Figura 6), pois os caminhos que ligam
escolaridade e cor da pele/discriminao racial; o estresse no trabalho obesidade, por meio de
S4 = idade, renda, ocupao e cor da pele/discri- uma causa comum no observada (personalida-
minao racial e dois conjuntos mnimos e su- de), permanecem desbloqueados. Como esses
ficientes, Sm1 = idade, renda e ocupao e Sm2 = caminhos passam pelo vrtice ocupao, ento
idade, sexo, renda e escolaridade. constata-se que necessrio incluir essa covarivel no conjunto
um conjunto contendo todas as causas diretas para ajuste. Portanto, se a estrutura causal repre-
da exposio ser considerado suficiente, mas sentada na Figura 2b est correta, ento os con-
em alguns casos no ser um conjunto mnimo. juntos (mnimos), Sm3 = i idade, renda, ocupao,
Considerando as hipteses alternativas re- escolaridade e cor da pele/discriminao racial e
presentadas no diagrama da Figura 2b, pode-se Sm4 = idade, sexo, renda, escolaridade e ocupao
testar se esses conjuntos mnimos (Sm1 e Sm2) so suficientes para controle de confundimento.
continuam sendo suficientes para controle Nos exemplos anteriores, criou-se a hiptese
de confundimento. de que a relao entre a varivel latente (perso-
Como demonstrado na Figura 5, se a escola- nalidade) e o estresse no trabalho mediada pe-
ridade e a cor da pele/discriminao racial esto lo tipo de ocupao. Todavia, se a personalidade
relacionadas com o estresse no trabalho por meio tem um efeito direto na exposio ao estresse no
de outros caminhos que no incluem a renda, trabalho, alguns dos caminhos pela porta de trs
ento as variveis em Sm1 no so mais suficien- incluiro uma varivel no observada, impossi-

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


10 Cortes TR et al.

Figura 5

Grfico representando a aplicao do critrio da porta de trs no diagrama da Figura 2b. O conjunto para ajuste contm as
variveis idade, renda e ocupao.

Nota: setas em negrito, destacam-se os caminhos pela porta de trs desbloqueados.

Figura 6

Grfico representando a aplicao do critrio da porta de trs no diagrama da Figura 2b. O conjunto para ajuste contm as
variveis idade, sexo, renda e escolaridade.

Nota: setas em negrito, destacam-se os caminhos pela porta de trs desbloqueados.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 11

bilitando o ajuste estatstico. Contudo, mesmo tfico disponvel impem algumas dificuldades
na presena de tais confundidores no mensu- para a construo e a utilizao desses modelos.
rados, pode-se, s vezes, concluir que o efeito de Algumas dessas dificuldades podem ser mi-
uma exposio identificvel. Um mtodo geral nimizadas mediante estratgias adotadas duran-
para identificar conjuntos suficientes para ajuste te a fase de planejamento do estudo. Nesta fase,
estatstico foi desenvolvido por Shpitser 17. o exerccio de construo de modelos causais
Outra questo importante a necessidade de plausveis bem como a reflexo cuidadosa sobre
determinar se dois conjuntos candidatos para hipteses alternativas permitiro, por exemplo,
ajuste possuem o mesmo potencial de reduo de identificar mais facilmente os dados necessrios
vis. Para o grfico apresentado na Figura 2a, com para responder a uma determinada pergunta
a aplicao do critrio da porta de trs, obtm-se de pesquisa, assim como o desenho de estudo
dois conjuntos mnimos suficientes para o ajuste mais apropriado. A construo desses modelos
estatstico (Sm1 = idade, renda e ocupao e Sm2 pode ser vista como um processo circular, pois,
= idade, sexo, renda e escolaridade). Se a estrutu- medida que algumas hipteses so falsificadas e
ra causal representada no diagrama est correta, novas evidncias so obtidas, essas informaes
ento os dois conjuntos de covariveis impli- podem ser combinadas para construir e atualizar
cam a mesma reduo do vis de confuso 10. os modelos causais.
No entanto, outros aspectos como dimensiona- Alm disso, a utilizao desses diagramas na
lidade, erros de mensurao e variabilidade da comunicao dos resultados permite que mode-
amostra so passveis de influenciar a estimativa los concorrentes possam ser comparados, faci-
de efeito 29. Contudo, a natureza no paramtrica litando a identificao de possveis explicaes
dos diagramas causais implica que alguns desses para resultados inconsistentes encontrados na
fatores no podem ser facilmente considerados literatura. Contudo, como estruturas causais di-
pela teoria grfica bsica. ferentes nem sempre resultam em concluses
Com base nas formalizaes tericas apre- distintas sobre confundimento, a comparao
sentadas em Pearl & Paz 29 e Greenland & Pearl 30, entre diagramas causais pode facilitar a identifi-
abordagens alternativas para seleo de variveis cao de outras possveis fontes de vis e incer-
para ajuste tm sido propostas utilizando a com- teza na interpretao dos resultados do estudo.
binao de diagramas causais e procedimentos Nesse contexto, ressalta-se que a comunicao
estatsticos tradicionais 21. no transparente de qualquer incerteza sobre os
Os diagramas causais podem ainda gerar modelos adotados pode contribuir para subesti-
concluses teis, mesmo em situaes nas quais mao da incerteza e para uma falsa percepo
no possvel identificar um conjunto suficiente de testabilidade do modelo, assim como pode
de variveis para o controle de confundimento. impedir ou limitar a sua considerao pela co-
Por exemplo, quando o controle para fatores de munidade cientfica.
confuso inadequado, resultados qualitativos, Por fim, destaca-se que, independentemente
como a direo do vis, podem ser obtidos, em da abordagem utilizada, a inferncia causal em
certos casos, por intermdio de diagramas cau- estudos observacionais quase sempre ser um
sais valorados 31. Na presena de mltiplos vie- exerccio desafiador, e a identificabilidade de um
ses, outras estratgias quantitativas podem ser parmetro causal sempre depender da validade
adotadas. Greenland 32 apresenta uma reviso do modelo considerado.
sobre diferentes tcnicas para modelagem de
vis na anlise de estudos observacionais.

Consideraes finais

A anlise causal em estudos observacionais re-


quer, ao menos, duas fontes de informao:
dados empricos e pressupostos causais. Nesse
contexto, a principal contribuio da teoria dos
diagramas causais oferecer uma nova lingua-
gem para a comunicao desses pressupostos
e permitir caracterizar o que pode e no pode
ser apreendido, dado o conjunto de premissas
escolhidas.
Porm, as limitaes prticas relacionadas ao
que pode ser observado e ao conhecimento cien-

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


12 Cortes TR et al.

Colaboradores

Todos os autores participaram do planejamento, da ela-


borao e da redao da verso final do manuscrito; T.
R. Cortes teve a responsabilidade primria pelo conte-
do final.

Referncias

1. Glymour MM, Greenland S. Causal diagrams. In: 14. Gebharter A, Kaiser MI. Causal graphs and biologi-
Rothman KJ, Greenland S, Lash TL, editors. Mod- cal mechanisms. In: Kaiser MI, Scholz O, Plenge D,
ern epidemiology. 3rd Ed. Philadelphia: Lippincott Httemann A, editors. Explanation in the special
Williams & Wilkins; 2008. p. 183-209. sciences: the case of biology and history. New York:
2. Greenland S, Pearl J, Robins JM. Causal diagrams Springer; 2014. p. 55-85.
for epidemiologic research. Epidemiology 1999; 15. Robins JM. Data, design, and background knowl-
10:37-48. edge in etiologic inference. Epidemiology 2001;
3. Hernn MA, Hernandez-Diaz S, Robins JM. A 12:313-20.
structural approach to selection bias. Epidemiol- 16. Reichenbach H. The philosophy of space and time.
ogy 2004; 15:615-25. New York: Dover; 1958.
4. Hernn MA, Cole SR. Invited commentary: causal 17. Shpitser I. Complete identification methods for causal
diagrams and measurement bias. Am J Epidemiol inference [Tese de Doutorado]. Los Angeles: Univer-
2009; 170:959-62. sity of California; 2008.
5. Daniel RM, Kenward MG, Cousens SN, De Stavo- 18. Ogburn EL, VanderWeele TJ. Causal diagrams for in-
la BL. Using causal diagrams to guide analysis in terference. Stat Sci 2014; 29:559-78.
missing data problems. Stat Methods Med Res 19. Auchincloss AH, Roux AVD. A new tool for epidemiol-
2012; 21:243-56. ogy: the usefulness of dynamic-agent models in un-
6. Pearl J. The causal mediation formula a guide derstanding place effects on health. Am J Epidemiol
to the assessment of pathways and mechanisms. 2008; 168:1-8.
Prev Sci 2012; 13:426-36. 20. Greenland S. Overthrowing the tyranny of null hy-
7. Wright S. Correlation and causation. J Agric Res potheses hidden in causal diagrams. In: Dechter R,
1921; 20:557-85. Gerffner H, Halpern JY, editors. Heuristics, prob-
8. Haavelmo T. The statistical implications of a sys- ability and causality: a tribute to Judea Pearl. Lon-
tem of simultaneous equations. Econometrica don: College Publications; 2010. p. 365-82.
1943; 11:1-12. 21. Evans D, Chaix B, Lobbedez T, Verger C, Flahaut
9. Pearl J. Causal diagrams for empirical research. A. Combining directed acyclic graphs and the
Biometrika 1995; 82:669-88. change-in-estimate procedure as a novel ap-
10. Pearl J. Causality: models, reasoning and infer- proach to adjustment-variable selection in epide-
ence. Cambridge: Cambridge University Press; miology. BMC Med Res Methodol 2012; 12:156.
2000. 22. Krieger N, Sidney S, Coakley E. Racial discrimina-
11. Spirtes P, Glymour C, Scheines R. Causation, pre- tion and skin color in the CARDIA study: implica-
diction, and search. New York: Springer Verlag; tions for public health research. Coronary Artery
1993. Risk Development in Young Adults. Am J Public
12. Aalen O, Borgan O, Gjessing HK. Survival and event Health 1998; 88:1308-13.
history analysis: a process point of view. New York: 23. Textor J, Hardt J, Knppel S. DAGitty: a graphical
Springer; 2008. tool for analyzing causal diagrams. Epidemiology
13. Clarke B, Leuridan B, Williamson J. Modelling 2011; 22:745.
mechanisms with causal cycles. Synthese 2014;
191:1651-81.

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016


UTILIZAO DE DIAGRAMAS CAUSAIS EM EPIDEMIOLOGIA 13

24. Knuppel S, Stang A. DAG program: identifying 29. Pearl J, Paz A. Confounding equivalence in obser-
minimal sufficient adjustment sets. Epidemiology vational studies (or, when are two measurements
2010; 21:159. equally valuable for effect estimation?). In: Pro-
25. Kleinbaum DG, Kupper LL, Morgenstern H. Epi- ceedings of the 26th Conference on Uncertainty in
demiologic research: principles and quantitative Artificial Intelligence. Corvallis: Association for Un-
methods. New York: Wiley; 1982. certainty in Artificial Intelligence; 2010. p. 433-41.
26. Hernn MA, Hernndez-Daz S, Werler MM, 30. Greenland S, Pearl J. Adjustments and their con-
Mitchell AA. Causal knowledge as a prerequisite sequences collapsibility analysis using graphical
for confounding evaluation: an application to models. Int Stat Rev 2011; 79:401-26.
birth defects epidemiology. Am J Epidemiol 2002; 31. VanderWeele TJ, Hernn MA, Robins JM. Causal
155:176-84. directed acyclic graphs and the direction of un-
27. Shrier I, Platt RW. Reducing bias through directed measured confounding bias. Epidemiology 2008;
acyclic graphs. BMC Med Res Methodol 2008; 8:70. 19:720-8.
28. Greenland S. Quantifying biases in causal models: 32. Greenland S. Multiple bias modelling for analysis
classical confounding vs collider-stratification bi- of observational data. J R Stat Soc Ser A Stat Soc
as.Epidemiology 2003; 14:300-6. 2005; 168:267-306.

Abstract Resumen

Epidemiological research still rarely uses causal dia- A pesar del creciente reconocimiento de su potencial,
grams, despite growing recognition of their explanato- los diagramas causales todava se utilizan poco en la
ry potential. One possible reason is that many research investigacin epidemiolgica. Una de las posibles ra-
programs involve themes in which there is a certain zones es que muchos programas de investigacin estn
degree of uncertainty as to mechanisms in the process- involucrados en temas sobre los cuales existe un cierto
es that generate the data. In this study, the relationship grado de incertidumbre acerca de los mecanismos de
between occupational stress and obesity is used as an los procesos que generan los datos. En este trabajo, la
example of the application of causal diagrams to ques- relacin entre estrs ocupacional y obesidad se utiliza
tions related to confounding. The article presents the como un ejemplo de aplicacin de diagramas causales
selection stages for variables in statistical adjustment en cuestiones relacionadas con la confusin. Se pre-
and the derivation of a causal diagrams statistical sentan etapas de la seleccin de variables para el ajus-
implications. The main advantage of causal diagrams te estadstico y de la derivacin de las implicaciones
is that they explicitly reveal the respective models un- estadsticas de un diagrama causal. La principal ven-
derlying hypotheses, allowing critical analysis of the taja de los diagramas causales es hacer explcitas las
implications and thereby facilitating identification of hiptesis adyacentes al modelo considerado, permi-
sources of bias and uncertainty in the epidemiological tiendo que sus implicaciones puedan ser analizadas
studys results. crticamente, facilitando, de esta forma, la identifica-
cin de posibles fuentes de sesgo e incertidumbre en los
Causality; Epidemiologic Methods; Bias resultados de un estudio epidemiolgico.
(Epidemiology); Statistical Models
Causalidad; Mtodos Epidemiolgicos; Sesgo
(Epidemiologa); Modelos Estadsticos

Recebido em 26/Jun/2015
Verso final reapresentada em 19/Fev/2016
Aprovado em 11/Mar/2016

Cad. Sade Pblica, Rio de Janeiro, 32(8):e00103115, ago, 2016

Vous aimerez peut-être aussi