Académique Documents
Professionnel Documents
Culture Documents
~
:.,
:::.:
,;..
.,;.
r~"
14.
;::..
;,-,,:
;;1:
"~
~...
J ~'"':
~~',
..~;
~,
.:
!':':.
~
;,.,
~
fi
317
~
j~;~t:t~~~~~'
--
r.iJ
I
31p EPIDEMIOLOGIA
MODERNA
<.:;pitui('s dc c~tl' libro podrian haber sido aplicados, pero se los dej de
lild() Cl1 r;\.or dcl anillisi~ multivariado y con otras en las que se aplica a
I(IS diltos \';rios modclos multivariados. cu~lndo con uno o dos habria
,id(, c;uli<.:icI1IC, Al cridemilogo. de el1lrada. le merece m~ la pena
ilrl'~;rsl:. ~icl11prc quc rue~c posible. el1 lo.c; procedimientos del anlisis
~,lr;tili<.:ildo. quc ~on m.c; directo~ y que en~endran una mayor familiari-
(l;d l\)11 I()s dato~ tanto p~lr.1 el inve~tigador como para e] Icctor.
( "u;l1d(, e] citad() anilli~ic; estratific~ld(' sr h~lce impracticable. el mul-
11\.ariild() es il1dudahlcmel1tc lJtil com(' ahordaie allalitico. La viahilidad
(I~ 111.'\ar .1 c;h() cl cstr~ltilicadt' depelldc del numero de subcategoria.c; a
1\, I;r!!(' d~ las cualc.C\ hclyil quc dispcr~l.lr It).c; datos: s son demasiado
I1UIll~rl)Sol.'i. los datos qucdariln e~troltilicoldo~ de rorma en extremo delga-
d:\ il II' l;rl1l'
-~ dc dich:ls suhcatc{!oria.c; \ el al1i\lisi.c; se volver ineficiente
..
1(, 1.1111.. c~ i() llli~nl(1 que decir quc lo.c; estim.ldo.c; resultante~ sern impre-
cisos. r;1 an:ilisis lllui\i\'ariad() proporciona una manera de preservar la
precisil)n al ticmp<) que se controlan mucha.c; variables. postulando un
m(,dc]<1 miltcmiltico quc permitc utilizar lo.c; d~lto~ de modo ms eficiente
paril e~timilr simultilneolmente mucho~ erectos. La medida en quc e~te
!.'r<)<.:cso al1:lli\ico repre~el1tc uno\ me.ior:l el1 la eficiencia. y no slo un
s<.:s~('. dcpcl1dc dc la adccuacin
IllIIl'I(1 mil\Cmiltico.
dc las .lsuncione.c; incorporadas
Un :lnilli.c;i.c; es\ratilicoldo. quiz(i.c; limitado
en el
a alguna~
I t
\.ilriilhlcs cl;vc. coIl~tituye con rrecuenci:l UI1 priogo sensato del multi-
~
\.ilriaI). rlle~\O quc ruede arro.iar luz ~ohre cl groldo el1 que los dato.c; se
rnllCS\roln col1rorme~ COI1 la~ aSUI1CiOlle~ dc un modelo multivariado I
!.'articular. Pese iI que c()nsumc mil~ tiempo. una combinl.-lci()n de estrate-
!-!ias analitica.c; suc!c ser mi\s rructircra el1 cuanto a dar pistas sobre los
(lato~ qUl' cuo\lquicr ahorda.ic por scraroluo. I
<.'ul.lndo se ha ortoldo par un anlisis multi\'ariado. el tiempo que se
cmrlca en rll.lnilicar la con~\rucci()n dc UI1() () UI1O~ pocos modelos de e~te
\ir(). el1'\"e7 de ordcn~\r por la~ buenas la generacin de ,'arios direrentes. .I'
I
tt.'lldrii C"l)mO producto trab~l.iar meno~ ~. con resultados ms claros. En
1;.; 111l'.i(:\tescircunstancia~. e] producto final seri\ un resumen elegante de
1{" d;t()s. dt=~cribiend() la.c; complicadas
mul'h;~ \"ariablc.c;.
il1\errelaciones existentes entre I
r:n su scl1tid() mil~ I.lmplio. anlisis multi\'ariado es cualquier anlisis
lll' dat('1~ que tom; mucha~ \'ariablc.c; en cuenta. Un concepto unificador
qll~ c;l1h~.ace a sus diferen\es \iras e.c;el uso de un modelo matemtico
quc rcsp()l1dc dc 1.1 intcrrelacin en\re la.<; ,'ariables del anlisis. Las
l.<.:II;<.:i(,nl'~ pr()hilhilisticas prcscntad.\s en el captulo 12 para estimar
n)l'Jid;s l.,.'idcmi(l!cI!!iL':ls dcl crc<.:t<,;llliem!.'(' que se conlrolaha 11.1conru-
sic,I\. SI)I\ c.icmplos dc I()s 1111)dcl<).<;miltcm:i\icos que constituyen un
:In:i!ic;i~ multi\.ariad(). MIICh<ls Olr()S Il:ln .'ij<lo desarrollados. h.lbilual-
11\~ntl.. <.:011!.'ropi)sil<)S c~pl:ciali7.ados. El oln.iiisi.<; por ractores. por e.icm- I
pl(\. es \In:l mctotl()lo~ia cOI1Cebid.l rara c()I~lpsar UI} nmero grande de
\.ilriilhlc~ predictoras CIl otr{) nlti.c; pequeo de factore~) que representan
suh!:!ruros corrclacionatlo~ del con.iunt<' dc volriables origil1al. El an{ilisis
dl' sl'rics tcmporolle~ cs UI1 mctodo diri~id() a evaluar la asociacin entre
~.~"'.!:~...,::,.":.;.; ,..':;.;~'-c.~~T~~.:'-:{:
.:~
;~~;
~~~1
c.;.~.: :,:,:.."'...;.,.;,~"
.--1.~*"~/.<~ ,..~ "
~-
~
] lt:mp()r,llcs.
1:1 ,111illi~is 111t1ltivari,ldo es un lema avanzado que ha sido objeto de
IIIUI:II~}S lihr(}s. lJn,l discusin plenu de sus aplicacioncs resulta impo~ible
a<lui. !)()r I:Onlr,l. el objetivo de este caplulo es describir en trminos
I SClIl:ill(}s los m(}delo~ matemticos
I.:stra tC!:!i,l q tiC el epidemilogo
bsicos que se utilzan y discutir
debe adoptar para construir e interpretar
la
1 111(}dcl(}s multivarildos.
j
IfIJ(,/fl 1;,I('fll
1:1 Il\odcll) lI\;is rulldamental que describe la relacin entre dos variables
cs la lilll:~1 re(;ta. E! modelo lil\eal par~1 dos de dichas variables sirve de
Irall\p()lill para l)lrOS lI\is (;u11\pli(.;ados. entre dos o ms de ellas. La
l:(;lla(;i(,ll dc la lillCa recIa que rclaciona dos variables tiene dos parme-
Ir(I,. f(lrllllllilU()' !lahilualmcnlc como 1.1 intercepcin. o constante y la
pcndicl1lc. o cucli(;icnte-:
\', Ih' T. J
a
i~
f:~:l~~~~.1~*~~
!ffl' ..,~..~w'
t~~~~
~;;:' r*;~~~~~~
,,!,~:' ~t.~~~
;;-
:~~1l~~f~
~IJ
~:
1 ri.
~~
~t
r,,:
32(! EPIDEMIOLOGIA MODERNA
,-,
.,.
~;
;;I:
.
:;:.c
I [:,
x +x,
;
"
;
;
i
!
-y
Fig. 14. I{('"r(',\('///(/("iril/ ,f!r(ifl("11 (Ir' J(/ ('("/,(I("i,i/1 tiC' /(1/{/ J;//('11 r('C1a
cana como para quc .c;can razonable~ la~ inferencia~ que se extraen
s()hre II ba.c;e dcl mismo. L(1 separacin de los datos respecto del
modclo puede rene.iar una discrepancia entre este ~. la naturaleza. as
como fuentes de inexactitud (1 I~! hor:l de obtener la informacil)n. Un
(,h.ictiv() scnsato consiste en ele.1:!ir UI1 m('dl'lo que se a.iuste a los dato~
Sllficicntcmcnte como para quc la milyor fucntc de scparacin dc los mi~-
m()s con rcspccto al modelo pr()\,en~a de inexactitudes inherentes a ellos
: n() dc I() inapropiado de ste.
La figura 14.2 ilustra una relacin casi lineal entre el nmero de ;
~
ci!:!arrillos fumados al dia y la mortalidad por cncer laringeo estanda- ,
"
rizada por edades (Rothman ('I al.. 1980). Raras veces siguen unos .,
t
datos epidemiolgicos un patrn lineal de forma tan cercana como stos. .~
1
Cuando las obser\'aciones no caen exactamente sobre una lnea, pero ,...
siguen mostrundo un patrn bsicamente lineal a pesar de una cierta ;i
~~~~~~~~~i~li~;
,."".,
",~'
~~ir~
::<~:::;;~~i~ik~~
(~:
ANALISIS MUlTlvARIA[Ja 321
~
~
~
~
c
':J
01
~
U)
~
~
I
N
"t:
~
-0
C
~
t
~
~
I
:2
m
~
O
~
o 10 20 30 40 50
Cigarrillos fumados al da
Fig. 14.2. M orlalidad c.\'la1ld{"i:oda por ('{1{/{1d('hi{lo o ('(i1l{'('r lar1l,r:('o, ,\,('ltli1l ('1
mm('ro d(' cigarrillo.\' jiIIlIOdo.\' diariam('1Il('. (1 p{,,'ir dr lo.\' d(110,\,d{' Kahll ( Rnlh-
man et al.. 1980).
~:
,.,
.t
~.
322 EPIDEMIOL
E~ltl ccut\cil1 sif!uc siel1do lineal. pero la linea recla cruzn un espacio
(,.'(tI1 mils dl.: dos dimensiol1es. una por ctlda variable dc la ecuacin. f
il1L.Illill:1 1:1 \'arjahlc ucpelldiel11e.
1:1 r:ls!.!() cl:lvc ucl al1illisis mullivtlri:lu(). quc Ic hacc scr Ul1tl Iccnica
1;111 \llil rtlr:1 cl tll1illisis cridcl\1i(tli)~i(,.'(I. csl;i Cl1 cl hcchl) uc quc Itl il1fc-
r\.,ll(i;l h:lsall:l Cl1 cl c()cricicl11C <ic ciI;llq\licr \'ari:lhlc illdcrCIldienl(' del
11,(1ucl() CSI:"I C()11llici()l1adtl tl I:I~ rcslal\ll:~ \.:Iri:lhlc~ iI1UCrcl1dicl1lcs del
11\IS111('. r:Sl;1 il1ll.:rrrcl:l(,.'i()l1 c()l1dici()11;,1 si~l1ific;I q\ll' CI1 \111 m()ucl() SCI1-
l.illl\ Sl. rlll:Jl. (,.'(11\lr(tl:lr sim\lll;il1c:1111~111l. 1..1C()11r\l~ii)l1 (Ichi(ltl 1 lii1 ~ral1
1111111L'r('d rtlClltrC~ ~ qllC !\C r11cdr dCICrmil1tlr :1 p:lrtir dc I()s c()cfi-
l.il;l1lL'S :I(lcc\lld()~; cl cfcct(l d(' C:ldtl r:lCI()r. 5in q\lc 1()5 rC51tlnte5
f:I'L.I ( 1rl:S ucl m()licl( 1 acIlICl1 col1f u I1d icndl)llI. siem rrc q liC las tlsul1ciol1es
11l;11L'111ill ic:ls dc J ich(, m()dcl() 5ca 11 rtl7.()I11 hlc5.
7 1'(11'.\:1 (11'/11(1(.i,III('
,/'1,,1(}/1('/( l,I('(/, tllltili.\i.\ l(.1gi.\" I j('(}
c:an!idad de d~ltOS.
El\ \1n ~Inilli~is cpidcmiolgico es comun que una variable tenga slo
dos ,.alores, quc corrcsponden a 1.1rresencia o ausencia de enfermedad o
a l.1 rrc~encia o ~\\1~cnci.\ dc cxpo~icin. A los model5 de regresin
ha~ados en \ariablc~ dcpendiente~ dicot)micas se los conoce como re-
J;rcsionc~ binaria~. Sllpongamos qlle sc llevase a cabo un estudio de
se~uimicnto para evaluar la aparicin de enfermedad en un grupo ex-
ruc~t(' ~. otro n()-cxpllesto. En ~u forma m~ sencilla, los dato~ consisti-
rian CI\ do~ oh~crv.\cione~ hinarias ror cad~l sujelo: ~i e~tahn expue~to, o
110. y si hahia cado enfermo al final de1 perodo de seguimiento. o no.
~
j'.;:
~;~
,0-.,-
c~..';:;,,:~~.;.;..,
IG
~:., .-~ ,.~ ~ :..
'.> :-:..'.~..;:V'.;~.~
~. ~~
\~~~!~\;~~~~~~J~~:~~.'.;:~:
~
I.
I~ .~:;."
...
s
I ::; .:
:::
:;.
.J
10
C
al
-0
l ~
~
""'
~
:/1
~
0-
Edad
I Los dalos del ejemplo 11.4 ilustran tal situacin: si tanto la variable
illdepcn<.\icntc Com() la dependiente son binnrias, los datos se resumen
mcdilntc UJ11tahla de 2 x 2. Se puede lpliclr a los mismos una regre-
D sin tlmbin hinaril: resulta convenicnte codificar cada una de las
\:ari:lhlcs con los valores O (> I dcl1otan<.\o. rcspectiVlmente, la ausencia y
presencia de exposicin o de enfermedad. Utilizando este esquema de
codificacin, el trmino constante ao corresponde a la incidencia acumu-
llda en el grupo no-expuesto. Por lo tanto, al. el coeficiente de la
v\riable independiente del modelo, corresponde a la diferencia de inci-
~ dencias acumuladas (o diferencia de riesgos) entre los expuestos y los
l1o-expuestos. Por supuesto, la diferencia de riesgo se puede estimar de
forma direct\ a partir de la tabla de 2 x 2 que describe los datos. con lo
que la regresin lineal, cuando se tienen datos binarios sencillos, resulta
innecesaril. El modelo de regresin, sin embargo. se puede extender
filcilmente para lcomodar muchas variables adicionales y es ah donde
~
~, radica su ventaja. Si se hiciesen diez observaciones ms por cada sujeto,
..~
rcprescntando diez f,lctores de confusin, podra controlrselos simple-
mente l,\diendo al modelo lineal una cantidad tan pequea de trminos
como diez, que corresponderan a los diez factores de confusin citados.
, ~~~
}~~~;:i~;:t~;;::.. .::.
,.;:~~~je:
.;~
~
~~ lh
}"
111
= a() + al ).'1 [14.3]
J -}'
(,"" +al.\"
)' = .
,,;;-":j--;;-;T ---,,-Ion+ol.\:tl
[14.4]
+ (' 4- (
:~
;~~'
.4-'..
:"!,1
Clo
(I() = In
[ 14.5]
r-1
U
~~
;ii~~.
1\
;~~:;~~\\~\~:
~-
..,
32r; EPIDEMIOLOGIA MODERNA
..
,t
}
i ~
f;-i~, 14.4. EII (,1111(}(/('1(1 1(},!!:;,\'li('(1 ,\,(' 11all(1 illlplCil(1 un(1 re/acin e-'\'pollellcia/
('III/'(' 1';"('1(',\ (1(' c.\.,,(},\'i('i(in l11Illi,,/(',\' .1' ,.ie,\,.~(1 d(' l'1!ft'rmedad,
"'1
, t
.~
'.
;~~
~~jj:
;~~;.: :~~~,
~
;'.;1',:
~iil
;:'.{:~~ft;~;
AL
111~ ;l~rg~~r~~~~:~:f:'
~~:.~:.-.
:':":1
I.
::.~~:}
'.-:~~] ~~.:~\;
32P EPIDEMIDLOGIA MODERNA
r
10 1!cncral. eslos do.c; abordajes son ms o menos. si es que no exacta-
mcnlc. cquiv.1Iellle.c; ( Breslo\\' y Powers. 197H), Resulta generalmenle ms
1 ~
r:icil uliliwr a la cl1rermedad como variable dependiente, porque este
(
IlICtod() pcrmilc la evaluacin dcl crccl() de divers.l$ variables de exposi-
ri()11 dirL'rcntcs cn UI1 nlism(\ 111()dl:I(\ ~. rllCdc rilcilmcnlc d.1r cabid.1 .1
L'XI')osici()ncs medid~l.C; con ms dl: dos c:1lc~orias.
.E~t;1 1!1,Cji)l) dc rjc~!!o cs. c()m() sc VC. 31!!() djrcrcntc a la que sc m\ncj\ con cl
lI()mhrc ((rj~k el1 mllch()~ tcxt()~ dc erjdemi()I()~i;. En in!!Jcs. 1; conrllsil1 no es rosiblc.
ror cl II~O dc do~ r:'I:lhr:ls distillt:l~. risk y hnz:lrd. ( "'. dcl T.}
I
i~
~$~tJ:1:..
~
,;:~::;
:\ft~~i\~\;~~:
;rf~~~ !~~I~I
~!
ANALISIS MULTIVARIADO 329
li(\r:ls lit: quc sc disr()l1e l1uy da. dados lo~ grandes conjuntos de datos :;
~,.
<.JUCS()11<.:1)1111111I.'S ;1 ~sle nivel en los seguimientos epidemiolgicos rela-
<.:ionados ~UII 1.1ill\"cslieacin etioieca. En circunstancias as. una alter- ~:
11ati\.~1 r~IZOI1~lhle cs ~lg;upar los d~ltOS por periodos de tiempo yjo edad.
l.:oI1siderand() .1 1.1 vez un modelo logistico condicion~ldo segun las
Jivers~ls c~llegor~ls temporales YlO etarias. pero no segun los muchos
subconjuntos Je individuos que permanecen bajo observacin en cada
runt() en el tiemp() (Breslow. 1979: Abbott. 1985). S. como se espera,
continua el progreso tecnolgico en el equipamiento in[ormtico, el
tiempo y el coste de los clculos que se precisan para adecuar a un
~ nllmero grande de datos un modelo de riesgos proporcionales puede que
t1 pronto resulte de poca importancia.
El mdelo que nos h~l ocup~ldo es uno de entre una variedad de
mtodos que sirven para estudiar datos con problemas en el eje tempo-
r.11. K.1lbncisch y Prcntice ( 1980) dan una excelente descripcin de estos
m!oJ(}s.
,\ f (Id(,/(1,\' fl',!,'-lill('(II(',\"
~~~;~:.;:: ~~~;:.i~ -~
.,,1
c~*: ,,;-:-~.~.
33(1 EPIDEMIOLOGIA
---~-
MODERNA
J
com() Ull:1 ful1cii)11 lincal a buse de tcrmil1os, Dichos trminos correspon-
dcn a clda variahlc dc la labia mullidimensiol1al, al tiempo que existen
\'ari:ls comhinacioncs de \'ariables represenlando los correspondienles
Icrmillos dc iIIICracci()t!. Los lolules marginales de la tabla multidimen-
si()I111prororcional1 rcslricciol1es a los \'alores esperados que se conside-
r111adccllados r~lra 1~lsccldas,
( ()II cl modcl() arroriado. esrccific~ldo en el conlexlo, de predictor
hillilri() \' v:lri:lhlc~ dr rcsull:ldos. 1:1SOlllCi()11 de mxima probabilidad de
IIII III()(I~I() 1o'J!.-lillc:11 scril idcnlica a la solllcin de mxim~1 rrobabilidad
ll\.' I(IS \'al()rcs c~rcrad()s rara la eslim(lcii)n de la razn de venlaja In"
t.('mlln CI1 lit! <:onjllt!l(1 de lahla~ dc :! >< 2. de la manera que se describa
cn el carillll<" I.:.: El cslimad<" de m~iximil rrob.lbilidad de la razn de
1;
vl.:ntl.i:1 rllcd(' ohlenersc a rartir dc los valores esrcrados de celda del SU
nl(IJ\.'I(1 1(,~-lil1cill lil11 \'c'/. :Idccllallll, ,iIISI(1 l"(lm() ~C Ilaca a parlil dc loS
\II()rcs lambicll adccllado~ qllc eman~lball de la eculcin [1.:.,25], Ms
al In, lin m()dcll) de regresit! lof!istica aprori(ldamenle especificado dar r,\
lambin los mismos reSUll~\dos, Todos e~los mlodos son reformulacio- I.c 1i
I1Cs matem:itica~ de un mismo modclo sut1yacente. el de una razn de
vcnla,ia qllc es con~lantc a I() larg<" dc la~ cat.egorias de uno o ms
.~Il
f:lclores distintos: es un modelo mulliplicativo porque conforme cambia m
lit tasa dc los n<,,-expuestos. la tasa de los expuestos debe multiplicarse
ror lil1 faclor constante de cara a que la razn de tasas de .incidencia, o 1~
11 ra7()n dr \'Clllaia. seall i!!lialmentc cOnslantes.
l(,s modelos iof!-lincal~~ han sid<" rorlllares enlre lo~ estadislicos
!)()rqlle ()frecen lil1a esrecie de ncxit1ilidld cstadistica: 11<"exislc esrecifi-
l"ilt"()11 (Ir Ul1a \'ilriat1lc dcrCI1(licJlte ~. ()lr(1 <:Oll,illl1t(' d(' \'uri~lhlc~ illdc-
rl.:l1dic:IIIC:;. ni d\.. lil1\ cnfcrlllC:d:ld ~' lilla \':II iablc: dc cxrosicil)n todas I S(
:::~l~!~.
,.,;o.
"",..
:~~".fij:;;.*: .: ,
-~I.
l ANALISIS MULTIVARIAOO 331
.\ 1 ( 1(/('/( 1,\' 1111//' ;!'(ir ;,1(/(1.\' f1l1 r(1 ('.V, 11(/;0.\" d(' ('{1.\,(1-('(1111r(l/ OfJ{lr('(I{/OS
~
,
:~,~::; :,;:; :
$.
;~~.
X:~I~1~
3 ~.
.).
EPIDEMIOLOGIA MODERNA
~~:
:!t:i~~~i~ ~~~}~:
\;f\~1~\~f\\\1
--'--' ;;,,-- ..,.;;;..:.;
;..~~~ :
Q ."
~~
':~~;.
334 EPIDEMIDLOGIA MODERNA
~.
~II~
.m:~i~~r~;~~~~:;:~1fu~:
"1> "...v , ~,~;
.,
ANALISISMULTIVARIADO 335
llll~ 1:1 illr()rlllaci()11 tic lo~ dato~ sobre cxpo~icin. sca ordenada por
rallgo I) (;olltinua. sc pierde y se necesitarn ahora varios trminos en el
m()delo dondc ante~ .~()Io ~e requeria uno. Es verdad que la potencia
l:st:ldistica de una prueba de tendencia que evaluase una relacin dosis-
rcspuest.l. incorporada en el v.llor de p adscrito al coeficiente de una
variable continua. se pierde con este mtodo. Por el contrario, la inclu-
si()n de varios trminos de exposicin permite utilizar la informacin
acerc.l de cada nivel de exposicin para generar estimados del efecto que
no cstcn constreidos a seguir ningun patrn especifico. La simplicidad
cs algo que en un modelo multivariado se ha visto casi siempre como
mlly descable. pero su lgica interna se basa habitualmente en la adop-
t:il)ll II~ m(){I~llls 1.:1111 pr{)p()sitos prcdictore$ o descriptivos. Cuando se
L.II)rl(;;111 1111111t:111,. I.:CIIII() .!.!t:llt:r:lllllt:lll~ -;c 11:ICCcn cpidcmiologia. para
11II.:t:rillf~rt:ll(;i:1 "llhrt: l:1 ral')ci tic r:ll.:tl)rCS cspccificoS. la simplicidad del
Ill()dclo Il() l:S lina IllCt.l importante. PI)r tanto. la inclusin de varios
trminos en vez de lino no representa un inconveniente real en lo que a
I.l complejidad dei modelo se refiere. La ventaja de ser capaz de estimar
por separado. sin un patrn impuesto. el efecto a cada nivel de exposi-
cin con relacin a un nivel basal. supera las desventajas de este aborda-
je en la mayoria de las situaciones. Cuando hay datos suficientes. relacio-
nc$ de dosis-respuesta complicadas como las que tienen forma de U o
I U invertida. pueden detectarse y estimarse sin temor a que el modelo no
describie$e .ldecuadamente los datos.
Tras definir cl trmino o trminos de exposicin del modelo. el
I in\,estigador
planteamientos
debe (;entrarse.en los factores de confusin. Para stos. los
son en gran medida los mismos que para la exposicin.
Cad.l \'.lriable debe ser traducida para introducirla en uno o ms trmi-
nos del modelo. De nuevo es deseable usar un conjunto de- trminos
indic.ldores que permita una relacin menos constreida entre el factor
que confunde y la enfermedad. La meta analtica es un tanto diferente
para las variables de confusin. En vez de realizar inferencia acerca del
erecto del factor que actua confundiendo. el objetivo es tomar en consi-
deracin el mismo. de forma que el efecto de la exposicin no resulte
distorsionado. Para conseguirlo. no obstante. se necesita esencialmente
~ dar en el modelo el mismo tratamiento a dicho factor de confusin que a
la exposicin. Para el primero no resulta importante apuntar ajustada-
mente la forma de I.l curva de dosis-respuesta, pero. por otra parte. hay
poco que ganar por lo general reduciendo el nmero de trminos del
Illodelo. a no ser que los datos estuviesen desperdigados o deficiente-
Illcnte distribuidos. Ms aun. en algunos anlisis un factor de confusin
de la exposicin podra tener por derecho propio algun inters, en tanto
que constituye exposicin. Si las variables en cuestin estn definidas de
manera ptim.l en el modelo, se pueden realizar con facilidad inferencias
~
:Iccrca de I.l exposicin y de varios factores de confusin a partir de un
(1
modelo nico. Por el contrario. si se sabe que el citado factor de confu-
sin tiene una relacin montona) con el resultado enfermedad, es
posible conseguir un mejor control de la confusin manteniendo la
EJ
's~
.:-:~: {~:,:.;;
~
~~~f;~~ ;\~
:..
~
$(:
{~~~:: ;11~
',JIJ; ~~
~:, :.~~~.
:~~
\~J~~
:jL;~.:;-
~.
.~:h~~
33~
~.
I
ANALISISMULTIVARIADO 339
hict1 COl! UI! prohlcma de regresin clilsica. ya quc /o tipico es que midan
l:ll una e$cala (.'olltinua no $(>Io la variable rcsult~ldo. sino tambin a
todas I~l$ v~lriables independientes. Puesto quc la unidad de observacin
c~ una poblacin. la informacin sobre variables predictoras se mide
como un promedio de poblacin. que es una variable continua. Inclu$o
vari~lbles discretas. como el gnero, se hacen continuas cuando se las
promedia para ulla poblacin: el gnero es una variable binaria. pero la
proporcin de una poblacin que son varones es esencialmente conti-
nu~l.
Aunque con dato~ a~i podria parecer que un modelo de regresin
L'1..1~ic~1 enc~lj~lria hicn. hay que llevar con claridad en la mente algunos
1t1:lticcs a la hor:1 tic re~lli7.ar el anillisis. Primero. dado que cada unidad
(Ic ()hscrvacii)11 cs Ijll:1 pohlacin y pue~to que las poblaciones difieren en
1:1111:lri().la (.'alltitl:lti tic informaci(>n de cada unidad observacional diferi-
,:;i. 1):lr:t tom;lr c~to adccuadamente en consideracin en el anlisis. la
rL'~rcsii)l! dchcr~i ser ponderada. Este procedimiento toma en cuenta
a~ignar ;1 cada ob~ervacin un peso que refleje la cantidad relativa de
informacin incorporada en Ja misma. Como pesos podran tomarse los
reciprocos de la varianza estimada de cada observacin; para una tasa
de incidencia o de mortalidad. serian el cuadrado del denominador
dividido por el numerador. Otro esquema razonable de ponderacin es
pesar cad~1 observacin simplemente segn el tamao del denominador
de la tasa.
Un segundo punto a tener presente es que los coeficientes del modelo
habitualmente no pueden convertirse a las medidas epidemolgicas
usuales del efecto. Aunque la variable resultado pudiera ser una medida
del tipo de una tasa de incidencia o de mortalidad. las variables indepen-
dientes representan. como mucho, valores promedios de exposicin y no
pueden reflejar con exactitud el efecto de un cambio en el nivel de la
exposicin sobre la ocurrencia de la enfermedad, a no ser que la asun-
cin lineal del modelo fuese razonablemente exacta. La ms de las veces.
las variables independientes del mismo son en cualquier caso aproxma-
I das. por lo que la interpretacin epidemiol()gica de los coeficientes resul-
t~l problemtica. estando en el mejor de los casos sujeta a considerable
~e$go. Los estim~ldos del erecto de los estudios epidemiolgicos pueden
I cstar grandemente exagerados
~csgo de cruce de niveles (Morgenstern,
por un fenmeno que se conoce como
1982). Con todo, teniendo
datos ecolgicos las inferencias epidemiolgicas son ocasionalmente po-
sibles y hasta podria ser factible valorar el grado de sesgo (Stevens y
Moolgavkar, 1984). Ejemplo de variables aproximadas son los datos
sohre impuesto~ recaudados por consumo de cgarrillos o de alcohol, en
lug~lr
~ U ndetercer
loS reales
punto sobrees queel elconsumo
control de de launos u otro. resulta dificil en los
confusin
]
anillisis ecolgicos. puesto que las observacones individuales son datos
promedio o datos aproximados de poblaciones, llevando por ello a
asociaciones atenuadas e intercorrelaciones entre varables que limitan el
control de la confusin {Greenland, 1980; Morgenstern, 1982). Ms an,
.J
~~~::~;~,
~;~~Ifr~
~~c
;~~~~~~~;J~~
,~
1;:;'
340 EPIDEMIOlOGIA
MODERNA
CI' I()s cslll<.1i()S ccol()gicos c,<; ror I() gencral mils dificil oblencr dato~
..illllicr:1 :Irr()xima<.1os dc all!l1n()~ r:lCl()rC~ ql1C ~e c()n()ce o ~c ~o~pccha
l'lll. ;ICIII:I" t'()"fll"dicndo. L:I f:lll:l dc di~rnnibilidad de informacin II:",) W;
.~ "!1; " -
r:111!!(1dl. mc,,()s infinil() ;1 mils inrinilo. rer() 1:1lasa de incidencia .vn ~lo
~.C.:;,
llc ccr(1 :1 m;'ls inrinil('. La i"c()mpar~lhilidad dc los rangos puede ser :i j' -
rt:..l1cll;, m()dificLl"d(, 1:1 l:ls:l <.I(' i"cidenci:l mediante lransrormacin I()-
~:Iritl"ic;t [;.n ta"I() qlll' csl:l tran~rOrmLICi()I' cs malem,ilicamcnlc alrac-
li\.;I. pl)rqlll' prc\,icnc ql1C cl m()<icl(, rr()dl17.C:l e~limad()s negalivo~ de la
l:lS:I <ic i"ci<ienciLI.la rri"cir,11 c()nsideraci()" cs si elm()dcl() multiplicati.
\,(1 qllC rL'sl111:l c()nslil\lyC \11':1 mc.ior dcscrirci" dc los dal()S ql1e el
:I<iili\'(' qllC sc arlic:l si" dich:l lransform~lci()n logLlrilmica. Los lrminos
C()I'li"II().; <.Icl m()(lcl() mllllirlic"liv(\ tc"dran. cnm() en el modelo logisli-
l.(I. 11";1 rcl;lci()J1 cxro"CI'Ci;11 I()~ u"o~ COII lo~ olr()s. Scria posible em-
rlC;lr \I" con.iunl(\ dc \,:Iri;,hlcs il,dicad()r:ls p:lra cada variable conlinua
, .
<icl m()<icl(). pcro r\leSI() ql'C Itls v:lrinblc~ conlinuas son promedios de : :;..,
i;..~~. .
r()hl:lcii",. sc vl1clven m\lci,() m;'ls diricile~ dc inlerrrelar. A n() ser que
\1":1 r:17()I' csrccric;, 1(\ dcm:l"d:lsc. parccc prercriblc llevar a cabo la
m:I\.()ri" <ic lo~ :IJ1;',li~i~ ccoli)1!icos ml1lli\'ariados como regresiones linea-
.~
Il.S "(1 Ir;l"srorm:ld:ls.
f1
J
"..::m~
:~~:
11it
~
'.:~~;~::~\:~~. ~.;~t.~::
; ~.;.: :
IllClllc I;U:Illtl() SC rrl:~l:lllaI1 allccl(.)r I(.)s tlat(.)s eslratilicad(.)s para que los
c~cruliI1e. L~I pril1cipallimitacin del anlisis estratificado es su incapaci-
ti~ld para hacer frente a mi1s de unas pocas variables a la vez. a no ser
que cl ap.lrc~lmiento haya proporcionado distribuciones similares, a lo
largo tic los cstr.1tos. de las series comparad.1s. Sin .1pareamiento. confor-
j mc cl nmero de ohscrvaciones dentro de los estratos disminuyese con el
:Iumento dcl nllmcr(.) dc stos. 1.1 r.1zn de controles a casos (o en
cstudios de seguimiento. la razn de sujetos no-expuestos a expuestos)
nuctu.1ril al .1Zar cn OI1d.IS dcscontrol.ld.1s sobre el valor medio; estas
nuctu.lcioncs inycct.1n tlclnasi.ldo error alcatorio al proceso de estima-
l;i()11. <:ausantl() 1Iila pcrtlitla tic cficicncia del estudio que pone en
ri~It1().
IJ~ls \CJII~I.jas y limit.lcioncs dcl ~ln~llisis multivariado son en gran
mctlida I~I im.lgcncll espcjo de las del anlisis estratificado. Mientras que
cl :In.ilisis cstratificado sc vuelve ineficiente frente a muchas covariables,
cl multivariudo es por lo general muy eficiente. Por el contrario. en el
~ln~llisis multiv.lriado se echa en falta la capacidad de captacin global
lJue licne el primero. La computadora viene a intercalarse como intrusa
cntre las observaciones crudas y las medidas epidemiolgicas que resul-
tln tle cllas. oscureciendo a los ojos tanto del investigador como del
Icctor algunas de las interrelaciones entre las variables del estudio que
p()sccn m.\s scntido. Slo una larga experiencia con el modelaje multiva-
riatlo cmpe7..1r:i a parecerse a la sensibilidad tratando datos que se
\)hticnc dc un ~In.ilisis cstratificado. Los cillculos son tan complicados
quc cl invcstigador se ve obligado a depender por completo del equipo
inform.itico y dcl .\,(~/i),.llr(' de que disponga. Los errores de dicho s~fi1\.a-
r(' puedcn p.lsar desapercibidos a travs de muchos anlisis. porque no
h.1y rorm.1 sencilla de comprobarlos en su integridad. Adems, la eficien-
L'ia cst.1distica tle los modelos multivariados tiene un precio, que es la
asuncin de que una forma matemtica dada describa la relacin de las
vari.1bles del estudio. La extrapolacin ms all de los lmites de las
\)hServ.1Ciones. que es algo que muchos investigadores son reacios a
R
l~l hacer y que es fi1cil de eludir en los anlisis estratificados, resulta dificil
(le evitar en los modelos multivariados. Ciertamente, en un anlisis
multivariado 1.1extrapolacin y la interpretacin son cuestiones criticas
a la hora de ganar en eficiencia. Asumiendo que el modelo matemtico :
~
tlcscrihe la distribucin condicional de una variable sobre un rango de
v:llorcs p~lra los cu.1les f.1It~ln 1.ls obscrvaciones directas, el modelo puede
cxpres.lr 1.1rel.1cin combinada de muchos factores simultneamente con
scncille7. y elcg.lncia. Si el modelo es incorrecto, sin embargo, la mejora
(Ic cficicnci.l pucdc quedar negada por un grado intolerable de sesgo:
q Inils ~ln. t.11scsgo no seri1 detcctable sin esfuerzos especiales y la precau-
'-1
~ cin que c.1racteriza a esfuerzos as puede verse minada frente al gancho
scductor de un modelo ntido y de aspecto eficiente.
I~stos inconvcnientes que tiene el anlisis multivariado convierten al
~f.
;~~:
~~\~r~
fl'lDEMIOLOGII\ MOOEnNI\
j
una \'ariahle continua unica que atIne la informacin rele\'ante acerca de
la~ pr<.'picdade~ de toda~ las variables a este respecto (Bunker el al.,
1969: Miettinen. 1976: Rosenbaum )' Rubin. 1983). Consideremos un 1
expcriment(\ aleatorio. Una propensin para desarrollar enfermedad, si
l,l r,lndClmizacin funcion:l bien debera estar distribuida por igual entre
los ~rupos dc intcr\'encin, No hay. no obstante. forma directa de com-
1
pr()h:lr estas distrihuciones. puestCl quc la propensin a la enfermedad
n() pucdc medir~c direclamentt' mils quc midiendo la incidencia de la
misma. quc es el rc$ultado del estudio ~; quc pCldria verse innuenciada
por la intervencin en si. Lo que $e necesita para evaluar la eficacia de
dicha randomizacin es alguna indicacin del riesgo de enfermedad
cntre lo~ individuos de los diferentes grupo$ de tratamiento aparte del
efecto de la intcrvencn, La distribucin de los factores de riesgo cono- n
:~
:t~~ ~~::;;~~
ANALISIS MULTIVARIADO 343
nc .
[r.
:i~~;
~i: ;*
::~~tr~t\f:~~ ~1;~~;:;!:!~ :~;%.
::;~4;;;.::;;~
EPIDEMIOLOGIA MODERNA
J~I:I:I:I{I:N(.I\S
-*
...:~.t~~:
;~'>:: ~~~\,:~~.
~:
J Micllincn. O. S. Strt\lilication
l:.il;(I(.I11;(,I. 197(,: J04:609-620.
by il multivariate conrounder score. A",. J.
I)rcnlit;c. 1{. l)sc l)f thc lugi~lic model in retrospective studies. Biom('lric.\" l~.
l~i(,:.~?::,q4-(,()h.
I)rclllit;c. 1{. I~.. alld P~'kc. I~. Ll)gislic dise~lsc incidence models and C3Se-COnlrol
dal:l. 11i(I/II(.fri".(( 1979:66:408-41 ::..
l)rl:llllcc. I~. L.. :Illtl Bresll)\V. N. E. Relrospective studies and failure time
m()uc~. n(II11('frika 1975:65: 153-15S.
J{()scllh~llIm. p R.. and RlIbin. D. The ccntral role of lhe propensity score in
()h~cr\'alion~11 stlldies ror causal effects. Bi(l/lll.'rika 1983:70:41-45.
I{()lllmall. K. J.. (..ann. C. I.. 1:I~lndcrs. D.. et al. Epidemiology of laryngeal
c;l"ccr. 1:,,;tl(.I/I;(II. RC1.. 19R():2:195-?09.
SIC\,I:IIS. J{. ( i.. antl Ml)()lg:lvk~lr. S. 11. 1\ cohort ~malysis or lung c3ncer and
~m()kin{! ill Hritish malcs. ..11/1.J. Ep;tl{!mi()/. 1984:119:624-641.
rll()mas. D~ C. (Jcllcral rcalivc risk modeis ror sur\,ival time and matched C3SC-
;1)lllr()1 an~llvsis. /J;(II,'(.'r;('.~ 1981 :37:673-676.
Wllkcr. 1\. M. mCienl ~Is~essment or ;onfounder effecls in matched folJow-up
,tlldics. :1""i. .)I(lf. 19R2: 31:::.93-297.
\V.llkcr. 1\. M.. alld Rolhman. K. J. Models or v3r~'ing paramelric form. ..111,.J.
E,,;tl(.I/,;(II. 19R~:115:129-137.
s
m i
i
~
r.l
4
":;:.:':[:;.-\:..j::,;,:~:~;:r~;.
'!~
11'11~ ~~~.