Vous êtes sur la page 1sur 25

.

11.

El tipo mi1s simple de al1;ili~is cpiuemioli)gico. que es el basado en datos


brutos o (T"tlo... (es decir. 110 estratilicados), se aplica cuando no es neccs..1-
rio tener en cuenta ningn factor mi1s aparte de 1..\exposicin y de la en.
fermedad que fuese de inters. ;\unque no es infrecuente ver dalos presen-
j tados nicamente en forma brula, lo lipico es que el investig..1dor necesile
primero explorar aniuisis ms complicados cmpleando la eslratilicacin
o mtodos multivariados para e\'aluar el rape! ue otros f..\ctores. Un,l
vigorosa restriccin mediante covariables en la seleccin de sujetos (de
forma que se prevenga la confusin). Ile\'a frecuentemente a un ani11isis
simple o crudo. Los ensayos clnicos que emplean la asignacin ale:1tori..1
de los sujetos pueden tambin ser muchas veces s..\tisfacloriamenle anali.
zados en forma bruta. si los invesligadorcs esli1n convencidos de que 1..1
randomizacin ha prevenido satisfactori.1menle el citado efecto de con-
fusin. El anlisis bruto. por su sencillez. ticne un atraclivo dcl que
carecen los anlisis mi\s complic:ldos.

COMPROBACION DE I11POTESIS CON DATOS BRUTOS

El epidemilogo. al col1ceptllalizar lipos de dalos epidemiolgicos liende


a separar los datos de seguimiento respecto de los datos de caso-conlrol.
Para la comprobacin de una hiptesis estadstica. no obstante. el mode-
laje estadstico lleva a una diferente clase de separacin. se-gn qlle los
datos sean unidades persona-liempo o persol1as. como obserVtlCiol1es
bsicas. En tanto las unidades de observacin se miden en trminos de
persona-tiempo llnicamente en los estlldios de seguimiento. no todos los
estudios de seguimiento se presentan con su~ datos expresldos en form\
de tasas de incidencil con denominadores en trminos de per~ona-
tiempo. Si todos los sujetos son seguidos durante un periodo constante.
podra ser conveniente expresar las tasas de incidencia como estimados
del riesgo. esto es. como datos de incidencia acumulada en los que el
nmero de casos est{l relacionado no con una cantidad de experiencia
173
.J
171. EPIDEMIOLOGIA
MODFRNA

persona-tiempo. sin() con el nilmcrn tnl:l1 de pcrson:ls <1IIC fllcron se~lli-


das. Los en$ayo~ clnico~ $e presentan a melludo de est\ manera. cuan-
do los denominadores de medidas de incidenc\ son presentad()~ c()m<)
contabilzaciones de personas. en \'ez de como medidas de expercnc:\
personcl-Iiempo. el modelo e$tadistico que se aplica para I;l comproha-
cin de la hiptesis es el m sm() que se a plica a los da lOS de C~IS()S)
controles. en o~ que todas las obser\'aci()ncs tarnhcn son rccucnt()~ dL'
pers()na~.

CO111rrohari(j/1 (1(' hirle.\,i.\. ('011 dalo.\ l"11 la .f(,r/11(1 pl"r.\,()1I(I-li(',11pt)

Los datos de tasa~ bruta~ de incidcncia consi~tcn en el nlJmer() \otal ti(.'


caso~ y de unidades per~ona-tiempo. tanto parcl la cate~ori:\ expuest()~
como para la no-expuestos. Utilizaremos la f()rma de presentacin de l.1
tabla 11.1. La aparente sencillez de esta tabl:1 puede enmascarar ~utileza~
analtica~ que deben ser tenidas en cuenta. Esr>ecficamente. la expericn-
.1
cia persona-tiempo de la columna de I()~ expucstos deberia dclinirsc
de acuerdo con un model() plausible, tentativo. en relacin con el tiempo
de induccin. Antes de que un indi\,idu() ~e convierta en expuesto. tOd:1
su experiencia persona-tiempo es. naturalmente. persona-tiemp() no-ex-
puesto (aunque este hecho no se inclu)'e muchas \'ece~ como tal en el
anlisis). Si la exposicin ocurre en un punto en eltiemp() y el m()delo dc
perodo de induccin que ~e est evaluand() exige que transcllrr~1 lin
p1a7.o minimo de induccin de cinco :\()s. en\once~ lo~ cinco aos
posteriore~ al punto de exposicin para Cc\d~\indi\,idllo son igualmen\e
experiencia persona-tiempo no expuesta. en vez de expuesta porque. de
acuerdo con el modelo de tiempo de induccin. se remont~\ a un periodo
de tiempo anterior en que la exposicin se hallaba ausente. Enclladr~\r
las unidades persona-tiempo dentro de la categoria de exposicin apr{)-
piada es una tarea que hay que hacer ~li.iclO a sujeto y puede nece~itar
J
reglas complicadas si la exposicin e~ crnica. Lo~ casos incidentes se
encuadran en la misma categorin a la que se e~t{\n :\c\diend() la~ uni-
dade~ persona-tiempo concurrentes -por e.iemplo. lin caso inciden\e
cuatro aos despus de la exposicin seria encuadrado en la categoria
no-expuesto, si el modelo de tiempo de induccin especificaba un
tiempo minimo de induccin de cinco ~\os. El modelo estadstico
empleado para la comprobacin de hipte~i~ de los dato~ persona-

Tabla 11.1. Fnrma (/(' !,re.'ien1acinn d(' I(},~ da In.\' d(' l(t.\"(t,~ hrltla.\" de itlCiJ('1Icitt.
COll d('IlOtllitladnr('.'i pC'r.'iml(/-1 iet"!'n

Expuestos No CXpuCSI()S Tot.1I

Ca!\()!\ a h MI
,, ' "',
Pers()na-ticmpo I T
ANALISIS DE DATOS CRUDOS '75
tiempo es la distribucin binominal
~---c (Shore (" lIl.. 197(1}. Un acontcci-

miento aleatorio que tiene solamente dos rcsultados posibles .,. e }'. que
ocurren con probabilidades lijas. se conoce como ensayo de Bernoulli.
Lanzar una moneda al aire es un ejemplo. Supongamos que la proh:lhili-
dad de uno de los dos resultados. digamos .,'. sea f1. La distrihucin
probabilstica del nmero total de .'(f que pucden ncurrir en N ensayos
de Bernoulli indcpendicntes con una p constantc se cnnoce como distri-
bucin binominal. Matem:ticamente. la prohahiJidad se expresa como

P'inmero total de .'(.\' = .\") = -1')1,"-.~'

N!
Jondc
(~~) es
.\!(N 1!

La media de la distribucin binominal es Vl' y la varianza es ,V1'(1 -p).


Al aplicar el modclo hinominal a los datos brutos persona-tiemp().
cada caso se considera como un ensayo de Bernoulli independiente. que
tiene como resultado las dos posibilidades de ser expuesto o 110-
expuesto. De acuerdo con la hiptesis nula de que la exposicin no tiene
relacin con la enfermedad. la probabilidad de que un caso dado sea
clasificado como expuesto o no-expuesto depende solamente de la pro-
porcin respecto deI total de la experiencia persona-tiempo total que sea
asignada a la categora expuestos; esto es. cada caso tiene. bajo la
hiptesis nula, una probabilidad igual a N l/T de ser clasificado como

1 expuesto.
Los IW t casos son. pues. considerados como ;\11 ensayos de Bernoulli
independientes y la distribucin de los casos expuestos sigue una distri-
bucin binominal bajo la hiptesis nula, con p = N l/T. La probabilidad
de los datos observados bajo la hiptesis nula puede escribirse como:

.i
Pr(nunlero de casos expuestos = (1) =
(\1
al
)( /V
i
~r ) ( IV( ) "
a ~r
-:I

Un valor exacto de p para el Fisher con una cola pucde obtenerse LI$i

.\, ,

I Pr(nmero de casos cxpucstos = k)


k=1I

El sumatorio anterior suministra la cola superior dc la distrihtlci()n: la


cola inferior puede obtenerse sumando k sohre un rango entre O y II.
Para obtener el valor de la media ?, en lulZar del \.alor de ? del Fisher
tradicional, nicamente dcberia aadirse al-sumatorio para cada cola 1.1
mitad de la probabilidad de los datos observados. Cuando se calculan
los valores de la media ?, las colas superior e inferior de la distribucin
tienen la deseable propiedad de que suman la unidad.
'76 EPIDEMIOLOGI/.
MODERNA

Con nllmeros grandes no son neccsarios estos cillclllo~ cxactos. ror-


que cualquier prueba estadistica asinttica dlril arroximaciollcs (t.iUSli.J- I
das del valor de P. La prueba estudistica se computa con la frmul(1
[11.1]. empleando el nmero dc casos expllesto-, como ,'ariablc alcat()-
ria. Basndose en las frmulas de la media \" la ,'arianza dc] nmcr() de
xitos en una distribucin binominal. la cxp~ctati,.a nula para el nllm~r()
de casos expuestos es !\iIM./Ty la ,'arianz~t es \.J!\'I.r\.I"T:.. )o que d~j

{I -1\.1 /'If..T
% = ~--
---

IJ

IMI!\.I!\.CI
1
I
\! T~
L(')s \,al(')rcs de l pllCrlCIl tr(lIlSr('1rm:lrse cn \.;limes dc r) :! parlir <II.: I;I~
tahl(ls dc l(l distrihllcin normal eslJIJ~lr.
P(lra ej e.jempl('1 11.1. l(l prob(lbilidad OC I()s d;llns nhscr\.ados I)a.i<) 1;1 1
hiptesis nula puede calcularse as:

Pr(41 casos expuestos) = = o.() 122


1
Un valor exacto de p para la cola superior del Fishcr puede obtcllcrsc
repitiendo los clculos para los resultados positivos mil!' extremos. ha~ta
los 56 ca~os expue~tos. Para 42 ca~{)~ exr\IC~los. los c{llculos dan:

1
Pr(42 casos expueslos) = = O.O()4

De forma similar. Pr(43 casos expueslos) = 0.00J 1. Pr(44 casos cxpucs-


tos) = 0.0013 y Pr(45 casos expueslos) = 0.0005. La pequea magnitud
de esta ltima probabilidad indica que no dcberia ser necesario calcular
los restantes trminos del sumatorio. y3 que ~u contribucin seria ms
pequea al In y no afectarian por ello materialmente a la suma. El valor
de p con una cola equivale. pues. a 0.0111 + 0.0064 + 0.003] + 0.0013 +
+ 0.0005 = 0.024. El valor medio de P con cada col,! lendria 12(0.0 121) J
~
~

Ejcmpl(} 11.1. C (l.\,(J.~ d(' ('{i1lc{'r d(' m(lm(l .1. f1(.rXml(I-(IIi(J.\ d(' (}hx(.rr{1('i(i,l f1{1r{1
1111~iere,\' C011 11Ihl'rcliI0.fi.\', l'."f1li(,.\'I{1.\, r{'f1('lid(lm('111(' {I m1iltif1I('.\' f1,I(lr(I.~('(If1i(lX d(.
rn.l.o.\, X.l" ml!i('rl',\' (,011 11Ih('r("lil(J,fi.\' 11(1 a\, (,.\"pli("\"la\ (B(Ji("(' .1' M(m,\'(m. 19ii)

Exposicin a la radiacil1
(

Si No Total

Cncer de mama
]
41 I5 56
Persona-ao5 28.010 19.017 47.027

~
ANALISISDEDATOSCRUDOS 177
~-- -
como primer sumando. dando un valor dc f' dc ().017 (cl \'alor real es
0.0174 y podria redondearse hasta 0.0018. si la suma se c()ntinuase en
algunos sumatldos milsl. Los valores de f' con dos colas pueden ()btencr-
se-simplemente doblando los correspondicntes \'alares dc > COI1 una.
Los nmeros del ejemplo son sulicientcmcnte grandes c()mo rara
emplear la aproximacin normal en la rl>rmula [11.11. lo que es un
clculo milS sencillo:

4
41 33.35 7.65
x -!
-, = 'V!I~
--
- = 2.08

I (5 ~. 010)(i 9.017)
3.67
~ (47.027)2

En las tablas dc la distribucin normal csti\ndar. un v(lor tIc X de 2.0R


corresponde a un valor de p con una cola de 0.019. que concuerd(\ muy
bien con el v(llor eX(lcto de 1:.\ media p con una col:.\.

Cmlprvha('i(;, ti(, hi/'t/('.'ii,\" ('(11/ tia I (1,\"(1(, r('t"'('/I(1

Los dalos de $eguimiento o de prevalencia que tuvie$en denominadore$


con$istenles en el nmero de personas en riesgo. rueden tratarse como
dalos de caso-control a erectos de comprobacin de la hiptcsis estadsti-
ca. Para cada uno de eslos tipos de dalos. la inrormacin btsica puede
desplegarse en rorma dc una tabla de 2 x 1 en la que las cuatro ccld.ts
son rrecuenci.ts de sujetos ci.tsific.1dos de .\cuerdo con 1.\ presenci.1 O
ausencia de exposicin y enrermed.1d. La rorro.\ de present.\cii)n que
utilizaremos se da en la tabla I 1.2.
Superficialmente. la tabla 11.2 se parece a la 11.1. excepto por la
adicin de una fila mi1s para los no casos. Los denominadores de la
tabla 11.2, sin embargo. son rrecuencias o recuentos de sujetos, en vez de
acumulaciones de persona-tiempo.
De nuevo. la aparente sencillez de la tabl.t puede enmasc.1rar .tlgun.ts
sutilezas a la hora de determinar la clasificacin de los sujetos.
Para datos de casos y controles, la clasificacin segn exposicin
depende de una definicin apropiada y con sentido de la t.tl exposicin.
de acuerdo .1 un modelo biolgico de periodo de induccin que especifi-
que la evolucin temporal de 1.1 exposicin de que $e tr.1te. en rel.1cin

Tabla 1.2. Pr<',\,('1II(1("i(i1l 1'(//"(1 1111(1/(1hl(1 hrll/(1 (1(' 2 x 2


178 tf'IDEMIOLOGI" MODERNA

u la enfermedad. En un e~tudi() ~()hre cilncer de la c(1vidad ()ral. r()r


ejemplo. lo~ paciente~ con cncer pueden tender a emplear lo~ lavad()s
regulare~ de boca con m~ frecuenci:.1 que los controles. pero tal US()
puede ocurrir como consecuencia de sntomas precoces de la enferme-
dad, o de su tratamiento suhsiguiente (la radioterapia en la regin de la
orofaringe tiende a atrofiar las glndulas salivare~ ~' producir ma] aiien-
to). Un modelo de perodo de induccin que tu\'ie~e "entido deheria
clasificar como no-expue~to-" nicamente a aquello~ indi\,iduo~ que flle-
ron expuestos al a!!ente fuera del i:lpso de tiempo durante e1 cllaJ la
exposicin podra haber estado etiolgicamente relaci()nada con la cn-
fermedad.
Para dato$ de seguimiento analizado$ con una tabla dc 2 x :. pre~lI-
miblcmente todo$ los sujctos sc encontraban libres de la enfermcd:.ld al
comienzo del perodo de seguimenlo: 1~1cla~ific~\cin de exr()~icin ~c
refiere al momento de iniciacin del seguimicnl() y 1:1de enfcrmedad. :.11
morncnlo de completarlo. La ocurrcnci:1 dc la enfcrmcdad no dchcria
contar como tal, pues, a no ser que ()curriese durante el lapso de ticmro
especificado por un modelo de period() de induccin. Todo proccso
patolgico de inters que ocurriese ante~ o de~pu~ del lapso de induc-
cin ((hipotetizado deberi~1 ~er ignorado: ~i la ocurrencia aparccc ante~
del lapso de tiempo. seria razonable excluir al ~u.icto por no haber est(ldo
libre de enfermedad cuando empez el perodo relevante de seguimiento. J
Si el periodo de seguimiento h(1 sido tan I(\rgo como par(1 quc una
proporcin sustancial dc sujetos hubieran mlJerto por cau~a~ no rclaci()-
nadas con el resultado que no~ intere~a. e~ prererhle emplcar denomin~l-
dores persona-tiempo. en vez dc analiz:\r lo~ dato~ con ~Ina t~\hla dc 2
x 2.
La tabla de 2 x 2 puede considcr(\rse como I~I repre~entacin dc do~
series de observaciones independientes: para 105 estudio~ de C(\so-con-
trol. la~ observacione.c; son obser\'aciones de exposicin ~' las do~ serie.c;
independientes
de ~eguimiento,
de sujetos Son los C(lSOSy los controles: par~\ lo~ estudio~
las observacione~ )o son de enrcrmedad y I(\~ do~ ~erie~
J
independicnte~ puede considcrarse quc se (Iju~tan al modelo de una
di~tribucin binomial: ba.io la hiptesi~ nula, la probabilidad de una
oh~ervacin ((positiva en cad(\ un(\ de la.c; series binomi(lles. indcpcn-
dentemcnte ob~ervadas. es la mi~rna.
Con~ideremos un estudio de seguimicnlo dc "'I Sll.icln.c; cxr\le~tos y
"1(1 no-expueslos. En la serie expuesto$..l/ su.ielos dcsarrollan la enrerrnc-
dad y en la serie no-expue~to~. lo hacen h su.ictos. La prob~lbilidad dc
que ex(\ctamente o y h ~ujclos desarrollen la enrermed(\d entre lo~ ex-
pue~to~ y lo~ no-expue~to~, respectivamente. es, de acuerdo con el rnodc-
lo binominl:

Pr(a ca~os expuestos y h ca~os no-expue~to~) =


]
.~]
J

:J
\
::.:-~;~

,C1rrf1
;:' ...:

ANALISIS OE OATOS CRUDOS 179 ~

que es el produclo dc las probabilidade~ hinomiules para c~lda uno de


los dos grupos indepcndienles. expueslos y no-expucsIOS. L~1 pr()bbili-
dad de desarroll~lr la enfermedad entre los ~xpueslos es 1'1; entre los n()-
expuestos.l'o. Bajo la hiplesis nula. estas dos prOb~lbilid~ldes son igua-
les: p I = 1'0 = p. lo cual da

-~.
il Pr(a casos expuestos y h casos no-expuestos) =
':;--c-

N t
)( ' No

1)1 = (p)"/I(1 -p)'\(" :.}~~~~.


!ij a h
[ 11.3]
..c

--.
Para calcular el valor de la expresin [11.3] para una tabla particular de
~'~.~:~
. 2 x 2. es necesario disponer de un estimado de !'. Por lo general. I' se
estima directamente ;1 partir de los datOs. I.'mple;1ndo la proporcii>n lotal
~:.~..:~(~..

:;c~
de enfermedad a partir de los mrgenes de la lahla. M IT. Sustituyendo
g p por 'vfl/T da

Pr(a C:lSOS expuestos y h caso~ no-expuesto~) =

I =
I N 1
)( Vn'

, (I h J
(\.f,iT}'\t,(,\f,,/T)\tn [11.4]
:

De la expresin [ 11.4] es posible obtener un valor de p que represente


~

,~;
;.:'
una prueba exacta basada en dos distribuciones binomiales independien-
tes, siempre que quede claro cmo se calculan las desviaciones respecto
I del estado nulo que son ms extremas que las observadas. Asumamos
que se observa una asociacin positiva entre exposicin y enfermedad.
Asumamos tambin que a y h son el nmero de casos expuestos y no-
expuestos realmente observados. Para otras posibles realizaciones de los
datos, en que el nmero de casos expuestos excediese a a. mientras el de
no-expuestos fuese h o menos. la desviacin total respecto de la condicin
~ nula es ms extrema que la que se observa realmente. De modo similar .
si el nmero de casos expuestos es a. pero el nmero de casos no-
c~~~
expuestos es menor que h. de nuevo la de.~viacin respecto al nulo sera :,~'t~:
I ms extrema que la realmente observada. Las posibilidades precedentes
son fciles de clasificar. pero. .qu pasaria si el nllmero de casos expues-
tos fuera a + I y el nmero de casos no-expuestos. h + l ? i.Qu pasara
con otras combinaciones como a + l y h + 2? Es dificil decir si estas
B posibilidades representan situaciones que se apartan del nulo en mayor ~:]j1it
medida que las observaciones reales. Para decidir definitivamente si una
desviacin es ms extrema, seria preciso evaluar una medida del erecto
~ para cada resultado hipottico de los datos y compararla con la medida
del efecto calculada a partir de las observaciones reales. Es interesante
recalcar que la decisin acerca de qu resultados ,conms extremos de-
~ pender de la medida del erecto que se emplee.
.Para ilustrar lo que decimos. consideremos el ejemplo 11.2. Los
datos observados indican una diferencia de riesgo estimada de 0.05.
D

:!il;:;;:::
i:~;.~~:);::~~~;:~:
:..:::.~:;.:;; .;:::'~:;.;:::
::.~~::.;.~;::':~,

~
\::;~::
.:.;;:\;.~~\~
::::::,:?:s;
:;1 ."
"-,"'
EPIDEMIOLOGIA MODERNA
180
1 I I I
I i ~ 10--
1 ,...
...I S: v. .". c
~
~
;

r-. : ~
c
.C Z
c
I
I
!
I .oc~

1
c'- rl
-! u I
~ ; .~ , 0
I::
~>1::.'
-I
~
-I

; ("; ,
i

~
"'
rJ
-I
I t- ---
---

]
...I --r-1
t.: I c..
..., I i u.;
., ,
~ I
.~ !
~ i I "'
.-.I - I -c
I
,
~
~ I -r;
"'"' I: ' c..
-\C' 1- ,.'.' :=:-
~ ~ i I >-: -
1- I ~
~ .E
t:..~ c o
::: .:: , .c I z .,. v, -.o
.I:: -I .-
c c '..1
.--c: u
.~ ... I I 0
.~
-c ..
~~ I c: I ~
~ > o ~
1 -."' I
-~ I
~ c I i ~
~ I \C -::- ~,
j
--I c.
~-!::. o< 1
..~ I,., ,
~"' --,
::: : :
:-~
--I
... I .I
1
~ ~ I .9 I
~~
...~
I ~
~ I
I:::: I ~ ~ V")V")c
~~
~
:: t:.. I I t,)
- C:ic.IVV)C>-: I
...::
-~
~~ I
c:
>
~
I z
o I
I

~
f
.
Ir, -'..1
C-,.., ! ...;.;
.-=
~
\,. ... 1
.o
~
c
I 0
:
"
I
"
v: '.
..
.-o
.~ -
c
-c:
...1'"'1 I v:
r,) 000
='
c..
I --r-1
I ,
.~ I
~ I I X
"' I u.;
C I t

~
Q
o
~ C(
- "' ~
- GJ .-,..
.-o ~
1- Q/) --
Q
"' c:
Q.
GJ ~GJGJGJ
.~ ;..
E
GJ ~~GJGJ
.~
~
I I/)
cu~ "'-
c
"'-
C': vcC':
"' c: . ~ ~
.o
.-tJ
u c:
1- .0 .0
C'; GJ N o,;
E~C';~
.=0~~
~ c "'
uZ UJ
~
~':
II'.
i~
~
~: ~~,~:;k~1~; =-
.:'~,.." ~
'c
'.'.'.~~
,':.."/'""",
..
~
;r:o~~~;"E~J;R~,~
.: --.,0,- .::.,~--:
t\\;\rf:ti;i:
;,:;;
~- -~,.J~;;-:;;;
:,..:;\;:::;:~'~
..:;; "

ANALIsls DEDATOSCRUDOS 181


... ~)

una razn tic ric~l!o dc 1.l1 \' una ra7:n Je \"cnl:lja dc I..:..:.. Las \"ari:lC.:i()-
nes l v 2 son ()tr(~~ dos posible~ resultados de los'd~ltos. prc~umicndo 1.1ue
se estn e~tudiClndo el mismo nmcro de su-jeto~ cxplle~tos ~' !1()-I.:XpUCS-
tos. Emplcando I:l metlida difercncia dc ril.:sgo p.1r.1 dctermin~lr !.lS
desviaciol1cs rcspcc!O dcl Ilulo. la v.lriaci()n 2. pcro no a~ la 1. si es una
desvi~lcin m:i$ c.xtrcma rc~pccto al nulo. El11plc:lndo 1.1 mc<.1id:t ra7()11
de riesgo. l1i la vari:tcin I ni 1.1 2 i() SOI1. P~lra la medida ralI1 dc
D l ventaj.1. lo son ambCl~.
C.1d.1 UI1.1 de l~lS difcrentes medidas Jcsignan ~1UI1 conjunto tlistil1to
B
; . de resultados como mils extremos. Esta ;Imhigcdad hacc problcl11.itico
L.
r
el empleo de dos distribuciones hinomiales indcrendientcs como mo<.1clo
para la comprobaci()11 dc hip()lcsis a r~lrtir tic una tah!.1 tic .:. x ~. Otro
:~Rd [ problema que ticne cl uso de 1.1Sdos bil1omiaJes cs cl gran nlJl11cro de
,1 rcsultados posiblcs. Por cjcmplo. si iV I = ;VII = .:.5. hay 676 resultados
,
,"

posibles para los 1.1:1!0$ [(N, + I) .( Nll + I )]. Para simplificar los
clculos. pue<.1e hacer~e un.1 asuncin rel:lcionad:t con :Imho~ prohlema~.
~~';
c', I La a~uncin para lo~ d~ltos dc set!uimiento () de rrevalencj:1 consislc en
que el l1mero total de ca~os re~llmel1tc ohser\'adoS sc 10m:1 como c()ns-
tante (M.lntel y 11ankc~'. 1971). P~lra d:I!()s dc C:1so-contr()l. las dos
I distribuciol1es hinomi.llc~ se rcficrcn no:1 I.IS series dc expuestos ~. 110-
ex puestos. si 110 ~I 1.1Sseries I.lc caso~ ~' con I rolcs ~' 1.1 corre~pond icn tc
asuncin C.:s1.1UCc.:1tirmcro !()I,II Jc SU,iel()S CXP\ICStOS I:S consl:lnlc. L()
que esenciall11cntc hacclt cst:t~ :Isunciones ~~ /ij.lr !0<.1()S!()S tot.\It:s m.lrgi-
n:1les de la t.1bla Je 2 x .:.; por lo t~lnIO. si la ccld.1 (I aument.1. la~ ccl<.1:1s
h y c deben c:1d.1 una disminuir en un.t canti<.1:It1 cquivalentc. y la ccl<.1a (I
aumentar en un.1 cantidad il!\lal. Una VCl m:1nteni<ios C()n~t.1ntc~ tOdoS
I los mrgenes. slo hay una v-:1riable ~1Ie:1!Oria a de~cribir: la \'ari.lcil)n en
cualquier celda de la I.lbla de 2 x 2 con m:irgenes !otales fij.ldos e$l:.
pues. concatenada con la vari.1cin concomital1te de cad.1 una de 1~ls
D otras casillas. H.1hitualmente. por tan!o. la cuestin ccntrCli \'icl1e :1 ser
simplemente la casilla a de la tabla. que e~ 1.1quc se tom:1 como \'.lri:1ble
aleatoria.
D La asuncin de que todo~ lo~ (otalc~ m:lrgin:1lL's dc una lahla de 2
x 2 estn fijados. puede ju$tificarse
para enfocar el problema (de la comprobacin
metodolgic.1mente como me<iiacit)n
dc hiptcsi~) direct.1mente
r~r
sobre la asociacin existente entre expo~icin ~' enfermedad. En jerga
H I

estadstica. el parmetro de perturbacin se elimina fijando lo~ !otales


marginales: comprobar la hiptesis nul.1 emple:1ndo un modelo Je dos

fi binomiales
parmetros.
independiente$
1.1$proporciones
requiere que se delerminen los valores de (1().\"
PI y po. en t.1nto quc el problema analtico il
puede reducirse a determinar el \'alor de UI1.1 medida nica. Tal mcdid:1
es la r.1Zn dc vent:lj:1. igual a PI ( 1 -1')/[!'11( I -PI )]. quc e~t:i por
~ completo detcrminada por el valor de la celd.\ a si los to!.lles marginale~
se toman como fijo~. Comprobar que se prnduce un alejamiento de 1.1
razn de ventaja re,<;pecto de la unidad es equi\'alcnte a comprohar un
alejamiento de 1'1 con respecto :1 1'0. ya que la condicin nula de PI = 1'11
~
es equivalente a una razn de ventaj.l de un.1 unidad. pero fijar los

n
~.I
u

'::~:~

:"'.~

;;t]~i~J:
ti~i~~-~
,,'~
.~1::
.~.i~i~~~:::;~;i~;::f;
;;J~1:;:;~:f..;~:;;:,.::;:;;;;:(.
i!!;,~~;
j~\t~;~\~~~~:rl:
I~t

ANALISIS DE DATOS CRUDOS 183

.~
1 La probabilidad de seis casos expuestos seria 0.0028: para siete C~\SOS
expuestos. 0,0002 y para el resultado ms extremo. ocho casos expuestos.
0.000009. El valor total de p con una cola, calculado segiln el metodo de
Fisher. sera de 0.0748 + 0,0185 + 0.0028 + 0.0002 + 0.000009 = 0.096.
El valor medio de p con una cola sera 0,0374 + 0.0185 + 0,002R +
0,0002 + 0.000009 = 0.059. El valor medo de p con dos col:ls. t:lnto del
Fsher como de la media P, podra obtenerse dobl~lndo el valor de la p
D de una cola.
Para este ejemplo, el modelo hpergeometrico requiere el clculo de
slo cnco probabildades. De haber empleado el modelo de las dos
r~\ dstribuciones binomiales independentes. con 390 casos y 1.254 contro-
les como las dos seres independientes. huhiesen sido necesarios por el
contraro miles de clculos para dcterminar qu resultados eran iguales .-:-:.
:!;,
.'
t1 de extremos o ms. y luego habria que h~lber c~llculad('1 tambien la
,.
.. probabilidad de cad~l uno de estos resultados. La simplfic~ldor~l ~lsun-
cin de la distribucin hipergeometrica. que fija todos los totales margi-
;~';
~
-:-,
I nales. reduce enormemente
Lo razonable
la complcjidad
de I~l asuncin
de los clculos.
hipergeometrica. incluso para datos
"'~:~.
tales como los del ejemplo 11.3 en que las frecuencias de las cuatro
celdas son pequeas. se hace evidentc al comproh;r sus rcsultados con
I
~~

los obtcnidos empieand('1 el modeio dos-hinomiaJ. Empleando ste y


usando la magnitud de la razn de ventaj~l p~lra determinar qu result~l-
dos son des\'iaciones iguales o m(ls extremas respecto al valor nulo. se
encontr que el valor de ? para el Fisher era de 0.094 y cl valor de la
media ?, 0.071. (Estos clculos requieren varias horas de uso de un ~-
~:
programa BASIC en una microcomputad('1ra.) L~l concordancia cntre los :
I dos abordajes
hipergeomtrico
es sorprendente cuando uno considera que en el c,llculo
slo se han ncluido cinco probahilidades separadas.
;:
~
i!
!i

~. mientras que en el modclo binomi:ll se incluyen miles. Con frecuencias


~;I'
I ms grandes en las celdas, mejora la coincidencia
ambos diferentes modelos. Sean cuales fueran las discrepancias
entre los resultad('1s de
entre los
resultados de los dos abordajes. no indican nnguna inexactitud p('1r
:':~:Wj
parte del modclo hipergeometrico: puesto que la asuncin de los totales
D marginales fijados suministra una prueba v:llida, aunque los m,irgenes
no estuviesen realmente fijados por el diseo del estudio. un test de la
hiptesis nula basado en el modelo hipergeometrico es tan vlido como ~0;~\j:,.J~
,..::.~ ,~
,
~ otro basado en el modelo dos-binomial. Como el ~lbordaje hiper-
geomtrico es extraordinariamente
modelo de eleccin. ms sencill('1. c('1nstituve
. claramente el
,);}f~~1;~.,

~ Desgraciadamente, incluso el modelo hipcrgeomtrico puede reque-


rir un nmero oneroso de clculos s todas las frecuencias de las celdas
son de cierto tamao. Por ello, en la mayora de las ocasiones se usa una
prueba estadistica asinttca para calcular el valor de ? La prueba
~
estadistica asinttica puede. derivarse partiendo tanto del modelo dos-
binomial como del modelo hpergeometrico. Con este ltimo, la variable
aleatoria sera la celda a. nmero de casos expuestos. La expectativa
~ nula para el nmero de casos expuestos es N I \1./T y la varianza hiper-

:::;:,;;:r~;~:i~;:~~ -~=:~.~;.:
..:~~:..;.,1;:,., ;.;~;, :":"
""i:';:t.::: ;;~:~;:;:;:
:~: :;,.,;
..::~~:.:::~:;
~~~J:. !;
~ .;,;:~:;:':;*,,:
:~(::~~;:;:.~ :~~:,i:~:;

~
[ 11.6]

quc p,lrccc similar a la ecuacin [I 1.1] para datos persona-tiempo. Si se


()htu\'icsc una prueba estadistica asinttica del modelo dos-binomial en
1\I!:!ar tIc ohtcncrla a partir dcl hipergcomctrico, se podran comparar las
tI()-; pr()rorcioncs binomiales observadas, al N I y hl N o. Bajo la hiptesis
n\lla. la cxpcctativa de la difcrcncia cl1tre estas dos proporciones es cero.
La vlrianza podria estimarse de diversas maneras; la usual consiste en
Iltili,ar una varianza comn conjunta para las dos proporciones bino-
mialcs ya que, bajo la hiptesis nula, las probabilidades binomiales para
Co;IStlos distribuciones son iguales. As, M I IT se toma como un estima-
tI() tIc 11prohahilidatl binomial conjunta y la varianza de la diferencia en
pr()p()rci()ncs pucdc expresarsc como

~!-!..)( ~ ) r -1- + ~
, T T LN1 No

1(, lllll.: ll:

z = 7]

f]
1.1 Illlllipllltcii)11 algcbrai(.;a ue la ecuacii)11 .7] da una expresin casi
i(ll'lllic;I11;1 lIJ.6J:

a -N.Af.IT
.~]

J~~~

L" lllliL." dirL'rcncja elllrc ItiS dos r()rmul"s cs Iti T- 1 dc la cxprcsin del
JCII1111Iill;IJ()r dc la ccut,cil1 [11.()1. C.'ICsc rcL'mrlazt\ por Tel1 la [11.8].
(.I)m() 11il1~una dc It\s dos r)rmlllas cs .'rlict'ble a mel1os quc T sea
..Jl"'Jc cl rulllo .dc visla rr;<.:liL.() aml)as son jdcl1licas.
hllhicsc l'lllrlL';'dl) lilla rrllL'I);1 csl;,(lsliL.a asjlll(!lica para calcu-
ANALISIS DE DATOS CRUDOS 185
-~-
lar el valor de p con los datos del ejemplo 11.3, habramo~ obtenido,
'empleando la ecuacin [11.6],

..
lo que da un valor de P, con una cola, de 0,040. Como cabra esperar, el
vaJor de p resultante de la prueba asinttica es ms cercano al valor
exacto de la media p que al valor exacto del Fisher (vase Cap. 10),.pero
la aproximacin no es muy buena. Obsrvese que bajo el modelo hiper-
geomtrico slo hay nueve resultados posibles para la celda a; evidente-
mente, el nmero de resultados es demasiado pequeo para que la
aproximacin sea vlida. Una regla de andar por casa y que se emplea a
menudo consiste en que la prueba estadistica asinttica debe aplicarse
solamente cuando la expectativa nula ms pequea para cualquier celda
de la tabla de 2 x 2, basada en los totales marginales, sea mayor que 3.
No obstante, si hay alguna duda sobre lo adecuado de esta aproxima-
cin asinttica, lo mejor es evaluar exactamente el valor de P.

ESTIMACION DE EFECTOS CON DA TOS BR UTOS

Estimacin COlI dato.t de .tegllllli('nto

ESTIMACION PUNTUAL

La estimacin puntual de las medidas del crecto, exprcsadas ya sea el1


forma de direrencia o de razn, implica hallar la dirercllci:1 o la razn
de los valores observados de incidencia o de riesgo. As. In cstimncin
puntual de la direrencia de tasas de incidencia (IRD) seria:

{1 ,
IRD = '::\1-;- -~

y el estimado puntual de la razn de tasas de incidencia

IRR = a/NJ

De modo similar, para dalos de riesgo (incidencia acumulada), en los


cuales los denominadores son recuenlos en l':Jgar de medidas persona-
tiempo, el estimado. puntual de la difcrencia de riesgo seria:

a h-
I

RD=N:"--::
RR=~

h/No

Si cl objeto de inferencia es la razn de tasas de incidencia, en vez de


la razn de riesgo. entonces la razn de riesgo que se puede calcular
directamente a partir de los datos de riesgo, empleando la frmula
3nterior. conduce a una subestimacin del efecto. El grado de subestima-
cin depende del nivel de los riesgos, siendo ligero para riesgos pequeos
y mayor para riesgos grandes (vase Cap. 4 y Tabla 6.1). Un abordaje
lltcrl1(ltivo para la estimacin puntual con denominadores que son re-
ClICI1tO.l; consiste en utilizar la frmula de la razn de ventaja

lflll' ...()hrccslima cJ erCClo ms o mcl1os CI1 Ja n1jsm;t exlcnsjn en quc la


ri17i)11 dc rics~o lo suhcsljn1a (TabJa 6.J ). pcro tjCJ1C Ja VeJ1taja dc ser el
J11isI1J() csljlJ1ad()r cl11pJcado CI1 c.<;ludio.<; dc caso-col1lroJ (rrmuJa [6.J]).

Sll~I,\(.I()N DI INTI:RVAI.O

I;.\fill",( i,i,l ,1c.11,lf(.n.(II" 1:.-.\(I("I(1C()II Dlil().~ d(. !>.('1!;'(imi('111(). La csljma.


L'i(111Jl' lIll il1ll'r\.alo rucdc scr cx~cla o arroxjmada. Para la exacla,
l'(}IJJ(1 r"r; ("I(ul,lr un \.alor cx;lclo dc r. dl'hc cmrlcarse un m()dl'lo
csl"di,lico arr()rjado quc dcscrjha la dj.c;lrjhlll:i()n dc rrob,lbjlidad de los
d,II(},. 1:1 IIJ(ldcl(}. gcIJcr,lll1Jcnlc, scri llIJ,1 C:\ICIlSi(}IJ Jcl lIljljz,IJO r,lra
l.ll.III.lr lIlJ \.,llor exaclo de r. l)ar,1 1,1 comprOb,lL'ii,1l dl' la hjrlcsis
11111.!. 'I.. ISII'JJl' lI'l crcl:lo ccr() y .c;cIc iIlC()rr(}r:1 cn Cl11Jodclo csl:ldjstjco;
r;lr;1 (;lll.lii;lr limilc5 dc confianl:l cxaclos, cl modclu csladjsliL'u dcbc scr
L'lr"7 <lc :I((\m(ld:lr ercctos no-cero.

I)., I()S 1)1' TASAS DI: IN('IDEN('IA (PERSO~A-l1EMI'(). Para la difc-


rcIJt:i\ Jl' tas:ls dc incidcncia, sc prcscnta una difil"ultad al intentar
postlllar Ul1 modclo estadstico a partir del cual pucda calcularse un
intcr\"alo dc conlian7..a exacto. Para la comprobacin dc hiptcsis, el
111()Jl.I() billomial dcscinsa en Ii ~isII11Cil)n dc quc M., el nmero total
dc I()s cas()s. es una constante. Esta asuJlcin es anloga a la de los
tol:IIl'~ Il1arginalcs fijados en el modclo hipcr!!comtrico para tablas de 2
x 2. I)aril la cstimacin del inlcrvalo, cl prohlcma que tiene asumir que
.\1 I es C()11stante consiste en que. con rcspccto a la diferencia de tasas de
il1ciJencia. el valor Afl no es simplemenle un parmelro de perlurba-
cil,11)' que estadisticamenle careciese de peso en la medida del erecto; el
\"JII)r dc "Ii imponc un lmitc en la magnitud de la direrencia de tasas de
ANAlJSIS OE OATOS CRUDOS 187

incidencia (un valor pequeo de M J es compatible nicamente con


valores pequeos de tasas), requiriendo por ello que la variabilidad
muestral de M J sea tomada en cuenta al estimar la diferencia de tasas de
incidencia. Por tanto, el modelo binomial simple con un M I fijo no
puede'emplearse para calcular lmites exactos de confianza para la dife-
rencia de tasas de incidencia con datos expresados en trminos de
persona-tiempo. La contrapartida para datos persona~tiempo del mode-
lo ms general dos-binomial para tablas de 2 x 2 seria un modelo
consistente en dos distribuciones de Poisson independientes, en el cual
los casos expuestos y no-expuestos ocurren cada uno independiente-
mente de los dems y con frecuencias descritas por una distribucin de
Poisson. La citada distribucin de Poisson, no obstante, carece de lmite
superior para el nmero de acontecimientos (es decir, casos) que pueden
ocurrir, por lo que no puede emplearse para los clculos anteriores sin
un truncamiento arbitrario. Por estas razones, la estimacin del inter-
valo exacto para diferencias de tasas de incidencia no es posible fcil-
mente.
Resulta apropiado. no obstante, fijar M J para estimar la razn de
tasas de incidencia, porque la medida razn depende de la razn de
casos expuestos a no-expuestos, no de la magnitud absoluta de las
frecuencias. Por ello, M I puede considerarse como un parmetro perlllr-
bador que esladisticamente es independienle de la medida de razn de
tasas. A efectos de estimacin, el sencillo modelo binomialllnico emplca-
do para la comprobacin de la hiplCSis debe scr modilicado para
acomodar un efecto no-cero. Puede conseguirsc esto haciendo constar
que la probabilidad de que un caso sea expuesto, dados \11, est{t rclacio-
nada con la razn de tasas de incidencia de la siguicrlle manera:

Los limites exactos de confianz.a para IRR pucden ob&encrsc haciando la


probabilidad de la cola de la distribucin binomial igual a !X/2 y 1 -cx/2,
donde 1 -cx es igual al nivel de confianza deseado. Si llamamos !! al
punto delin1itador ms bajo del intervalo de confianza para la probabili-
dad de que un caso sea expuesto y ii al punto de delimitacin ms alto
de dicho intervalo de confianza, entonces

[ .91

No
mR= [ 10]
(I -)N.
Ii ~:cf~ll!
."C,-;,:~:::;:. .
..,

l ANAliSIS DE DATOS CRUDOS 189

~
Fisher. podri~IJl C~III..'\lI~lrsc :1 p:lrlir tic I~I,'; I.:CU~IL'j(),1C,'; r ,1)~' .101 L'(\I11(1
:\
"l
slgUC:

~"
0.05 = -!J).~h k
1 I
k ,= . I

~ (,
().t)5 = \ ii I~'.
j, L..
... k:.2

Estos clcul{)s $e ltaccl1 mcjor C()11una c()mrutuor:l o ror UI1 ml:touo ue


n
,1t:.ljO que incluye 1:1 di.'itrihlJci()n F (Rothm:JI1 y B()ice. 19X.:.: Ar()\\,I1I~c.
11
1965). Una s()llIci()n de cnsy(') y crr()r r:lr:J Is rrcccdcnlcs crlllci()nes
ua l! = O.6IR y li = ().X27. uc d()ndc slc illJi = I.I() :/ n:ffi" = .1.:.5.

u Si se clcul11 los limitc.'i L'11h:lse :11 \,:1I{)r L'X:ICt() ue. p UI.: liJ m~{li
cntonces 1,1SCcucj(')nc$ :1 res(')lver s()n:
P.

.~I,
( '5(' )
9
) !.lll ~
0.05 = ::;- -1!).'(' -k
.~-
.:-:.. k
..~- \ ,
.~: y . ." ,
,~
0.95 = , + l()~h k
t ~::.;:::.

~.;;;.."~':
Los lmites de confianza slJrcri()r c infcri()r ;ll ()() r()r I()() uclermill,ld()s
por las anteriores ccuacjones hasdas en 1:1 mcdia P. -'()Il !J = ().62h :. Ii
= 0.8205. corresp()ndiendo a lR.R = I.J4 :' mR = J.I().
.;~~i;"
::;:~;
DATOS DE IN('If)EN('IA ,\('tfMVL\DI\, Si los del1omil1:1dores SOI1 re- ':::~1;;i'.
cuentos en lug.1r de unidades persona-tiempo. un interv:llo de confi:lnz:l '..:~11~;::
,:;;\~,::
plra la diferencia de riesgo podra c.1Icu.lrse t~()ric:lmente .1 p:lrtir del .;.::~:
modelo dos-binomi(ll, El c~llculo. no obstante. implic:lria 1:1 delermil1a- ':;:-;:
cin reiterntiva de 1.1 problbilidad eXlcta de 1:1 cola h:l~ada en dos
binomiales independientes y. por tanto. no es r:icil de ~.iecutar,
Los lmites de confianzn para la medid:l de la r:lzn de riesgo e."tin
rI
t,
,- tambin sujetos a la misma dificultad de compllt:ICi()n. porque cl \';llor
de dicha medida depende del nllmero total de C:IS<)Sy requiere cl u~o dc
.:~~ii,
dos binomiales independientes, Si. por el contrario. sc ernrle.1 lit medida
de razn de ventaja para 11e$timacin. amho~ mi1rgel1e$ tIc 1.1tahla Je 2
x 2 pueden ser considerado$ fij.1dos y lo.'\ c:ilculo.'\ ~e sirnplilic:lri:ln
mucho. ya que la cit.1d1 medida de la raz{)n tIc vent:lja es independiente
del nmero total de ca$os. Corno la razn de ventitja e$ sol.lrnente una ,c::i.~~.:'i~;

aproximacin de la rnzn de riesgo. el c~llcul<) ~ic 10$ limite~ L'xact<)~ tIc la


primera no produce lmites exactos de conlianZl para 1.1 segund:l. L:I
aproximacin es buena solamente ~i 10$ rie$gos $on pequco$. en cuyo
~ caso el intervalo exacto de confianza de la razn de ventaja pllede
emplearse como razonable intervalo de conlilnza ,~ustituti"o de m ra7:(1n
de riesgo.
B El modelo estadstico que describe la ,'ari:lci<)n de una cclda l'n lll1:1

D
,---c".-

:;~.;:c .::~'::~.~.::{j~.;.~: , .:.:~ ": c;


:.:..
.i~:~:~
~:.~:.~;;.:c :..~:.:::;.". '.;;;;':,

~
:;;,::

j~~r; .~;: :;ifLJ ;;!~jfl~;~

n ANALISIS DE DATOS CRUDOS


19'

...
l
Ni\,ci tic ;lnlicllcrp()~

Di.lrrca 7 12

9
a
2
No di.lrrca
TOlalc$ 16 14

n
I
!
,
para los lmites J~ la media ? La solucin dc las ecuacioncs que
anteceden puede consumir mllcho tiempo. ~'a que cada repeticin en el
,1
r'

[ proceso exige que se Ilevc a caho Ilna suma complicada. pero no e~ ni dc


. lejos lo complicada que resultaran los cillculos que se prccisarian si se
~t~'
emplease un modclo cst:ld~tico de dos hinomialcs independiente~. ~:..~:...""".

;.:~~
~..," Los datos del cjemplo 11.4 describen los resultados p:lrci:llcs de un
~~:'; estudio de seguimiento. e\'aluando el riesgo de p:\decer diarrea en nios
sometidos ,\ I:\ctancia m,ltern:\ en BangJ:ldcsh durante un periodo de
once das. segn la detcrminaci()n de varios ttulos de ,Inticucrpos cn la
leche del pecho de sus madres. Un valor exacto dc ? dc 1:1hiptcsis nul~l
dc no :1sociacin. da ?II) = 0.02 p~lra el valor de ? de Fisher ~. ?iII =
0.01 para el valor de 1:\ medi~\ ? El estimado del riesgo rcl~ltivo ~I rar1ir
de estos datos. comp~1rando cl grupo expuesto :1 titulos ~lltos con cl
expuesto :1 ttulos bajos. e~ (7/16)/(12,!14) = 0.51. El de la razn de
ventaja dfiere notablemente de est,l cifr,l. dcbido ~I que los riesgo~ ~on
;.::.
muy ~lltos: el cit~ldo cstim~\d() de 1:1-razn de ventaj:1 es (7 x :?)/( I:. x 9) =
= 0,13. Se puede calcular un ntervalo de col1fi~\nza exacto p,\r,\ I~\ r,lZI1 de
ventaja empleando las frmulas [ 11.11 ] y [ 11.1 :.] p,\ra obtener los limi-
tes de Fisher. Los lmtes de confianza ~ll 90 por 100 son 0.0 17 y 0.75 1.
obtenidos por cl mtodo de solucin de ecuaciones de ensayo y error de
l,lS frmulas ~lntes citad,lS. Si. por el contrario. se dcse:\scn los lmites
exactos de I~I medi:\ ? podr,ln ohtenerse :\ p:lrtir de las ccuaciones
[11.13] y [11.14] y .~on 0.0:?5 y 0.608. Esto~ lmites ex~lctos de la razn Jc
ventaj:.\. sin emb,\rgo. no pueden ser empleados como lmites de confian-
,:jt~~::~::-
za de la razn de riesgo. puesto que con estos datos. la razn de \'entaja
~ es una pobre aproximacin para la razn de riesgo.

8
La eslimacin aproximada dcl illlcrvalo a partir dc Jato~ de ~cgl1imiclllo
brulos es direcla.
~ DATOS DE TASAS DE INCIDEN('IA (Pf:RS()N\-TIE/IIP(). Col1~iJercmo~
primero los dalos de tasas de incidencia con denominadores persona-
liempo. Se pueJen estimar do5 medidas dcl cfecto: diferencia de t:l~a~
u y razn de tasas. Como la medida de diferencia de tasas tiene \ll1a

o
~.
~--~---,-- ..'c~.,;,~-~
,.:,: ,
:.. -,'"

:;:;-,
:. :t~~\;;:;:
.:;: -.;.,
:.~.
.:;~.::~;i~:~j [:::;::;.:.;~ifu::~::i~[~~:~

~
ANAliSIS DE DATOS CRUDOS 193

clculo de]osintiJogaritmos, se consigue mucha mayor exactitud que si


se obtienen 'IoS 1mites calcuJndolos simctricamente 'Sobre la razn de
.tasas misma. ~s,;procederemos

La desviacin estndar de la razn de tasas de iricidencia puede


aproximarse con la frmula

/!-;!
~~Tb
De nuevo, empleando los datos del ejemplo 11.1, podemos estimar la
razn de tasas de incidencia como

41128.010aos
= 1,86
15/19.017 aos

y el In (1,86) == 0,618: La desviacin estndar del estimado puntual


transformado logarlmiramente es

.JI/4i + 1/15 = JO:jijT = 0,302

Un intervalo dc confi:lnza al 90 por 100 para clln (RR) sera entonces

0,618 .i ,645(0,302) = 0,12,

el cual, despus de sacar el antilogaritmo para invertir la-transformaci()n,


da un intervalo de confianza entre 1,1 y 3,0. El proceso en su conjunto
puede rcsumirsc como sigue

:,645.jl/4i + 1/15] =
exp [III (1,86) i 3,0

Estos lrntes concuerdan bien con los lrniles exactos al 90 por 100 de la
media P, calculados anteriormcnle corno 1,1 y 3,1.
Una forma altcrnativa de haccrlo podra ser ernplcar la frmula
basada en el test

RR'I:1:ll1.)

en la cual X tiene un valor de 2,08 para los datos del ejemplo 11.1.
Utilizando Z = 1,645 para limites al 90 por 100, el abordaje basado en
dicho test da un intcrvalo desde 1,1 a 3,0. que igualmente est en
excelente concordancia con los limites exactos de la media P.
:;;;~::~;;:i;:;:;:;:~:":.i;~,:.
.:".~.'-:'~::...~,:~\:~~...

::";,:'

~.::.~i;
!;a!,i~. .:::

ANALISIS DE DATOS CRUDOS 195

La desviacin estnd:lr estimada del In (RR) es

i'-
'-"j

y el inlcrvalo dc confianza .11 90 por 100 cs

cxp [ -0.673 ::!: .645(0.304)] = 0.31. 0.84

Ailernalivamente. loS lmites basados en eltesl podran calcultlrSc como

RltII.tZlll = O,51(1.t l.h45-1.J01.I = 0.32.


0.82

De nuevo. los dos mtodos aproximados par~\ I~\ estimacin del iI1Icr\'~\lo
de confianza concuerdan bien.
Si la inferencia a partir de los datos de seguimicnto con dcnominado-
res de recuento tuviese que estar basada en la razn de ventaja. en vez de
en la razn de riesgos. entonces la frmula par~l la desviacin estnd:\r es
(Woolf. 1955)

SD[ln (razn dc venlajal] = 1:- + -+ -+ -


V (I h c (I

Para el ejemplo 11.4. la razn de ventaja es (7.2)/(9.1.?) = 0.]3 y el


logaritmo es In (0,13) = -2.04. La desviacin estnd.lr es

SD[ln (razn de venlaja)] =

y el intervalo de confianza aproximado al 90 por 100 es

exp [In (0.13) :!: 1.645(0.915)] = 0.03. 0.58

Los lmites de confianza basados en el lcst se calculan como

0.131Itt.h4s1-1.J41 = 0.03. 0.55

Considerando los muy pequeos nmeros implicados en cstos clculos.


~ las dos estimaciones aproximadas anteriores del intervalo para la razn
de ventaja coinciden tolerablemcnte bien, no slo una con la otra. sino
tambin con el intcrvalo de confianza de la media p exacta para la razn
~
de ventaja, que anteriormente se calcul era de 0.025 a 0.608.
El abordaje de Cornfield ( 1956), que se describe con mayor detalle en
el captulo 12, es una tcnica de aproximacin tericamente prcferiblc.
~ ya que implica volver a recalcular el error estndar usando frecuencias

:.

:;~;
;!~:
..!:f~7~

~
;,:"':...' ,.;..~,..,

\t\~:l*~~~ ;:";-,:::' :~~..:.~.~...~...;.,.

~~f;~i~i\\~@
::.;;.:

196 EPIDEMIOLOGI" MODERNA

de cclda adeclladas qll(, c()rre~p()ndcn iI \':II('1r <lcl lmitc dc c()l1fianza.


A5i pues, el proceso es reiterativ() e i1lcluye $u~tancialmc1llt.' 111ilSt:ilclll()s
quc ()tros mtodos de aproximacii)n. Plra I()s dat()s dcl c.icmplo 11.4. c.:1
lbordljc dc Cornficlu da lI1l i1llcr\,lll) dc C(mri;lni'.:1 :11l)() r()r I(){) OC ().()~
a 0.55. concorda1ldo en e$la ()casin con el ~Ib()rua.ic b~l!;adl) C1l cl lc.:sl.

Daln,\" di' ('a,\"(I-Cm11/'m

Para dalos de caso-controJ. J. medid.1 cpidcmiolll.t!icl dc intcrcs ccntr:11


es la razn dc ventaja. el estimad()r punlu.11 dc IIi Cll:lI cs

R = tl(1
h('

La estimacin del intervalo de confi.ln7.a cxact() dc I~t raZl)J1 dc ventit.iil cs


idntica para los datos de caso-control y de seguimicnlo. y se hasa cn las
frmulas que van dc 11 [11.11] .1 I~t [11.14]. Lo.c; intervalo.c; de confitn7.a
aproximados de la razn dc venl.lja partir de d~tlos de Clso-control se
determinan cmpleando los mismos rnctodos q\lC' par;} los datos dr seg\li-
miento. lI~ann() la transformacin logartimic con una de la.c; siguienlc~
rrmula.c;

Rcl t;~1:1
o exp {111(R ::tz SD[ln IR)]:

donde

SD[ln (razn de venta.ia)] ~ I ~ ~- ~ + -+ ~


\ 'I h (. (I

Consideremos el ejemplo I J.3. Los limilcs dc confi~ln7:.' cxlcln!\ .119() por


100 para la razn de ventaja, utilizando las ecu~lci()nes l J 1. J I J y [ 11.1 :!J
para los lmites de Fisher, son 0.77 )' 13.6: emplcando 1.1~ ecuacionc!\
[11.13] )' [ll.J4] para los lmites de 1~1med.1 !'. los re,c;ultados ~on 0.94
y ~1,1. Los limit~s de confian7.a aproxmados ul90 por lO() puedcll dclcr-
mmarse como sIgue:

In (R = In (3,24) = 75

SD[ln (razn de ventaja)] = 0.71

exp [In (3,24) :t 1,645(0.71)]

o, empleando el abordaje basado en el lest

3.2411'! 1.(,4~'1.7~1 = 9.8

,~!~. ~:
J
ANALISIS DE DATOS CRUDOS 97

Como era tic csrcr:tr. I.'St()S rcslllt:t(I()s CnI1CliCr(I:\ll ml.i()r C()11 I()s lmitcs
exactos de 1.\ mctii.\ > qlle cnl1 los lmilcs CX:tl"\OS tic I;is/tcr. L.\ :trro.xi-
m:\cin 11() cs rerrcct:\. rer() t:lmr()C() cs ticm:lsi:IJ() r()hrc. c()l1siJcr:\l1ti()
que dos dc I.\s cu.ltro ccldas tic 1.1 t:lhl:\ 2 x 2 r()SCCll rrccllcl1cias ()hscr-
v.\d.\s de s()I() cu.\tr(). El mct()Jo tic C()rl1ficlti J:I lIn il1tcr\,:\lo al ()O r()r
n tOO de t.t a 9.R. idcJltic() :tl ticl :thord:t-jc COI1 h:tsc CI1 c:1 tcst.
u

~
,'1 REFERENCIAS

Boicc. .J. D.. ;ln<.1 M()n"nn. I~. I~. IJrc:l!;1 (;:lnt:cr in \\,omcn :lflcr rl:rl::lII:(1 I1l1-
orosc()pic cx:lminllinn!; ()r tJ1c chcst. J. IV(lrl. (.clll(.I.r 111.\"1.1()7i:S9:~~.1-X.1~.
Br()wnlcc. K. 1\. .)'llli.\"li("(11 71,(.(lr.. (111(1,\I(.,h(I(IIII(II.'.. ill .\.("i(.I1("(.(m(I,:i,l.'i//(.I.rilll.'.
Ncw y ()rk: Wilcv. I ()(,5.
Cornlicld. J. 1\ ~t:lti~tit::11 pr()hlcm :lrisin~ rr()m rClrOSrI:L.ti\.c stlluil:s. 1,1.1. NI::-
man jcd.). Pr(II.(.{.(lil1l.'.\" "/,i/"(1 B(.r".(.".I. .)../I1"IIXill/I1. V()I. .J. IJl:rkl:lcy: Ilni\.cr.
sity of C:llir()rni:1 Prcss. I ()5(,. rr. I :l.5-14X.
Fishcr. R. 1\. TJIC I()!:!ic I)r inllt:li\,c inrcrl:ncc. .1. I~. .)'(iI. .\i/(... Sl:ril:s :\.
19~5:9R::1.9-54.
Gart. J. J. TJc comrari!;on < rr()r()rlion~: ;1 rc\.il:\v ()f "i~,1ifit::lllt:C II:Sls. \..(1'11i.
dcncc inlCrvuls unJ uujllslmcnlS for str:llilit::lli()n. I~{.r. 111,. .\i,ll. 111\1.
197J:39:I~H-I(,l}.
GJass. R. J.. Svcnncrholm. ..\. M.. .<;1()II. IJ. J.. CI ul. Pr()lcclinn ,I~aill!;t (;h(lll:ra in
brc:1Sl.rcd childrcn by antihi(ltics in brt'I~t milk. .V. EI1f,'I. .1. .\1(.(1.
1983:308: 1389.1392.
Mantcl. N.. and Hankcy. B. F. Pr(lgrammcd analysis ()r a ~ x;. contingcnt:y
table. ..f/11. .)/{11. 1971 :25:40-44.
RotJman. K. J.. and Roicc. J. D. E"i(I('/I1i(II(1.f,'i(" ..111l1l \"i.\" 11.ilh II Pr(I.f,'rl/ll/I1ll1hl{'
C{llc/(llIr(1r (2nd cd. ). Brooklinc. M \: Epidcmiolngy Rc$()lirccs 1nt:.. 19X;..
Rothm:1n. K. J.. Fyler. D. C.. Goldhlatt. \.. et ;11. Exogen()lis h()rmones and
other drug exposures ()r childrcn \vith congcnital hcart di~easc. ..//11. J.
E"i{ll'mi(ll. 1979: 109:433-439.
Shorc. R. E.. Pa~lcrnack. n. s.. and Curncn. ~1. (j. 1~l:lalin!:! illnllcnza 1."1'iuc-
mics I() childlloo<.1lc\lkcmia in tllm()r rcgi~tric~ \Vilhnllt ; <.Iclincd pnrUlali()n
~ basc: 1\ I:ritiqllc wilJ 5uggcsti()ns r()r improvc mcthod~. ..1/11.J. E"i(".,lli(ll.
1976: 103:527-535.
woolr. R. On cstimating lhc rcl:llion hct\vccn hl<.)(,d gr()lip an LliscI$C. ..1ll1/.
H/(11,. G('11(,t. 1955:19:251-253.

u
.
~... ~::x"~"'.:;.':'..;.
v ~.~.;;... ..

;~:
'I ,~ .f~

Vous aimerez peut-être aussi