Vous êtes sur la page 1sur 47

Elementos de Probabilidad

Luis Bustos M, Juan Jose Orellana C, Sergio Muoz N, Antonio Sanhueza C

1
Introduccin
El concepto de probabilidad desempea un papel
importante en el tratamiento de pacientes y en
la investigacin cientfica.

Son muy pocas las decisiones sobre pronstico de


un tratamiento o sobre resultados de un
experimento que se pueden predecir con
certeza absoluta.

2
Experimento Aleatorio
Experimento que satisface las siguientes
condiciones:
no se puede predecir un resultado particular del
experimento antes de realizarlo
se pueden conocer todos los resultados posibles
del experimento
el experimento puede ser repetido bajo las mismas
condiciones

3
Espacio Muestral

Se define como el conjunto de todos los posibles


resultados de un experimento aleatorio, y se
denota por S.

Ejemplo:
En el lanzamiento de una moneda tenemos
S = {c, s}.
En el lanzamiento de un dado tenemos
S = {1, 2, 3, 4, 5, 6}

Suceso o Evento (A)

Dado un espacio muestral S, un suceso (o


evento) es un subconjunto de S. Los
eventos se denotan con letras
maysculas; A, B, C, etc.

5
Ejemplo

Se selecciona un paciente al azar de un total de


400 pacientes clasificados segn hbitos de
fumar y frecuencia de bronquitis.

Son eventos de inters:


A = {seleccionar una persona que tenga bronquitis}
B = {Seleccionar una persona que fume}

6
Definiciones
El complemento de un suceso A con respecto al espacio
muestral S, es aquel que contiene a todos los resultados de
S que no se encuentran en A, A o Ac

El suceso formado por todos los posibles resultados en A1 o


A2 o en ambos, recibe el nombre de la unin de A1 y A2,
AUB.

El suceso formado por todos los resultados comunes tanto


A1 como a A2, recibe el nombre de interseccin de A1 y A2,
AB.

7
Probabilidad

La probabilidad es una medida matemtica de la


posibilidad de que ocurra un evento de inters.

8
Definicin Clsica de Probabilidad

Consideremos un experimento aleatorio que tiene un


nmero finito de resultados, de tal forma que el espacio
muestral puede ser escrito como S = {w1, w2, , wn}. Si
los resultados del experimento son igualmente probables,
es decir P({wi}) = 1/n, entonces la probabilidad de un evento
A puede ser obtenida utilizando la siguiente frmula:

P(A) = # (A) / # (S)

Obs:
0P(A) 1
9
Probabilidad Condicional
Sean A y B dos sucesos cualesquiera de un espacio
muestral S, tal que P(B) > 0.
La probabilidad condicional de A dado B, denotada
por P(A/B), es el cuociente entre la probabilidad
conjunta de A y B, simbolizada por P(AB), y la
probabilidad marginal de B, digamos P(B). Esto es:

P(A/B) = P(AB) / P(B)

10
Teorema de la probabilidad total

A1 A2
Si conocemos la probabilidad de B en
cada uno de los componentes de un
sistema exhaustivo y excluyente de
sucesos, entonces

B podemos calcular la probabilidad de


B.

A3 A4

P(B) = P(BA1) + P(BA2 ) + P( BA3 ) + ( BA4 )

=P(B|A1) P(A1) + P(B|A2) P(A2) +


11
Ejemplo: En esta aula el 70% de los alumnos son mujeres. De ellas, el 10%
son fumadoras. De los varones, son fumadores el 20%.
Qu porcentaje de fumadores hay en total?
P(F) = P(FH) + P(FM)
= P(F|H) P(H) + P(F|M) P(M)
=0,2 x 0,3 + 0,1 x 0,7 T. Prob. Total.
Hombres y mujeres forman
= 0,13 =13% Un Sist. Exh. Excl.
De sucesos
Se elije a un individuo al azar y resulta
fumador. Cul es la probabilidad de que sea un hombre?
P(H|F) = P(F H)/P(F)
= P(F|H) P(H) / P(F)
= 0,2 x 0,3 / 0,13 Mujeres
Varones
= 0,46 = 46%
T. Bayes

fumadores
12
Expresin del problema en forma de rbol

P(F) = 0,7 x 0,1 + 0,3x0,2=0,13


Fuma
0,1
P(H | F) = (0,3x0,2)/0,13 = 0.46

0,7 Mujer
0,9
Los caminos a travs de
No fuma
nodos representan
Estudiante intersecciones.

0,3 0,2 Las bifurcaciones representan


Fuma
Hombre uniones disjuntas.

Podemos resolver los


0,8 problemas
No fuma usando la tcnica de vuestra
preferencia.
13
Teorema de Bayes
Si conocemos la probabilidad de B en
cada uno de los componentes de un
A1 A2 sistema exhaustivo y excluyente de
sucesos, entonces

si ocurre B, podemos calcular la


probabilidad (a posteriori) de
B ocurrencia de cada Ai.

P(B Ai)
P(Ai | B) =
A3 A4 P(B)

donde P(B) se puede calcular usando el teorema de la


probabilidad total:

P(B)=P(BA1) + P(BA2 ) + P( BA3 ) + ( BA4 )


14
=P(B|A1) P(A1) + P(B|A2) P(A2) +
Ejercicio:
Durante los ltimos aos se ha
escrito mucho sobre la posible
relacin entre el Fumar y el
Cncer Pulmonar. Supngase
que en un centro mdico, de
todos los fumadores el 90% tena
cncer pulmonar, mientras que Personas
nicamente el 5% de los no
fumadores lo padeca. Si la
proporcin de fumadores es de
0.45, cul es la probabilidad
que un paciente con cncer
pulmonar, seleccionado al azar,
sea fumador?

15
Pruebas diagnsticas
Una prueba diagnstica sirve para ayudar a mejorar una
estimacin de la probabilidad de que un individuo presente
una enfermedad (E+).

En principio tenemos una idea subjetiva de P(Enfermo).


Nos ayudamos de
Incidencia,
Porcentaje de nuevos casos de la enfermedad en la
poblacin.
Prevalencia,
Porcentaje de la poblacin que presenta una
enfermedad.

16
Pruebas diagnsticas
Por otra parte, para confirmar, usamos una prueba diagnstica.
La misma ha sido evaluada con anterioridad sobre dos grupos de
individuos: sanos (E-) y enfermos (E+). As de modo frecuentista
se ha estimado:
Sensibilidad (verdaderos +)= Tasa de acierto sobre enfermos.
Especificidad (verdaderos -)= Tasa de acierto sobre sanos.

A partir de lo anterior y usando el teorema de Bayes, podemos


calcular las probabilidades a posteriori (en funcin de los
resultados del test): ndices predictivos
P(Enfermo | Test +) = ndice predictivo positivo
P(Sano | Test -) = ndice predictivo negativo

17
Tabla de Contingencia, 2x2

Enfermedad

+ -
Test VP FP
+
(a) (b) a+b
FN VN
-
(c) (d) c+d
a+c b+d

18
Pruebas diagnsticas: aplicacin T. Bayes.
Sensibilidad, T+
verdaderos +
P. a priori de enfermedad:
Enfermo

Falsos - T-
Individuo
Falsos +
T+
Sano

Especificidad, T-
Verdaderos -

19
De la tabla y diagrama de rbol se tiene:

a=VP= Verdaderos +, son individuos enfermos que dan el test +


b= FP= Falsos +, son individuos sanos que dan el test +
c= FN= Falsos -, son individuos enfermos que dan el test
d= VN= Verdaderos -, son individuos sanos que dan el test

Probabilidad de un falso positivo, probabilidad que una persona


sana se la diagnostique como enferma.
P(F+)=P(T+/E-)= b/ (b+d)
Probabilidad de un falso negativo, probabilidad que una persona
enferma se la diagnostique como sana.
P(F-)=P(T-/E+)= c/ (a+c)
20
Sensibilidad: Es la proporcin de personas ENFERMAS que
tienen un resultado positivo al realizarles un determinado test
diagnstico
Sn=P(T+/E+) = a/ (a+c) = 1-P(F-)

Especificidad: Es la proporcin de personas SANAS que tienen


un resultado negativo al realizarles un determinado test
diagnstico
Sp=P(T-/E-) = d/ (b+d) = 1-P(F+)

Existe un equilibrio entre la sensibilidad y la especificidad,


cuando aumenta la sensibilidad disminuye la especificidad y
viceversa.
21
La significacin del resultado de un test diagnstico no slo depende
de su sensibilidad y especificidad, sino tambin de la Prevalencia
(tambin llamada Probabilidad Pre-test) de la enfermedad en la
poblacin en la que se realiza el test.
Valor predictivo positivo, probabilidad de que un individuo con
resultado positivo en el test est enfermo.
VP+ =P(E+/T+) = a/ (a+b)=(Sn*Prev)/ [(Sn*Prev + (1-Sp)(1-Prev)]
Valor predictivo negativo, probabilidad de que un individuo con
resultado negativo en el test est sano.
VP- =P(E-/T-) = d/ (c+d)=Sp(1-Prev)/ [Sp(1-Prev) + (1-Sn)Prev]

VP, probabilidad de que la enfermedad est presente (o ausente) despus de


obtener los resultados de la prueba depende probabilidad pretest.
22
Ejemplo: Pruebas diagnstica y T. Bayes

La diabetes afecta al 20% de los individuos que acuden a una


consulta. La presencia de glucosuria se usa como indicador de
diabetes. Su sensibilidad es de 0,3 y la especificidad de 0,99.
Calcular los ndices predictivos.

P ( Enf T +)
0,3 P ( Enf | T +) =
T+ P ( Enf T +) + P ( Sano T +)
0,2 Enfermo 0,2 0,3
= = 0,88
T- 0,2 0,3 + 0,8 0,01
Individuo 0,7

0,01 T+ P ( Sano T )
0,8 P ( Sano | T ) =
Sano P ( Sano T ) + P ( Enf T )
0,8 0,99
T- = = 0,85
0,99 0,8 0,99 + 0,2 0,7
23
Observaciones -Qu probabilidad
tengo de estar
enfermo?
En el ejemplo anterior, al llegar un individuo
a la consulta tenemos una idea a priori sobre - En principio un 20%.
la probabilidad de que tenga una Le haremos unas
enfermedad. pruebas.

A continuacin se le pasa una prueba


diagnstica que nos aportar nueva
informacin: Presenta glucosuria o no.

En funcin del resultado tenemos una nueva


idea (a posteriori) sobre la probabilidad de
que est enfermo.
Nuestra opinin a priori ha sido modificada - Presenta glucosuria.
por el resultado de un experimento.
La probabilidad ahora
Relacinalo con el mtodo cientfico. es del 88%.

24
diagti 60 140 8 792
True |
disease | Test result
status | Neg. Pos. | Total
-----------+----------------------+----------
Normal | 792 8 | 800
Abnormal | 140 60 | 200
-----------+----------------------+----------
Total | 932 68 | 1,000

[95% Confidence Interval]


---------------------------------------------------------------------------
Prevalence Pr(A) 20% 18% 22.6%
---------------------------------------------------------------------------
Sensitivity Pr(+|A) 30% 23.7% 36.9%
Specificity Pr(-|N) 99% 98% 99.6%
ROC area (Sens. + Spec.)/2 .645 .613 .677
---------------------------------------------------------------------------
Likelihood ratio (+) Pr(+|A)/Pr(+|N) 30 14.6 61.7
Likelihood ratio (-) Pr(-|A)/Pr(-|N) .707 .646 .774
Odds ratio LR(+)/LR(-) 42.4 20.2 89.2
Positive predictive value Pr(A|+) 88.2% 78.1% 94.8%
Negative predictive value Pr(N|-) 85% 82.5% 87.2%
---------------------------------------------------------------------------
diagti 80 20 90 810

True |
disease | Test result
status | Neg. Pos. | Total
-----------+----------------------+----------
Normal | 810 90 | 900
Abnormal | 20 80 | 100
-----------+----------------------+----------
Total | 830 170 | 1,000

[95% Confidence Interval]


---------------------------------------------------------------------------
Prevalence Pr(A) 10% 8.2% 12%
---------------------------------------------------------------------------
Sensitivity Pr(+|A) 80% 70.8% 87.3%
Specificity Pr(-|N) 90% 87.9% 91.9%
ROC area (Sens. + Spec.)/2 .85 .809 .891
---------------------------------------------------------------------------
Positive predictive value Pr(A|+) 47.1% 39.4% 54.9%
Negative predictive value Pr(N|-) 97.6% 96.3% 98.5%
---------------------------------------------------------------------------

26
Valor predictivo positivo
VP+ =(Sn*Prev)/ [(Sn*Prev + (1-Sp)(1-Prev)]
=80*10/[80*10+10*90]=47.1

Valor predictivo negativo


VP- =Sp(1-Prev)/ [Sp(1-Prev) + (1-Sn)Prev]
=90*90/[90*90+20*10]=97.6

27
Razones de probabilidad

Queda claro pues cmo la prevalencia es un factor determinante en


los valores predictivos de un test. Por lo tanto, stos, no pueden ser
utilizados como ndices a la hora de comparar dos mtodos
diagnsticos diferentes, ni tampoco a la hora de extrapolar los
resultados de otros estudios a datos propios. Por ello, resulta
necesario determinar otros ndices de valoracin que sean a la vez
clnicamente tiles y no dependan de la prevalencia de la enfermedad
en la poblacin a estudiar. As, adems de los conceptos de
sensibilidad, especificidad y valores predictivos, se suele hablar del
concepto de razn de verosimilitudes, razn de probabilidad, o
cociente de probabilidades. Estos miden cunto ms probable es un
resultado concreto (positivo o negativo) segn la presencia o ausencia
de enfermedad:

28
Razn de probabilidad o Likelihood Ratio (LR) o
Cuociente de verosimilitud

1.Cuando el test es positivo


Se calcula dividiendo la probabilidad de un resultado positivo en
los pacientes enfermos entre la probabilidad de un resultado
positivo entre los sanos. Es, en definitiva, el cociente entre la
fraccin de verdaderos positivos (sensibilidad) y la fraccin de
falsos positivos (1-especificidad)

LR+ = sensibilidad/ (1-especificidad)= 80/10=8

29
Razn de probabilidad o Likelihood Ratio (LR)
o Cuociente de verosimilitud

2. Cuando el test es negativo


Se calcula dividiendo la probabilidad de un resultado
negativo en presencia de enfermedad entre la
probabilidad de un resultado negativo en ausencia de la
misma. Se calcula por lo tanto, como el cociente entre la
fraccin de falsos negativos (1-sensibilidad) y la fraccin
de verdaderos negativos (especificidad)

LR- = (1-sensibilidad)/ especificidad= 20/90= 0.22


30
La siguiente tabla muestra el impacto diagnstico
segn 5 niveles de su LR

LR Impacto diagnstico

Muy positivo, LR>10 Confirmar SpPin

Moderadamente +, LR>3 Intermedio alto

Neutro, LR=1 Indeterminado

Moderadamente -, LR<0.3 Intermedio bajo

Extremadamente -, LR<0.1 Descartar SnNout

31
Donde:
SpPin: Cuando un test diagnstico tiene una especificidad
elevada, el resultado positivo de dicha prueba con un LR>10
hace que el diagnstico de la enfermedad que se investiga con
dicho test sea prcticamente seguro (Sp=Specificity,
P=Positive, In=Dentro, seguro).

SnNout: Cuando un test diagnstico tiene una sensibilidad


elevada, el resultado negativo de dicha prueba con un LR<0.1
hace que el diagnstico de la enfermedad que se investiga con
dicho test sea prcticamente imposible (Sn=Sensibility,
N=Negative, Out=Fuera, imposible).

32
Para este ejemplo, si la probabilidad pre-prueba de un sujeto es de
0.50 y el resultado de la prueba resulta positivo la probabilidad de
que padezca la enfermedad se modifica aplicando la frmula
descrita anteriormente a 0.89, mientras que si fue negativo se
modifica a 0.08.

Si comparamos dos pruebas diagnsticas A y B, y calculamos


sus cocientes de probabilidad positivos, y vemos que LR+A >
LR+B, diremos que la prueba A es mejor que la B para
confirmar la presencia de enfermedad.
Si en cuanto a los cocientes de probabilidad negativos vemos
que LR- A < LR- B, diremos que la prueba A es mejor que la B
para confirmar la ausencia de enfermedad.
33
Curva ROC (Receiver Operating Characteristics),
curva caracterstica del operador receptor
Una herramienta til para evaluar la capacidad diagnstica de una prueba
cuantitativa para todos los posibles puntos de corte, es la denominada curva
ROC. Tambin nos servir para comparar diferentes pruebas.

34
Existe una zona de posibles resultados de la prueba para la que la
distribucin de sujetos sanos y enfermos se solapan. Si queremos
aumentar la probabilidad de detectar pacientes enfermos, en la
grfica corresponde a mover el punto de corte hacia la izquierda,
vemos que entonces tambin aumentaremos el nmero de falsos
positivos. Si movemos el punto de corte hacia la derecha,
disminuiremos los falsos positivos, pero a costa de aumentar el
de falsos negativos. Resumiendo, un aumento de la sensibilidad
disminuye la especificidad, y viceversa.

Una curva ROC es una grfica lineal , que muestra la probabilidad


de un resultado positivo real (sensibilidad) en funcin de la
probabilidad de un resultado falso positivo para varios punto de
corte.
35
Cuanto ms desplazada est la curva ROC hacia el vrtice superior
izquierdo, mejor es la capacidad discriminatoria de la prueba.
Precisamente una forma de evaluar de manera global esa capacidad
de discriminacin consiste en calcular el rea del polgono que
queda debajo de la curva ROC, y se denomina rea bajo la curva,
sirviendo como ndice de comparacin entre pruebas diagnsticas,
cuanto mayor es el rea mejor es la capacidad diagnstica.
Adems, el punto que se ubica ms cerca de esta esquina por lo
general se elige como punto de corte pues se obtiene su mxima
sensibilidad y especificidad simultneamente.

36
37
roctab esofagitis sum17, detail graph mlabel(sum17)

Detailed report of Sensitivity and Specificity


------------------------------------------------------------------------------
Correctly
Cutpoint Sensitivity Specificity Classified LR+ LR-
------------------------------------------------------------------------------
( >= 0 ) 100.00% 0.00% 37.13% 1.0000
( >= 1 ) 100.00% 20.95% 50.30% 1.2651 0.0000
( >= 2 ) 99.19% 30.95% 56.29% 1.4366 0.0261
( >= 3 ) 92.74% 41.90% 60.78% 1.5964 0.1732
( >= 4 ) 87.10% 52.38% 65.27% 1.8290 0.2463
( >= 5 ) 80.65% 66.67% 71.86% 2.4194 0.2903
( >= 6 ) 73.39% 77.14% 75.75% 3.2107 0.3450
( >= 7 ) 58.87% 81.43% 73.05% 3.1700 0.5051
( >= 8 ) 50.81% 87.14% 73.65% 3.9516 0.5645
( >= 9 ) 37.90% 91.90% 71.86% 4.6822 0.6757
( >= 10 ) 25.00% 96.19% 69.76% 6.5625 0.7797
( >= 11 ) 16.94% 98.10% 67.96% 8.8911 0.8468
( >= 12 ) 9.68% 100.00% 66.47% 0.9032
( >= 13 ) 4.03% 100.00% 64.37% 0.9597
( > 13 ) 0.00% 100.00% 62.87% 1.0000
------------------------------------------------------------------------------

38
ROC -Asymptotic Normal--
Obs Area Std. Err. [95% Conf. Interval]
--------------------------------------------------------
334 0.8097 0.0234 0.76395 0.85552
1.00

1 0 0
4
2
3
4
0.75

5
Sensitivity

6
0.50

8
0.25

10
11
12
0.00

13

0.00 0.25 0.50 0.75 1.00


1 - Specificity
Area under ROC curve = 0.8097

39
Punto de corte en 4

diagt esofagitis erge4

| erge4
esofagitis | Pos. Neg. | Total
-----------+----------------------+----------
Abnormal | 108 16 | 124
Normal | 100 110 | 210
-----------+----------------------+----------
Total | 208 126 | 334

True abnormal diagnosis defined as esofagitis = 1

[95% Conf. Inter.]


-------------------------------------------------------------------------
Sensitivity Pr( +| D) 87.10% 79.89% 92.44%
Specificity Pr( -|~D) 52.38% 45.40% 59.30%
Positive predictive value Pr( D| +) 51.92% 44.91% 58.88%
Negative predictive value Pr(~D| -) 87.30% 80.20% 92.56%
-------------------------------------------------------------------------
Prevalence Pr(D) 37.13% 31.93% 42.55%
-------------------------------------------------------------------------

40
Punto de corte en 5
diagt esofagitis erge5

| erge5
esofagitis | Pos. Neg. | Total
-----------+----------------------+----------
Abnormal | 100 24 | 124
Normal | 70 140 | 210
-----------+----------------------+----------
Total | 170 164 | 334

True abnormal diagnosis defined as esofagitis = 1

[95% Conf. Inter.]


-------------------------------------------------------------------------
Sensitivity Pr( +| D) 80.65% 72.58% 87.19%
Specificity Pr( -|~D) 66.67% 59.85% 73.00%
Positive predictive value Pr( D| +) 58.82% 51.03% 66.30%
Negative predictive value Pr(~D| -) 85.37% 79.01% 90.39%
-------------------------------------------------------------------------
Prevalence Pr(D) 37.13% 31.93% 42.55%
-------------------------------------------------------------------------

41
Ejemplo: Para facilitar la comprensin de los conceptos se utilizarn
como ejemplo los resultados del estudio Birkebaek N H, Hansen L K,
Elle B, Andersen P E, Friis M, Egebland M, Damgaard- Pedersen K et
al. Chest roentgenogram in the evaluation of heart defects in
asymptomatic infants and children with a cardiac murmur:
reproducibility and accuracy. Pediatrics 1999; 103: e15.
El objetivo de este estudio era determinar la utilidad de la radiografa de
trax para confirmar o descartar la presencia de una cardiopata en nios
que presentan un soplo cardiaco y que se encuentran clnicamente
asintomticos. Para ello, se realiza una radiografa de trax (clasificando
sus resultados como presencia- ausencia de enfermedad congnita) y se
comparan sus resultados con los de una ECO doppler, prueba que es
considerada como el estndar de referencia.

42
Ejercicio:

ECO Doppler

Enfermo No enfermo
Total

Radiografa Anormal 7 11 18
Trax
Normal 16 64 80

Total 23 75 98

43
Calcular:
1) Sensibilidad
2) Especificidad
3) LR+
4) LR-
Si la probabilidad pretest es 70%, calcular
5) VP+
6) VP-

44
45
46
Referencias
1. U de Malaga. http:/ftp.medprev.uma.es/libro/
2. Pagano, M. y Gauvreau, K (1993) "Principles of Biostatistics". Editorial
Duxbury Press. Belmont California.
3. http://www.fisterra.com/mbe/investiga/pruebas_diagnosticas/pruebas_d
iagnosticas.htm
4. http://www.pap.es/FrontOffice/PAP/front/Articulos/Articulo/_IXus5l_LjPoaO
Wa4GoonMy2SP_H3waGz
5. Scielo.cl

47

Vous aimerez peut-être aussi