Académique Documents
Professionnel Documents
Culture Documents
BIOESTADSTICA
Unidad 1: Probabilidad y medidas de riesgo
NOCIONES DE PROBABILIDAD
Es una medida de lo aleatorio. Slo se habla de probabilidad en fenmenos o experimentos
aleatorios.
Hay ocho resultados posibles en este espacio muestral. Cada uno de estos resultados, es
decir, cada elemento del espacio muestral se denomina punto muestra. La definicin de qu
Un subconjunto del espacio muestral se llama evento o suceso, y se lo denota con las letras
maysculas del comienzo del alfabeto (A, B, C, etc.). Si al realizar el experimento el punto
muestra resultante es un elemento del suceso A, entonces se dice que A ocurri; si no lo es,
.
ocurri el suceso contrario a A, que se simboliza
Un suceso se llamar imposible si nunca puede ocurrir al realizar el experimento, ya que no
contiene ningn elemento del espacio muestral. Se simboliza . Un suceso ser seguro o
cierto si contiene todos los puntos del espacio muestral, es decir: ocurre siembre. Se
simbolizar S.
DEFINICIONES DE PROBABILIDAD
1. Clsica o a priori
2. Frecuencial o a posteriori
3. Axiomtica
4. Subjetiva
Definicin clsica o a priori de probabilidad
Surge por el 1700, aplicada principalmente a los juegos de azar. La probabilidad de que al
realizar un experimento ocurra un determinado suceso es igual al cociente entre el nmero
de resultados favorables al suceso y el nmero total de resultados posibles, siendo estos
igualmente probables.
La principal ventaja de esta definicin recae en que no es necesaria la experimentacin para
calcular la probabilidad de un evento. La desventaja principal recae en que slo se puede
aplicar en espacios discretos y a sucesos equiprobables.
Definicin axiomtica de probabilidad
Surge alrededor de 1930 con Kolmogorov, un estudioso que defini la probabilidad a travs
de un conjunto de axiomas y propiedades. Sea un suceso aleatorio con cierto espacio
muestral donde se definen los sucesos A, B, C, etc. Para el suceso A (al igual que para el resto)
se define un nmero real llamado probabilidad del suceso A que cumple con los siguientes
axiomas:
o P(A) 0.
o Si los sucesos A, B, C, son todos mutuamente excluyentes, entonces la probabilidad
de que ocurra cualquiera de esos sucesos es igual a la suma de las probabilidades
individuales de cada suceso.
o La probabilidad de que ocurra el suceso cierto o seguro es igual a 1.
Definicin subjetiva de probabilidad
Es la evaluacin racional del grado de creencia que la persona que la emite tiene acerca de
la realizacin de un suceso.
CLCULOS DE PROBABILIDAD
El concepto que se va a usar a lo largo del presente curso es el de probabilidad frecuencial.
Supongamos la realizacin de un experimento que consiste en seleccionar un alumno al azar
y observar su sexo y si fuma o no. Vamos a notar:
F: El alumno fuma.
F: El alumno no fuma.
M: El alumno es mujer.
V: El alumno es varn.
El espacio muestral y los puntos muestra quedan definidos entonces como: {FM, FV, FM,
FV}. La tabla de contingencia (tabla de distribucin de frecuencias de dos variables de forma
simultnea) queda definida entonces como:
Sexo
Fuma M V Total
F 30 10 40
F 160 80 240
Total 190 90 280
Interpretaciones:
o En total hay 280 alumnos en estudio
o 30 de los alumnos son mujeres y fuman
o 90 alumnos son varones
o Hay 240 alumnos que no fuman
A partir de esta tabla de contingencia puede construirse la tabla de probabilidades conjuntas,
dividiendo cada valor de la tabla por el total (280 alumnos):
Sexo
Fuma M V Total
F 0,107 0,036 0,143 10
F 0,571 0,286 0,857 P(FV) =
280
= 0,036
190
P(M) = = 0,679
280
Cabe destacar que si tomamos una columna (por ejemplo, la correspondiente a las mujeres),
la suma de las probabilidades de las dos filas fuma/no fuma es igual a la probabilidad que
figura en la lnea Total. Puesto en otras palabras, la probabilidad de que un estudiante sea
fumador y mujer o de que sea mujer y no fumador es igual a la probabilidad de que sea
mujer.
Sexo
Fuma M V Total
F + 0,107 0,036 0,143
F 0,571 0,286 0,857
=
Total 0,679 0,321 1,000
Esto es as dado que, como ser fumador y no ser fumador son eventos disjuntos (no pueden
ocurrir a la vez) y exhaustivos (cada persona es fumadora o no fumadora, no hay otras
opciones), la probabilidad de que ocurra una opcin o la otra es igual a la probabilidad total,
que en este caso corresponde a la probabilidad de que el alumno sea mujer. Esta
probabilidad total de una fila o de una columna se llama probabilidad marginal. Pueden
observarse dos distribuciones marginales en este ejemplo: la correspondiente a la
caracterstica fuma/no fuma y la del sexo del alumno:
Sexo
Fuma M V Total
F 0,107 0,036 0,143
F 0,571 0,286 0,857
Total 0,679 0,321 1,000
10 0,036
P(F/V) = = 0,111 P(F/V) = = 0,111
90 0,321
Recordando que la probabilidad de que un alumno fume y sea varn es igual al 3,6%, claro
est que saber que el alumno seleccionado es varn incrementa la probabilidad de que este
fume y sea varn (11,1%), dado que en ese caso la probabilidad que se est calculando es la
de que el alumno fume conociendo de antemano que es varn. Esto se traduce en un mejor
aprovechamiento de la informacin.
Siguiendo con el caso prctico, podemos calcular algunas probabilidades a modo de
ejemplo:
P(FM) 30
o La probabilidad de que un alumno fume siendo mujer: P(F/M) = P(M)
= 190
P(FM) 30
o La probabilidad de que un alumno que fuma sea mujer: P(M/F) = =
P(F) 40
40 240
P(F F) = P(F)+P(F) = +
280 280
Consideremos la siguiente situacin: P(A/B) = 0,3 y P(A) = 0,3. Qu nos dice esto sobre
los eventos A y B? Supongamos que los eventos son fumar o no fumar y sexo. Podra
ocurrir que P(F/M) = 0,15 y que a su vez P(F) = 0,15. En estos casos, saber el sexo del sujeto
(suceso B) no cambia la probabilidad de encontrar un sujeto fumador (suceso A), es decir
P(A/B) = P(A). Cuando esto sucede, se dice que los dos eventos son independientes (esto
vale tanto para P(A/B) = P(A/B) = P(A) as como tambin vale para P(B/A) = P(B/A ) =
P(B)).
Ejercicio
En un trabajo organizado por una ctedra de pediatra sobre lactancia materna se
encuestaron 144 madres en consultorios de hospitales pblicos. Como parte de ese trabajo
se estudi la relacin entre el nivel de instruccin de la madre (3 categoras) y el tiempo de
lactancia exclusiva del nio motivo de la consulta, clasificado en menor a 6 meses y mayor
o igual a 6 meses (tiempo recomendado).
Considere el experimento aleatorio consistente en elegir al azar una de las madres
encuestadas y determinar:
o si amamant o no a su hijo el tiempo recomendado;
o su nivel de instruccin, categorizado en primario, secundario y mayor nivel.
a) Explicite el espacio muestral.
b) Defina por extensin los siguientes sucesos:
A: que el tiempo de amamantamiento sea el recomendado
B: que la madre no tenga el secundario completo
AB
AB
c) Defina un suceso C tal que A y C sean mutuamente excluyentes.
d) Defina un suceso D tal que D B sea un suceso seguro.
Se obtuvieron los siguientes resultados al clasificar a las madres segn el tiempo de
lactancia exclusivo de su hijo y nivel de instruccin:
( ) (/ )
( /) =
( ) (/ ) + ( ) (/ ) + + ( ) (/ )
Ejemplo
Hay tres comisiones de Bioestadstica de segundo ao en esta Universidad. El 38% de los
alumnos asiste a la comisin A, el 30% a la B y el resto a la comisin C. El 95% de los
estudiantes de la comisin A entiende lo dado en probabilidad, en la comisin B lo entendi
el 84% y en la C slo lo comprendi el 8% de los estudiantes. Si un alumno elegido al azar
dice entender el tema, cul es la probabilidad de que pertenezca a la comisin A?
E: que el alumno comprenda el tema.
P(A)=0,38 P(E/A) = 0,95
P(B)=0,30 P(E/B) = 0,84
P(C)=0,32 P(E/C) = 0,08
P(A) P(E/A)
P(A/E) =
P(A) P(E/A) + P(B) P(E/B) + P(C) P(E/C)
0,38 0,95
P(A/E) = =
0,38 0,95 + 0,30 0,84 + 0,32 0,08
0,361 0,361
= = = 0,565
0,361 + 0,252 + 0,0256 0,6386
Respuesta: Sabiendo que el alumno elegido al azar comprendi el tema, la probabilidad de
que pertenezca a la comisin A es del 56,5%.
Pruebas de diagnstico
Ejercicio
Supongamos que un test muy confiable ha sido desarrollado para una enfermedad viral
poco frecuente. Cuando la persona est enferma, el test da positivo el 98% de las veces
(sensibilidad del test: probabilidad de que el resultado d positivo cuando la persona est
enferma, dado que la persona est enferma, sabiendo que la persona est enferma). Cuando
la persona no est enferma, el test da negativo el 95% de las veces (especificidad del test:
probabilidad de que el resultado d negativo cuando la persona no est enferma, dado que
la persona est enferma, sabiendo que la persona est enferma).
Se cree que el 1% de la poblacin padece esta enfermedad (prevalencia del test:
probabilidad de la enfermedad en la poblacin de referencia).
a) Si alguien de la poblacin es sometido al test, cul es la probabilidad de que d
positivo?
Sensibilidad = P(+/e) = 0,98
Especificidad = P(/e) = 0,95
Prevalencia = P(e) = 0,01
P(+) = P(+e +e) = P(+e) + P(+e) = P(e) P(+/e) + P(e) P(+/e) =
= 0,01 0,98 + (1 0,01) (1 0,95) = 0,0098 + 0,99 0,05 =
= 0,0098 + 0,0495 = 0,0593
Prevalencia e incidencia
En una investigacin epidemiolgica los resultados pueden ser expresados como variables
continuas (ndice de masa corporal o contenido de hierro en sangre) o variables discretas
(cantidad de porciones consumidas de un alimento). En el caso en que los resultados son
presentados como variables categricas dicotmicas (slo dos niveles), las frecuencias
(contrajo o no contrajo la enfermedad, o bien desarroll o no caries) pueden definirse en
forma genrica como el nmero de individuos que presentan algn evento en particular
(numerador, siendo el evento enfermedad, caries) dividido por el nmero de individuos que
se encontraban en riesgo de ocurrencia de ese evento (denominador). Hay dos cantidades
absolutas que permiten medir la frecuencia de un evento: incidencia y prevalencia.
Prevalencia: Frecuencia de casos ya existentes en un perodo determinado. Representa la
proporcin de sujetos que han presentado el evento en cuestin durante el perodo
analizado.
cantidad de personas con la enfermedad
poblacin total
Por ejemplo: Registros del rea de salud de la Municipalidad de Rosario indican que durante
2010 hubo 20 casos de tuberculosis pulmonar en la ciudad de Rosario. Si la poblacin de la
ciudad para ese ao fue de 1.076.635 personas, entonces la prevalencia de tuberculosis
durante 2010 en Rosario fue de
20
= 0,00002
1.076.635
es decir, 2 por 100.000 personas (0,00002*100.000).
Incidencia: Frecuencia de casos nuevos en un perodo determinado. Puede medirse como
una tasa (no vara entre 0 y 1, tiene unidad de medida, en el denominador tiene tiempo en
riesgo) o como una probabilidad (se la llama incidencia acumulada, vara entre 0 y 1, no
tiene unidad de medida ya que numerador y denominador tienen la misma unidad). Si los
eventos se distribuyen uniformemente en un perodo determinado de tiempo, una tasa de
datos agrupados ser un buen estimador de la tasa a nivel individual.
Medidas de riesgo
Supongamos que tenemos una tabla 2x2 que muestre la distribucin de los individuos bajo
estudio del siguiente modo:
Exposicin al
Enfermo (e) No enfermo (e)
factor de riesgo
Expuesto A B
No expuesto C D
Nota: las frmulas presentadas a continuacin estn expresadas en funcin de esta tabla. Tener presente que al
armarla debe colocarse el evento (en este caso la enfermedad) en la primera columna y el no evento en la
segunda, as como se debe colocar la exposicin al factor en la primera fila y la no exposicin en la segunda. De
lo contrario, las frmulas que se exponen dejan de ser vlidas.
La primera medida que vamos a ver es el riesgo relativo (RR). El riesgo relativo compara la
ocurrencia de un suceso entre quienes estn expuestos a un factor de riesgo y quienes no lo
estn. Se emplea en estudios prospectivos (como los estudios de cohorte), dado que es
necesario conocer la incidencia. Se expresa como el cociente del riesgo en los individuos
expuestos (+ ) sobre el riesgo en los individuos no expuestos ( ).
+ +
= = =
+
La segunda medida de ocurrencia es la razn de odds. Para poder hablar de la razn de odds
primero debemos comprender el significado de los odds.
La palabra odds no tiene una traduccin exacta al espaol. Puede ser entendida como una
posibilidad. Vamos a explicar la diferencia entre odds y probabilidad a travs de un
ejemplo. Si deseamos conocer la probabilidad de obtener un tres al lanzar un dado, como
todos sabemos slo tenemos que dividir el nmero de caras que tienen el nmero tres en
un dado (que es slo un lado) entre el total de caras (que son seis). La probabilidad de
1
obtener un tres es entonces de 6. Ahora bien, si nos interesa calcular el odds de obtener el
nmero tres, lo que hacemos es dividir el nmero de caras que tienen en nmero tres (slo
una) entre en nmero de caras que no tienen el tres (5 caras). De esta manera, el odds de
1
obtener un tres en el tiro de un dado es .
5
Esto significa que los individuos que sufren de hipertensin severa (expuestos al factor de
riesgo) tienen 6 veces ms chances de padecer un infarto de miocardio que aquellos que no
sufren de hipertensin.
180
9820 0,01833
= = = 6,09
30 0,00301
9970
Una razn de odds igual a 6,09 indica que dentro del grupo de aquellos que sufrieron un
infarto, es 6,09 veces ms probable que un paciente padezca hipertensin severa a que
tenga presin arterial normal.
Cabe destacar que la interpretacin de la razn de odds va desde los enfermos hacia los
grupos de riesgo. En cambio, como se vio en el caso del riesgo relativo, la interpretacin va
desde los factores de riesgo hacia los enfermos. Esto es as dado que estas medidas se usan
en distintas circunstancias.
Como se seal previamente, el RR se emplea en estudios de cohorte. En estos estudios se
toman dos cohortes (una de sujetos expuestos a un factor de riesgo y otra sin la exposicin
al factor) y se estudian por largos perodos de tiempo estudios prospectivos) para ver si los
expuestos al factor de riesgo se enferman ms. En general, van a resultar enfermos en ambas
cohortes, pero se espera que el grupo expuesto presente ms sujetos enfermos.
La RO suele emplearse en estudios de tipo caso-control. Para la realizacin de este tipo de
estudios se buscan primero los enfermos, y luego se busca otro grupo de sujetos sanos con
caractersticas similares a los enfermos (estos sern los controles). Una vez que se cuenta
con los dos grupos de sujetos, se averigua si cada uno de ellos ha estado expuesto o no a
algn factor de riesgo. Es de esperarse que los enfermos sean quienes han estado ms
expuestos. Este tipo de estudio es transversal, ya que los datos se toman en un solo
momento para cada sujeto.
Sin embargo, puede demostrarse que matemticamente es lo mismo calcular la razn de
odds respecto a un factor de riesgo para dos grupos enfermos/no enfermos que obtener la
razn de odds para la enfermedad respecto a los dos grupos expuesto/no expuesto. Por lo
tanto, la interpretacin de la razn de odds presentada previamente puede tambin
plantearse como sigue: Una razn de odds igual a 6,09 indica que para aquellos que padecen
hipertensin severa, la chance de presentar un infarto de miocardio es 6,09 veces mayor
que para aquellos con presin arterial normal.
+
+ + 1 +
= = = = =
+ 1