Académique Documents
Professionnel Documents
Culture Documents
Al lanzar tres monedas, el espacio muestral es E = {(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c),
(s,c,s), (s,s,c), (s,s,s)}
Evento o Suceso. Se llama evento o suceso a todo subconjunto de un espacio muestral.
Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los
siguientes son eventos:
A partir de esta definición las probabilidades de los posibles resultados del experimento se
pueden determinar a priori, es decir, sin realizar el experimento.
Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la
probabilidad de que un fumador sea hipertenso?
A = {ser hipertenso} B = {ser fumador}
A B = {ser hipertenso y fumador}
p(A|B) = 0,10/0,50 = 0,20
Obsérvese que los coeficientes falso-positivo y falso-negativo de las pruebas diagnósticas
son probabilidades condicionadas.
La fórmula anterior se puede poner p(A B) = p(B) p(A|B) = p(A) p(B|A)
llamada regla de la multiplicación, que se puede generalizar a más sucesos
p(A1 A2 A3) = p((A1 A2) A3) = p(A1 A2) p(A3|A1 A2) = p(A1) p(A2|A1)
p(A3|A1 A2)
En general p(A1 A2 A3 ...) = p(A1) p(A2|A1) p(A3|A1 A2) ...
llamado principio de las probabilidades compuestas y especialmente útil para aquellas
situaciones en que las probabilidades condicionadas son más fáciles de obtener que las
probabilidades de las intersecciones.
Ejemplo 5:
Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un
estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de
ateroma. Si el 10% de los individuos con placas de ateroma están expuestos a muerte
súbita por desprendimiento de trombos ¿qué probabilidad tiene un individuo cualquiera de
estar expuesto a muerte súbita por desprendimiento de trombos de una placa de ateroma?
A1 = {problemas vasculares}; A2 = {placas de ateroma}; A3 = {expuesto a muerte súbita
por ....}
p(A1) = 0,001; p(A2|A1) = 0,20; p(A3|A1 A2) = 0,1
p(A1 A2 A3) = 0,001 x 0,20 x 0,1 = 0,000002
Ejemplo 6:
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al
azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.
Definimos A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde}
p(A1) = 2/10 aplicando la definición clásica de probabilidad, puesto que hay 10 bolas y 2
son verdes.
p(A2|A1) = 5/9; si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas
verdes.
p(A3|A1 A2) = 4/8; si la primera bola extraída es azul y la segunda verde en la urna
quedan 8 bolas, 4 de ellas verdes.
p(A1 A2 A3) = 2/10 x 5/9 x 4/8 = 1/18
Regla de la probabilidad total: Si un conjunto de sucesos Ai forman una partición del espacio
muestral y p(Ai) 0 Ai, para cualquier otro suceso B se cumple
Demostración
Ejemplo 8:
La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del
0,1%. Si la prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la
prevalencia del infarto en esa población?
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una partición
B = {padecer infarto}
datos: p(B|A1) = 0,003; p(B|A2) = 0,001; p(A1) = 0,25
Teorema de Bayes
Si los sucesos Ai son una partición y B un suceso tal que p(B) 0
Demostración
Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los
síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc.
y Si a los síntomas y síndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La información accesible en los libros de patología, o en un archivo de historias clínicas es
del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el
paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades
forman una partición (son mutuamente excluyentes y se consideran todas las
enfermedades compatibles con el síntoma) y se conocen sus prevalencias.
Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si
se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón
de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden
representar en una tabla de doble entrada
Patrón de oro
NE E
- a b r
Prueba
+ c d s
t u
una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la
prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad
de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno
en el que dé negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96
p(-|E) = 0,05 p(+|E) = 0,95
p(E) = 0,07 p(NE) = 0,93
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
2º Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05
y falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la
enfermedad de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de
que no esté enferma.
Solución
Sea NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y - = {el
resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son
p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del
último p(NE)=0,85, por lo tanto aplicando el teorema de HYPERLINK
"http://www.hrc.es/bioest/Probabilidad_18.html"Bayes
eorema de Bayes
Si los sucesos Ai son una partición y B un suceso tal que p(B) 0
Demostración
Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los
síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc.
y Si a los síntomas y síndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La información accesible en los libros de patología, o en un archivo de historias clínicas es
del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el
paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades
forman una partición (son mutuamente excluyentes y se consideran todas las
enfermedades compatibles con el síntoma) y se conocen sus prevalencias.
Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si
se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón
de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden
representar en una tabla de doble entrada
Patrón de oro
NE E
- a b r
Prueba
+ c d s
t u
una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la
prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad
de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno
en el que dé negativo?
p(+|NE) = 0,04 p(-|NE) = 0,96
p(-|E) = 0,05 p(+|E) = 0,95
p(E) = 0,07 p(NE) = 0,93
Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
Ejercicios Resueltos Variables Aleatorias Discretas
1. Un artesano ha elaborado 7 colchas de una etnia indígena 2 de ellas tienen algún
defecto. Un turista compra 3 de estas colchas. Sea el número de colchas defectuosas.
Hallar la distribución de probabilidad de X:
Datos:
5 buenas
n=7 2 defectuosas
r=3
X = Numero de colchas defectuosas
X = 0, 1, 2
función de Probabilidad
X = Xi 0 1 2
P (Xi) 2/7 4/7 1/7
Media
µ = (0)(2/7) + (1)(4/7) + (2)(1/7) = 6/7
Varianza
V(x)= (0 – 6/7)2(2/7) + (1-6/7)2 (4/7) + (2-6/7)2 (1/7)= 20/49 = 0.40816
Desviación Estándar
σ= 0.40816 = 0.6388
Media
µ = (1)(2/28) + (2)(3/28) + (3)(4/28) + (4)(5/48) + (5)(4/20) + (6)(3/20) + (7)(2/20) +
(8)(1/20) = 129/28
Varianza
V(x)=(1-129/28)2(2/28)+(2-129/28)2(3/28)+(3-129/28)2(4/28)+(4-129/28)2(5/28)+(5-
129/28)2(4/20)+
(6-129/28)2(3/20)+(7-129/28)2(2/20)+(8-129/28)2(1/20)= 57/16 = 3.5625
Desviación Estándar
σ= 3.5625 = 1.887
2. Una variable aleatroria discreta X tiene la función de probabilidad f(x) donde
F(x)= k(9-x) si x= 5, 6, 7, 8
en otro caso
a) Determine K, b) encuentre la media y la varianza de X
P(X=5) = k (9-5) = 4k
P(X=6) =k(9-6) =3k
P(X=7) =k(9-7) =2k
P(X=8) =k(9-8) =1k
Sabemos que: 10k = 1 entonces tenemos que:
k = 1/10
función de Probabilidad
X 5 6 7 8
P (X) 4/10 3/10 2/10 1/10
0 si X < 5
4/10 si 5 ≤ X ≤ 6
F(X) 7/10 si 6 ≤ X ≤ 7
9/10 si 8 ≤ X ≤ 9
1 si X> 8
Media
µ = (5) (4/10)+ (6) (3/10)+ (7) (2/10)+(8) (1/10) = 6
Varianza
V(x)= (5 – 6)2(4/10) + (6-6)2 (3/10) + (7-6)2 (2/10)+ (8-6)2 (1/10) = 1
Función de Probabilidad
X 4 5 6 7
P (Xi) 4/60 10/60 18/60 28/60
se sabe que el 30% de los habitantes de una ciudad depende del asma. determinar la probabilidad de
que en una muestra aleatoria de 4 personas.
i) P(X=0)= (40)*0,30*(0,7)4=0,2401
ii) P(X ≥ 3)= (43)*0,33*(0,7)1 + (44)*0,34*(0,7)0=
0,0756 + 0,0081=0,0837
DISTRIBUCIÓN BINOMIAL
En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número
de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad
fija p de ocurrencia del éxito entre los ensayos.
Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados.
A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite nveces, de forma
independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la
binomial se convierte, de hecho, en una distribución de Bernoulli.
FORMULA
PROCEDIMIENTO
- Debes de leer cuidadosamente el problema en cuestión para saber acomodar los datos correctos en la
formula.
Es imprtante también que sepas como utilizar la calculadora (es necesario que sea cientifica) ya que ésta
contiene funciones primordiales que necesitarás.
RESOLVIENDO EL PROBLEMA
n= 10
x= 5
p= 80%
p(x=8)= [ 10/5]
En este primer paso es importante que sepas que NO estamos dividiendo 10/5 si no que usaremos la
tecla nCr de tu calculadora, para obtener el resultado (que en este caso te debe de dar 252).
Enseguida lo multiplizarás por lo siguiente 1-.8 ^10-5. Aqui 1 se refiere a un entero y le retarás "p" para
saber lo que quedaba [en algunas formulas este paso (1-p) puede venir como "q" y es correcto también]
y lo elevarás con los datos que tengas.
~Si tienes alguna duda, puedes consultar los siguientes ejemplos para darte una mejor idea
http://dl.dropbox.com/u/73370758/DISTRIBUCI%C3%93N%20BINOMINAL.xlsx
DISTRIBUCIÓN BINOMIAL NEGATIVA
DISTRIBUCIÓN BINOMIAL NEGATIVA
Esta distribución puede considerarse como una extensión o ampliación de la distribución geométrica . La
distribución binomial negativa es un modelo adecuado para tratar aquellos procesos en los que se repite
un determinado ensayo o prueba hasta conseguir un número determinado de resultados favorables (por
vez primera) .Es por tanto de gran utilidad para aquellos muestreos que procedan de esta manera. Si el
número de resultados favorables buscados fuera 1 estaríamos en el caso de la distribución geométrica .
Está implicada también la existencia de una dicotomía de resultados posibles en cada prueba y la
independencia de cada prueba o ensayo, o la reposición de los individuos muestreados.
Esta distribución o modelo puede hacerse derivar de un proceso experimental puro o de Bernouilli en el
que se presenten las siguientes condiciones
Las probabilidades p y q son constantes en todas las pruebas. Todas las pruebas son
independientes. Si se trata de un experimento de extracción éste se llevará cabo con devolución del
individuo extraído, a no ser que se trate de una población en la que el número de individuos tenga de
carácter infinito.
FORMULA
En una fabrica, la probabilidad de que una persona la acepten para trabajar es de el 20 %. De 10 personas que no
salieron seleccionadas. Calcular probabilidad de que antes 3 hayan sido seleccionadas.
Este tipo de distribución es muy sencilla ya que tienes los datos muy claros en los problemas. Aún así, si sigues
teniendo dudas te invito a checar el link que viene abajo. Ahí encontrarás más problemas con el procedimiento dado.
DISTRIBUCIÓN DE POISSON
La distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una
frecuencia de ocurrencia media, la probabilidad que ocurra un determinado número de eventos durante
cierto periodo de tiempo.
Donde:
• k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el
evento suceda precisamente k veces).
• λ es un parámetro positivo que representa el número de veces que se espera que ocurra el
fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4
veces por minuto y estamos interesados en la probabilidad de que ocurra kveces dentro de un intervalo
de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
• e es la base de los logaritmos naturales (e = 2,71828 ...)
RESOLVIENDO EL PROBLEMA
• Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades
de que reciba cuatro cheques sin fondo en un día dado?
Solución:
a) x = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3,
....., etc, etc.
= 2.718
TIPS:
Es necesario el uso de una calculadroa científica que te ayude a resolver el problema, ya que una de bolsillo te será
inútil en este caso. Sabiendo utilizar las teclas correctas te será mucho más fácil solucionarlo.
- para activar la tecla "e" deberás oprimir la tecla "shift" y despues "In".
- Para actival la opción "!" deberás, nuevamente, oprimir la tecla "shift" y despúes "x-1".
FORMULA
DONDE:
EJEMPLO:
En una jaula hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar calcular posibilidad
de que 3 de ellos hablen chino ( característica deseada).
En caso de que tengas dudas puedes consultar el siguiente link en el que podrás observar más
problemas de este tipo de distribución.
DISTRIBUCIÓN GEOMÉTRICA
La distribución geométrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas
hasta la consecución del éxito a resultado deseado y tiene interesantes aplicaciones en los muestreos
realizados de esta manera . También implica la existencia de una dicotomía de posibles resultados y la
independencia de las pruebas entre sí.
Proceso experimental del que se puede hacer derivar
Esta distribución se puede hacer derivar de un proceso experimental puro o de Bernouilli en el que
tengamos las siguientes características
Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son
independientes (si se trata de un proceso de "extracción" éste se llevará a , cabo con devolución del
individuo extraído) .
FORMULA
DONDE:
Del salon el 60% de los alumnos son hombres, calcular probabilidad de extraer el 1er hombre a la cuarta
ocasión que extraemos un alumno.
x=4
Recordemos que "x" será siempre el número de experimentos que se hicieron antes de que salga el
primer éxito.
p = 0.60
Esta cantidad casi siempre viene representada en %, si no es así, comúnmente es el primer dato que
aparece.
q = 0.40
Este dato, generalmente, no viene en el problema pero se puede sacar facilmente haciendo la sigueinte
operación: 1-p
Esta distribución es de las más sencillas, si aún tienes dudas en el siguiente link podrás ver más
problemas que te pueden ayudar a entender esta distribución...
http://dl.dropbox.com/u/73370758/DISTRIBUCI%C3%93N%20GE%C3%93METRICA.xlsx