Vous êtes sur la page 1sur 20

Probabilides, Algunas Definiciones

Espacio Muestral.- Se llama espacio muestral (E) asociado a un experimento aleatorio, el


conjunto de todos los resultados posibles de dicho experimento.
Al lanzar una moneda, el espacio muestral es E = {sale cara, sale sello} ó E = {c, s}.

Al lanzar un dado de seis caras, el espacio muestral es


E = {sale 1, sale 2, sale 3, sale 4, sale 5, sale 6}
ó E = {1, 2, 3, 4, 5, 6}

Al lanzar dos monedas, el espacio muestral es


E = {(c,c), (c,s), (s,c), (s,s)}.

Al lanzar tres monedas, el espacio muestral es E = {(c,c,c), (c,c,s), (c,s,c), (c,s,s), (s,c,c),
(s,c,s), (s,s,c), (s,s,s)}
Evento o Suceso. Se llama evento o suceso a todo subconjunto de un espacio muestral.
Por ejemplo en el espacio muestral E = {1, 2, 3, 4, 5, 6} del lanzamiento de un dado, los
siguientes son eventos:

1. Obtener un número primo A = {2, 3, 5}


2. Obtener un número primo y par B = {2}
3. Obtener un número mayor o igual a 5 C = {5, 6}
Eventos mutuamente excluyentes.- Dos eventos son mutuamente excluyentes si no
pueden ocurrir en forma simultánea, esto es, si y sólo si su intersección es vacía. Por
ejemplo, en el lanzamiento de un dado los eventos B = {2} y C = {5, 6} son mutuamente
excluyentes por cuanto
B C=
Eventos Complementarios.- Si A B= yA B = E, se dice que A y B son eventos
complementarios: Ac = B y
Bc = A
Su Medición Matemática o Clásica. Si en un experimento aleatorio todos los resultados
son equiprobables (iguales probabilidades), es decir, la ocurrencia de uno es igualmente
posible que la ocurrencia de cualquiera de los demás, entonces, la probabilidad de un
evento A es la razón:
P(A) = número de casos favorables para A/número total de casos posibles

A partir de esta definición las probabilidades de los posibles resultados del experimento se
pueden determinar a priori, es decir, sin realizar el experimento.

Se deduce de la definición lo siguiente:


0 P(A) 1 La medición probabilística es un número real entre 0 y 1, inclusive, ó
0% P(A) 100% en porcentaje.
P( ) = 0 y P(E) = 1
Su Medición Experimental o Estadística.- La frecuencia relativa del resultado A de un
experimento es la razón
FR = número de veces que ocurre A/número de veces que se realiza el experimento

Si el experimento se repite un número grande de veces, el valor de FR se aproximará a la


medición probabilística P del evento A. Por ejemplo, si lanzo 100 veces una moneda, el
número de veces que obtengo cara es cercano a 50, o sea FR es cercano a 50%.
Probabilidad condicionada
Como la probabilidad está ligada a nuestra ignorancia sobre los resultados de la experiencia,
el hecho de que ocurra un suceso, puede cambiar la probabilidad de los demás. El proceso
de realizar la historia clínica, explorar y realizar pruebas complementarias ilustra este
principio.

La probabilidad de que ocurra el suceso A si ha ocurrido el suceso B se


denomina probabilidad condicionada y se define

Esta definición es consistente, es decir cumple los axiomas de probabilidad.

Cuando ocurre un suceso cambia el espacio HYPERLINK


"http://www.hrc.es/bioest/Probabilidad_12.html"muestral, por eso cambia la probabilidad. A
veces es más fácil calcular la probabilidad condicionada teniendo en cuenta este cambio de
espacio muestral.
Ejemplo 3:
Una mujer es portadora de la enfermedad de Duchenne ¿Cuál es la probabilidad de que su
próximo hijo tenga la enfermedad?
Según las leyes de Mendel, todos los posibles genotipos de un hijo de una madre portadora
(xX) y un padre normal (XY) son xX, xY, XX, XY y tienen la misma probabilidad. El espacio
muestral es  = {xX, xY, XX, XY}
el suceso A={hijo enfermo} corresponde al genotipo xY, por tanto, según la definición
clásica de probabilidad
p(A) = 1/4 = 0,25
La mujer tiene el hijo y es varón ¿qué probabilidad hay de que tenga la enfermedad?
Se define el suceso B = {ser varón} = {xY, XY}
la probabilidad pedida es p(A|B) y aplicando la definición anterior
p(B) = 0,5; A  B = {xY}; p(A B) = 0,25; p(A|B) = 0,25/0,5 = 0,5
Si sabemos que es varón, el espacio HYPERLINK
"http://www.hrc.es/bioest/Probabilidad_12.html"muestral ha cambiado, ahora es B. Por lo
tanto se puede calcular p(A|B) aplicando la definición clásica de probabilidad al nuevo
espacio muestral
p(A|B) = 1/2 = 0,5
Ejemplo 4:

Se sabe que el 50% de la población fuma y que el 10% fuma y es hipertensa. ¿Cuál es la
probabilidad de que un fumador sea hipertenso?
A = {ser hipertenso} B = {ser fumador}
A  B = {ser hipertenso y fumador}
p(A|B) = 0,10/0,50 = 0,20
Obsérvese que los coeficientes falso-positivo y falso-negativo de las pruebas diagnósticas
son probabilidades condicionadas.
La fórmula anterior se puede poner p(A  B) = p(B) p(A|B) = p(A) p(B|A)
llamada regla de la multiplicación, que se puede generalizar a más sucesos
p(A1  A2  A3) = p((A1  A2)  A3) = p(A1  A2) p(A3|A1  A2) = p(A1) p(A2|A1)
p(A3|A1  A2)
En general p(A1  A2  A3 ...) = p(A1) p(A2|A1) p(A3|A1  A2) ...
llamado principio de las probabilidades compuestas y especialmente útil para aquellas
situaciones en que las probabilidades condicionadas son más fáciles de obtener que las
probabilidades de las intersecciones.
Ejemplo 5:
Se sabe por estudios previos que el 0,1% de la población tiene problemas vasculares. Un
estudio sobre individuos con problemas vasculares revela que el 20% de ellos son placas de
ateroma. Si el 10% de los individuos con placas de ateroma están expuestos a muerte
súbita por desprendimiento de trombos ¿qué probabilidad tiene un individuo cualquiera de
estar expuesto a muerte súbita por desprendimiento de trombos de una placa de ateroma?
A1 = {problemas vasculares}; A2 = {placas de ateroma}; A3 = {expuesto a muerte súbita
por ....}
p(A1) = 0,001; p(A2|A1) = 0,20; p(A3|A1  A2) = 0,1
p(A1  A2  A3) = 0,001 x 0,20 x 0,1 = 0,000002
Ejemplo 6:
Una urna contiene 10 bolas, de las cuales 3 son rojas, 5 verdes y 2 azules. Se extraen al
azar 3 bolas. Calcular la probabilidad de que la primera sea azul, y las otras dos verdes.
Definimos A1 = {la 1ª bola es azul}; A2 = {la 2ª bola es verde}; A3 = {la 3ª bola es verde}
p(A1) = 2/10 aplicando la definición clásica de probabilidad, puesto que hay 10 bolas y 2
son verdes.
p(A2|A1) = 5/9; si la primera bola extraída es azul, en la urna quedan 9 bolas, 5 de ellas
verdes.
p(A3|A1  A2) = 4/8; si la primera bola extraída es azul y la segunda verde en la urna
quedan 8 bolas, 4 de ellas verdes.
p(A1  A2  A3) = 2/10 x 5/9 x 4/8 = 1/18

Regla de la probabilidad total


Se llama partición a conjunto de sucesos Ai tales que
A1  A2  ...  An =  y Ai  Aj =  i j
es decir un conjunto de sucesos mutuamente excluyentes y que cubren todo el espacio
muestral

Regla de la probabilidad total: Si un conjunto de sucesos Ai forman una partición del espacio
muestral y p(Ai)  0  Ai, para cualquier otro suceso B se cumple
Demostración
Ejemplo 8:
La prevalencia de infarto cardíaco para hipertensos es del 0,3% y para no hipertensos del
0,1%. Si la prevalencia de hipertensión en una cierta población es del 25% ¿Cuál es la
prevalencia del infarto en esa población?
A1 = {ser hipertenso} A2 = {no serlo} estos sucesos constituyen una partición
B = {padecer infarto}
datos: p(B|A1) = 0,003; p(B|A2) = 0,001; p(A1) = 0,25

evidentemente p(A2) =0,75 por la propiedad 1

p(B) = 0,003x0,25 + 0,001 x 0,75 = 0,0015

Teorema de Bayes
Si los sucesos Ai son una partición y B un suceso tal que p(B)  0

Demostración
Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los
síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc.
y Si a los síntomas y síndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La información accesible en los libros de patología, o en un archivo de historias clínicas es
del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el
paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades
forman una partición (son mutuamente excluyentes y se consideran todas las
enfermedades compatibles con el síntoma) y se conocen sus prevalencias.

Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si
se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón
de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden
representar en una tabla de doble entrada

Patrón de oro

NE E

- a b r
Prueba
+ c d s

t u

Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se


denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la
probabilidad condicionada p(+|NE), se denominacoeficiente falso-negativo (CFN) al cociente
b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes
cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma.
Simétricamente, los coeficientes que cuantifican los aciertos son lasensibilidad, p(+|E), y
la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+)
y/o p(NE|-).

Como E y NE son una partición, usando el Teorema de Bayes

Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica


que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal.
Ejemplo 9:

una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la
prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad
de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno
en el que dé negativo?
p(+|NE) = 0,04  p(-|NE) = 0,96
p(-|E) = 0,05  p(+|E) = 0,95
p(E) = 0,07  p(NE) = 0,93

Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.

Problemas de probabilidad resueltos:


1º Una mujer es hija de una portadora de la enfermedad de Duchenne. Dicha mujer tiene
tres hijos varones sin la enfermedad. Calcular la probabilidad de que ella sea portadora de
la enfermedad.
Solución
Si representamos por x el gen alterado y por X el gen normal, el espacio muestral para el
nacimiento de la mujer  ={xX, XX}, cada suceso elemental con la misma probabilidad (1ª
ley de Mendel). Por tanto, si A = {xX} = {la mujer es portadora}, según la definición
clásica de probabilidad p(A) = 1/2.
Si la mujer fuera portadora, los posibles genotipos para sus hijos son xX, xY, XX, XY, todos
con la misma probabilidad. El espacio muestral para el nacimiento de un hijo varón
es  ={xY, XY}, por tanto la probabilidad de que un hijo varón no tenga la enfermedad es
1/2 (también según la definición clásica). Cómo los genotipos de los sucesivos hijos son
independientes (2ª ley de Mendel), y de acuerdo a ladefinición HYPERLINK
"http://www.hrc.es/bioest/Probabilidad_16.html" de independencia, la probabilidad de que
los 3 hijos varones no tengan la enfermedad es (1/2)x(1/2)x(1/2) = 1/8. Obviamente si la
mujer no fuera portadora, la probabilidad de que los 3 hijos varones no tengan la
enfermedad es 1.
Como el suceso A = {la mujer es portadora} y su complementario A c = {la mujer no es
portadora} forman una partición, se puede aplicar el teorema de HYPERLINK
"http://www.hrc.es/bioest/Probabilidad_18.html"Bayes en relación con el suceso B = {los 3
hijos varones no tienen la enfermedad}

2º Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-positivo de 0,05
y falso-negativo de 0,10. Una mujer con una probabilidad pre-prueba de padecer la
enfermedad de 0,15 tiene un resultado negativo con la misma. Calcular la probabilidad de
que no esté enferma.
Solución
Sea NE = {la mujer no está enferma}, + = {el resultado de la prueba es positivo} y - = {el
resultado de la prueba es negativo}. La pregunta pide p(NE|-). Los datos que se dan son
p(+|NE)=0,05; p(-|E)=0,10 y p(E)=0,15. Del primero se deduce que p(-|NE)=0,95 y del
último p(NE)=0,85, por lo tanto aplicando el teorema de HYPERLINK
"http://www.hrc.es/bioest/Probabilidad_18.html"Bayes

eorema de Bayes
Si los sucesos Ai son una partición y B un suceso tal que p(B)  0

Demostración
Aplicaciones
Diagnóstico médico (en general clasificaciones no biunívocas): El diagnóstico consiste en
establecer la enfermedad de un paciente, a partir de una serie de síntomas. Pero los
síntomas y las enfermedades no están ligados de un modo biunívoco.
Llamemos Ei al conjunto de enfermedades
E1: tuberculosis pulmonar; E2 :cáncer de pulmón; E3: bronquitis obstructiva; etc.
y Si a los síntomas y síndromes asociados con las mismas.
S1: tos; S2: estado febril; S3: hemotisis; etc.
La información accesible en los libros de patología, o en un archivo de historias clínicas es
del tipo.
Para E1: algunos (digamos el 20%) tienen hemotisis; muchos (80%) tienen tos; etc.
y lo mismo para las demás enfermedades.
En términos de probabilidad condicionada, esta información es
p(S3|E1) = 0,2; p(S1|E1) = 0,8 etc.
para diagnosticar la tuberculosis se ha de evaluar, para los síntomas que presenta el
paciente p(E1|Si) para lo que se puede usar el teorema de Bayes si las enfermedades
forman una partición (son mutuamente excluyentes y se consideran todas las
enfermedades compatibles con el síntoma) y se conocen sus prevalencias.

Nótese que un mismo conjunto de síntomas podría dar lugar a un diagnóstico diferente en
poblaciones en las que las prevalencias fueran diferentes.
Pruebas diagnósticas: Supóngase una prueba diagnóstica, por ejemplo nivel de glucosa en
sangre, en ayunas, para diagnosticar la diabetes. Se considera que la prueba es positiva si
se encuentra un nivel por encima de un cierto valor, digamos 120 mg/l.
Para evaluar la prueba, (habrá que hacerlo para distintos valores de corte) se somete a la
misma a una serie de individuos diabéticos diagnosticados por otro procedimiento (el patrón
de oro o "gold standar") y a una serie de individuos no diabéticos. Los resultados se pueden
representar en una tabla de doble entrada

Patrón de oro
NE E

- a b r
Prueba
+ c d s

t u

Si la prueba fuera perfecta b=c=0, desgraciadamente nunca ocurre. Se


denomina coeficiente falso-positivo (CFP) al cociente c/t, y es una estimación de la
probabilidad condicionada p(+|NE), se denominacoeficiente falso-negativo (CFN) al cociente
b/u, y es una estimación de la probabilidad condicionada p(-|E). Estos dos coeficientes
cuantifican los dos errores que la prueba puede cometer y caracterizan a la misma.
Simétricamente, los coeficientes que cuantifican los aciertos son lasensibilidad, p(+|E), y
la especificidad p(-|NE).
Cuando la prueba se usa con fines diagnósticos (o de "screening") interesa calcular p(E|+)
y/o p(NE|-).

Como E y NE son una partición, usando el Teorema de Bayes

Nótese que ambas dependen de la prevalencia de la enfermedad: una prueba diagnóstica


que funciona muy bien en la clínica Mayo, puede ser inútil en el Hospital Ramón y Cajal.
Ejemplo 9:

una prueba diagnóstica para la diabetes tiene un CFP de 4% y un CFN del 5%. Si la
prevalencia de la diabetes en la población donde se usa es del 7% ¿cuál es la probabilidad
de que sea diabético un individuo en el que la prueba dé positiva? y ¿de que no lo sea uno
en el que dé negativo?
p(+|NE) = 0,04  p(-|NE) = 0,96
p(-|E) = 0,05  p(+|E) = 0,95
p(E) = 0,07  p(NE) = 0,93

Pruebas en serie: Cuando se aplican pruebas en serie, para cada prueba p(E) y p(NE), serán
la p(E|+) y p(NE|+) de la prueba anterior (si dio positiva) o p(E|-) y p(NE|-) si dio negativa.
Ejercicios Resueltos Variables Aleatorias Discretas
1. Un artesano ha elaborado 7 colchas de una etnia indígena 2 de ellas tienen algún
defecto. Un turista compra 3 de estas colchas. Sea el número de colchas defectuosas.
Hallar la distribución de probabilidad de X:
Datos:

5 buenas

n=7 2 defectuosas
r=3
X = Numero de colchas defectuosas
X = 0, 1, 2

función de Probabilidad
X = Xi 0 1 2
P (Xi) 2/7 4/7 1/7

Función de Distribución Acumulada


X P(X)
F(X)
0 2/7 0 + 2/7 = 2/7
1 4/7 2/7 + 4/7 = 6/7
2 1/7 6/7 + 1/7 = 1

Media
µ = (0)(2/7) + (1)(4/7) + (2)(1/7) = 6/7

Varianza
V(x)= (0 – 6/7)2(2/7) + (1-6/7)2 (4/7) + (2-6/7)2 (1/7)= 20/49 = 0.40816

Desviación Estándar

σ= 0.40816 = 0.6388

La función de probabilidad de una variable aleatoria discreta X esta dad por:


Función de probabilidad
X = Xi 1 2 3 4 5 6 7 8
P (Xi) 2/28 3/28 4/28 5/28 4/20 3/20 2/20 1/20

Función de Distribución Acumulada


X P(X) F(X)
1 2/28 0 + 2/28 = 2/28
2 3/28 2/28 + 3/28 = 5/28
3 4/28 5/28 + 4/28 = 9/28
4 5/28 9/28 + 5/28 = 14/28
5 4/20 14/28 + 4/20 = 14/20
6 3/20 14/20 + 3/20 = 17/20
7 2/20 17/20 + 2/20 = 19/20
8 1/20 19/20 + 1/20 = 1

Media
µ = (1)(2/28) + (2)(3/28) + (3)(4/28) + (4)(5/48) + (5)(4/20) + (6)(3/20) + (7)(2/20) +
(8)(1/20) = 129/28

Varianza
V(x)=(1-129/28)2(2/28)+(2-129/28)2(3/28)+(3-129/28)2(4/28)+(4-129/28)2(5/28)+(5-
129/28)2(4/20)+
(6-129/28)2(3/20)+(7-129/28)2(2/20)+(8-129/28)2(1/20)= 57/16 = 3.5625

Desviación Estándar

σ= 3.5625 = 1.887
2. Una variable aleatroria discreta X tiene la función de probabilidad f(x) donde

F(x)= k(9-x) si x= 5, 6, 7, 8
en otro caso
a) Determine K, b) encuentre la media y la varianza de X

P(X=5) = k (9-5) = 4k
P(X=6) =k(9-6) =3k
P(X=7) =k(9-7) =2k
P(X=8) =k(9-8) =1k
Sabemos que: 10k = 1 entonces tenemos que:
k = 1/10

función de Probabilidad
X 5 6 7 8
P (X) 4/10 3/10 2/10 1/10

Función de Distribución Acumulada


X P(X) F(X)
5 4/10 0+4/10 = 4/10
6 3/10 4/10+3/10 =7/10
7 2/10 7/10+2/10 =9/10
8 1/10 9/10+1/10 = 1

0 si X < 5
4/10 si 5 ≤ X ≤ 6
F(X) 7/10 si 6 ≤ X ≤ 7
9/10 si 8 ≤ X ≤ 9
1 si X> 8
Media
µ = (5) (4/10)+ (6) (3/10)+ (7) (2/10)+(8) (1/10) = 6

Varianza
V(x)= (5 – 6)2(4/10) + (6-6)2 (3/10) + (7-6)2 (2/10)+ (8-6)2 (1/10) = 1

3. Sea X la variable aleatoria que representa la demanda semanal de una maquina de


premios que esta puesta en un supermercado. La función de probabilidad para Z esta dada
por,

F(x)= x2-3x para x= 4, 5, 6, 7


60 si x= 4, 5, 6, 7
Encuentre, a) la distribución acumulada, b) la desviación estándar,

Función de Probabilidad
X 4 5 6 7
P (Xi) 4/60 10/60 18/60 28/60

P(X=4)= (4)2-3/4) = 4/60


60
2
P(X=5)= (5) -3/5) = 10/60
60
P(X=6)= (6)2-3/6) = 18/60
60
P(X=7)= (7)2-3/7) = 28/60
60

Función de Distribución Acumulada


X P(X) F(X)
4 4/60 0+4/60 = 4/60
5 10/60 4/60+10/60 = 14/60
14/60+18/60 =
6 18/60
32/60
7 28/60 32/60+28/60 = 1
Media
µ = (4) (4/60) + (5) (10/60) + (6) (18/60) (7) (28/60) = 37/60
Varianza
V(x)= (4 - 37/60)2(4/60) + (5 – 37/60)2 (10/60) + (6 – 37/60)2 (18/60) + (7 – 37/60) (28/60)
V(x)=8.560
Desviacion Estándar
σ = (8.560)1/2 = 2.925
BINOMIAL

se sabe que el 30% de los habitantes de una ciudad depende del asma. determinar la probabilidad de
que en una muestra aleatoria de 4 personas.

i) Ninguna padezca de agua.


ii) más de 2 sufran de asma.

sea x el numero de personas que sufren de asma en una muestra de personas.


X~B(n=4; P=0,3)

i) P(X=0)= (40)*0,30*(0,7)4=0,2401
ii) P(X ≥ 3)= (43)*0,33*(0,7)1 + (44)*0,34*(0,7)0=
0,0756 + 0,0081=0,0837
DISTRIBUCIÓN BINOMIAL
En estadística, la distribución binomial es una distribución de probabilidad discreta que mide el número
de éxitos en una secuencia de n ensayos de Bernoulli independientes entre sí, con una probabilidad
fija p de ocurrencia del éxito entre los ensayos.

Un experimento de Bernoulli se caracteriza por ser dicotómico, esto es, sólo son posibles dos resultados.
A uno de estos se denomina éxito y tiene una probabilidad de ocurrencia p y al otro, fracaso, con una
probabilidad q = 1 - p. En la distribución binomial el anterior experimento se repite nveces, de forma
independiente, y se trata de calcular la probabilidad de un determinado número de éxitos. Para n = 1, la
binomial se convierte, de hecho, en una distribución de Bernoulli.

FORMULA
PROCEDIMIENTO

- Debes de leer cuidadosamente el problema en cuestión para saber acomodar los datos correctos en la
formula.

- "n" siempre será el número total de casos.


- "x" será el número de éxitos
- "p" será la probabilidad de éxito en cada ensayo.

Sabiendo esto se te facilitará más resolver el problema.

Es imprtante también que sepas como utilizar la calculadora (es necesario que sea cientifica) ya que ésta
contiene funciones primordiales que necesitarás.

RESOLVIENDO EL PROBLEMA

Digamos que tenemos lo siguientes datos en un problema:

n= 10
x= 5
p= 80%

Lo que haremo será sustitur los datos en la formula de esta manera:

p(x=8)= [ 10/5]
En este primer paso es importante que sepas que NO estamos dividiendo 10/5 si no que usaremos la
tecla nCr de tu calculadora, para obtener el resultado (que en este caso te debe de dar 252).

Despúes sustituirás la "p" por .8 y lo elevaras a la x dada que es 5: .8^5

Enseguida lo multiplizarás por lo siguiente 1-.8 ^10-5. Aqui 1 se refiere a un entero y le retarás "p" para
saber lo que quedaba [en algunas formulas este paso (1-p) puede venir como "q" y es correcto también]
y lo elevarás con los datos que tengas.

LA FORMULA DEBE QUEDARTE ASI:


p(x=8)= [ 10/5].8^5 * 1-.8 ^10-5

Y el resultado debe ser= .026424

~Si tienes alguna duda, puedes consultar los siguientes ejemplos para darte una mejor idea

http://dl.dropbox.com/u/73370758/DISTRIBUCI%C3%93N%20BINOMINAL.xlsx
DISTRIBUCIÓN BINOMIAL NEGATIVA
DISTRIBUCIÓN BINOMIAL NEGATIVA

Esta distribución puede considerarse como una extensión o ampliación de la distribución geométrica . La
distribución binomial negativa es un modelo adecuado para tratar aquellos procesos en los que se repite
un determinado ensayo o prueba hasta conseguir un número determinado de resultados favorables (por
vez primera) .Es por tanto de gran utilidad para aquellos muestreos que procedan de esta manera. Si el
número de resultados favorables buscados fuera 1 estaríamos en el caso de la distribución geométrica .
Está implicada también la existencia de una dicotomía de resultados posibles en cada prueba y la
independencia de cada prueba o ensayo, o la reposición de los individuos muestreados.

Esta distribución o modelo puede hacerse derivar de un proceso experimental puro o de Bernouilli en el
que se presenten las siguientes condiciones

 El proceso consta de un número no definido de pruebas separadas o separables . El proceso


concluirá cuando se obtenga un determinado número de resultados favorables K

 Cada prueba puede dar dos resultados posibles mutuamente excluyentes A y no A

 La probabilidad de obtener un resultado A en cada una de las pruebas es p siendo la


probabilidad de no A , q . Lo que nos lleva a que p+q=1

 Las probabilidades p y q son constantes en todas las pruebas. Todas las pruebas son
independientes. Si se trata de un experimento de extracción éste se llevará cabo con devolución del
individuo extraído, a no ser que se trate de una población en la que el número de individuos tenga de
carácter infinito.

 (Derivación de la distribución) Si, en estas circunstancias aleatorizamos de forma que la variable


aleatoria x sea "el número de pruebas necesarias para conseguir K éxitos o resultados A " ;
entonces la variable aleatoria x seguirá una distribución binomial negativa con parámetros p y k.

FORMULA

Teniendo en cuenta que:

P(X=x) = función de densidad de la variable aleatoria binomial negativa.


p = probabilidad de éxito
q = probabilidad de fracaso
K = cantidad de éxitos
x = cantidad de fracasos
RESOLVIENDO EL PROBLEMA

En una fabrica, la probabilidad de que una persona la acepten para trabajar es de el 20 %. De 10 personas que no
salieron seleccionadas. Calcular probabilidad de que antes 3 hayan sido seleccionadas.

Aqui el primer paso es checar los datos que nos proporcioan


Tenemos que:
p= .20
q=.40
k=10
x=3
El siguiente paso será distribuir los datos en la formula dada.

Este tipo de distribución es muy sencilla ya que tienes los datos muy claros en los problemas. Aún así, si sigues
teniendo dudas te invito a checar el link que viene abajo. Ahí encontrarás más problemas con el procedimiento dado.

DISTRIBUCIÓN DE POISSON
La distribución de Poisson es una distribución de probabilidad discreta que expresa, a partir de una
frecuencia de ocurrencia media, la probabilidad que ocurra un determinado número de eventos durante
cierto periodo de tiempo.

La función de masa de la distribución de Poisson es

Donde:

• k es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el
evento suceda precisamente k veces).
• λ es un parámetro positivo que representa el número de veces que se espera que ocurra el
fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4
veces por minuto y estamos interesados en la probabilidad de que ocurra kveces dentro de un intervalo
de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
• e es la base de los logaritmos naturales (e = 2,71828 ...)
RESOLVIENDO EL PROBLEMA

• Si un banco recibe en promedio 6 cheques sin fondo por día, ¿cuáles son las probabilidades
de que reciba cuatro cheques sin fondo en un día dado?
Solución:

a) x = variable que nos define el número de cheques sin fondo que llegan al banco en un día cualquiera = 0, 1, 2, 3,
....., etc, etc.

 = 6 cheques sin fondo por día

 = 2.718

Lo que viene a contunuación será sustituir los datos en la formula


p(x=4)= (6)4 (2.78) -6 / 4!= .13392

TIPS:

Es necesario el uso de una calculadroa científica que te ayude a resolver el problema, ya que una de bolsillo te será
inútil en este caso. Sabiendo utilizar las teclas correctas te será mucho más fácil solucionarlo.

- para activar la tecla "e" deberás oprimir la tecla "shift" y despues "In".
- Para actival la opción "!" deberás, nuevamente, oprimir la tecla "shift" y despúes "x-1".

SI TIENES ALGUNA DUDA PUEDES REVISAR EL SIGUIENTE LINK EN EL QUE ENCONTRARÁS


MÁS PROBLEMAS DE DISTRIBUCIÓN POISSON QUE TE AYUDARÁN A ENTENDER ESTE TIPO DE
DISTRIBUCIÓN
DISTRIBUCIÓN HIPERGEOMÉTRICA
La distribución hipergeométrica es especialmente útil en todos aquellos casos en los que se extraigan
muestras o se realizan experiencias repetidas sin devolución del elemento extraído o sin retornar a la
situación experimental inicial.
Modeliza , de hecho, situaciones en las que se repite un número determinado de veces una prueba
dicotómica de manera que con cada sucesivo resultado se ve alterada la probabilidad de obtener en la
siguiente prueba uno u otro resultado. Es una distribución .fundamental en el estudio de muestras
pequeñas de poblaciones .pequeñas y en el cálculo de probabilidades de, juegos de azar y tiene grandes
aplicaciones en el control de calidad en otros procesos experimentales en los que no es posible retornar
a la situación de partida.
La distribución hipergeométrica puede derivarse de un proceso experimental puro o de Bernouilli con las
siguientes características:

 El proceso consta de n pruebas , separadas o separables de entre un conjunto de N pruebas
posibles.
 Cada una de las pruebas puede dar únicamente dos resultados mutuamente excluyentes: A y no
A.
 En la primera prueba las probabilidades son :P(A)= p y P(A)= q ;con p+q=l.

FORMULA
DONDE:

x= será la cantidad de éxitos

np= será todos o la cantidad de elementos que cumple característica deseada.

nq= será el resto del total de la población.

N= será el tamaño de la población.

n= será el tamaño de muestra

EJEMPLO:

En una jaula hay 30 pericos rusos y 20 pericos chinos si extraemos 10 pericos al azar calcular posibilidad
de que 3 de ellos hablen chino ( característica deseada).

x= 3 ya que es lo que se busca

np= será 20 ya que esa cantidad es la que tiene la característica buscada

nq= 30 ya que es el resto de la población

N= 50 que es el total de pericos que tenemos

n= 10 ya que fue la muestra que tomamos.

La formula quedaría sustituida de esta manera:

En caso de que tengas dudas puedes consultar el siguiente link en el que podrás observar más
problemas de este tipo de distribución.

DISTRIBUCIÓN GEOMÉTRICA
La distribución geométrica es un modelo adecuado para aquellos procesos en los que se repiten pruebas
hasta la consecución del éxito a resultado deseado y tiene interesantes aplicaciones en los muestreos
realizados de esta manera . También implica la existencia de una dicotomía de posibles resultados y la
independencia de las pruebas entre sí.
Proceso experimental del que se puede hacer derivar

Esta distribución se puede hacer derivar de un proceso experimental puro o de Bernouilli en el que
tengamos las siguientes características

 El proceso consta de un número no definido de pruebas o experimentos separados o


separables. El proceso concluirá cuando se obtenga por primera vez el resultado deseado (éxito).

 Cada prueba puede dar dos resultados mutuamente excluyentes : A y no A

 La probabilidad de obtener un resultado A en cada prueba es p y la de obtener un resultado no


A es q
siendo (p + q = 1).

Las probabilidades p y q son constantes en todas las pruebas ,por tanto , las pruebas ,son
independientes (si se trata de un proceso de "extracción" éste se llevará a , cabo con devolución del
individuo extraído) .

 (Derivación de la distribución). Si en estas circunstancias aleatorizamos de forma que tomemos


como variable aleatoria X = el número de pruebas necesarias para obtener por primera vez un
éxito o resultado A , esta variable se distribuirá con una distribución geométrica de parámetro p.

FORMULA

DONDE:

P (x=x) = función de densidad, de la variable aleatoria con distribución geométrica.


X Numero de experimentos hasta que aparece el 1er éxito.
p probabilidad de éxito
q probabilidad de fracaso (1 - p)

Tomemos este problema como ejemplo:

Del salon el 60% de los alumnos son hombres, calcular probabilidad de extraer el 1er hombre a la cuarta
ocasión que extraemos un alumno.

Definir éxito: sea hombre.

Comenzaremos con sacar los datos del problema:

x=4
Recordemos que "x" será siempre el número de experimentos que se hicieron antes de que salga el
primer éxito.

p = 0.60
Esta cantidad casi siempre viene representada en %, si no es así, comúnmente es el primer dato que
aparece.

q = 0.40
Este dato, generalmente, no viene en el problema pero se puede sacar facilmente haciendo la sigueinte
operación: 1-p

El siguiente paso es sustituir los datos en la formula:

Esta distribución es de las más sencillas, si aún tienes dudas en el siguiente link podrás ver más
problemas que te pueden ayudar a entender esta distribución...

http://dl.dropbox.com/u/73370758/DISTRIBUCI%C3%93N%20GE%C3%93METRICA.xlsx

Vous aimerez peut-être aussi