Vous êtes sur la page 1sur 50

DISTRIBUCIONES DE

PROBABILIDAD
Bibliografía
• Devore, J. L. (2008). Probabilidad y estadística para ingenierías y
ciencias. Cengage Learning Editores.
• Triola, M. F. (2004). Estadística. Pearson educación.
• Mendelhall, W., Beaver, R., & Beaver B. (2002). Introducción a la
probabilidad y estadística. International Thomson Editores.
• Myers, R. H. M., Walpole, S. L., Ronald, E. Y., & Walpole, K. E. (2007).
Probabilidad y estadística para ingeniería y ciencias.
• Quezada, N. (2010). Estadística para ingenieros. Empresa Editora
Macro EIRL.
QUÉ ES UNA DISTRIBUCIÓN DE
PROBABILIDAD
Listado de todos los resultados de un
experimento (espacio muestral) y la probabilidad
asociada con cada resultado.
fórmula, tabla o gráfica
Juego: el que pase las fichas al otro lado
primero
Ejercicio
• Un embarque de 20 computadoras portátiles similares
para una tienda minorista contiene 3 que están
defectuosas. Si una escuela compra al azar 2 de estas
computadoras, calcule la distribución de probabilidad
para el número de computadoras defectuosas que
podría comprar la escuela.

• Hallemos la distribución de probabilidad y


expresémosla en forma de tabla, gráfica y f(x)
Distribución de probabilidad para las
computadoras defectuosas
3 17
𝑥 2−𝑥
Histograma de probabilidad 𝑓 𝑥 = 20
2
0.800
0.700
0.600
0.500
0.400
0.300
0.200
0.100
0.000
0 1 2
Distribuciones de probabilidad
DISCRETAS CONTINUAS

1. La probabilidad de un resultado en particular se encuentra entre 0 y


1, inclusive.
2. Los resultados son eventos mutuamente excluyentes.
3. La lista es exhaustiva. Así, la suma de las probabilidades de los
diversos eventos es igual a 1.
Parámetros de una distribución de
probabilidad
La manera como una fdp queda mejor especificada es mediante su
expresión matemática, sin embargo, a veces no se desea un
conocimiento exhaustivo de la función, sino que bastan ciertos
parámetros de ella, que brinden información respecto a su
• tendencia,
• dispersión,
• simetría,
• etc.
Parámetro de tendencia central:
media o valor esperado o esperanza
Sea X una variable aleatoria con distribución de probabilidad f(x). La
media o valor esperado de X es:

µ= E(X) =  x f(x) si X es discreta


Parámetro de dispersión:
Varianza
• La varianza de una variable aleatoria nos dice algo acerca de la
variabilidad de las observaciones con respecto a la media.

Por ejemplo, si una variable


Sea X una variable aleatoria discreta con aleatoria tiene una varianza
o desviación estándar
distribución de probabilidad f (x) y media μ. La pequeña, esperaríamos que
varianza de X es: la mayoría de los valores se
agrupen alrededor de la
2= E [(X −μ)2 ] =  (x −μ)2 f (x) = E(X2) - µ2 media.
a. Grafique la distribución de probabilidad.
Las líneas aéreas en ocasiones
b. Calcule los parámetros media (valore esperado o
venden boletos de más. Suponga
esperanza matemática) y varianza e interprete.
que para un avión de 50 asientos,
55 pasajeros tienen boletos. c. Cuál es la probabilidad de que aparezcan menos
Interesa el comportamiento del de 45 pasajeros?
número de pasajeros con boletos d. ¿Cuál es la probabilidad de que el vuelo
que en realidad aparecen para el acomodará a todos los pasajeros con boleto que
vuelo. aparecieron?
Se expresa de manera tabular así: e. ¿Cuál es la probabilidad de que no todos los
pasajeros con boleto que aparecieron puedan ser
acomodados?
f. Si usted es la primera persona en la lista de espera
(lo que significa que será el primero en abordar el
avión si hay boletos disponibles después de que
todos los pasajeros con boleto hayan sido
acomodados), ¿cuál es la probabilidad de que podrá
tomar el vuelo?
g. ¿Cuál es esta probabilidad si usted es la tercera
persona en la lista de espera?
DISTRIBUCIONES DE
PROBABILIDAD
ESTÁNDAR
Distribuciones de probabilidad estándar
En los casos vistos en clases anteriores tratamos situaciones en las que
la naturaleza de la distribución, e incluso una estimación óptima de la
estructura de la probabilidad, se pueden determinar utilizando datos
históricos, datos tomados de estudios a largo plazo o incluso de
grandes cantidades de datos planeados.
Sin embargo, no todas las funciones de probabilidad y de densidad
de probabilidad se derivan de cantidades grandes de datos
históricos. Hay un gran número de situaciones en las que la
naturaleza del escenario científico sugiere un tipo de distribución.
Ejemplos
• Cuando observaciones repetidas independientes son binarias por
naturaleza con un valor de 0 o 1 (por ejemplo, defectuoso o no,
funciona o no, alérgico o no), la distribución que cubre esta situación
se llama distribución binomial.
𝑛 𝑥 𝑛−𝑥
b(x; n, p) = 𝑥 𝑝 𝑞
x = 0,1, 2, . . . , n .
La distribución binomial también se utiliza mucho
en aplicaciones médicas y militares. En ambos
casos un resultado de éxito o de fracaso es
importante. Por ejemplo, la importancia del trabajo
farmacéutico radica en poder determinar si un
determinado fármaco “cura” o “no cura”; mientras
que si se está probando la eficacia al lanzar un
proyectil el resultado se interpretaría como “dar en
el blanco” o “fallar”.
Ejemplos
• En una industria, cuando se prueba una muestra de artículos
seleccionados de un lote de producción, el número de productos
defectuosos en la muestra por lo general se puede representar como
una variable aleatoria hipergeométrica.

𝑘 𝑁−𝑘
𝑥 𝑛−𝑥
ℎ 𝑥; 𝑁, 𝑛, 𝑘 = 𝑁
𝑛
máx {0, n −(N − k)} ≤ x ≤ min {n, k}.
Ejemplos
• La distribución exponencial es la distribución más usada en confiabilidad,
también se usa en teoría de colas. Por lo general describe los tiempos entre
eventos que ocurren en secuencia. El tiempo de operación antes de
cualquier falla, a menudo sugiere una clase de distribución denominada
distribución exponencial.
Ejemplos
• Distribución de Poisson Se utiliza en situaciones en las que se quiere
determinar el número de eventos de un tipo concreto que ocurren en
un intervalo de tiempo o espacio dado.

𝑒 −λt λt 𝑥
𝑝 𝑥; λt =
𝑥!
X= 0,1,2,…

• El número de vehículos que pasan por una


caseta de cobro en las horas de mayor
tráfico.
• Número de accidentes en un cruce.
• El número de peces muertos encontrados
por unidad de superficie en una
determinada área.
Tales tipos de ejemplos son tan sólo dos de la gran
cantidad de las llamadas distribuciones estándar que se
utilizan ampliamente en situaciones del mundo real
porque el escenario científico que da lugar a cada uno
de ellos es reconocible y a menudo se presenta en la
práctica.
DISTRIBUCIÓN NORMAL
La distribución de probabilidad continua mas importante en todo el
campo de la estadística es la distribución normal.

Describe de manera aproximada muchos fenómenos que


ocurren en la naturaleza, la industria y la investigación. Por
ejemplo:
• Las mediciones físicas (estaturas, pesos, etc.)
• Experimentos meteorológicos.
• Estudios de la precipitación pluvial
• Mediciones de partes fabricadas.
• Los errores en las mediciones científicas
• Mediciones antropométricas en fósiles
• Tempos de reacción en experimentos psicológicos
• Mediciones de inteligencia y aptitud
• Calificaciones en exámenes
• Medidas e indicadores económicos.
DISTRIBUCIÓN NORMAL
En 1733, Abraham DeMoivre
desarrollo la ecuación matemática de
la curva normal, la cual sentó las
bases sobre las que descansa gran
parte de la teoría de la estadística
inductiva.
La distribución normal a menudo se
denomina distribución gaussiana en
honor de Karl Friedrich Gauss (1777-
1855), quien también derivo su
ecuación a partir de un estudio de
errores en mediciones repetidas de
la misma cantidad.
La curva normal Una variable aleatoria continua X que tiene la
distribución en forma de campana de la figura se
denomina variable aleatoria normal. La ecuación
matemática para la distribución de probabilidad
de la variable normal es n(x; μ, σ)

La densidad de la variable aleatoria normal X, con media


μ y varianza σ2, es

1 𝑥−µ 2

𝑛 𝑥; µ, σ = 𝑒 2 2
2 
−∞ < 𝑥 < ∞
Una vez que se especifican μ y σ, la curva normal queda determinada
por completo. donde π = 3.14159. . . y e = 2.71828. . .
Por ejemplo, si μ = 50 y σ = 5, entonces se pueden calcular las alturas
en y con n(x; 50, 5) para diferentes valores de x y dibujar la curva.
La curva normal

µ1 = µ2 𝑦 1 < 2

µ1 < µ2 𝑦 1 = 2

µ1 < µ2 𝑦 1 < 2
Propiedades de la curva normal
• 1. La moda, que es el punto sobre el
eje horizontal donde la curva tiene su
punto máximo, ocurre en x = μ.
• 2. La curva es simétrica alrededor de
un eje vertical a través de la media μ.
• 3. La curva normal se aproxima al eje
horizontal de manera asintótica,
conforme nos alejamos de la media en
cualquier dirección.
• 4. El área total bajo la curva y sobre el
eje horizontal es igual a uno.
Regla empírica
• Si la distribución de la población de
una variable es (aproximadamente)
normal, entonces
• 1. Aproximadamente 68% de los
valores están dentro de 1  de la
media.
• 2. Aproximadamente 95% de los
valores están dentro de 2  de la
media.
• 3. Aproximadamente 99.7% de los
valores están dentro de 3  de la
media.

En realidad es inusual observar un valor de una población normal que esté mucho más lejos de 2 desviaciones estándar de µ.
Cálculo de la probabilidad 𝑃(𝑥1 < X < 𝑥2 )
(área bajo la curva)

𝑥2
1 𝑥2 𝑥−µ 2

𝑛 𝑥; µ, 𝜎 𝑑𝑥 = 𝑒 2 2 𝑑𝑥
𝑥1 2  𝑥1

Ó….
Distribución Normal Estándar
• Podemos transformar
todas las observaciones
de cualquier variable
aleatoria normal X en un
nuevo conjunto de
observaciones de una
variable aleatoria normal
Z con media 0 y varianza
1  NORMAL ESTÁNDAR

𝑥2
𝑛 𝑥; µ, 𝜎 𝑑𝑥 𝑋−µ Tablas de la normal estándar
𝑍=
𝑥1 
Ejemplo
• Dada una distribución normal estándar, calcule el área bajo la curva
que se localiza
• a) a la derecha de z = 1.84, y
• b) entre z = –1.97 y z = 0.86
Ejercicio
• Dada una distribución normal estándar, calcule el valor de k tal que
• a) P (Z > k) = 0.3015, y
• b) P(k < Z < −0.18) = 0.4197
Ejemplo
• Dada una variable aleatoria X que tiene una distribución normal con
μ= 50 y σ = 10, calcule la probabilidad de que X tome un valor entre
45 y 62.

1. Grafique para identificar el área P (45 < X < 62) = P (Z1 < Z < Z2)
que le piden
2. Calcular los valores de Z1 y Z2
3. Con las tablas calcule el área
(probabilidad)
Ejercicio
• En una lechería la producción diaria de leche
por vaca, se distribuye de manera Normal con
media µ=18 y varianza 𝜎 2 =9
Cuál es la probabilidad que una vaca elegida al
azar:
1) produzca menos de 12 litros
2) tenga una producción entre 21 y 24 litros?
3) produzca entre 15 y 22 litros?
4) tenga una producción mayor a 25 litros?
Ejercicio
• El consumo medio anual de cerveza de
los habitantes de un país es de 59
litros, con una varianza de 36. Se
supone que se distribuye según una
distribución normal.
• A) Usted presume de buen bebedor ,
¿cuántos litros de cerveza tendría que
beber al año para pertenecer al 5% de
la población que más bebe?
• Si usted bebe 45 litros de cerveza al
año y su mujer le califica de borracho
¿qué podría argumentar en su
defensa?
Ejercicio
• Suponga que Michelin ha fabricado un nuevo neumático que será
vendido por un almacén de cadena del país. Como este neumático
es un producto nuevo, los directivos de la empresa piensan que la
garantía de duración será un factor importante en la aceptación del
neumático. Antes de definir la póliza, los directivos necesitan
información probabilística acerca de x= duración del neumático en
número de kilómetros.
• De acuerdo con las pruebas realizadas al neumático, los ingenieros
de Michellin estiman que la duración media en kilómetros es µ=
36500 kilómetros y que la desviación estándar es =5000. Además,
los datos recogidos indican que es razonable suponer una
distribución normal.
• ¿Qué porcentaje de los neumáticos se espera que duren más de
40000 kilómetros? En otras palabras ¿cuál es la probabilidad de que
la duración de los neumáticos sea superior a 40000?
Continuación ejercicio llantas
• Ahora suponga que Michelin está
considerando una garantía que de un
descuento en la sustitución del
neumático original si este no dura lo que
asegura la garantía. ¿Cuál debe ser la
duración en kilómetros especificada en
la garantía si Michelin desea que no más
del 10% de los neumáticos alcancen la
garantía?
Ejercicio
En un proceso industrial el diámetro de un
rodamiento es una medida importante.
El comprador establece que las
especificaciones en el diámetro sean 3.0 
0.01 cm. Esto implica que no se aceptará
ninguna parte que no cumpla estas
especificaciones.
Se sabe que en el proceso el diámetro de un
rodamiento tiene una distribución normal
con media μ = 3.0 y una desviación estándar
σ=0.005. En promedio, ¿cuántos de los
rodamientos fabricados se descartarán?
DISTRIBUCIÓN t- student
𝑋−µ
𝑍=
  Tiene forma de campana y es simétrica
 No existe una distribución t, sino una familia. Todas
las distribuciones t tienen una media de 0 y sus
desviaciones estándares difieren de acuerdo con el
tamaño de la muestra n.
 La dist t se extiende más y es más plana por el centro
que la normal estándar.
 Si el tamaño de la muestra es suficientemente grande,
digamos n ≥ 30, la distribución de T no difiere mucho de la
normal estándar

𝑋−𝜇
𝑇=
𝑆/ 𝑛 v= Grados de Libertad= n-1
Ejercicio t
• Hallar el valor t con 19 grados de libertad, que deja un área de 0.05 a la
derecha
Ejercicio t
• Hallar el valor t con v= 14 grados de libertad que deja un área de 0.025 a la
izquierda
Ejercicio t
• Encuentre la probabilidad de –t0.025 < t < t0.05.
Ejercicio t
Encuentre k tal que P(k < t < -1.761) = 0.045, para una muestra
aleatoria de tamaño 15.
Ejercicio t
Un ingeniero químico afirma que
el rendimiento medio de la
población de cierto proceso en
lotes es 500 gramos/milímetro de
materia prima.
Para verificar esta afirmación
toma una muestra de 25 lotes
cada mes.
Si el valor de t calculado cae entre
–t0.05 y t0.05, queda satisfecho con ¿Qué conclusión extraería de una muestra que
su afirmación. tiene una media de 518 gramos por milímetro y una
𝑋−𝜇 desviación estándar de 40 gramos?
𝑇=
𝑆/ 𝑛
Ejercicio t
Los puntajes de un grupo de estudiantes se comportan de manera
normal con promedio de 50, sin embargo, no se conoce la desviación.
Se tomó una muestra aleatoria de 9 estudiantes encontrando una
varianza de 36 y un promedio de 52. Cuál es la probabilidad de que el
promedio:
• Sea mayor de 54?
• Sea menor que 54?
• Esté comprendido entre 48 y 52 puntos?
𝑋−𝜇
𝑇=
𝑆/ 𝑛
DISTRIBUCIÓN EXPONENCIAL
Se utiliza con frecuencia como modelo
de la distribución de tiempos entre la
ocurrencia de eventos sucesivos, tales
como:

• Tiempos entre llegadas en instalaciones


de servicio, colas.
• Tiempos de operación antes de que
partes componentes y sistemas eléctricos
fallen (Tiempo de duración).
DISTRIBUCIÓN EXPONENCIAL
La variable aleatoria continua X tiene una
distribución exponencial, con parámetro 
(tiempo medio entre eventos  tiempo/evento) o
por λ (tasa de eventos eventos/tiempo), si su
función de densidad es dada por:

f(x;) = 𝑒 −𝑥/𝛽
ó λ𝑒 −λ𝑥 x ≥ 0 >0
o 𝛽
f(x; λ) =
0 en cualquier otro caso

La función de distribución acumulada es:

µ = = = 1/ λ F(x)= P(X≤x)= 1 − 𝑒 −𝑥/𝛽 = 1 − 𝑒 −λ𝑥 para x ≥ 0


0 en cualquier otro caso
Ejemplo
1. Suponga que el tiempo de respuesta X en un
call center (el tiempo transcurrido entre el final
de la consulta de un usuario y el inicio de la
respuesta del sistema a dicha consulta) tiene
una distribución exponencial con tiempo de
respuesta esperado de 5s.
• Halle λ
• ¿Cuál es la probabilidad de que el tiempo de
respuesta sea cuando mucho de 10 s?
• ¿Cuál es la probabilidad de que el tiempo de
respuesta sea de entre 5 y 10 s?
Ejercicio 2
Se ha comprobado que el
tiempo de vida de cierto tipo
de marcapasos sigue una
distribución exponencial con
media de 16 años.
¿Cuál es la probabilidad de
que a una persona a la que se
le ha implantado este
marcapasos se le deba
reimplantar otro antes de 20
años?
Ejercicio 3
Suponga que la duración de un
dispositivo electrónico sea una
distribución exponencialmente
con una media entre fallas de
100 horas.
¿Que probabilidad hay que el
dispositivo no falle antes de 150
horas de uso?  P(X≥x)