Vous êtes sur la page 1sur 25

4. DISTRIBUCIONES ESPECIALES: CASO CONTINUO.

 Veamos mediante un ejemplo como graficar una función de densidad de probabilidad


y el cálculo de probabilidades.

Para trazar f(x) primero se define la función:


f<- function(x) {12*(x-1.5)^2}

Luego se traza la curva: curve(f, from = 1, to = 2)

Para calcular P(1.25X<1.75): integrate(f, lower= 1.25, upper= 1.75)

que da como resultado: 0.125; esto es, P(1.25X<1.75)= 0.125

En forma similar se obtiene P(X>1.75)= 0.4375


Modelos de distribución de probabilidad y sus características
Distribución de Paráme- Función de densidad probabilidad Función
X tros caracterís-
tica

a, b
Uniforme:
a<b
a, b
µєR
Normal: a<b μ σ2
σ>0
Gamma: µєR
μ σ2
σ>0
a>0
Beta: B(a, b) b>0
 
α>0
Weibull: W(α,β)
β>0
a>0
Beta: B(a, b) θb>0
єR  
Cauchy: C(θ,β) ,      
β>0
Lognormal: α>0
µєR
Weibull: W(α,β)  
LogN(µ,σ) β>0
σ>0
θєR
Cauchy: C(θ,β)      
β>0
Lognormal: µєR
 
LogN(µ,σ) σ>0
Resumen funciones en r
R permite calcular probabilidades (incluyendo acumuladas), la evaluación de
funciones de densidad y probabilidad puntual y la generación de valores pseudo-
aleatorios. La tabla siguiente muestra los nombres en R de varias funciones, para
variables continuas, junto con argumentos adicionales.
Distribución Nombre en r Argumentos
Uniforme: unif min=a, max=b ; (0,1)
Normal: norm mean = , sd = σ; (0, 1)
Gamma: gamma
gamma shape=r,
shape=r, rate
rate == λλ (1/θ);
(1/θ); (λ=1)
(λ=1)
beta shape1=a,
shape1=a, shape2=b
Beta: B(a,
Beta: B(a, b)
b) beta shape2=b
Weibull: W(α,β) weibull
weibull shape=
shape= α,
α, scale=1/β;
scale=1/β; (β=1)
(β=1)
Weibull: W(α,β)
Cauchy: C(θ,β) cauchy
cauchy location=θ,
location=θ, scale=β;
scale=β; (θ=0,
(θ=0, β=1)
β=1)
Cauchy: C(θ,β)
Lognormal: LogN(µ,σ) lnorm
lnorm µ,
µ, σ
σ ;; (µ=0,
(µ=0, σ=1)
σ=1)
Lognormal: LogN(µ,σ)

A cada nombre de función dado por R (tabla anterior) se le agrega un prefijo ‘d’ para obtener la función
de densidad de probabilidad, ‘p’ para la función de distribución, ‘q’ para la función cuantil o percentil y
‘r’ para generar variables pseudo-aleatorias (random).
Distribución uniforme (a ,b)
 Ejemplo 1. La función de densidad de probabilidad del tiempo requerido, en
segundos, para completar una operación de ensamble, es:

a) La proporción de ensambles que requieren más de 37 segundos para completarlos


es: 30%.

b) El tiempo que es excedido por el 90% de los ensambles es de 31 segundos

c) La media y la varianza del tiempo de ensambles es: 35 y 25/3 respectivamente

b) qunif(0.10, 30,40)
Distribución normal (µ , σ2)
 Indudablemente la distribución normal es la más importante y de mayor uso.
Constituye un buen modelo para muchas variables aleatorias continuas. Parte de su
importancia se debe al teorema central del límite, del cual se hablará más adelante.

Una variable aleatoria X con función de densidad de probabilidad

es una variable aleatoria normal de parámetros μ y σ. El parámetro μ es un


parámetro de localización y σ es un parámetro de escala. [μ= (E(X), y σ2 = V(X)]

Algunos perfiles de la distribución normal los podemos trazar con ayuda del software
R, veamos para N(2, 1), N(2, 4) y N(5, 4).

curve(dnorm(x, 2,1), -6,10, col="blue")


curve(dnorm(x, 2,2),-6,10, add=T, col="red")
curve(dnorm(x, 5,2),-6,10, add=T)
Ejemplo 2. (Distribución normal) Un proceso fabrica cojinetes de bolas cuyos
diámetros tienen distribución normal con media de 2.505 cm y desviación
estándar de 0.008 cm. Las especificaciones requieren que el diámetro esté
dentro del intervalo 2.5± 0.01cm. ¿Qué proporción de cojinetes que cumple
con la especificación?
Sea X el diámetro de un cojinete seleccionado aleatoriamente. Entonces X:
N(2.0505, 0.0082 ). La proporción de cojinetes que cumplen la especificación
es:
P(2.49<X<2.51) = 0.7056
Valor que se obtuvo con la función R
pnorm(2.51, 2.505, 0.008)-pnorm(2.49, 2.505, 0.008)

El proceso puede recalibrarse para que la media sea igual a 2.5. Si la


desviación estándar sigue siendo 0.008 ¿Qué proporción de diámetros cumpla
la especificación?
Rta.: P(2.49<X<2.51) = 0.7887
Distribución normal estándar (µ=0 , σ2=1)
 Una variable normal con
μ= 0, y σ2 = 1

es llamada una variable aleatoria normal estándar y se denota como Z, su función de


densidad de probabilidad es:

La función de distribución de la variable aleatoria Z se denota por

la cual se encuentra tabulada.

Como es simétrica respecto al eje Y, se satisface que:


Distribución normal estándar (µ=0 , σ2=1)
 Si X es una variable aleatoria normal con E(X)=μ y V(X)=σ 2, entonces la variable
aleatoria

es una variable aleatoria con E(Z)=0 y V(X)=1. Esto es Z es una variable aleatoria
normal estándar.

La nueva variable creada mediante la transformación es una variable estandarizada

Con referencia al ejemplo 2.

0.030054

Ver tabla siguiente. Obtener la anterior probabilidad mediante R. [ pnorm(-1.88) ]


Parte de tabla de la función de distribución de la normal estándar
 Ejemplo 2. (continuación) Un proceso fabrica cojinetes de bolas cuyos
diámetros tienen distribución normal con media de 2.505 cm y desviación
estándar de 0.008 cm. Las especificaciones requieren que el diámetro esté
dentro del intervalo 2.5± 0.01cm.
Suponga que se ha recalibrado el proceso de tal forma que la media del
diámetro ahora es 2.5 cm. ¿A qué valor debe reducirse la desviación estándar
para que 95% de los diámetros satisfaga la especificación?

Se debe encontrar un valor de σ para que se cumpla


P(2.49<X<2.51) = 0.95

Usando la transformación Z y la tabla de la distribución normal estándar


,

al despejar σ se obtiene que σ= 0.0051. (A cambio de la tabla se puede usar R con la


función qnorm(0.025), que genera el valor -1.959964
La distribución normal (µ, σ2) y la regla empírica
 

Si X es una variable aleatoria con distribución normal de parámetros µ y σ2,


entonces se cumple

9545
0.9973
La distribución normal (µ, σ2) como aproximación de otras distribuciones.
 Si X es una variable aleatoria con distribución binomial de parámetros n y p,

se aproxima a una distribución normal estándar. La aproximación se considera buena


si np >5 y n(1-p) > 5.

Ver ejemplo 4.22 [Blanco]

 Si X es una variable aleatoria con distribución de Poisson de parámetro λ ,

se aproxima a una distribución normal estándar. La aproximación se considera buena


para λ >5.
Variables aleatorias deducidas de la normal (µ, σ2)
 1. Combinaciones lineales de variables aleatorias independientes normales.

Sean X1 , X2, . . ., Xn , variables aleatorias independientes con distribución normal con


media µi y varianza , con i= 1, 2, . . . , n. Y sean c1 , c2, . . ., cn constantes. La variable
aleatoria Y = X1 + X2 + . . . + Xn , tiene distribución normal de media µY y varianza ,
donde

Si µi = µ y =σ2 , entonces
Variables aleatorias deducidas de la normal (µ, σ2)
 2. Variable aleatoria Chi-cuadrado de Pearson.

Sean X1 , X2, . . ., Xn , variables aleatorias independientes con distribución normal


estándar.
La variable aleatoria

Tiene distribución Chi-cuadrado de parámetro n grados de libertad. Su función de


densidad de probabilidad, su media, su varianza y su función característica se indican
a continuación.

E(X) = n, V(X) = 2n,

El nombre de la función de densidad de probabilidad en R es: chisq


Variables aleatorias deducidas de la normal (µ, σ2)
 3. Variable aleatoria T de Student.
Sean Z, η1 , η2, . . ., ηn , n+1 variables aleatorias independientes con distribución
normal estándar. Entonces la variable aleatoria

Tiene distribución t de Student con n grados de libertad. Su función de densidad de


probabilidad, su media y su varianza se indican a continuación.

E(t) = 0, , n>2

El nombre de la función de densidad de probabilidad en R es: t


Variables aleatorias deducidas de la normal (µ, σ2)
 4. Variable aleatoria F de Fisher-Snedecor
Sean η1 , η2, . . ., ηn, y ξ1 , ξ2, . . ., ξm , (n+m) variables aleatorias independientes con
distribución normal estándar. Entonces la variable aleatoria

Tiene distribución F n, m grados de libertad. Su función de densidad de probabilidad,


su media y su varianza se indican a continuación.

E , V, m>4
La función en R es: f
Distribución gamma (r , λ)
 Consideremos en un experimento de Poisson la variable aleatoria X:= tiempo que
transcurre hasta que ocurren r éxitos. Hallemos su distribución de probabilidad.

P(X>t) = P(menos de r éxitos en el tiempo t) =

por tanto F(t)= P(X≤t) = 1- P(X<t) = 1-

Derivando respecto a t para obtener la función de densidad de probabilidad se


obtiene:

Si se generaliza esta función para cualquier valor de r, no necesariamente entero, la


distribución resultante se denomina gamma.
Distribución gamma (r , λ)
 La variable aleatoria X con función de densidad de probabilidad

Es una variable aleatoria gamma de parámetros r > 0 y λ > 0.

Si X tiene distribución gamma de parámetros r y λ,

, V

La función gamma

, !, si r es entero
, (1/2)
Distribución gamma (r , λ)
 Observación. La variable aleatoria X con función de densidad de
probabilidad

es una variable aleatoria gamma de parámetros r > 0 y λ > 0.

i) Si r es un valor entero la variable aleatoria X tiene distribución de Erlang.

ii) Si r= 1 la variable aleatoria X tiene distribución exponencial.

iii) Si r= n/2, con n valor entero y λ = ½, X tiene distribución Chi-cuadra, con n grados
de libertadgamma de parámetros r y,

Actividad. Escribir las ecuaciones de la función de densidad de probabilidad, del


valor esperado y de la varianza, para los tres casos anteriores.
perfiles de la distribución gamma (r , λ)
Usar R para trazar la grafica de las siguientes distribuciones gamma
Г (1, 1)
Г(3, 1)
Г(3, 2)

curve(dgamma(x,1, 1), 0,10, col=3)


curve(dgamma(x, 3,1), 0,10, add=T, col="red")
curve(dgamma(x, 3,2), 0,10, add=T)
Distribución gamma (r , λ)
Ejemplo 3. En un sistema de comunicación de datos, varios mensajes que llegan a un
nodo se agrupan en un paquete antes de que se transmitan a través de la red.
Suponga que los mensajes llegan al nodo de acuerdo con un proceso de Poisson con
una media de 30 mensajes por minuto. Se utilizan cinco mensajes para formar un
paquete.
(a) ¿Cuál es el tiempo promedio hasta que se forma un paquete, es decir, hasta que
llegan cinco mensajes al nodo?, ¿Cuál es la desviación estándar?
(b) ¿Cuál es la probabilidad de que se forme un paquete en menos de 10 segundos?
(c) ¿Cuál es la probabilidad de que un paquete se forme en menos de 5 segundos?

Sea X el tiempo hasta que llegan cinco mensajes al nodo. X tiene distribución de
Erlang con r=5 y λ= 30 mensajes por minuto.
(d) E(X)= 10 seg, V(X)= 1/3 seg2
(e) P(X<10) = 0.5595; pgamma(10, 5, 0.5)
(f) P(X<5) = 0.1088; pgamma(5, 5, 0.5)
Actividad

Distribución de Weibull (α, β).

1. Trazar los perfiles de las siguientes distribuciones.


W(1,1), W(3.5, 0.5) W(3.5, 0.25)

2. Se propone una distribución de Weibull para modelar la duración de un proceso de


horneado en la fabricación de semiconductores. Sea T la duración en horas del
proceso de horneado. Si T tiene distribución W(0.3, 0.1), ¿cuál es la probabilidad de
que el proceso de horneado dure más de 4 horas?, ¿cuál es la probailidad de quedure
entre dos y siete horas ?

P(T > 4 ) = 0.4678

P(2 < T < 7) = 0.1324


Actividad

Distribución de Beta (a, b)

1. Trazar los perfiles de las siguientes distribuciones.


B(1,1), B(2, 2) , B(3, 2), B(0.5, 2)

2. Suponga que la proporción X de área de un cuadrado seleccionado al azar que


está cubierto por cierta planta tiene una distribución beta con a=5 y b=2.
a) Calcule E(X) y V(X)
b) P(X < 0.2)
c) P(0.2 < X < 0.4)
Actividad

Distribución de lognormal ( μ, σ )

1. Trazar los perfiles de las siguientes distribuciones.


LogN(0,0.5), LogN(1, 0.5) , LogN(1, 1)

2. La distribución lognormal se utiliza con frecuencia para modelar propiedades de


materiales. La distribución lognormal con μ= 0.375 y σ= 0.25 es un modelo
adecuado para X:= modulo de elasticidad de sistemas de piso de viguetas de
madera de pino. Determine:
a) E(X) y V(X)
b) P(1 ≤X ≤ 2)
c) El percentil 99

1.5, 0.1453, 0.8316, 2.603


¿ De cuál distribución proviene un conjunto de datos?

En la práctica, a menudo se tiene una muestra de alguna población y se debe utilizar


para decidir la distribución de probabilidad de la población de donde proviene la
muestra. Si la muestra es razonablemente grande, el histograma es una buena
indicación.
Dado el siguiente conjunto de datos

4.9, 9.0, 2.1, 3.3, 0.8, 2.9, 1.3, 1.1, 2.0, 3.3,
2.4, 2.3, 2.8, 1.1, 2.5, 2.1, 4.5, 4.0, 4.7, 1.6,
5.8, 3.0, 1.5, 0.8, 4.6, 2.6, 1.9, 2.1, 3.1, 3.4,
1.5, 1.8, 2.7, 6.4, 2.3, 1.0, 3.5, 7.2, 4.5, 3.1,
1.2, 2.0, 1.8, 2.3, 3.1, 4.9, 8.4, 2.7, 2.7, 2.3

Proponer un modelo para la población de donde proviene la muestra.


hist(muest, freq = F)
curve(d----(x, -----, ----), add=T)

Vous aimerez peut-être aussi