Probabilidad y Distribuciones Continuas

Distribucin exponencial (T.
colas y confiabilidad)
Explica fenmenos de la vida real como por ejemplo
lneas de espera, (teora de colas). Esta distribucin se

usa para modelar tiempos de espera para la
ocurrencia de un cierto evento.
Es un caso
especial de
D. Gama
Consideraciones
La distribucin exponencial es el equivalente continuo de la distribucin
geomtrica discreta. Esta ley de distribucin describe procesos en los que:
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo
que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
ocurra en un instante tf, no depende del tiempo transcurrido anteriormente
en el que no ha pasado nada.
De hecho la distribucin exponencial puede derivarse de un proceso
experimental de Poisson con las mismas caractersticas, pero tomando como
variable aleatoria , en este caso, el tiempo que tarda en producirse un hecho
Ejemplos
El tiempo que tarda una partcula radiactiva en desintegrarse. El
conocimiento de la ley que sigue este evento se utiliza en Ciencia
para, por ejemplo, la datacin de fsiles o cualquier materia
orgnica mediante la tcnica del carbono 14, C14;
El tiempo que puede transcurrir en un servicio de urgencias, para la

llegada de un paciente;
En un proceso de Poisson donde se repite sucesivamente un
experimento a intervalos de tiempo iguales, el tiempo que
transcurre entre la ocurrencia de dos sucesos consecutivos sigue un
modelo probabilstico exponencial. Por ejemplo, el tiempo que
transcurre entre que sufrimos dos veces una herida importante.
Ejemplo
Ejemplo
Se ha comprobado que el tiempo de vida de cierto tipo
de marcapasos sigue una distribucin exponencial con
media de 16 aos. Cul es la probabilidad de que a una
persona a la que se le ha implantado este marcapasos se
le deba reimplantar otro antes de 20 aos? Si el
marcapasos lleva funcionando correctamente 5 aos en
un paciente, cul es la probabilidad de que haya que
cambiarlo antes de aos?
Ejemplo
Distribucin Gamma
Este modelo es una generalizacin del modelo Exponencial ya que,
en ocasiones, se utiliza para modelar variables que describen el

tiempo hasta que se produce p veces un determinado suceso. Su
funcin de densidad es de la forma:
Como vemos, este modelo depende de dos parmetros positivos: y
p. La funcin (p) es la denominada funcin Gamma de Euler que

representa la siguiente integral:
que verifica (p + 1) = p(p), con lo que, si p es un nmero entero
positivo, (p + 1) = p!
Distribucin Gamma
Distribucin normal
Es la distribucin continua ms importante, tanto en estadstica terica como
aplicada. Si X es una variable aleatoria normal, entonces su funcin de d.p. est dada
por
donde (mu) es la media y (sigma) es la
desviacin estndar (2 es la varianza).
Suponga una v.a . X~N(, 2), para calcular la probabilidad
de que esta variable tome valores entre dos nmeros a y b,
entonces se calcula el rea bajo la curva entre a y b
(mediante mtodos numricos ya que la integral de la
funcin de distribucin no tiene solucin analtica).
Cuando es una distribucin normal con parmetros = 0 y 2 = 1, entonces a la
distribucin se le conoce como distribucin normal estndar (N(0, 1)) y los valores de
las probabilidades estn ya tabulados.
Estandarizar una variable es fcil, puesto que si X tiene una distribucin normal con E(X)
= y V(X) = 2, entonces la variable (estandarizada) es
10
El Valor Z - Estandarizar
En esta ecuacin, m es la media, s es la desviacin estndar,
y x es un valor que nos gustara evaluar.

x-m calcula que tan lejos se est de la media.
Cuando se divide por s, se est calculando
cuantas desviaciones estndar se est de la media.
Zona 1: m 1s
68.26% de los datos se esperan contener
dentro de una desviacin estndar de la
media.
Zona 2: m 2s
dentro de dos desviaciones estndar de la
media.
Zona 3: m 3s
reas bajo la curva de distribucin
dentro de tres desviaciones estndar.
normal
GRAPH/Prob.Distrib.Plot/View
Prob/shaded area
Ejemplo
El tiempo de entrega de un producto se distribuye normal con media 60,5 y desv.
estandar 5,9. Si un tiempo de entrega es de 70, cuntas desviaciones estndar
tiene respecto de la media?
Si estamos considerando una zona con m 3s

entonces 1,61 desviaciones estndar de la
media est al interno del rea de la zona.
Cuntas desviaciones estndar tiene el
tiempo de 100 respecto de la media?
Este valor esta muy lejos de la zona de

aceptacin lo que indica que algn
cambio ha ocurrido en las operaciones
normales del proceso.
12
Distribucin Normal
Una de las ms importantes en la Estadstica.
Matemtico Alemn Karl Friedrich Gauss (1777-1855)
Muchos de los fenmenos del mundo real se
comportan bajo esta estructura probabilstica.

Cuando una variable aleatoria representa a una
poblacin que tiene un comportamiento probabilstico
normal el histograma tiene una forma ms o menos
simtrica.
Funcin densidad y Distribucin de

Probabilidad
Nota: Los errores en las

mediciones cientficas se
aproximan extremadamente
bien mediante una
distribucin normal.
Una variable Aleatoria
continua X que tiene la
forma de campana se dice
que sigue una Distribucin
Normal
Figuras importantes
Consideraciones
La moda, que es el punto sobre el eje horizontal donde
la curva es un mximo, ocurre en x =

La curva es simtrica alrededor de un eje vertical a
travs de la media
La curva tiene sus puntos de inflexin en x = , es
cncava hacia abajo si - < X < + , y es
cncava hacia arriba en cualquier otro punto.
Consideraciones
La curva normal se aproxima al eje horizontal de
manera asinttica conforme nos alejamos de la media

en cualquier direccin.
La rea total bajo la curva y sobre el eje horizontal es
igual a 1.
Es una buena aproximacin para la binomial y la
hipergeomtrica.
Atencin
Funcin de probabilidad normal depende de y y
como estos valores tienen un dominio de

entonces puede existir un nmero infinito de curvas
para cada y .
Para evitar esto se ha encontrado una curva normal
reducida o estandarizada que tenga un valor medio
igual a cero y una varianza igual a 1, de tal manera que
cualquier distribucin normal de y varianza 2 se
pueda convertir o estandarizar a otro distribucin
Atencin
En consecuencia de lo anterior la funcin densidad es.
Teorema central del lmite (TLC)

Una de las razones por las que la distribucin normal es tan importante es
debido al TLC que en un caso particular afirma:
sea x1, x2,, xn una muestra aleatoria de cualquier poblacin, y sea x la
media muestral; entonces, independientemente de cmo sea la distribucin
de la poblacin de donde se extrajo la muestra, la distribucin de x se
aproxima a la normal N(m,s2) conforme n crece. La forma lmite de la
distribucin de
X m conforme n, es la distribucin normal
z
s n
estndar N(0,1).
En algunos casos la aproximacin puede ser buena para n pequea
n<10.
En otros casos se necesita un n grande, n>100.
En el caso en que las x tengan la misma distribucin y no sea
radicalmente diferente a la normal, entonces un n 4 es suficiente.
20
Prueba de normalidad
Test cuantitativos
Es posible usar test cuantitativos para calcular el p-value
asociado a la hiptesis nula del tipo de distribucin.
El p-value es la significancia de la prueba, es el rea bajo la
distribucin de referencia que esta mas all del valor del
estadstico de prueba.
Existen muchas pruebas para verificar la normalidad, entre las
que se encuentran las siguientes:
Ji-cuadrada para bondad de ajuste (para cualquier
distribucin)
Kolmogorov-Smirnov
Shapiro-Wilks
Anderson-Darling (para dist. Gauseana o Normal), usaremos
sta prueba ya implementada en Minitab. Stat/Basic Stat/
Normality Test
21
Distribuciones que se derivan del

muestreo Distribucin T de Student
Es una d.p. que surge del problema de:
estimar la media y desviacin de una poblacin normalmente distribuida cuando
el tamao de la muestra es pequeo.
Debido a que si se obtiene una muestra aleatoria de tamao n de una

poblacin cuya distribucin es normal, entonces el estadstico:
xm
T
S /v
Grados de
libertad (df)
~ T Student (v)
v n 1
En la figura se muestra la grfica de

densidades T y la normal. Como se
aprecia la distribucion T es similar a la
normal (0, 1), excepto que tiene colas ms
pesadas.
GRAPH/PROBABILITY DISTRIB
PLOT
22
Distribucin ji-cuadrada
Usada para hacer inferencias acerca de la desviacin estndar .
Sean Z1, Z2, , Zk v.a. ind., ~N( = 0 , 2 = 1), entonces la v.a.
Si se obtiene una muestra de tamao

n, entonces el estadstico: ( n1) S
s
2
tiene una distribucin

ji-cuadrada con n 1 grados de
libertad (S2, es la varianza
muestral).
GRAPH/PROBABILITY DISTRIB
PLOT
Conforme crecen los grados de libertad

se aproxima a una distribucin normal.
23
Distribucin ji-cuadrada
La distribucin tiene muchas aplicaciones en inferencia
estadstica. La ms conocida es la de la denominada prueba
utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimacin de varianzas.
Pero tambin est involucrada en el problema de estimar la
media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de
varianza por su relacin con la distribucin F de Snedecor,
que es la distribucin del cociente de dos variables aleatorias
independientes con distribucin .
Distribucin F de Fisher
Sean W y Y variables aleatorias ji-cuadrada independientes con u y v grados
de libertad, respectivamente. Entonces el cociente F W u
Y v
tiene una distribucin F con u grados de libertad en el numerador, y v en
el denominador, cuya funcin de densidad de probabilidad est dada por:
u / 2 1
u v u
x
2 v
f ( x)
(u v / 2)
u v u
x 1
2 2 v
u 2
0 x
Densidades F para diferentes
grados de libertad.
La distribucin F se encuentra
centrada con respecto a 1, y los
dos parmetros le dan
flexibilidad.
25
La importancia de la distribucin F radica en que es de especial utilidad

para hacer inferencia cuando se comparan varianzas, ya que si se
tienen dos poblaciones con distribucin normal y varianzas 12 y 22,
respectivamente, y se toman muestras aleatorias de cada poblacin, de
tamao n1 y n2, respectivamente, entonces la variable aleatoria formada
por el cociente
F
S s
S s
2
1
2
1
2
sigue una distribucin F con n1 y n2 grados de libertad en el

numerador y denominador, respectivamente, donde S12 y S22 son las
varianzas muestrales.
26
Inferencia Estadstica
La inferencia estadstica es una parte de la

estadstica que comprende los mtodos y
procedimientos para deducir propiedades de
una poblacin estadstica, a partir de una
pequea parte de la misma.
27
Intervalo de Confianza (I.C.)
Intervalo de Confianza
Un intervalo construido
alrededor de un parmetro
de una distribucin.
En este caso, un intervalo
es construido alrededor de
la media muestral usando
la distribucin muestral
para capturar un % de la
distribucin.
Intervalo de Confianza (I.C.)

Intervalo de confianza indica un rango donde puede estar el parmetro con
cierto nivel de seguridad o confianza. Construir un intervalo al 100(1 )%
de confianza para un parmetro desconocido consiste en estimar dos
nmeros (estadsticos) L y U, de manera que la probabilidad de que se
encuentre entre ellos sea 1 , es decir,
PL U 1
donde L y U forman el intervalo de confianza buscado [L, U].
Intervalo de Confianza Bilateral
El riesgo se distribuye igualmente en ambos lados,PL U 1
Intervalo de Confianza Unilateral
El riesgo es concentrado en un lado, PL 1
P U 1
29
IC para la media cuando n > 30 datos

(s conocido)
Intervalo de confidencia bilateral:
Intervalo de confidencia superior:

Intervalo de confidencia inferior:
IC para la media cuando n < 30

(s desconocido)
Intervalo de confidencia bilateral:
Intervalo de confidencia superior:

Intervalo de confidencia inferior:
Siguiendo con el ejemplo

del grosor de discos
En tabla 2.1 la caracterstica de calidad del producto (disco) es su grosor, que debe
ser de 1.20 mm con una tolerancia de 0.10 mm. Determine el intervalo de
confianza de la media.
x t 2,n 1 s
1,18341
n 1,1786 1,97928 0,270
1,17387
Student's t distribution with 124 DF

P( X <= x )
x
0,025 -1,97928
STAT/BASIC STATISTICS/1t 1
Sample t
N Mean StDev SE Mean
95% CI
125 1,17864 0,02695 0,00241 (1,17387; 1,18341)
32
EJEMPLO 4.2
En el proceso de fabricacin de discos para computadoras una de las variables
crticas es el rendimiento del formato. Se toma una muestra aleatoria de n = 10
discos de la produccin del ltimo turno, se formatean y se reporta el
rendimiento de cada disco. Los datos obtenidos son:
96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41, 89.79, 92.62
Con base en estos datos interesa estimar, de manera puntual y por intervalo, la
media y la desviacin estndar para la poblacin de discos de dicho turno.
Variable N Mean StDev SE Mean
95% CI
rend
10 91,029 2,991 0,946 (88,889; 93,169)
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
rend
Standard (2,06; 5,46) (4,23; 29,82)
33
Tamao de la
muestra
Tamao de muestra n para lograr que la estimacin de una media
poblacional tenga como error mximo a un nmero E.
Para un error de estimacin est dado
, despejando n
s
x
t
2, n 1
se obtiene
n
t 2,n 1 * S
Como t(/2, n 1) depende de n, y sta es la incgnita, entonces para

propsitos prcticos y con tamaos de muestra mayores que 30, el valor
de t(/2,n 1) puede tomarse como 2. De esta manera,
n
4* S
34
IC para Varianzas
I.C.
bilateral:
I.C. superior:
I.C. inferior:
Determine el intervalo de confianza para la desviacin estndar

del ejemplo 4.2
STAT/Basic Statistic/1
CI for
CI for
Variable Method
StDev
Variance
variance
rend
Chi-Square (2,06. 5,46) (4,23. 29,82)
Distrib. Chi-Cuadrado
Control de Calidad, PI-4307
36
Prueba de Hiptesis Estadstica

Una hiptesis es una declaracin sobre los parmetros de una
poblacin.
Los parmetros deben estar identificados antes de hacer el
anlisis.
En general no tenemos datos poblacionales pero si tenemos
datos muestrales de los cuales calculamos estadsticos.
Usamos estos estadsticos para hacer inferencias sobre los
parmetros verdaderos de la poblacin.
Debido a que hacemos inferencias, hay algn riesgo asociado
con las decisiones que hacemos.
Por tanto, nunca debemos pensar de nuestros estadsticos
como estimadores puntuales, mas bien como intervalos sobre
los cuales tenemos algn nivel de confianza que estemos
prediciendo con exactitud los verdaderos parmetros de la
poblacin.
Hiptesis Nula & Alternativa

Hiptesis Nula: H0
Contiene una declaracin de
igualdad tal como , =, .
Hiptesis Alternativa: H1
Contiene una declaracin de
inigualdad tal como > , , <
Por ejemplo, la afirmacin este proceso produce menos de 8% de defectuosos se

puede plantear estadsticamente, en trminos de la proporcin p desconocida de
artculos defectuosos que genera el proceso, como se hace a continuacin.
H0: p = 0.08
HA: p < 0.08
HA: p > 0.08
comnmente se plantea como una igualdad, lo cual facilita

tener una distribucin de probabilidad de referencia especfica
se aceptar como cierta slo en caso de rechazar la hiptesis nula
Hiptesis alternativa unilateral
H0: p = 0.08 este proceso produce 8% de defectuosos

HA: p 0.08 se observan menos de 8% de defectuosos como ms de 8% de defectuosos
Hiptesis alternativa bilateral
Probar una hiptesis consiste en investigar, con base en la evidencia contenida en una
muestra aleatoria, si lo afirmado por H0 es verdad o no, y en caso de ser falso, se toma
como verdadera la HA.
La estrategia para probar la hiptesis parte del supuesto de que H0 es verdadera, y si los
resultados de la investigacin contradicen en forma suficiente dicho supuesto,
entonces se rechaza H0 y se acepta la HA.
En caso de que los resultados de la investigacin no demuestren claramente la falsedad
de H0, sta no se rechaza. Es decir, la hiptesis nula es verdadera mientras no se
demuestre lo contrario.
Control de Calidad, PI-4307
39
Si en efecto, H0 es verdad, el valor del estadstico de prueba debera caer dentro del
rango de valores ms probables de su distribucin asociada, el cual se conoce como
regin de aceptacin.
Pero si cae en una de las colas de su distribucin asociada, fuera del rango de
valores ms probables (en la regin de rechazo), es evidencia en contra de que este
valor pertenece a dicha distribucin.
40
Riesgos para la Toma de Decisin
Aceptar
H0
H0
verdadera
H0
falsa
Decisin
correcta
Error tipo
II
Rechazar Error tipo I

H0
Error Tipo I
H1
Decisin
correcta
/2
/2
Incorrectamente Rechazar H0 cuando sta es Verdadera
= Probabilidad de cometer un error tipo I.
Error Tipo II
Incorrectamente Aceptar H0 cuando esta es Falsa
= Probabilidad de cometer un error tipo II.

1- =Prob. de rechazar H0 cuando es falsa, Potencia del Test.
Errores Tipo I vs. Tipo II

Caso de un Juicio
Hiptesis
H0
verdadera
H0
falsa
Aceptar
H0
Decisin
correcta
Error tipo II
Rechazar
H0
Error tipo I
Decisin
correcta
H0: Acusado es inocente y debe salir libre.

H1: Acusado es culpable y debe ser castigado.
Riesgos
Error Tipo I: Castigar una persona inocente.
Error Tipo II: Liberar a una persona culpable.
Cul de los dos riesgos es mas serio?

H0
verdadera
H0
falsa
Aceptar
H0
Decisin
correcta
Error tipo II
Rechazar
H0
Error tipo I
Decisin
correcta
Fabricacin de un paracadas
Hiptesis
H0: Paracadas abrir exitosamente.
H1: Paracadas fallar al abrir.
Riesgos
Error Tipo I
No vender un buen paracadas (perder una venta).
Error Tipo II
Vender un paracadas que no se abrir (perder un cliente).

Agregar una segunda maquina a la lnea de produccin:
H0: m1 = m2
Aceptar
H0
H0
verdadera
H0
falsa
Decisin
correcta
Error tipo
II
Maquina 1 tiene la misma media que la maquina 2.

Rechaza
Error tipo I
rH
El cambio debe ser implementado.

H1: m1 m2
Maquina 1 no tiene la misma media que la maquina 2.
El cambio no debe ser implementado.
Riesgos
-riesgo: No usar la nueva maquina aunque tenga la misma media
que la maquina antigua.
-riesgo: Usar la nueva maquina aunque tenga una media diferente
que la maquina antigua.
Decisin
correcta
P-value
El valor P representa la probabilidad de que la estadstica de prueba tome un valor al
menos tan extremo como el valor observado en ella cuando Ho es verdadera.
Representa el nivel de significancia () mas pequeo que conducira al rechazo de
Ho.
Se acostumbra calificar como significativa a la estadstica de prueba (y los datos)
cuando se rechaza la hiptesis nula Ho, por lo que podemos considerar el valor P
como el nivel mas pequeo en el que los datos son significativos.
El Valor P es usado para determinar si existe suficiente evidencia para rechazar la
hiptesis nula en favor de la alternativa.
El valor P es la probabilidad de rechazar incorrectamente
la hiptesis nula.
Regla General de Decisin:
Si Valor P , Acepte H0
Si Valor P < , Rechace H0
Ejemplo 3-3, libro Control Estadstico de la Calidad de D.

Montgomery, 3 Ed.
La resistencia a la tensin media de una fibra sinttica es una
caracterstica de calidad importante. Al fabricante le gustara
probar la hiptesis de que la resistencia media es 50 psi, utilizando
alfa=0,05. Por la experiencia anterior del fabricante, ste esta
dispuesto a asumir que la resistencia a la tensin tiene una
distribucin aproximadamente normal, sin embargo se desconoce
la media y la varianza de la resistencia a la tensin.
Se selecciona una muestra de 16 ejemplares de prueba de la fibra y
se determina su tensin.
H0: m = 50 psi
HA: m 50 psi
xm
T
S /v
~ T Student (v 1 )
Tensin
48,89
52,07
49,29
51,66
52,16
49,72
48,00
49,96
49,20
48,10
47,90
46,94
51,76
50,75
49,86
51,57
46
One-Sample T: tension
Stat/BS/1 t 1 sample/options/not equal
Test of mu = 50 vs not = 50
Variable N Mean StDev SE Mean
95% CI
T
P
tension 16 49,864 1,661 0,415 (48,979. 50,750) -0,33 0,749
Alfa=0,0
5
P-value
47
One-Sample T: tension
Test of mu = 50 vs > 50
Al fabricante le preocupa
que los valores de la
resistencia sean bajos
H0: m 50
95% Lower
Variable N Mean StDev SE Mean Bound T
P
tension 16 49,864 1,661 0,415 49,136 -0,33 0,626
HA: m 50
Stat/BS/1 t 1 sample/options/
greater thanl
48
Para los mismos datos de la

Tensin
H0: 2= 3
HA: 2 3
Estadstico de la prueba
es
Test and CI for One Variance: tension

Method
Null hypothesis
Sigma-squared = 3
Alternative hypothesis Sigma-squared not =
3
( n1)
P-value
Statistics
Variable N StDev Variance
tension 16 1,66
2,76
CI for
CI for
Variable Method
StDev
Variance
tension Chi-Square (1,23. 2,57) (1,51. 6,61)
Test
Variable Method
Statistic DF P-Value
49
Ejemplo 3-6 Montgomery

En una muestra aleatoria de 80 rodamientos de cigeales para motor, 15 de los
rodamientos tiene un acabado superficial cuya aspereza rebasa lo que permiten las
especificaciones. Determine el intervalo de confianza de la fraccin disconforme
del proceso.
x 15
p
0,1875
n 80
^
Suponiendo que es apropiada la aproximacin

normal de la distribucin binomial, el IC del 95%
es
Normal with mean = 0 and standard deviation

IC: [0.10197, 0,27302]
=1
(Exel)
P( X <= x )
x
Test and CI for One Proportion
0,025 -1,95996
Sample X N Sample p
95% CI
1
15 80 0,187500 (0,108914. 0,290328)
50
Comparaciones de Dos
Muestras
Ejemplos:
Media nueva mquina vs. Media mquina de referencia.
Partes del suplidor A vs. suplidor B.
Ajustes temperatura actuales vs. ajustes propuestos de
temperatura.
Condicin actual vs. condicin propuesta.
Hiptesis de 2 Muestras
Se desea probar las hiptesis:
H 0 : m1 m2
vs.
H1: m1 m2
Muestras aleatorias tomadas de cada poblacin.
m1 s 1
Poblacin 1
x1 , s1 , n1
Usar x1 x2
m2 s 2
Poblacin
2
x2 , s2 , n2
como el mejor estimado de la diferencia en

medias de la poblacin m1- m2.
Prueba para la Igualdad de

Dos Medias
Prueba estadstica de
x1 x2
Estimado / Dev Std (Estimado)

Distribucin Muestral de
x1 x2
t
StdDev( x1 x2 )
x1 x2
Asumir que las dos muestras provienen de la misma

poblacin (m1= m2)
Qu tan aparte estara x1 x2 por casualidad
aleatoria?
x1 x2
0
Mean=0
Desv Estd=?
Prueba para la Igualdad de

Dos Medias
Del Teorema del Limite Central:StdDev( x1 )
Combinando ambas:
StdDev( x1 x2 )
s 12
n1
s1
n1
StdDev
, ( x2 )
s 22
n2
s
1
Distribucin de x1 N m1 ,
n1
Distribucin de
Distribucin de x2
N m , s 2
2
n2
x1 x2
2
2
s
s
N m1 m 2 , 1 2
n1
n2
s2
n2
Si s1 = s2.
StdDev( x1 x2 )
s 12
n1
s 22
n2
1 1
s
n1 n2
Los dos mtodos de anlisis dependen si las desviaciones estndar

son la misma.
Prueba- t: Igualdad de 2 Medias

Caso 1: s1 = s2
Caso 2: s1 <> s2
Desconocidas pero iguales
Desconocidas pero no iguales
x1 x2
t
1
1
sp
n1 n2
Con n1+n2-2 g.l

sp
s1 y s2
s12
s22
n1
n2
Con g.l ajustados
n1 1 s12 n2 1 s22
n1 n2 2
Sp promedio pesado de
x1 x2
2
2
S1 S
n1 n
S n S
2
n 1
1
2
2
(1-% Intervalo de Confianza

para m1-m2
Un intervalo de confianza tiene la forma:
estimado valor t tabulado*(Desv. Estd del estimado)
Caso 1: s1 = s2
x1 x2 t / 2;n n 2 * s p
1
/2
1
1
n1 n2
Caso 2: s1 s2
s12 s22
x1 x2 t / 2;"adjusted " *
n1 n2
t / 2;n1 n2 2
t0.025;n1 n2 2 2
Un IC del 95% es aprox.
+/- 2 desv. estd.
Hiptesis de 2 Muestras
Se desea probar la hiptesis:
H0: s1 s 2
vs.
H1: s 1 s 2
Porqu comparar dos desviaciones estndar?

Determinar cual prueba t usar para una prueba de medias.
Comparar variacin entre dos grupos.
Nuevo instrumento de medicin vs. Actual instrumento de medicin.
Cambio propuesto del proceso vs. proceso actual.
Estadsticos Muestrales
Muestras aleatorias tomadas de cada poblacin.
m1 s 1
Poblacin 1
x1 , s1 , n1
Usar
m2 s 2
Poblacin 2
x2 , s2 , n2
s1 s2
como el mejor estimado de la razn de las desviaciones

estndar de la poblacins 1 s 2 .
s1
Si las muestras tienen la misma desviacin estndar (1= 2), entonces
debe estar cercano a 1.
s2
Prueba Estadstica F
Para probar la igualdad de las desviaciones estndar, la
prueba estadstica es dada por

2
s1
F
s2
Cuando H0 es verdadera, el estadstico F sigue una
distribucin F con n1-1 y n2-1 grados de libertad.
Si las desviaciones estndar de la poblaciones son iguales, el

valor calculado F ser cercano a 1 y el valor P correspondiente
se espera que sea grande o cercano a 1.
Comparaciones Muestrales
Pareadas
Se utiliza para comparar dos poblaciones donde las
observaciones de una muestra pueden ser pareadas con las

observaciones en la otra muestra.
Ejemplos:
Cada unidad es sometida a ambos tratamientos.
Observaciones antes y despus en las mismas unidades.
Dos sistemas de metrologa midiendo las mismas
unidades.
Grupos de unidades son partidas. Mitad de cada grupo es
asignada aleatoriamente a cada tratamiento.
Ejemplo de Tenis de Carrera

Un fabricante desea comparar dos materiales diferentes para
hacer las suelas de las tenis para correr

Material A: Estndar
Material B: Mas barato
Se desea cambiar al Material B pero se teme que este sea
menos durable.
Suponga que se ha escogido incluir los siguientes factores y
niveles en un experimento:
Material: A y B
10 corredores
Cmo se diseara este estudio?
Propuesta Diseo 1
5 Corredores
Material A
10 Corredores
5 Corredores
Material B
1.
Partir aleatoriamente los diez corredores en dos grupos de igual tamao.
2.
Asignar un grupo para usar tenis hechas con material A y asignar el otro
grupo para usar tenis hechas con material B.
3.
Los corredores se ejercitan como de costumbre por un periodo

especificado de semanas y retornan las tenis al fabricante.
4.
El desgaste del tenis es medido para cada par y los datos son analizados
usando una prueba-t de dos muestras.
Es ste el mejor diseo para este estudio?.
Propuesta Diseo 2
Corredor
Planteamiento muestras pareadas

Asignar aleatoriamente una tenis del
Material A y una del Material B al pie

izquierdo y derecho de cada corredor.
B
B
A
A
Es ste un mejor diseo?
A
B 9
Este es un ejemplo de un experimento

pareado.
A 6
A
A
B 10
Datos Experimento Pareado

Muestras pareadas
Son aquellas en
las que los datos
de ambas
poblaciones se
pueden ver como
pares porque
tienen algo en
comn y no son
independientes.
Anlisis Muestra Pareada

Calcular una nueva columna con la diferencia en desgaste
para cada corredor.

Delta (B-A) = XB - XA
Jogger
1
2
3
4
5
6
7
8
9
10
Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3
Material B Delta (B-A)

14.0
0.8
8.8
0.6
11.2
0.3
14.2
-0.1
11.8
1.1
6.4
-0.2
9.8
0.3
11.3
0.5
9.3
0.5
13.6
0.3
Analizar la columna de deltas, no los datos iniciales.
Delta (B-A) vs. Corredor

Puede ud. indicar en
Delta vs Corredor
1,2
este grfico si los dos

materiales tienen el
mismo desgaste?
0,9
Delta
0,6
Cmo se pueden
0,3
0,0
comparar
estadsticamente?
10
Corredor
Si los materiales tienen el mismo desgaste, el delta

promedio debe estar cercano a 0.
Hiptesis Estadstica
Se quiere probar la hiptesis:
H 0 : m A mB
versus
H1 : m A mB
Nota: La hiptesis puede
tambin ser establecida como:
H 0 : mB m A = 0
vs.
H1 : mB m A 0
Desgaste medio verdadero es el

mismo para ambos materiales A y
B
Desgaste medio verdadero es
diferente para los materiales A y B
Prueba Pareada-t
Aplicar mtodos muestrales a la columna de deltas.
Jogger
1
2
3
4
5
6
7
8
9
10
Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3
Material B Delta (B-A)

14.0
0.8
8.8
0.6
11.2
0.3
14.2
-0.1
11.8
1.1
6.4
-0.2
9.8
0.3
11.3
0.5
9.3
0.5
13.6
0.3
Recuerde el estadstico t de una sola muestra.
x m0
t
s
n
Con n-1 grados de

libertad, donde n es el
numero de pares.
Prueba-t Pareada
Probar la hiptesis que el delta promedio es 0 usando =
0.05.
H 0 : mB m A = 0
vs.
H1 : mB m A 0
x m0 0.41 0
t
3.35
s
0.39
n
10
Prob ( t > |3.35| ) = 0.0085
Paired T-Test and CI: mat A. mat B

Paired T for mat A - mat B
N Mean StDev SE Mean
mat A
10 10,630 2,451 0,775
mat B
10 11,040 2,518 0,796
Difference 10 -0,410 0,387 0,122
Conclusin:
Ya que 0.0085 < 0.05.
Rechazar Ho. Los materiales
son estadsticamente
diferentes.
95% CI for mean difference: (-0,687. -0,133)

T-Test of mean difference = 0 (vs not = 0): T-Value = -3,35 P-Value =
0,009
Intervalo de Confianza
Qu tan diferentes son los materiales?
Determine un intervalo de confianza que contenga la
verdadera diferencia.
x t
s
*
, n 1
Un intervalo de confianza del 95% para el ejemplo de los
tenis para correr:
0.41 2.26* 0.39
10
0.13, 0.69
Conclusin: 95% de confianza que la verdadera diferencia en

desgaste esta entre 0.13 y 0.69.
Ventajas del Anlisis Pareado

Removi la variabilidad de corredor a corredor de la
comparacin.
Mejoro la precisin (se redujo el error estndar) del
estimado mA - mB o md.
Resultando en una comparacin mas sensitiva que el
planteamiento de dos muestras independientes.

Probabilidad y Distribuciones Continuas

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Probabilidad y Distribuciones Continuas

Transféré par

Droits d'auteur :

Formats disponibles

Distribucin exponencial (T.

lneas de espera, (teora de colas). Esta distribucin se

El tiempo que puede transcurrir en un servicio de urgencias, para la

en ocasiones, se utiliza para modelar variables que describen el

Como vemos, este modelo depende de dos parmetros positivos: y

p. La funcin (p) es la denominada funcin Gamma de Euler que

y x es un valor que nos gustara evaluar.

Si estamos considerando una zona con m 3s

Este valor esta muy lejos de la zona de

comportan bajo esta estructura probabilstica.

Funcin densidad y Distribucin de

Nota: Los errores en las

la curva es un mximo, ocurre en x =

manera asinttica conforme nos alejamos de la media

como estos valores tienen un dominio de

Teorema central del lmite (TLC)

Distribuciones que se derivan del

Debido a que si se obtiene una muestra aleatoria de tamao n de una

En la figura se muestra la grfica de

Sean Z1, Z2, , Zk v.a. ind., ~N( = 0 , 2 = 1), entonces la v.a.

Si se obtiene una muestra de tamao

tiene una distribucin

Conforme crecen los grados de libertad

La importancia de la distribucin F radica en que es de especial utilidad

sigue una distribucin F con n1 y n2 grados de libertad en el

La inferencia estadstica es una parte de la

Intervalo de Confianza (I.C.)

Intervalo de Confianza (I.C.)

El riesgo se distribuye igualmente en ambos lados,PL U 1

Intervalo de Confianza Unilateral

El riesgo es concentrado en un lado, PL 1

IC para la media cuando n > 30 datos

Intervalo de confidencia superior:

IC para la media cuando n < 30

Intervalo de confidencia superior:

Siguiendo con el ejemplo

n 1,1786 1,97928 0,270

Student's t distribution with 124 DF

Como t(/2, n 1) depende de n, y sta es la incgnita, entonces para

Determine el intervalo de confianza para la desviacin estndar

Control de Calidad, PI-4307

Prueba de Hiptesis Estadstica

Hiptesis Nula & Alternativa

Por ejemplo, la afirmacin este proceso produce menos de 8% de defectuosos se

comnmente se plantea como una igualdad, lo cual facilita

H0: p = 0.08 este proceso produce 8% de defectuosos

Control de Calidad, PI-4307

Riesgos para la Toma de Decisin

Rechazar Error tipo I

Incorrectamente Rechazar H0 cuando sta es Verdadera

= Probabilidad de cometer un error tipo I.

= Probabilidad de cometer un error tipo II.

Errores Tipo I vs. Tipo II

H0: Acusado es inocente y debe salir libre.

Errores Tipo I vs. Tipo II

H1: Paracadas fallar al abrir.

Cul de los dos riesgos es mas serio?

Errores Tipo I vs. Tipo II

Maquina 1 tiene la misma media que la maquina 2.

El cambio debe ser implementado.

-riesgo: Usar la nueva maquina aunque tenga una media diferente

que la maquina antigua.

Cul de los dos riesgos es mas serio?

Regla General de Decisin: