Académique Documents
Professionnel Documents
Culture Documents
colas y confiabilidad)
Explica fenmenos de la vida real como por ejemplo
Consideraciones
La distribucin exponencial es el equivalente continuo de la distribucin
geomtrica discreta. Esta ley de distribucin describe procesos en los que:
Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo
que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
ocurra en un instante tf, no depende del tiempo transcurrido anteriormente
en el que no ha pasado nada.
De hecho la distribucin exponencial puede derivarse de un proceso
experimental de Poisson con las mismas caractersticas, pero tomando como
variable aleatoria , en este caso, el tiempo que tarda en producirse un hecho
Ejemplos
El tiempo que tarda una partcula radiactiva en desintegrarse. El
conocimiento de la ley que sigue este evento se utiliza en Ciencia
para, por ejemplo, la datacin de fsiles o cualquier materia
orgnica mediante la tcnica del carbono 14, C14;
Ejemplo
Ejemplo
Se ha comprobado que el tiempo de vida de cierto tipo
de marcapasos sigue una distribucin exponencial con
media de 16 aos. Cul es la probabilidad de que a una
persona a la que se le ha implantado este marcapasos se
le deba reimplantar otro antes de 20 aos? Si el
marcapasos lleva funcionando correctamente 5 aos en
un paciente, cul es la probabilidad de que haya que
cambiarlo antes de aos?
Ejemplo
Distribucin Gamma
Este modelo es una generalizacin del modelo Exponencial ya que,
positivo, (p + 1) = p!
Distribucin Gamma
Distribucin normal
Es la distribucin continua ms importante, tanto en estadstica terica como
aplicada. Si X es una variable aleatoria normal, entonces su funcin de d.p. est dada
por
donde (mu) es la media y (sigma) es la
desviacin estndar (2 es la varianza).
Suponga una v.a . X~N(, 2), para calcular la probabilidad
de que esta variable tome valores entre dos nmeros a y b,
entonces se calcula el rea bajo la curva entre a y b
(mediante mtodos numricos ya que la integral de la
funcin de distribucin no tiene solucin analtica).
Cuando es una distribucin normal con parmetros = 0 y 2 = 1, entonces a la
distribucin se le conoce como distribucin normal estndar (N(0, 1)) y los valores de
las probabilidades estn ya tabulados.
Estandarizar una variable es fcil, puesto que si X tiene una distribucin normal con E(X)
= y V(X) = 2, entonces la variable (estandarizada) es
10
El Valor Z - Estandarizar
En esta ecuacin, m es la media, s es la desviacin estndar,
Zona 1: m 1s
68.26% de los datos se esperan contener
dentro de una desviacin estndar de la
media.
Zona 2: m 2s
95.46% de los datos se esperan contener
dentro de dos desviaciones estndar de la
media.
Zona 3: m 3s
99.73% de los datos se esperan contener
reas bajo la curva de distribucin
dentro de tres desviaciones estndar.
normal
GRAPH/Prob.Distrib.Plot/View
Prob/shaded area
Ejemplo
El tiempo de entrega de un producto se distribuye normal con media 60,5 y desv.
estandar 5,9. Si un tiempo de entrega es de 70, cuntas desviaciones estndar
tiene respecto de la media?
12
Distribucin Normal
Una de las ms importantes en la Estadstica.
Matemtico Alemn Karl Friedrich Gauss (1777-1855)
Muchos de los fenmenos del mundo real se
Figuras importantes
Consideraciones
La moda, que es el punto sobre el eje horizontal donde
Consideraciones
La curva normal se aproxima al eje horizontal de
Atencin
Funcin de probabilidad normal depende de y y
Atencin
En consecuencia de lo anterior la funcin densidad es.
20
Prueba de normalidad
Test cuantitativos
Es posible usar test cuantitativos para calcular el p-value
asociado a la hiptesis nula del tipo de distribucin.
El p-value es la significancia de la prueba, es el rea bajo la
distribucin de referencia que esta mas all del valor del
estadstico de prueba.
Existen muchas pruebas para verificar la normalidad, entre las
que se encuentran las siguientes:
Ji-cuadrada para bondad de ajuste (para cualquier
distribucin)
Kolmogorov-Smirnov
Shapiro-Wilks
Anderson-Darling (para dist. Gauseana o Normal), usaremos
sta prueba ya implementada en Minitab. Stat/Basic Stat/
Normality Test
21
xm
T
S /v
Grados de
libertad (df)
~ T Student (v)
v n 1
22
Distribucin ji-cuadrada
Usada para hacer inferencias acerca de la desviacin estndar .
Distribucin ji-cuadrada
La distribucin tiene muchas aplicaciones en inferencia
estadstica. La ms conocida es la de la denominada prueba
utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimacin de varianzas.
Pero tambin est involucrada en el problema de estimar la
media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de
varianza por su relacin con la distribucin F de Snedecor,
que es la distribucin del cociente de dos variables aleatorias
independientes con distribucin .
Distribucin F de Fisher
Sean W y Y variables aleatorias ji-cuadrada independientes con u y v grados
de libertad, respectivamente. Entonces el cociente F W u
Y v
tiene una distribucin F con u grados de libertad en el numerador, y v en
el denominador, cuya funcin de densidad de probabilidad est dada por:
u / 2 1
u v u
x
2 v
f ( x)
(u v / 2)
u v u
x 1
2 2 v
u 2
0 x
Densidades F para diferentes
grados de libertad.
La distribucin F se encuentra
centrada con respecto a 1, y los
dos parmetros le dan
flexibilidad.
25
S s
S s
2
1
2
1
2
26
Inferencia Estadstica
Intervalo de Confianza
Un intervalo construido
alrededor de un parmetro
de una distribucin.
En este caso, un intervalo
es construido alrededor de
la media muestral usando
la distribucin muestral
para capturar un % de la
distribucin.
P U 1
29
x t 2,n 1 s
1,18341
1,17387
STAT/BASIC STATISTICS/1t 1
Sample t
N Mean StDev SE Mean
95% CI
125 1,17864 0,02695 0,00241 (1,17387; 1,18341)
32
EJEMPLO 4.2
En el proceso de fabricacin de discos para computadoras una de las variables
crticas es el rendimiento del formato. Se toma una muestra aleatoria de n = 10
discos de la produccin del ltimo turno, se formatean y se reporta el
rendimiento de cada disco. Los datos obtenidos son:
96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41, 89.79, 92.62
Con base en estos datos interesa estimar, de manera puntual y por intervalo, la
media y la desviacin estndar para la poblacin de discos de dicho turno.
Variable N Mean StDev SE Mean
95% CI
rend
10 91,029 2,991 0,946 (88,889; 93,169)
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
rend
Standard (2,06; 5,46) (4,23; 29,82)
33
Tamao de la
muestra
Tamao de muestra n para lograr que la estimacin de una media
poblacional tenga como error mximo a un nmero E.
Para un error de estimacin est dado
, despejando n
s
x
t
2, n 1
se obtiene
n
t 2,n 1 * S
4* S
34
IC para Varianzas
I.C.
bilateral:
I.C. superior:
I.C. inferior:
Distrib. Chi-Cuadrado
36
poblacin.
Los parmetros deben estar identificados antes de hacer el
anlisis.
En general no tenemos datos poblacionales pero si tenemos
datos muestrales de los cuales calculamos estadsticos.
Usamos estos estadsticos para hacer inferencias sobre los
parmetros verdaderos de la poblacin.
Debido a que hacemos inferencias, hay algn riesgo asociado
con las decisiones que hacemos.
Por tanto, nunca debemos pensar de nuestros estadsticos
como estimadores puntuales, mas bien como intervalos sobre
los cuales tenemos algn nivel de confianza que estemos
prediciendo con exactitud los verdaderos parmetros de la
poblacin.
Hiptesis Alternativa: H1
Contiene una declaracin de
inigualdad tal como > , , <
Probar una hiptesis consiste en investigar, con base en la evidencia contenida en una
muestra aleatoria, si lo afirmado por H0 es verdad o no, y en caso de ser falso, se toma
como verdadera la HA.
La estrategia para probar la hiptesis parte del supuesto de que H0 es verdadera, y si los
resultados de la investigacin contradicen en forma suficiente dicho supuesto,
entonces se rechaza H0 y se acepta la HA.
En caso de que los resultados de la investigacin no demuestren claramente la falsedad
de H0, sta no se rechaza. Es decir, la hiptesis nula es verdadera mientras no se
demuestre lo contrario.
39
Si en efecto, H0 es verdad, el valor del estadstico de prueba debera caer dentro del
rango de valores ms probables de su distribucin asociada, el cual se conoce como
regin de aceptacin.
Pero si cae en una de las colas de su distribucin asociada, fuera del rango de
valores ms probables (en la regin de rechazo), es evidencia en contra de que este
valor pertenece a dicha distribucin.
40
Aceptar
H0
H0
verdadera
H0
falsa
Decisin
correcta
Error tipo
II
Error Tipo I
H1
Decisin
correcta
/2
/2
Error Tipo II
Incorrectamente Aceptar H0 cuando esta es Falsa
H0
verdadera
H0
falsa
Aceptar
H0
Decisin
correcta
Error tipo II
Rechazar
H0
Error tipo I
Decisin
correcta
Riesgos
Error Tipo I: Castigar una persona inocente.
Error Tipo II: Liberar a una persona culpable.
Cul de los dos riesgos es mas serio?
H0
falsa
Aceptar
H0
Decisin
correcta
Error tipo II
Rechazar
H0
Error tipo I
Decisin
correcta
Fabricacin de un paracadas
Hiptesis
H0: Paracadas abrir exitosamente.
Riesgos
Error Tipo I
No vender un buen paracadas (perder una venta).
Error Tipo II
Vender un paracadas que no se abrir (perder un cliente).
Aceptar
H0
H0
verdadera
H0
falsa
Decisin
correcta
Error tipo
II
Decisin
correcta
P-value
El valor P representa la probabilidad de que la estadstica de prueba tome un valor al
menos tan extremo como el valor observado en ella cuando Ho es verdadera.
Representa el nivel de significancia () mas pequeo que conducira al rechazo de
Ho.
Se acostumbra calificar como significativa a la estadstica de prueba (y los datos)
cuando se rechaza la hiptesis nula Ho, por lo que podemos considerar el valor P
como el nivel mas pequeo en el que los datos son significativos.
El Valor P es usado para determinar si existe suficiente evidencia para rechazar la
hiptesis nula en favor de la alternativa.
El valor P es la probabilidad de rechazar incorrectamente
la hiptesis nula.
Si Valor P , Acepte H0
xm
T
S /v
~ T Student (v 1 )
Tensin
48,89
52,07
49,29
51,66
52,16
49,72
48,00
49,96
49,20
48,10
47,90
46,94
51,76
50,75
49,86
51,57
46
One-Sample T: tension
Test of mu = 50 vs not = 50
Variable N Mean StDev SE Mean
95% CI
T
P
tension 16 49,864 1,661 0,415 (48,979. 50,750) -0,33 0,749
Alfa=0,0
5
P-value
47
One-Sample T: tension
Test of mu = 50 vs > 50
Al fabricante le preocupa
que los valores de la
resistencia sean bajos
H0: m 50
95% Lower
Variable N Mean StDev SE Mean Bound T
P
tension 16 49,864 1,661 0,415 49,136 -0,33 0,626
HA: m 50
Stat/BS/1 t 1 sample/options/
greater thanl
48
Estadstico de la prueba
es
( n1)
P-value
Statistics
Variable N StDev Variance
tension 16 1,66
2,76
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
tension Chi-Square (1,23. 2,57) (1,51. 6,61)
Test
Variable Method
Statistic DF P-Value
49
x 15
p
0,1875
n 80
^
50
Comparaciones de Dos
Muestras
Ejemplos:
Media nueva mquina vs. Media mquina de referencia.
Partes del suplidor A vs. suplidor B.
Ajustes temperatura actuales vs. ajustes propuestos de
temperatura.
Condicin actual vs. condicin propuesta.
Hiptesis de 2 Muestras
Se desea probar las hiptesis:
H 0 : m1 m2
vs.
H1: m1 m2
Muestras aleatorias tomadas de cada poblacin.
m1 s 1
Poblacin 1
x1 , s1 , n1
Usar x1 x2
m2 s 2
Poblacin
2
x2 , s2 , n2
x1 x2
x1 x2
t
StdDev( x1 x2 )
x1 x2
x1 x2
0
Mean=0
Desv Estd=?
Combinando ambas:
StdDev( x1 x2 )
s 12
n1
s1
n1
StdDev
, ( x2 )
s 22
n2
s
1
Distribucin de x1 N m1 ,
n1
Distribucin de
Distribucin de x2
N m , s 2
2
n2
x1 x2
2
2
s
s
N m1 m 2 , 1 2
n1
n2
s2
n2
Si s1 = s2.
StdDev( x1 x2 )
s 12
n1
s 22
n2
1 1
s
n1 n2
Caso 2: s1 <> s2
x1 x2
t
1
1
sp
n1 n2
s1 y s2
s12
s22
n1
n2
n1 1 s12 n2 1 s22
n1 n2 2
Sp promedio pesado de
x1 x2
2
2
S1 S
n1 n
S n S
2
n 1
1
2
2
Caso 1: s1 = s2
x1 x2 t / 2;n n 2 * s p
1
/2
1
1
n1 n2
Caso 2: s1 s2
s12 s22
x1 x2 t / 2;"adjusted " *
n1 n2
t / 2;n1 n2 2
t0.025;n1 n2 2 2
Un IC del 95% es aprox.
+/- 2 desv. estd.
Hiptesis de 2 Muestras
Se desea probar la hiptesis:
H0: s1 s 2
vs.
H1: s 1 s 2
Estadsticos Muestrales
Muestras aleatorias tomadas de cada poblacin.
m1 s 1
Poblacin 1
x1 , s1 , n1
Usar
m2 s 2
Poblacin 2
x2 , s2 , n2
s1 s2
s1
Si las muestras tienen la misma desviacin estndar (1= 2), entonces
debe estar cercano a 1.
s2
Prueba Estadstica F
Para probar la igualdad de las desviaciones estndar, la
Comparaciones Muestrales
Pareadas
Se utiliza para comparar dos poblaciones donde las
menos durable.
Suponga que se ha escogido incluir los siguientes factores y
niveles en un experimento:
Material: A y B
10 corredores
Propuesta Diseo 1
5 Corredores
Material A
10 Corredores
5 Corredores
Material B
1.
2.
Asignar un grupo para usar tenis hechas con material A y asignar el otro
grupo para usar tenis hechas con material B.
3.
4.
El desgaste del tenis es medido para cada par y los datos son analizados
usando una prueba-t de dos muestras.
Propuesta Diseo 2
Corredor
B
B
A
A
A
B 9
A 6
A
A
B 10
Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3
Delta vs Corredor
1,2
0,9
Delta
0,6
Cmo se pueden
0,3
0,0
comparar
estadsticamente?
10
Corredor
Hiptesis Estadstica
H 0 : m A mB
versus
H1 : m A mB
Nota: La hiptesis puede
tambin ser establecida como:
H 0 : mB m A = 0
vs.
H1 : mB m A 0
Prueba Pareada-t
Aplicar mtodos muestrales a la columna de deltas.
Jogger
1
2
3
4
5
6
7
8
9
10
Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3
x m0
t
s
n
Prueba-t Pareada
Probar la hiptesis que el delta promedio es 0 usando =
0.05.
H 0 : mB m A = 0
vs.
H1 : mB m A 0
x m0 0.41 0
t
3.35
s
0.39
n
10
Prob ( t > |3.35| ) = 0.0085
Conclusin:
Ya que 0.0085 < 0.05.
Rechazar Ho. Los materiales
son estadsticamente
diferentes.
Intervalo de Confianza
Qu tan diferentes son los materiales?
Determine un intervalo de confianza que contenga la
verdadera diferencia.
x t
s
*
, n 1
10
0.13, 0.69
comparacin.
Mejoro la precisin (se redujo el error estndar) del
estimado mA - mB o md.
Resultando en una comparacin mas sensitiva que el