Vous êtes sur la page 1sur 72

Distribucin exponencial (T.

colas y confiabilidad)
Explica fenmenos de la vida real como por ejemplo

lneas de espera, (teora de colas). Esta distribucin se


usa para modelar tiempos de espera para la
ocurrencia de un cierto evento.
Es un caso
especial de
D. Gama

Consideraciones
La distribucin exponencial es el equivalente continuo de la distribucin
geomtrica discreta. Esta ley de distribucin describe procesos en los que:

Nos interesa saber el tiempo hasta que ocurre determinado evento, sabiendo
que,
el tiempo que pueda ocurrir desde cualquier instante dado t, hasta que ello
ocurra en un instante tf, no depende del tiempo transcurrido anteriormente
en el que no ha pasado nada.
De hecho la distribucin exponencial puede derivarse de un proceso
experimental de Poisson con las mismas caractersticas, pero tomando como
variable aleatoria , en este caso, el tiempo que tarda en producirse un hecho

Ejemplos
El tiempo que tarda una partcula radiactiva en desintegrarse. El
conocimiento de la ley que sigue este evento se utiliza en Ciencia
para, por ejemplo, la datacin de fsiles o cualquier materia
orgnica mediante la tcnica del carbono 14, C14;

El tiempo que puede transcurrir en un servicio de urgencias, para la


llegada de un paciente;
En un proceso de Poisson donde se repite sucesivamente un
experimento a intervalos de tiempo iguales, el tiempo que
transcurre entre la ocurrencia de dos sucesos consecutivos sigue un
modelo probabilstico exponencial. Por ejemplo, el tiempo que
transcurre entre que sufrimos dos veces una herida importante.

Ejemplo

Ejemplo
Se ha comprobado que el tiempo de vida de cierto tipo
de marcapasos sigue una distribucin exponencial con
media de 16 aos. Cul es la probabilidad de que a una
persona a la que se le ha implantado este marcapasos se
le deba reimplantar otro antes de 20 aos? Si el
marcapasos lleva funcionando correctamente 5 aos en
un paciente, cul es la probabilidad de que haya que
cambiarlo antes de aos?

Ejemplo

Distribucin Gamma
Este modelo es una generalizacin del modelo Exponencial ya que,

en ocasiones, se utiliza para modelar variables que describen el


tiempo hasta que se produce p veces un determinado suceso. Su
funcin de densidad es de la forma:

Como vemos, este modelo depende de dos parmetros positivos: y

p. La funcin (p) es la denominada funcin Gamma de Euler que


representa la siguiente integral:
que verifica (p + 1) = p(p), con lo que, si p es un nmero entero

positivo, (p + 1) = p!

Distribucin Gamma

Distribucin normal
Es la distribucin continua ms importante, tanto en estadstica terica como
aplicada. Si X es una variable aleatoria normal, entonces su funcin de d.p. est dada
por
donde (mu) es la media y (sigma) es la
desviacin estndar (2 es la varianza).
Suponga una v.a . X~N(, 2), para calcular la probabilidad
de que esta variable tome valores entre dos nmeros a y b,
entonces se calcula el rea bajo la curva entre a y b
(mediante mtodos numricos ya que la integral de la
funcin de distribucin no tiene solucin analtica).
Cuando es una distribucin normal con parmetros = 0 y 2 = 1, entonces a la
distribucin se le conoce como distribucin normal estndar (N(0, 1)) y los valores de
las probabilidades estn ya tabulados.
Estandarizar una variable es fcil, puesto que si X tiene una distribucin normal con E(X)
= y V(X) = 2, entonces la variable (estandarizada) es

10

El Valor Z - Estandarizar
En esta ecuacin, m es la media, s es la desviacin estndar,

y x es un valor que nos gustara evaluar.


x-m calcula que tan lejos se est de la media.
Cuando se divide por s, se est calculando
cuantas desviaciones estndar se est de la media.

Zona 1: m 1s
68.26% de los datos se esperan contener
dentro de una desviacin estndar de la
media.
Zona 2: m 2s
95.46% de los datos se esperan contener
dentro de dos desviaciones estndar de la
media.
Zona 3: m 3s
99.73% de los datos se esperan contener
reas bajo la curva de distribucin
dentro de tres desviaciones estndar.
normal
GRAPH/Prob.Distrib.Plot/View
Prob/shaded area

Ejemplo
El tiempo de entrega de un producto se distribuye normal con media 60,5 y desv.
estandar 5,9. Si un tiempo de entrega es de 70, cuntas desviaciones estndar
tiene respecto de la media?

Si estamos considerando una zona con m 3s


entonces 1,61 desviaciones estndar de la
media est al interno del rea de la zona.
Cuntas desviaciones estndar tiene el
tiempo de 100 respecto de la media?

Este valor esta muy lejos de la zona de


aceptacin lo que indica que algn
cambio ha ocurrido en las operaciones
normales del proceso.

12

Distribucin Normal
Una de las ms importantes en la Estadstica.
Matemtico Alemn Karl Friedrich Gauss (1777-1855)
Muchos de los fenmenos del mundo real se

comportan bajo esta estructura probabilstica.


Cuando una variable aleatoria representa a una
poblacin que tiene un comportamiento probabilstico
normal el histograma tiene una forma ms o menos
simtrica.

Funcin densidad y Distribucin de


Probabilidad

Nota: Los errores en las


mediciones cientficas se
aproximan extremadamente
bien mediante una
distribucin normal.
Una variable Aleatoria
continua X que tiene la
forma de campana se dice
que sigue una Distribucin
Normal

Figuras importantes

Consideraciones
La moda, que es el punto sobre el eje horizontal donde

la curva es un mximo, ocurre en x =


La curva es simtrica alrededor de un eje vertical a
travs de la media
La curva tiene sus puntos de inflexin en x = , es
cncava hacia abajo si - < X < + , y es
cncava hacia arriba en cualquier otro punto.

Consideraciones
La curva normal se aproxima al eje horizontal de

manera asinttica conforme nos alejamos de la media


en cualquier direccin.
La rea total bajo la curva y sobre el eje horizontal es
igual a 1.
Es una buena aproximacin para la binomial y la
hipergeomtrica.

Atencin
Funcin de probabilidad normal depende de y y

como estos valores tienen un dominio de


entonces puede existir un nmero infinito de curvas
para cada y .
Para evitar esto se ha encontrado una curva normal
reducida o estandarizada que tenga un valor medio
igual a cero y una varianza igual a 1, de tal manera que
cualquier distribucin normal de y varianza 2 se
pueda convertir o estandarizar a otro distribucin

Atencin
En consecuencia de lo anterior la funcin densidad es.

Teorema central del lmite (TLC)


Una de las razones por las que la distribucin normal es tan importante es
debido al TLC que en un caso particular afirma:
sea x1, x2,, xn una muestra aleatoria de cualquier poblacin, y sea x la
media muestral; entonces, independientemente de cmo sea la distribucin
de la poblacin de donde se extrajo la muestra, la distribucin de x se
aproxima a la normal N(m,s2) conforme n crece. La forma lmite de la
distribucin de
X m conforme n, es la distribucin normal
z
s n
estndar N(0,1).
En algunos casos la aproximacin puede ser buena para n pequea
n<10.
En otros casos se necesita un n grande, n>100.
En el caso en que las x tengan la misma distribucin y no sea
radicalmente diferente a la normal, entonces un n 4 es suficiente.

20

Prueba de normalidad
Test cuantitativos
Es posible usar test cuantitativos para calcular el p-value
asociado a la hiptesis nula del tipo de distribucin.
El p-value es la significancia de la prueba, es el rea bajo la
distribucin de referencia que esta mas all del valor del
estadstico de prueba.
Existen muchas pruebas para verificar la normalidad, entre las
que se encuentran las siguientes:
Ji-cuadrada para bondad de ajuste (para cualquier
distribucin)
Kolmogorov-Smirnov
Shapiro-Wilks
Anderson-Darling (para dist. Gauseana o Normal), usaremos
sta prueba ya implementada en Minitab. Stat/Basic Stat/
Normality Test

21

Distribuciones que se derivan del


muestreo Distribucin T de Student
Es una d.p. que surge del problema de:
estimar la media y desviacin de una poblacin normalmente distribuida cuando
el tamao de la muestra es pequeo.

Debido a que si se obtiene una muestra aleatoria de tamao n de una


poblacin cuya distribucin es normal, entonces el estadstico:

xm
T
S /v

Grados de
libertad (df)

~ T Student (v)

v n 1

En la figura se muestra la grfica de


densidades T y la normal. Como se
aprecia la distribucion T es similar a la
normal (0, 1), excepto que tiene colas ms
pesadas.
GRAPH/PROBABILITY DISTRIB
PLOT

22

Distribucin ji-cuadrada
Usada para hacer inferencias acerca de la desviacin estndar .

Sean Z1, Z2, , Zk v.a. ind., ~N( = 0 , 2 = 1), entonces la v.a.

Si se obtiene una muestra de tamao


n, entonces el estadstico: ( n1) S
s
2

tiene una distribucin


ji-cuadrada con n 1 grados de
libertad (S2, es la varianza
muestral).
GRAPH/PROBABILITY DISTRIB
PLOT

Conforme crecen los grados de libertad


se aproxima a una distribucin normal.
23

Distribucin ji-cuadrada
La distribucin tiene muchas aplicaciones en inferencia
estadstica. La ms conocida es la de la denominada prueba
utilizada como prueba de independencia y como prueba de
bondad de ajuste y en la estimacin de varianzas.
Pero tambin est involucrada en el problema de estimar la
media de una poblacin normalmente distribuida y en el
problema de estimar la pendiente de una recta de regresin
lineal, a travs de su papel en la distribucin t de Student.
Aparece tambin en todos los problemas de anlisis de
varianza por su relacin con la distribucin F de Snedecor,
que es la distribucin del cociente de dos variables aleatorias
independientes con distribucin .

Distribucin F de Fisher
Sean W y Y variables aleatorias ji-cuadrada independientes con u y v grados
de libertad, respectivamente. Entonces el cociente F W u
Y v
tiene una distribucin F con u grados de libertad en el numerador, y v en
el denominador, cuya funcin de densidad de probabilidad est dada por:
u / 2 1
u v u

x
2 v
f ( x)
(u v / 2)

u v u
x 1
2 2 v

u 2

0 x
Densidades F para diferentes
grados de libertad.
La distribucin F se encuentra
centrada con respecto a 1, y los
dos parmetros le dan
flexibilidad.

25

La importancia de la distribucin F radica en que es de especial utilidad


para hacer inferencia cuando se comparan varianzas, ya que si se
tienen dos poblaciones con distribucin normal y varianzas 12 y 22,
respectivamente, y se toman muestras aleatorias de cada poblacin, de
tamao n1 y n2, respectivamente, entonces la variable aleatoria formada
por el cociente
F

S s
S s
2

1
2

1
2

sigue una distribucin F con n1 y n2 grados de libertad en el


numerador y denominador, respectivamente, donde S12 y S22 son las
varianzas muestrales.

26

Inferencia Estadstica

La inferencia estadstica es una parte de la


estadstica que comprende los mtodos y
procedimientos para deducir propiedades de
una poblacin estadstica, a partir de una
pequea parte de la misma.
27

Intervalo de Confianza (I.C.)

Intervalo de Confianza
Un intervalo construido
alrededor de un parmetro
de una distribucin.
En este caso, un intervalo
es construido alrededor de
la media muestral usando
la distribucin muestral
para capturar un % de la
distribucin.

Intervalo de Confianza (I.C.)


Intervalo de confianza indica un rango donde puede estar el parmetro con
cierto nivel de seguridad o confianza. Construir un intervalo al 100(1 )%
de confianza para un parmetro desconocido consiste en estimar dos
nmeros (estadsticos) L y U, de manera que la probabilidad de que se
encuentre entre ellos sea 1 , es decir,
PL U 1
donde L y U forman el intervalo de confianza buscado [L, U].
Intervalo de Confianza Bilateral

El riesgo se distribuye igualmente en ambos lados,PL U 1

Intervalo de Confianza Unilateral

El riesgo es concentrado en un lado, PL 1

P U 1
29

IC para la media cuando n > 30 datos


(s conocido)
Intervalo de confidencia bilateral:

Intervalo de confidencia superior:


Intervalo de confidencia inferior:

IC para la media cuando n < 30


(s desconocido)
Intervalo de confidencia bilateral:

Intervalo de confidencia superior:


Intervalo de confidencia inferior:

Siguiendo con el ejemplo


del grosor de discos
En tabla 2.1 la caracterstica de calidad del producto (disco) es su grosor, que debe
ser de 1.20 mm con una tolerancia de 0.10 mm. Determine el intervalo de
confianza de la media.

x t 2,n 1 s

1,18341

n 1,1786 1,97928 0,270

1,17387

Student's t distribution with 124 DF


P( X <= x )
x
0,025 -1,97928

STAT/BASIC STATISTICS/1t 1
Sample t
N Mean StDev SE Mean
95% CI
125 1,17864 0,02695 0,00241 (1,17387; 1,18341)

32

EJEMPLO 4.2
En el proceso de fabricacin de discos para computadoras una de las variables
crticas es el rendimiento del formato. Se toma una muestra aleatoria de n = 10
discos de la produccin del ltimo turno, se formatean y se reporta el
rendimiento de cada disco. Los datos obtenidos son:
96.11, 91.06, 93.38, 88.52, 89.57, 92.63, 85.20, 91.41, 89.79, 92.62
Con base en estos datos interesa estimar, de manera puntual y por intervalo, la
media y la desviacin estndar para la poblacin de discos de dicho turno.
Variable N Mean StDev SE Mean
95% CI
rend
10 91,029 2,991 0,946 (88,889; 93,169)
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
rend
Standard (2,06; 5,46) (4,23; 29,82)
33

Tamao de la
muestra
Tamao de muestra n para lograr que la estimacin de una media
poblacional tenga como error mximo a un nmero E.
Para un error de estimacin est dado
, despejando n
s
x

t
2, n 1
se obtiene
n

t 2,n 1 * S

Como t(/2, n 1) depende de n, y sta es la incgnita, entonces para


propsitos prcticos y con tamaos de muestra mayores que 30, el valor
de t(/2,n 1) puede tomarse como 2. De esta manera,
n

4* S

34

IC para Varianzas

I.C.
bilateral:
I.C. superior:

I.C. inferior:

Determine el intervalo de confianza para la desviacin estndar


del ejemplo 4.2
95% Confidence Intervals
STAT/Basic Statistic/1
CI for
CI for
Variable Method
StDev
Variance
variance
rend
Chi-Square (2,06. 5,46) (4,23. 29,82)

Distrib. Chi-Cuadrado

Control de Calidad, PI-4307

36

Prueba de Hiptesis Estadstica


Una hiptesis es una declaracin sobre los parmetros de una

poblacin.
Los parmetros deben estar identificados antes de hacer el

anlisis.
En general no tenemos datos poblacionales pero si tenemos
datos muestrales de los cuales calculamos estadsticos.
Usamos estos estadsticos para hacer inferencias sobre los
parmetros verdaderos de la poblacin.
Debido a que hacemos inferencias, hay algn riesgo asociado
con las decisiones que hacemos.
Por tanto, nunca debemos pensar de nuestros estadsticos
como estimadores puntuales, mas bien como intervalos sobre
los cuales tenemos algn nivel de confianza que estemos
prediciendo con exactitud los verdaderos parmetros de la
poblacin.

Hiptesis Nula & Alternativa


Hiptesis Nula: H0
Contiene una declaracin de
igualdad tal como , =, .

Hiptesis Alternativa: H1
Contiene una declaracin de
inigualdad tal como > , , <

Por ejemplo, la afirmacin este proceso produce menos de 8% de defectuosos se


puede plantear estadsticamente, en trminos de la proporcin p desconocida de
artculos defectuosos que genera el proceso, como se hace a continuacin.
H0: p = 0.08
HA: p < 0.08
HA: p > 0.08

comnmente se plantea como una igualdad, lo cual facilita


tener una distribucin de probabilidad de referencia especfica
se aceptar como cierta slo en caso de rechazar la hiptesis nula
Hiptesis alternativa unilateral

H0: p = 0.08 este proceso produce 8% de defectuosos


HA: p 0.08 se observan menos de 8% de defectuosos como ms de 8% de defectuosos
Hiptesis alternativa bilateral

Probar una hiptesis consiste en investigar, con base en la evidencia contenida en una
muestra aleatoria, si lo afirmado por H0 es verdad o no, y en caso de ser falso, se toma
como verdadera la HA.
La estrategia para probar la hiptesis parte del supuesto de que H0 es verdadera, y si los
resultados de la investigacin contradicen en forma suficiente dicho supuesto,
entonces se rechaza H0 y se acepta la HA.
En caso de que los resultados de la investigacin no demuestren claramente la falsedad
de H0, sta no se rechaza. Es decir, la hiptesis nula es verdadera mientras no se
demuestre lo contrario.

Control de Calidad, PI-4307

39

Si en efecto, H0 es verdad, el valor del estadstico de prueba debera caer dentro del
rango de valores ms probables de su distribucin asociada, el cual se conoce como
regin de aceptacin.
Pero si cae en una de las colas de su distribucin asociada, fuera del rango de
valores ms probables (en la regin de rechazo), es evidencia en contra de que este
valor pertenece a dicha distribucin.

40

Riesgos para la Toma de Decisin

Aceptar
H0

H0
verdadera

H0
falsa

Decisin
correcta

Error tipo
II

Rechazar Error tipo I


H0

Error Tipo I

H1

Decisin
correcta

/2

/2

Incorrectamente Rechazar H0 cuando sta es Verdadera

= Probabilidad de cometer un error tipo I.

Error Tipo II
Incorrectamente Aceptar H0 cuando esta es Falsa

= Probabilidad de cometer un error tipo II.


1- =Prob. de rechazar H0 cuando es falsa, Potencia del Test.

Errores Tipo I vs. Tipo II


Caso de un Juicio
Hiptesis

H0
verdadera

H0
falsa

Aceptar
H0

Decisin
correcta

Error tipo II

Rechazar
H0

Error tipo I

Decisin
correcta

H0: Acusado es inocente y debe salir libre.


H1: Acusado es culpable y debe ser castigado.

Riesgos
Error Tipo I: Castigar una persona inocente.
Error Tipo II: Liberar a una persona culpable.
Cul de los dos riesgos es mas serio?

Errores Tipo I vs. Tipo II


H0
verdadera

H0
falsa

Aceptar
H0

Decisin
correcta

Error tipo II

Rechazar
H0

Error tipo I

Decisin
correcta

Fabricacin de un paracadas
Hiptesis
H0: Paracadas abrir exitosamente.

H1: Paracadas fallar al abrir.

Riesgos
Error Tipo I
No vender un buen paracadas (perder una venta).
Error Tipo II
Vender un paracadas que no se abrir (perder un cliente).

Cul de los dos riesgos es mas serio?

Errores Tipo I vs. Tipo II


Agregar una segunda maquina a la lnea de produccin:
H0: m1 = m2

Aceptar
H0

H0
verdadera

H0
falsa

Decisin
correcta

Error tipo
II

Maquina 1 tiene la misma media que la maquina 2.


Rechaza
Error tipo I
rH

El cambio debe ser implementado.


H1: m1 m2
Maquina 1 no tiene la misma media que la maquina 2.
El cambio no debe ser implementado.
Riesgos
-riesgo: No usar la nueva maquina aunque tenga la misma media
que la maquina antigua.

-riesgo: Usar la nueva maquina aunque tenga una media diferente

que la maquina antigua.

Cul de los dos riesgos es mas serio?

Decisin
correcta

P-value
El valor P representa la probabilidad de que la estadstica de prueba tome un valor al
menos tan extremo como el valor observado en ella cuando Ho es verdadera.
Representa el nivel de significancia () mas pequeo que conducira al rechazo de
Ho.
Se acostumbra calificar como significativa a la estadstica de prueba (y los datos)
cuando se rechaza la hiptesis nula Ho, por lo que podemos considerar el valor P
como el nivel mas pequeo en el que los datos son significativos.
El Valor P es usado para determinar si existe suficiente evidencia para rechazar la
hiptesis nula en favor de la alternativa.
El valor P es la probabilidad de rechazar incorrectamente

la hiptesis nula.

Regla General de Decisin:

Si Valor P , Acepte H0

Si Valor P < , Rechace H0

Ejemplo 3-3, libro Control Estadstico de la Calidad de D.


Montgomery, 3 Ed.
La resistencia a la tensin media de una fibra sinttica es una
caracterstica de calidad importante. Al fabricante le gustara
probar la hiptesis de que la resistencia media es 50 psi, utilizando
alfa=0,05. Por la experiencia anterior del fabricante, ste esta
dispuesto a asumir que la resistencia a la tensin tiene una
distribucin aproximadamente normal, sin embargo se desconoce
la media y la varianza de la resistencia a la tensin.
Se selecciona una muestra de 16 ejemplares de prueba de la fibra y
se determina su tensin.
H0: m = 50 psi
HA: m 50 psi

xm
T
S /v

~ T Student (v 1 )

Tensin
48,89
52,07
49,29
51,66
52,16
49,72
48,00
49,96
49,20
48,10
47,90
46,94
51,76
50,75
49,86
51,57
46

One-Sample T: tension

Stat/BS/1 t 1 sample/options/not equal

Test of mu = 50 vs not = 50
Variable N Mean StDev SE Mean
95% CI
T
P
tension 16 49,864 1,661 0,415 (48,979. 50,750) -0,33 0,749
Alfa=0,0
5

P-value

47

One-Sample T: tension
Test of mu = 50 vs > 50
Al fabricante le preocupa
que los valores de la
resistencia sean bajos
H0: m 50

95% Lower
Variable N Mean StDev SE Mean Bound T
P
tension 16 49,864 1,661 0,415 49,136 -0,33 0,626

HA: m 50

Stat/BS/1 t 1 sample/options/
greater thanl

48

Para los mismos datos de la


Tensin
H0: 2= 3
HA: 2 3

Estadstico de la prueba
es

Test and CI for One Variance: tension


Method
Null hypothesis
Sigma-squared = 3
Alternative hypothesis Sigma-squared not =
3

( n1)

P-value

Statistics
Variable N StDev Variance
tension 16 1,66
2,76
95% Confidence Intervals
CI for
CI for
Variable Method
StDev
Variance
tension Chi-Square (1,23. 2,57) (1,51. 6,61)
Test
Variable Method

Statistic DF P-Value

49

Ejemplo 3-6 Montgomery


En una muestra aleatoria de 80 rodamientos de cigeales para motor, 15 de los
rodamientos tiene un acabado superficial cuya aspereza rebasa lo que permiten las
especificaciones. Determine el intervalo de confianza de la fraccin disconforme
del proceso.

x 15
p
0,1875
n 80
^

Suponiendo que es apropiada la aproximacin


normal de la distribucin binomial, el IC del 95%
es

Normal with mean = 0 and standard deviation


IC: [0.10197, 0,27302]
=1
(Exel)
P( X <= x )
x
Test and CI for One Proportion
0,025 -1,95996
Sample X N Sample p
95% CI
1
15 80 0,187500 (0,108914. 0,290328)

50

Comparaciones de Dos
Muestras
Ejemplos:
Media nueva mquina vs. Media mquina de referencia.
Partes del suplidor A vs. suplidor B.
Ajustes temperatura actuales vs. ajustes propuestos de
temperatura.
Condicin actual vs. condicin propuesta.

Hiptesis de 2 Muestras
Se desea probar las hiptesis:
H 0 : m1 m2

vs.
H1: m1 m2
Muestras aleatorias tomadas de cada poblacin.

m1 s 1

Poblacin 1

x1 , s1 , n1
Usar x1 x2

m2 s 2

Poblacin
2

x2 , s2 , n2

como el mejor estimado de la diferencia en


medias de la poblacin m1- m2.

Prueba para la Igualdad de


Dos Medias
Prueba estadstica de

x1 x2

Estimado / Dev Std (Estimado)


Distribucin Muestral de

x1 x2
t
StdDev( x1 x2 )

x1 x2

Asumir que las dos muestras provienen de la misma


poblacin (m1= m2)
Qu tan aparte estara x1 x2 por casualidad
aleatoria?

x1 x2
0
Mean=0

Desv Estd=?

Prueba para la Igualdad de


Dos Medias
Del Teorema del Limite Central:StdDev( x1 )

Combinando ambas:

StdDev( x1 x2 )

s 12
n1

s1

n1

StdDev
, ( x2 )

s 22
n2

s
1

Distribucin de x1 N m1 ,

n1

Distribucin de

Distribucin de x2

N m , s 2
2

n2

x1 x2

2
2

s
s
N m1 m 2 , 1 2

n1
n2

s2
n2

Si s1 = s2.
StdDev( x1 x2 )

s 12
n1

s 22
n2

1 1
s

n1 n2

Los dos mtodos de anlisis dependen si las desviaciones estndar


son la misma.

Prueba- t: Igualdad de 2 Medias


Caso 1: s1 = s2

Caso 2: s1 <> s2

Desconocidas pero iguales

Desconocidas pero no iguales

x1 x2
t
1
1
sp

n1 n2

Con n1+n2-2 g.l


sp

s1 y s2

s12
s22

n1
n2

Con g.l ajustados

n1 1 s12 n2 1 s22
n1 n2 2

Sp promedio pesado de

x1 x2

2
2

S1 S
n1 n

S n S
2

n 1
1

2
2

(1-% Intervalo de Confianza


para m1-m2
Un intervalo de confianza tiene la forma:
estimado valor t tabulado*(Desv. Estd del estimado)

Caso 1: s1 = s2

x1 x2 t / 2;n n 2 * s p
1

/2

1
1

n1 n2

Caso 2: s1 s2
s12 s22

x1 x2 t / 2;"adjusted " *
n1 n2

t / 2;n1 n2 2
t0.025;n1 n2 2 2
Un IC del 95% es aprox.
+/- 2 desv. estd.

Hiptesis de 2 Muestras
Se desea probar la hiptesis:

H0: s1 s 2
vs.
H1: s 1 s 2

Porqu comparar dos desviaciones estndar?


Determinar cual prueba t usar para una prueba de medias.
Comparar variacin entre dos grupos.
Nuevo instrumento de medicin vs. Actual instrumento de medicin.
Cambio propuesto del proceso vs. proceso actual.

Estadsticos Muestrales
Muestras aleatorias tomadas de cada poblacin.

m1 s 1

Poblacin 1

x1 , s1 , n1
Usar

m2 s 2

Poblacin 2

x2 , s2 , n2

s1 s2

como el mejor estimado de la razn de las desviaciones


estndar de la poblacins 1 s 2 .

s1
Si las muestras tienen la misma desviacin estndar (1= 2), entonces
debe estar cercano a 1.

s2

Prueba Estadstica F
Para probar la igualdad de las desviaciones estndar, la

prueba estadstica es dada por


2
s1
F
s2
Cuando H0 es verdadera, el estadstico F sigue una

distribucin F con n1-1 y n2-1 grados de libertad.

Si las desviaciones estndar de la poblaciones son iguales, el


valor calculado F ser cercano a 1 y el valor P correspondiente
se espera que sea grande o cercano a 1.

Comparaciones Muestrales
Pareadas
Se utiliza para comparar dos poblaciones donde las

observaciones de una muestra pueden ser pareadas con las


observaciones en la otra muestra.
Ejemplos:
Cada unidad es sometida a ambos tratamientos.
Observaciones antes y despus en las mismas unidades.
Dos sistemas de metrologa midiendo las mismas
unidades.
Grupos de unidades son partidas. Mitad de cada grupo es
asignada aleatoriamente a cada tratamiento.

Ejemplo de Tenis de Carrera


Un fabricante desea comparar dos materiales diferentes para

hacer las suelas de las tenis para correr


Material A: Estndar
Material B: Mas barato

Se desea cambiar al Material B pero se teme que este sea

menos durable.
Suponga que se ha escogido incluir los siguientes factores y

niveles en un experimento:
Material: A y B
10 corredores

Cmo se diseara este estudio?

Propuesta Diseo 1
5 Corredores

Material A

10 Corredores
5 Corredores

Material B

1.

Partir aleatoriamente los diez corredores en dos grupos de igual tamao.

2.

Asignar un grupo para usar tenis hechas con material A y asignar el otro
grupo para usar tenis hechas con material B.

3.

Los corredores se ejercitan como de costumbre por un periodo


especificado de semanas y retornan las tenis al fabricante.

4.

El desgaste del tenis es medido para cada par y los datos son analizados
usando una prueba-t de dos muestras.

Es ste el mejor diseo para este estudio?.

Propuesta Diseo 2

Corredor

Planteamiento muestras pareadas


Asignar aleatoriamente una tenis del

Material A y una del Material B al pie


izquierdo y derecho de cada corredor.

B
B

A
A

Es ste un mejor diseo?

A
B 9

Este es un ejemplo de un experimento


pareado.

A 6

A
A

B 10

Datos Experimento Pareado


Muestras pareadas
Son aquellas en
las que los datos
de ambas
poblaciones se
pueden ver como
pares porque
tienen algo en
comn y no son
independientes.

Anlisis Muestra Pareada


Calcular una nueva columna con la diferencia en desgaste

para cada corredor.


Delta (B-A) = XB - XA
Jogger
1
2
3
4
5
6
7
8
9
10

Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3

Material B Delta (B-A)


14.0
0.8
8.8
0.6
11.2
0.3
14.2
-0.1
11.8
1.1
6.4
-0.2
9.8
0.3
11.3
0.5
9.3
0.5
13.6
0.3

Analizar la columna de deltas, no los datos iniciales.

Delta (B-A) vs. Corredor


Puede ud. indicar en

Delta vs Corredor
1,2

este grfico si los dos


materiales tienen el
mismo desgaste?

0,9

Delta

0,6

Cmo se pueden

0,3

0,0

comparar
estadsticamente?

10

Corredor

Si los materiales tienen el mismo desgaste, el delta


promedio debe estar cercano a 0.

Hiptesis Estadstica

Se quiere probar la hiptesis:

H 0 : m A mB
versus
H1 : m A mB
Nota: La hiptesis puede
tambin ser establecida como:

H 0 : mB m A = 0
vs.
H1 : mB m A 0

Desgaste medio verdadero es el


mismo para ambos materiales A y
B
Desgaste medio verdadero es
diferente para los materiales A y B

Prueba Pareada-t
Aplicar mtodos muestrales a la columna de deltas.
Jogger
1
2
3
4
5
6
7
8
9
10

Material A
13.2
8.2
10.9
14.3
10.7
6.6
9.5
10.8
8.8
13.3

Material B Delta (B-A)


14.0
0.8
8.8
0.6
11.2
0.3
14.2
-0.1
11.8
1.1
6.4
-0.2
9.8
0.3
11.3
0.5
9.3
0.5
13.6
0.3

Recuerde el estadstico t de una sola muestra.

x m0
t
s
n

Con n-1 grados de


libertad, donde n es el
numero de pares.

Prueba-t Pareada
Probar la hiptesis que el delta promedio es 0 usando =

0.05.

H 0 : mB m A = 0
vs.
H1 : mB m A 0

x m0 0.41 0
t

3.35
s
0.39
n
10
Prob ( t > |3.35| ) = 0.0085

Paired T-Test and CI: mat A. mat B


Paired T for mat A - mat B
N Mean StDev SE Mean
mat A
10 10,630 2,451 0,775
mat B
10 11,040 2,518 0,796
Difference 10 -0,410 0,387 0,122

Conclusin:
Ya que 0.0085 < 0.05.
Rechazar Ho. Los materiales
son estadsticamente
diferentes.

95% CI for mean difference: (-0,687. -0,133)


T-Test of mean difference = 0 (vs not = 0): T-Value = -3,35 P-Value =
0,009

Intervalo de Confianza
Qu tan diferentes son los materiales?
Determine un intervalo de confianza que contenga la

verdadera diferencia.

x t

s
*
, n 1

Un intervalo de confianza del 95% para el ejemplo de los

tenis para correr:

0.41 2.26* 0.39

10

0.13, 0.69

Conclusin: 95% de confianza que la verdadera diferencia en


desgaste esta entre 0.13 y 0.69.

Ventajas del Anlisis Pareado


Removi la variabilidad de corredor a corredor de la

comparacin.
Mejoro la precisin (se redujo el error estndar) del

estimado mA - mB o md.
Resultando en una comparacin mas sensitiva que el

planteamiento de dos muestras independientes.

Vous aimerez peut-être aussi