Vous êtes sur la page 1sur 65

Introduccin

Diseo de experimentos p. 1/65


Introduccin

Historia

R.A. Fisher, en la dcada de los 20s, fu el iniciador del


Diseo de Experimentos, con experimentos en el rea de
agricultura en Inglaterra. De ah se generalizaron al rea de
Medicina. En la dcada de los 80s tuvieron un auge en la
Industria, cuando surgi la escuela de Taguchi de Control de
Calidad de procesos industriales.

Montgomery define un experimento como una prueba, o serie


de pruebas, en las cuales se hacen cambios controlados a las
variables de entrada de un proceso o sistema, para observar e
identificar las razones de los cambios en la respuesta de
salida.

Diseo de experimentos p. 2/65


Introduccin

Los experimentos se realizan en muchas reas de


investigacin:
Veterinaria. Se desea saber cul de cuatro dietas diferentes
A,B,C y D proporciona mayor ganancia de peso en cerdos.
Biologa. Se desea saber cul es el efecto en el crecimiento
de las plantas de centeno de la aplicacin de ciertas dosis de
radiacin en presencia de uno de tres radioprotectores.
Agricultura. Se desea saber cul es el mejor fertilizante de un
grupo de cinco, en cuanto a rendimiento de plantas de maiz.
Industria. Se desea comparar la eficiencia de tres mquinas
de hilados. La eficiencia se mide como un ndice entre el
tiempo que tarda la mquina en hilar una tela de cierto tamao
entre el nmero de errores.

Diseo de experimentos p. 3/65


Introduccin

Medicina. Se desea investigar el funcionamiento de cierta


droga para aliviar el dolor de cabeza.
Pedagoga. Se quiere investigar el efecto de la T.V. en nios
de 5 a 10 aos comparando sus conocimientos de los
programas de T.V. y algunos hechos histricos.

El experimento es un estudio comparativo, longitudinal,


prospectivo y experimental.

El diseo estadstico de experimentos es el proceso de


"planear" el experimento de tal manera que se puedan
analizar por mtodos estadsticos los datos recolectados
y que resulten en conclusiones objetivas y vlidas.

Diseo de experimentos p. 4/65


Lineamientos para disear experimentos

1. Reconocimiento y establecimiento del problema.

Esto se hace preferentemente por un equipo


interdisciplinario con un estadstico en l.
En el ejemplo de agricultura.

Cul de los cinco fertilizantes produce mayor rendimiento


en las plantas de maz de cierto tipo definido?

Estos cinco fertilizantes modifican su accin segn el tipo


de maz?. Hay interaccin?

Qu dosis de fertilizante es ms efectiva para aumentar


el rendimiento?

Diseo de experimentos p. 5/65


Lineamientos para disear experimentos

2. Definir factores, niveles. Equipo interdisciplinario.


Factor: es la caracterstica cuyo efecto queremos
estudiar.
En el ejemplo, un solo factor: Fertilizante.
Nivel: es la categora estudiada del factor.
En el ejemplo, cinco niveles: fertilizante A, B, C, D y E.
Tratamiento: Combinacin de niveles de los factores
estudiados. Otro ejemplo,
Factor fertilizante: A,B,C,D,E.
Factor Cantidad de agua: 1,2,3.
Tratamientos: A1, B1,...,E3.

Diseo de experimentos p. 6/65


Lineamientos para disear experimentos

Los tratamientos seleccionados deben ser de una naturaleza


tal que puedan ser reproducidos en gran escala.
Por ejemplo, no tiene sentido prctico estudiar el tratamiento
que es poner el fertilizante a mano en cada plantita de maiz.
A esto se le llama practicabilidad de los tratamientos.

Tambin es importante considerar un tratamiento que es no


recibir ningn fertilizante o recibir el habitual, a ste se le
llama:
tratamiento testigo o control.

Diseo de experimentos p. 7/65


Lineamientos para disear experimentos

3. Definir la unidad experimental (u.e.)


La unidad experimental es la subdivisin menor del
material experimental que puede recibir un tratamiento en
forma independiente.
Un aspecto importante es la representatividad de las u.e.
Esto es, las u.e. debern ser reproducciones de
condiciones comerciales o de gran escala.
As, una planta de maz para comparar fertilizantes no es
representativa.

Diseo de experimentos p. 8/65


Lineamientos para disear experimentos

En un experimento mdico, si se tienen en un cuarto cinco


pacientes con bronquitis y a cada uno de ellos se les d
tratamiento diferente (cada paciente es una u.e.) y si un
tratamiento no es efectivo, dicho paciente es un foco de
infeccin para los dems, por lo que contaminaria todo el
experimento.
La solucin es un grupo de pacientes por cuarto como u.e. o
un paciente en cada cuarto como u.e.
Unidades experimentales grandes producen menos
variabilidad, sin embargo, el tamao de las u.e. debe
considerarse en forma simultnea con el tamao de muestra y
el costo.
Es ms efectivo aumentar el tamao de muestra que el
tamao de las u.e.
El tamao de muestra es el nmero de u.e. que reciben el
mismo tratamiento.

Diseo de experimentos p. 9/65


Lineamientos para disear experimentos

4. Definir la variable de respuesta.


La variable de respuesta es lo que se va a medir en cada
unidad experimental.
Se debe estar seguro que d informacin til acerca del
fenmeno estudiado.
En el ejemplo, Kg. de maz
No es raro que se mida ms de una variable de inters
primario: kg. de maz, kg. de hojas, etc. Esto se estudia
con tcnicas de anlisis multivariado.
Se debe tener cuidado en la toma de las mediciones para
eliminar sesgos introducidos por operaciones conscientes
o inconscientes.
En medicina, se recomienda que ni los sujetos (u.e.) ni los
mdicos que toman las mediciones conozcan los
tratamientos asignados a cada u.e., a esto se le llama
mtodo de doble ciego.
Diseo de experimentos p. 10/65
Lineamientos para disear experimentos

5. Eleccin del diseo experimental.


El diseo experimental es la forma de asignar los
tratamientos a las unidades experimentales.
El diseo determina el modelo y el anlisis estadstico a
seguir.

Aleatorizacin. Introducida por Fisher, sirve para


"controlar" factores de variacin no includa en el modelo
en forma explcita. Se busca eliminar sesgos sistemticos y
justificar la independencia de los errores.

Diseo de experimentos p. 11/65


Lineamientos para disear experimentos

Otro ejemplo en Agronoma:

Aleatorizamos dentro de cada bloque (una restriccin a la


aleatorizacin). Cada uno de los tratamientos los tenemos en
cada una de las dos condiciones de terreno.

Diseo de experimentos p. 12/65


Lineamientos para disear experimentos

5. Eleccin del diseo experimental.


Un bloque es un grupo de u.e. ms o menos homogneas.
El uso de bloques es la inclusin en el diseo (modelo) de
un factor que, aunque no es de inters, se sabe que puede
causar una fuerte variacin en la u.e.
En general, los factores de bloqueo ms importantes son
las posiciones en el tiempo y en el espacio.
El uso de bloques tiene como objetivo el control de factores
de variacin en forma explcita en el modelo, disminuyendo
as la varianza de los errores.

Diseo de experimentos p. 13/65


Lineamientos para disear experimentos

6. Determinacin del nmero de repeticiones.


Las repeticiones (rplicas) son el nmero de u.e. a las que
se les aplica, en forma independiente, un tratamiento.
Dan una estimacin de la varianza del error experimental
Incrementan la precisin del experimento. A mayor
nmero de repeticiones menor la varianza de los
estimadores.

7. Hacer el experimento y colectar datos.


El estadstico solo asesora.

8. Efectuar el anlisis estadstico.

9. Obtencin de conclusiones.
El estadstico auxilia.

Diseo de experimentos p. 14/65


Error experimental

El error experimental describe la variacin entre u.e. idntica e


independientemente tratadas.

Se origina por:
1. Variacin natural entre u.e.
2. Variabilidad en la medicin de la respuesta
3. Incapacidad de reproducir las condiciones de los
tratamientos exactamente de una u.e. a otra
4. Interaccin de tratamientos y u.e.
5. Cualquier otro factor externo que afecte las caractersticas
medidas

Lo que se busca es tener un diseo que minimice la varianza


del error experimental.

Diseo de experimentos p. 15/65


Repaso

El objetivo de la inferencia estadstica es obtener conclusiones


acerca de una poblacin usando una muestra de esa
poblacin.

Muestra aleatoria. Sean n variables aleatorias x1 , x2 , . . . , xn


independientes conjuntamente, todas con la misma funcin de
densidad f (x). Se dice que x1 , x2 , . . . , xn es una muestra
aleatoria de tamao n de f (x). La densidad conjunta de las n
variables aleatorias es:
g(x1 , x2 , . . . , xn ) = f (x1 )f (x2 ) f (xn )

Nota. x1 , x2 , . . . , xn son v.a.i.i.d. y forman una


muestra aleatoria de f (x)

Nota. En este curso, a diferencia del de Muestreo,


supondremos que trabajamos con poblaciones infinitas
o potencialmente infinitas, entonces la definicin de
m.a.s. no aplica.

Diseo de experimentos p. 16/65


Repaso

Estadstica. Una funcin de la muestra que no contiene


parmetros desconocidos.

Estimador. Es una estadstica usada para estimar un


parmetro desconocido de la poblacin.

Estimacin. Es un valor numrico particular de un estimador,


calculado en una muestra.

Hay algunas caractersticas que se requieren para ser un buen


estimador. Dos de las ms importantes:

1. Insesgamiento. Un estimador es insesgado cuando su


valor esperado es el parmetro que est estimando.
Aunque es deseable el insesgamiento, esta propiedad por
si sola no garantiza un buen estimador.
2. Varianza mnima. El estimador de varianza mnima tiene
una varianza que es menor que la de cualquier otro
estimador del parmetro.
Diseo de experimentos p. 17/65
Repaso

Suponga y1 , y2 , . . . , yn una m.a. de fY (y) con E(yi ) = y


V (yi ) = 2 .
Pn Pn 2
i=1 yi 2 i=1 (yi
y)
Sean y = n yS = n1 dos estimadores.

Pn n !
i=1 yi 1 X
E(
y) = E = E yi
n n i=1
n
1X
= E(yi )
n i=1
1
= n =
n

y es un estimador insesgado de .

Diseo de experimentos p. 18/65


Repaso

n
" #
2
(yi y)2
X
E S = E
i=1
n1
" n #
1 X
2 1
= E (yi y) = E [SS]
n1 i=1
n 1

Pn
donde SS = i=1 (yi y)2 es la Suma de Cuadrados
corregida de las observaciones.
" n #
X
E (SS) = E (yi y)2
i=1
n
" #
X
= E y2
yi2 n
i=1
n
X
= E(yi2 ) nE(
y2 )
i=1

Diseo de experimentos p. 19/65


Repaso

Por otro lado:


2

V (y) = E (y E(y))
h i
2
= E y 2 2yE(y) + [E(y)]
2 2
= E y 2E(y)E(y) + [E(y)]
2 2
= E y [E(y)]
2 E y 2
2
=

por lo tanto

E(y 2 ) = 2 + 2

Diseo de experimentos p. 20/65


Repaso

Y por otro:
n
! n !
1 X 1 X
V (
y) = V yi = 2V yi
n i=1
n i=1
n
1 X
=iid 2
V (yi )
n i=1
2
1 2
= n = .
n2 n

Entonces,
2 2
V (
y) = E y [E(
y )]
2 2
E y = V (
y ) + [E(
y )]
= 2 /n + 2 .

Diseo de experimentos p. 21/65


Repaso

Regresando,
n
X
E (SS) = E(yi2 ) nE(
y2 )
i=1
Xn
= (2 + 2 ) n(2 + 2 /n)
i=1

= n + n 2 n2 2
2

= (n 1) 2

Por lo tanto,
2 1 1
(n 1) 2 = 2

E S = E (SS) =
n1 n1
S 2 es un estimador insesgado de 2 .

Diseo de experimentos p. 22/65


Repaso

Distribucin muestral. Es la distribucin de probabilidad de


una estadstica.
Se puede determinar la distribucin muestral de una
estadstica si conocemos la distribucin de probabilidad de la
poblacin de la que se extrajo la muestra.

Diseo de experimentos p. 23/65


Distribuciones (algunas)

Diseo de experimentos p. 24/65


Normal

Si y N (, 2 ) entonces:
1 212 (y)2
f (y) = e < y <
2
< <
2 > 0

0.4

NH10,1L
0.3

NH10,4L
0.2

NH10,9L
0.1

5 10 15 20

Diseo de experimentos p. 25/65


Normal

Si y N (, 2 ) entonces:
y
z= N (0, 1)

Muchas tcnicas estadsticas suponen que la variable
aleatoria en cuestin se distribuye normalmente. El Teorema
Central del Lmite es muchas veces una justificacin para
suponer normalidad.
Teorema Central del Lmite.
Sean x1 , x2 , . . . , xn v.a.i.i.d de una funcin de probabilidad
fX (x) con media y varianza 2 .
Sea x = x1 +x2 +...+x
n
n
, para un tamao de muestra grande n,
la distribucin de x es aproximadamente:

n(
x )
x (, 2 /n)
N N
(0, 1)

Diseo de experimentos p. 26/65


Ji-cuadrada

Una distribucin muestral que se puede definir a travs de v.a.


normales es la distribucin Ji-cuadrada 2

Si z1 , z2 , . . . , zk son v.a.i.i.d. N (0, 1) entonces:

x = z12 + z22 + . . . + zk2


tiene una distribucin 2k .

La densidad tiene la forma:


1
f (x) = k/2 k xk/21 ex/2 x > 0
2 ( 2 )

Diseo de experimentos p. 27/65


Ji-cuadrada

0.15

0.125 H5L
0.1
H10L
0.075

0.05 H15L
0.025

5 10 15 20 25 30

Diseo de experimentos p. 28/65


Ji-cuadrada

La distribucin es asimtrica con = k y 2 = 2k.

Un ejemplo de v.a. con distribucin Ji-cuadrada es el


siguiente:

Suponga que y1 , y2 , . . . , yn es una m.a. de N (, 2 ), entonces:


Pn
SS )2
i=1 (yi y 2
= n1
2 2

Diseo de experimentos p. 29/65


t-Student

Si z tiene distribucin normal estndar y x tiene distribucin 2k


y z y x son independientes, entonces la v.a.
z
t= p tk
x/k
La funcin de densidad tiene la forma:
[(k + 1)/2] 1
f (t) = <t<
k(k/2) [(t2 /k) + 1](k+1)/2

La distribucin es simtrica con = 0 y 2 = k/(k 2) para


k > 2.

Diseo de experimentos p. 30/65


t-Student

0.4

tH1L
0.3

tH2L
0.2

tH30L
0.1

-6 -4 -2 2 4 6

Diseo de experimentos p. 31/65


t-Student

Un ejemplo de v.a. con distribucin t es:

Si y1 , y2 , . . . , yn es una m.a. de N (, 2 ) entonces:


y
t= tn1
S/ n
donde, sP
n
y)2
i=1 (yi
S=
n1

Diseo de experimentos p. 32/65


Distribucin F

Si 2u y 2v son dos v.a. 2 independientes con u y v g.l.


respectivamente, entonces

2u /u
F = 2 Fu,v
v /v

Diseo de experimentos p. 33/65


Distribucin F

Como ejemplo de una estadstica que se distribuye como F ,


suponga que tenemos dos poblaciones normales
independientes con varianza comn 2 , es decir,
y11 , y12 , . . . , y1n1 es una m.a. de la primera poblacin

y21 , y22 , . . . , y2n2 es una m.a. de la segunda poblacin


entonces,
S12
2 Fn1 1,n2 1
S2
donde
Pn1 2
Pn2
i=1 (y1i y1 ) y2 )2
i=1 (y2i
S12 = y S22 =
n1 1 n2 1

Diseo de experimentos p. 34/65


Distribucin F

Sabemos que:
SS1 SS2
S12 = 2
y S2 =
n1 1 n2 1
y
SS1 (n1 1)S12 2
= n1 1
2 2
SS2 (n2 1)S22 2
= n2 1
2 2
Por lo tanto:

(n1 1)S12
(n1 1) 2
(n2 1)S22
Fn1 1,n2 1
(n2 1) 2

Diseo de experimentos p. 35/65


Pruebas de hiptesis

Diseo de experimentos p. 36/65


Primero un ejemplo

Un ingeniero desea comparar la resistencia de una frmula


modificada de cemento a la cual se le agrega ltex durante el
mezclado. Se tienen diez observaciones de la resistencia para
la frmula modificada y otras diez para la frmula usual.

mezcla modificada mezca sin modificar


j kgf /cm2 (y1j ) kgf /cm2 (y2j )
1 16.85 17.50
2 16.40 17.63
3 17.21 18.25
4 16.35 18.00
5 16.52 17.86
6 17.04 17.75
7 16.96 18.22
8 17.15 17.90
9 16.59 17.96
10 16.57 18.15
Diseo de experimentos p. 37/65
Primero un ejemplo

Factor: frmula con dos niveles: modificada(1) y usual(2). Dos


tratamientos 10 repeticiones y1 = 16.76 y y2 = 17.92.
Diseo de experimentos p. 38/65
Primero un ejemplo

Los promedios de resistencia son diferentes entre estas dos


muestras, sin embargo, no es obvio que esta diferencia sea lo
suficientemente grande para que implique que las dos
frmulas son "realmente" diferentes.

Tal vez esta diferencia observada en los promedios de


resistencia es el resultado de fluctuaciones muestrales y que
las dos frmulas son realmente iguales. Posiblemente otras
dos muestras podran dar resultados opuestos.

Para probar si las dos frmulas son iguales o no, se utiliza una
tcnica de estadstica inferencial llamada Prueba de Hiptesis,
la cual permite hacer la comparacin de las dos frmulas en
trminos objetivos, con el conocimiento del riesgo asociado a
llegar a una conclusin errnea.

Diseo de experimentos p. 39/65


Prueba de hiptesis con un ejemplo

Primero, necesitamos establecer un modelo para los datos:


yij = i + ij i = 1, 2 j = 1, . . . , 10
donde
yij es la j-sima observacin del i-simo tratamiento
i es la media de la respuesta en el tratamiento i, i = 1, 2
ij es el error asociado a la ij-sima observacin.
Suponga que ij N ID(0, 2 ) i = 1, 2 j = 1, . . . , 10.
Esto implica que
yij N ID(i , 2 ) i = 1, 2 j = 1, . . . , 10.

Diseo de experimentos p. 40/65


Prueba de hiptesis con un ejemplo

0.2

0.15
trat 1
0.1

trat 2
0.05

5 10 15 20 25 30

Diseo de experimentos p. 41/65


Prueba de hiptesis con un ejemplo

Lo que interesa probar es:

H0 : 1 = 2 hiptesis nula
vs.
Ha : 1 6= 2 hiptesis alternativa dos colas
1 < 2 1 > 2

Para probar una hiptesis necesitamos una estadstica de


prueba y especificar una regin de rechazo o regin crtica,
que es el conjunto de valores de la estadstica de prueba que
llevan a rechazar la hiptesis nula.

Diseo de experimentos p. 42/65


Prueba de hiptesis con un ejemplo

Se pueden cometer dos tipos de error al probar una hiptesis:

situacin real (desconocida)


H0 es cierta H0 no es cierta
rechazar H0 error Tipo I
conclusin
estadstica
no rechazar H0 error Tipo II

= P (error tipo I) = P (rechazar H0 |H0 es cierta)

= P (error tipo II) = P (no rechazar H0 |H0 no es cierta)

Diseo de experimentos p. 43/65


Prueba de hiptesis con un ejemplo

El procedimiento general en pruebas de hiptesis es


especificar un valor de , llamado nivel de significancia de la
prueba y disear el procedimiento de tal manera que sea
pequeo.

Regresando al ejemplo.

y1 = 16.764 y2 = 17.992
S1 = 0.3164 S2 = 0.2479
S12 = 0.100 S22 = 0.061
n1 = 10 n2 = 10

Diseo de experimentos p. 44/65


Construccin de la estadstica de prueba

Suponga, por el momento, que las varianzas de las dos


poblaciones son iguales. Es decir,
y1j N ID(1 , 2 ) y2j N ID(2 , 2 ) j = 1, . . . , 10

y1 N (1 , 2 /n1 ) y2 N (2 , 2 /n2 )

Si las dos poblaciones son independientes, entonces:



1 1
y1 y2 N 1 2 , 2 +
n1 n2
Si 2 es conocida y si H0 : 1 = 2 es cierta, entonces:

y1 y2 (1 2 )
z0 = q N (0, 1)
1 1
n1 + n2

Diseo de experimentos p. 45/65


Construccin de la estadstica de prueba

Si no conocemos 2 , entonces se utiliza la estadstica de


prueba:
y1 y2
t0 = q tn1 +n2 2
Sp n11 + n12
donde,
2 2
(n 1 1)S 1 + (n 2 1)S 2
Sp2 = (pooled)
n1 + n2 2

Diseo de experimentos p. 46/65


Regin de rechazo

Para determinar la regin de rechazo, es decir, los valores de


la estadstica de prueba que llevan a rechazar H0 , se fija
primero el nivel de significancia .

Diseo de experimentos p. 47/65


Regin de rechazo

1/2
Se compara t0 con tn1 +n2 2 porcentil (1 /2) de la
distribucin t con n1 + n2 2 g.l.
1/2
Si |t0 | > tn1 +n2 2 se rechaza H0 .

Esto es, si H0 es cierta entonces t0 tn1 +n2 2 y


esperaramos que el 100(1 )% de los valores de t0 cayeran
entre t/2 y t1/2 .

Si una muestra produce un valor de t0 fuera de estos lmites,


sera "extrao" si la hiptesis nula es cierta, por lo que es
evidencia de que H0 se debe rechazar.

Diseo de experimentos p. 48/65


De vuelta al ejemplo

Haciendo los clculos del ejemplo:

y1 y2 16.76 17.92
t0 = q = q = 9.13
1 1 2
S p n1 + n2 0.284 10

Si fijamos = 0.05 entonces rechazamos H0 si


|t0 | > t0.975
18 = 2.101

Como 9.13 > 2.101 entonces, rechazamos H0 al 5% de nivel


de significancia. Y conclumos que en promedio, la resistencia
de las dos frmulas es diferente.

Diseo de experimentos p. 49/65


p-value

Esta es una forma de reportar los resultados, es decir, la


hiptesis nula se rechaz o no se rechaz a un nivel de
significancia especificado.

Sin embargo, esto no d al investigador idea de si el valor


calculado de la estadstica de prueba estaba en la frontera de
la regin crtica o si estaba muy adentro de sta. Para eliminar
esta deficiencia se utiliza el p-value.

El p-value (significancia observada) es la probabilidad, si la


hiptesis nula es cierta, de que la estadstica de prueba
resulte en un valor tan extremo como el observado o ms.

Diseo de experimentos p. 50/65


Suposiciones de la prueba t

Ambas muestras provienen de poblaciones independientes


y que pueden ser descritas por distribuciones normales.
Las varianzas de ambas poblaciones son iguales.
Las observaciones son independientes.

Las suposiciones de independencia se pueden satisfacer a


travs del diseo.

La suposicin de normalidad se verifica a travs de grficas en


papel normal o la prueba de Kolmogorov-Smirnov, entre otras.

Diseo de experimentos p. 51/65


Intervalos de confianza

Aunque las pruebas de hiptesis son una herramienta muy til,


algunas veces no dan todo el panorama. A veces es preferible
dar un intervalo en el que esperamos que est el verdadero
valor del parmetro. O puede suceder que el investigador ya
sabe que las medias 1 y 2 son diferentes, pero quiere saber
qu tan diferentes pueden ser.

Suponga que es un parmetro desconocido. Para construir


un intervalo de confianza para necesitamos dos estadsticas
L y U tales que:
P (L U ) = 1
El intervalo (L, U ) es llamado intervalo del (1 )100% de
confianza para el parmetro .

Diseo de experimentos p. 52/65


Intervalos de confianza

La interpretacin de este intervalo es:

Si en un nmero grande de muestreos repetidos se construyen


intervalos de confianza para , entonces el (1 )100% de
stos contendrn al verdadero valor de .

L y U son los lmites de confianza, inferior y superior.


1 es el coeficiente de confianza.

Los intervalos de confianza tienen una interpretacin


frecuentista, esto es, no sabemos si la aseveracin es cierta
para esta muestra especfica, pero sabemos que el mtodo
usado para calcular el intervalo de confianza produce
aseveraciones correctas el (1 )100% de las veces.

Diseo de experimentos p. 53/65


Intervalos de confianza

Para el caso que estamos tratando de dos poblaciones normales


independientes, el intervalo de confianza para 1 2 se construye de la
siguiente manera:

y1 y2 (1 2 )
q tn1 +n2 2
1 1
S p n1 + n2

(1/2) y1 y2 (1 2 ) (1/2)
P tn1 +n2 2 q tn1 +n2 2 = 1
Sp n11 + n12

r
(1/2) 1 1
P y1 y2 tn1 +n2 2 Sp + 1 2
n1 n2
r
(1/2) 1 1
y1 y2 + tn1 +n2 2 Sp + =1
n1 n2

Diseo de experimentos p. 54/65


Intervalos de confianza

Un intervalo del (1 )100% de confianza para 1 2 es:


r r
(1/2) 1 1 (1/2) 1 1
y1 y2 ) tn1 +n2 2 Sp
( + y1 y2 ) + tn1 +n2 2 Sp
, ( +
n1 n2 n1 n2

Regresando al ejemplo del problema del cemento:


y1 = 16.76 y2 = 17.92
Sp = 0.284 n1 = n2 = 10
t0.975
18 = 2.101

El intervalo es: (1.43, 0.89).


Note que si el valor 0 (cero) no est includo en el intervalo
implica que los datos no sostienen la hiptesis de que 1 = 2
al 5% de nivel de significancia.

Diseo de experimentos p. 55/65


Prueba de hiptesis cuando 12 6= 22

Si estamos probando
H0 : 1 = 2 vs. Ha : 1 6= 2
y no podemos suponer que las varianzas 12 y 22 son iguales,
la prueba t se modifica. La estadstica de prueba es ahora:
y1 y2
t0 = q 2 2
.
S1 S2
n1 + n2

Esta estadstica no se distribuye exactamente como una t. Sin


embargo, se aproxima muy bien a una t si usamos como
grados de libertad:
2 2
S1 S22
n1 + n2
= 2 2 2
(S1 /n1 ) (S22 /n2 )
n1 1 + n2 1

Diseo de experimentos p. 56/65


Datos apareados

En algunos experimentos podemos mejorar grandemente la


precisin haciendo comparaciones con u.e. apareadas.

Ejemplo: Suponga que se tiene una mquina que prueba la


dureza de un metal al presionar una varilla con una punta en el
metal, aplicando una fuerza conocida.

Se determina la dureza del metal midiendo la profundidad de


la depresin causada por la punta.

Se tienen 2 puntas y se sospecha que las mediciones hechas


por las dos puntas producen lecturas diferentes, a pesar de
que la precisin (variabilidad) de las mediciones parecen
iguales.

Diseo de experimentos p. 57/65


Datos apareados

Se lleva a cabo primero el siguiente experimento:

Se seleccionan 20 especmenes de metal. Diez de ellos se


medirn con la punta 1 y los otros 10 con la punta 2. La
asignacin de los especmenes a las puntas es aleatorio.

Este es un diseo completamente al azar.

Punta 1 Punta 2
7,3,3,4,8, 6,3,5,3,8,
3,2,9,5,4 2,4,9,4,5
y1 = 4.80 y2 = 4.90
S12 = (2.39)2 S22 = (2.23)2

Diseo de experimentos p. 58/65


Datos apareados

(n1 1)S12 + (n2 1)S22


Sp2 = = 5.3425
n1 + n2 2
y1 y2
t0 = q = 0.09674
Sp n11 + n12
1/2
Si |t0 | > t18 rechazamos H0 : 1 = 2
1/2
t18 = 2.101 por lo tanto no rechazamos H0 .
p-value=0.924.

En este ejemplo puede haber una desventaja al hacerlo con


un diseo completamente al azar. Suponga que los
especmenes de metal fueron cortados de diferentes lotes que
fueron producidos con diferentes temperaturas o que no son
homogneos en algun factor que puede afectar su dureza.

Esta falta de homogeneidad contribuir a las mediciones de


dureza y tender a aumentar el error experimental, haciendo
que la verdadera diferencia entre las puntas sea difcil de
detectar.
Diseo de experimentos p. 59/65
Datos apareados

Para solventar este problema, considere un diseo


experimental alternativo.

Suponga que cada especimen de metal es lo suficientemente


grande para que se puedan hacer 2 determinaciones de
dureza en l.

Este diseo consistir en dividir cada especimen en dos


partes, luego se asigna aleatoriamente una punta a una de las
mitades y la otra punta a la otra mitad. El orden en el cual se
prueban las puntas es aleatorio tambin.

Diseo de experimentos p. 60/65


Datos apareados

Especimen Punta 1 Punta 2 dj


1 7 6 1
2 3 3 0
3 3 5 -2
4 4 3 1
5 8 8 0
6 3 2 1
7 2 4 -2
8 9 9 0
9 5 4 1
10 4 5 -1

Diseo de experimentos p. 61/65


Datos apareados

El modelo estadstico que describe los datos de experimento


es:
yij = i + j + ij i = 1, 2 j = 1, . . . , 10
donde

yij es la observacin de dureza para la punta i en el


especimen j.

i es la media verdadera de dureza de la punta i.

j es el efecto del especimen j.

ij es el error experimental y suponemos que se distribuye


N (0, 2 )

Diseo de experimentos p. 62/65


Datos apareados

Si
dj = y1j y2j j = 1, . . . , 10
entonces
d = E(dj ) = E(y1j y2j ) = E(y1j ) E(y2j )
= 1 + j (2 + j )
= 1 2 (se cancela el efecto de j )

Entonces, H0 : 1 = 2 vs. Ha : 1 6= 2 es equivalente a


probar
H0 : d = 0 vs. Ha : d 6= 0
De aqu surge la prueba t para datos apareados. La
estadstica de prueba es:
d
t0 =
Sd / n

Diseo de experimentos p. 63/65


Datos apareados

P 2
(dj d)
donde d = 1
Sd2
P
n j dj y = n1 .

Haciendo clculos, tenemos


d = 0.10 Sd = 1.20 t0 = 0.26
1/2
Si |t0 | > tn1 se rechaza H0 .

t0.975
9 = 2.262 p-value = 0.798

No se rechaza H0 .

Diseo de experimentos p. 64/65


Comparacin de los dos diseos

Completamente al azar Apareado (Bloques al azar)


18 g.l. 9 g.l.

Sp = 2.31 Sd = 1.20

1 2 (0.10 2.18) d (0.10 0.86)

Al hacer el experimento apareado se "perdieron" 9 g.l. lo que


implica que la prueba es menos sensible, sin embargo, se
redujo la estimacin de la variabilidad lo que implica intervalos
de confianza ms angostos, es decir, ms precisin.

Diseo de experimentos p. 65/65

Vous aimerez peut-être aussi