Vous êtes sur la page 1sur 67

Métodos Estadísticos Varela/Llanos/Asnate

CAPITULO III

DISEÑOS EXPERIMENTALES

¿Que es un Diseño Experimental?


Diseñar un experimento es simplemente planear un experimento de
modo que reúna la información que sea pertinente al problema bajo
investigación
El diseño experimental es, entonces la secuencia completa de
pasos formados de antemano para asegurar que los datos apropiados se
obtendrán de modo que permitan un análisis, de tal manera que
conduzca a deducciones validas con respecto al problema establecido.

PROPOSITO DE UN DISEÑO EXPERIMENTAL


El propósito de cualquier diseño experimental es proporcionar una
cantidad máxima de información pertinente al problema bajo
investigación.
También es importante que el diseño sea tan simple como sea posible,
además debería hacerse todo esfuerzo para ahorrar tiempo, dinero,
personal, y material experimental.

PRINCIPIOS BASICOS DEL DISEÑO EXPERIMENTAL


Los principios básicos del diseño experimental son: reproducción,
aleatorización y control local.

REPRODUCCIÓN O REPLICA.- es la repetición del experimento


básico.
Este concepto tiene dos propiedades importantes.
1° Permite al experimentador obtener una estimación del error
experimental, tal estimación se convierte en la unidad básica para
determinar si las diferencias observadas en los datos son
estadísticamente significativas.
2° El uso de replicas permite al experimentador calcular una estimación
más precisa del efecto de un factor en el experimento si se usa la media
de la muestra como una estimación de dicho efecto.

ALEATORIZACION.- Es la piedra angular que fundamenta el uso de


los métodos estadísticos. En el diseño de experimentos se entiende por
aleatorización el hecho de que tanto la asignación del material
experimental como el orden en que se realizan las pruebas individuales
o ensayos se determinan aleatoriamente. Además la aleatorización
Métodos Estadísticos Varela/Llanos/Asnate
ayuda a cancelar los efectos de factores extraños que pudieran estar
presentes.

CONTROL LOCAL.- Se refiere a la cantidad de balanceo, bloque y


agrupamiento de las unidades experimentales, este principio se usa para
incrementar la precisión del experimento, se busca que el material
experimental sea más homogéneo que el total del material.

ERROR EXPERIMENTAL Y UNIDADES EXPERIMENTALES


UNIDAD EXPERIMENTAL.- Es la unidad a la cual se le aplica un
sub tratamiento (que puede ser una combinación de muchos factores) en
una reproducción del experimento básico.
ERROR EXPERIMENTAL.- Describe el fracaso de llegar a
resultados idénticos con dos unidades experimentales tratadas
idénticamente.
El error experimental puede reducirse normalmente adoptando una o
más de las técnicas siguientes:
1) Usando material experimental más homogéneo o por la
estratificación cuidadosa del material experimental.
2) Utilizando información proporcionada por variables aleatorias
relacionadas.
3) Teniendo más cuidado al dirigir el experimento.
4) Usando un diseño experimental más eficiente.

CONFUNDIDO.- Es sinónimo de entremezclados, es decir, se dice que


dos o más efectos se confunden en un experimento si es imposible
separar los efectos, cuando se lleva a cabo el subsecuente análisis
estadístico.

ANALISIS DE VARIANZA
Es una técnica en el que la varianza total de un conjunto de datos se
divide en varios componentes, cada uno de los cuales tiene asociado
una fuente específica de variación, de manera que durante el análisis es
posible encontrar la magnitud con la que contribuye cada una de esas
fuentes en la variación total.
El análisis de varianza se utiliza con dos propósitos:
1) Estimar y probar la hipótesis respecto a varianzas poblacionales.
2) Estimar y probar hipótesis respecto a las medias de las poblaciones.
Para utilizar correctamente el análisis de varianza como una herramienta
de la inferencia estadística es necesario satisfacer un conjunto de
suposiciones fundamentales las mismas que son:
Métodos Estadísticos Varela/Llanos/Asnate
1) Los efectos de los tratamientos, así como los ambientales son
aditivos.
2) Los errores experimentales se distribuyen normalmente e
independientemente con una varianza común.

DISEÑO COPLETAMENTE AL AZAR DCA


Es el más simple de los diseños; es un diseño en el cual los tratamientos
son asignados completamente al azar a las unidades experimentales o
viceversa, es un diseño que no impone restricciones (tales como
bloqueo) en la distribución del los tratamientos a las unidades
experimentales.
Debido a su simplicidad, el DCA es usado ampliamente, sin
embargo debe de usarse en casos en los cuales se dispone de unidades
experimentales homogéneas. Si no se puede tener tales unidades, debe
utilizarse algún bloqueo para incrementar la eficiencia del diseño.

DCA CON UNA OBSERVACION POR UNIDAD


EXPERIMENTAL
Siendo un DCA, ni unidades experimentales se sujetasen al i-
ésimo tratamiento (i = 1,2,...t) y únicamente se obtiene una observación
por unidad experimental, los datos aparecerían como en la tabla 1.

Tabla 1.- Representación simbólica de los datos de un DCA (N°


desigual de observaciones para cada tratamiento)

Tratamientos Total
1 2 3 ... k
Y11 Y12 Y13 ... Y1k
Observaciones

Y21 Y22 Y23 Y2k


. . . .
. . . .
. . . .
y n1 1 yn2 2 y n3 3 ynk k
Totales Y.j y.1 y.2 y.3 ... y.1 k
Y ..   Y .i
Número de n1 n2 n3 ... nk i 1

observaciones
nj    ...   ni  N
i 1
 Y.1 Y.2 Y.3 Yk
Medias Y. j  Y.i2
Y ..  k

 ni
i 1
Métodos Estadísticos Varela/Llanos/Asnate

Usando las siguientes fórmulas obtenemos el cuadro de ANVA



nj
k
Y 2 ..
SCT = Suma de cuadrados total =  yij 
2

i 1 j 1 N
k Y. 2j Y..2
SCt = Suma de cuadrados entre tratamientos = n
i 1

N
j
SCE = Suma de cuadrados del error =
nj 2
k Y
 y   n
i 1 j 1
2
ij
.j
 SCT  SCt
j
TABLA Nº 02 : ANALISIS DE VARIANZA (ANVA)

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Tratamientos SCt K–1 CMt CM t
Error SCE N–k CME CM E
Total SCT N–1

* Los cuadrados medios se encuentran dividiendo para cada suma de


cuadrados entre los correspondientes grados de libertad.

Tabla 3.- Representación simbólica de los datos en un diseño CA


(con igual número de observaciones para cada tratamiento).

Tratamientos Total
1 2 3 ... t
Y11 Y21 Y31 ... Y1t
Y12 Y22 Y32 Yt2
Y13 Y23 Y33. Yt3.
Observaciones . . .
. . . .
y1n1 y2n2 y3n3 ytn
Totales T1 T2 T3 ... Tt
Número de T   Ti
observaciones n n n ... N
Medias    ...  tn
Y.1 Y.2 Y.3 Yt
Métodos Estadísticos Varela/Llanos/Asnate
 T
Y 
tn

Usando las siguientes fórmulas obtenemos el cuadro de ANVA


t n
Y..2
SCT =  y
i 1 i 1
ij
2

N
Suma de cuadrados del total

2
a
Y Y..2
SCt = 
i 1 n
i.
N
Suma de cuadrados de los

tratamientos

SCE = SCT  SCt   yij2 


n t
Y 2
i.
Suma de cuadrados
i 1 i 1 n
del error

TABLA DE ANALISIS DE VARIANZA (ANVA)

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Tratamientos SCt t-1 CMt CM t
Error SCE t(n-1) CME CM E
Total SCT t(n-1) CMT

El modelo será:
Yij  u  ti   ij

H 0 : τ1  τ 2  τ3  ...  τ t  0 vs
H1 : τ i  0
si al menos para una i
El modelo será a efectos fijos.
Si H 0 :  2  0 vs H 1 :  t2  0 modelo a efectos aleatorios
Antes de que puedan usarse los análisis precedentes de varianza para
fines de deducción estadística deberá hacerse ciertas suposiciones
respecto a las observaciones.
Métodos Estadísticos Varela/Llanos/Asnate
Las suposiciones en el ANVA son las mismas que las del análisis de
regresión:
- Aditividad
- Linealidad
- Normalidad
- Independencia
- Varianzas homogéneas

Modelo Estadístico Lineal


Yij  u  ti   ij i  1, t ; j  1, n i o j  1, n
obs. Desiguales obs. Iguales
Donde:
μ= efecto medio verdadero
τi = es el efecto verdadero del i-ésimo tratamiento
εij = es el efecto verdadero de la j-ésima unidad experimental sujeta
al i-ésimo tratamiento (u es una constante y los εij :DNI (0, σ)
1)  i  0 , lo cual nos dice que estamos interesados en los t
tratamientos presentes en su experimento.
2) Los ti es tan DNI (0, t ) lo que indica que estamos interesados en
una población de tratamientos de los cuales únicamente una
muestra al azar (los τ tratamientos) están presentes en el
experimento.
1) Es el modelo I: Modelo de análisis de varianza (efectos fijos)
2) Es el modelo II: Modelo de componentes de varianza (efectos al
azar)
Después de estas suposiciones podemos hacer uso de los cuadros de
ANVA, donde comúnmente interesan tres conclusiones en los
siguientes problemas:
1) Hipótesis a cerca del efecto relativo de tratamientos: sea la
hipótesis puede expresarse como:
H 0 :  i  0 (i  1, t ) , si H0 es verdadera, tanto el cuadrado medio del
error experimental como el cuadrado medio entre tratamientos, son
estimaciones de  2 . Así si H es verdadera, entonces:
t
T
esta distribuida como F, con  1  t  1 y  2   ( ni  1) g.l.
E i 1
debido a que los  ij  DNI (0, ); si Fc  F(1 ) ( v1,v 2 )  H 0 será
rechazada
Por lo tanto habrá diferencias significativas entre los tratamientos.
Métodos Estadísticos Varela/Llanos/Asnate
b) Usando el modelo I, es decir si la hipótesis se hubiese expresado
como: no hay diferencia entre los efectos de todos los tratamientos en la
población en la cual los t tratamientos en el experimento son una
muestra, entonces la hipótesis será: H 0 :  t2  0 , la cual será probada

con una F 
T
E
¿Por qué, entonces, hemos estado tan interesados respecto a la
distensión entre los modelos? Por dos razones:
1.- Las deducciones en los dos casos son respecto a poblaciones
enteramente diferentes.
2.- En un análisis más complejo, podrían indicarse algunos
procedimientos de prueba completamente s

ESTIMACION DE COMPONENTES DE VARIANZA


S 2 = cuadrado medio del error experimental =E
CM   CME ; para números desiguales
S t2 
n0
CM   CME ; para números iguales
S t2 
n
Ejemplo.

1.- Una fabrica de textiles cuenta con un gran número de telares se


supone que cada uno tiene la misma producción de tela por minuto, para
investigar esta suposición se elige cinco telares al azar y se mide la
cantidad de tela producida en cinco tiempos diferentes obteniéndose los
siguientes datos

Telares (Lib/min)
1 2 3 4 5
14.0 13.9 14.1 13.6 13.8
14.1 13.8 14.2 13.8 13.6
14.2 13.9 14.1 14.0 13.9
14.0 14.0 14.0 13.9 13.8
14.1 14.0 13.9 13.7 14.0

a) Explique en este experimento de efecto aleatorio ¿tienen todos los


telares el mismo rendimiento?
b) Calcular la variabilidad de los telares.
c) Estime la varianza del error experimental
Métodos Estadísticos Varela/Llanos/Asnate

Solución
Telares (Lib/min)
1 2 3 4 5
14.0 13.9 14.1 13.6 13.8
14.1 13.8 14.2 13.8 13.6
14.2 13.9 14.1 14.0 13.9
14.0 14.0 14.0 13.9 13.8
14.1 14.0 13.9 13.7 14.0
Yi 70.4 64.6 70.3 68.0 69.1
Ni. 5 5 5 5 5
14.08 13.92 14.06 13.8 13.82
yi .

y.. = 348.4
N = 25

Y.. = 13.936
SCT =

Y .. 348.4 2
 y  N 2
ij  (14  14.1  ...  14 ) 
2 2

25
2
 06376

SCt =

y 2
i

Y
.
2
 (70.4) 2  (69.6) 2  ...  (69.1) 2  4855.3  0.3416
ni N

y 2

SCE =  y 2
ij 
ni
i.
 SCT  SCt = 0.6376 – 0.3416 = 0.296

Cuadro ANVA

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Telares 0.3416 4 0.854 5.77
Métodos Estadísticos Varela/Llanos/Asnate
(trat.) 0.296 20 0.0148
Error
Total 0.6376

f1-0.05 = f 0.95 (4.20) = 2.87


Se dice que todos los telares tienen la misma producción de tela por
minuto

2.- Se estudia la duración de líquidos distintos a una carga acelerada de


35 kN. Se han obtenido datos de prueba para cuatro tipos de liquido los
resultados son.

Tipo de líquido
1 2 3 4
17.6 16.9 21.4 19.3
18.9 15.3 23.6 21.1
16.3 18.6 19.4 16.9
17.4 17.1 18.5 17.5
20.1 14.5 20.5 18.3
21.6 20.3 22.3 19.8

a) Existe indicaciones de que los líquidos difieran


b) Realiza la prueba de Tukey
Solución:
Realizando los cálculos
Tipo de líquido
1 2 3 4
17.6 16.9 21.4 19.3
18.9 15.3 23.6 21.1
16.3 18.6 19.4 16.9
17.4 17.1 18.5 17.5
20.1 14.5 20.5 18.3
21.6 20.3 22.3 19.8
yi. 111.9 107.7 125.7 112.9
ni. 6 6 6 6
18.65 17.95 20.95 18.82
yi .

y.. = 458.2
N = 24
y.. = 19.092
Métodos Estadísticos Varela/Llanos/Asnate
SCT =

2
y 458.2 2
 y  N 2
ij
..
 (17.6  18.9  ...  19.8 ) 
2 2 2

24
 96.158

SCt =

y 2
i

y 2
..

(11.9 2  107.7 2  ...  112.9 2 )
 8747.80  30.165
ni N 6

SCE = SCT  SC = 96.158 – 30.165 = 65.993


Cuadro ANVA

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Tipo de líquido 30.165 3 10.055
3.047
Error 65.993 20 3.29965
Total 96.158

f1-0.05 = f 0.95 (3.20) = 3.10


La duración efectiva de líquidos distintos de una carga acelerada, no
tiene la misma duración.

3.- Se sospecha que 5 máquinas alineamiento en cierta maquina están


llenando latas a diferentes niveles se tomaron muestras al azar de la
producción de cada maquina con los resultados siguientes:

Maquina
A B C D E
11.95 12.18 12.16 12.25 12.10
12.00 12.11 12.15 12.30 12.04
12.25 12.08 2.10 12.02
12.10 12.02

a) Realice el análisis de varianza y realice sus comentarios.


Métodos Estadísticos Varela/Llanos/Asnate

Solución
Realizando los cálculos
Maquina
A B C D E
11.95 12.18 12.16 12.25 12.10
12.00 12.11 12.15 12.30 12.04
12.25 12.08 2.10 12.02
12.10 12.02
Yi 48.30 24.29 36.39 36.65 48.18
Ni. 4 2 3 3 4
12.075 12.145 12.3 12.217 12.045
yi .

y.. = 193.81
N = 16
y.. = 12.113
SCT =

2
y 193.812
 y  N 2
ij
..
 (11.95  12  ...  12.02 ) 
2 2 2

16
 0.144

SCt =

y 2
i

y

2
..48.302 24.29 2 36.39 2 36.652 48.182 193.812
      0.05943
ni N 4 2 3 3 4 16

SCE = SCT  SC = 0.144 – 0.05943 = 0.08457


Cuadro ANVA

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Máquinas 0.05943 3 0.01486
1.93
Error 0.08457 11 0.00769
Total 96.158

f0.05 = f 1 - 0.05 = f 0.95 (4.11) = 5.94


Los alineamientos de las máquinas no son confiables en los enlatados
Métodos Estadísticos Varela/Llanos/Asnate

DISEÑO EN BLOQUE COMPLETO AL AZAR DBCA


- Es el más ampliamente usado de todos los diseños experimentales
- Un DBCA es aquel en el que las u.e. se distribuyen en grupos o
bloques, de tal manera que las u.e. dentro de un bloque sean
relativamente homogéneas y el número de u.e. por bloque sea igual
al número de tratamientos por investigar; los tratamientos se
asignan al azar a las u.e. dentro de cada bloque.

DISEÑO EN BLOQUE COMPLETO AL AZAR CON UNA


OBSERVACION POR U.E
Modelo estadístico lineal
Yij = μ + βi + τi + εij i  1, b ; j  1, t
Donde:
μ : verdadero efecto medio
βi : verdadero efecto del i-ésimo bloque
τi : verdadero efecto del i-ésimo tratamiento
εij : verdadero efecto de la u.e. en el i-ésimo bloque que esta sujeta al j-
ésimo tratamiento
Además:
b


i 1
i  0 ;  ij  DNI (0, )

Tabla: Representación simbólica de los datos en un DBCA


Tratamientos Total Media
Bloque
1 2 3 k
1 Y11 Y12 Y1j ……. Y1t Y1.
2 Y21 Y22 Y2j ……. Y2t Y2. 
. . . . ……. . . Y1.
. . . . …….. . . 

i Yi1 Yi2 Yij. ……. Yit. Yi. Y 2.


n Yn1 Yn2 Yn3 ……. ynk Yn.. 
Yi .

Yk .

Total Y1 Y2 Y.j Y.t


Media     Y.. 
Y.1 Y.2 Y. j Yt Y..

Fórmulas para calcular la suma de cuadrados y obtener el análisis de


varianza son:
Métodos Estadísticos Varela/Llanos/Asnate
k n 2
Y
SCT =  y
i 1 j 1
ij
2
 ..

kn
Suma de cuadrados del total

1 n 2 Y..2
SCτ =  Y. j  kn
n j 1
Suma de cuadrados entre tratamientos

1 k 2 Y..2
SCB =  Yi.  kn
k i 1
Suma de cuadrados entre bloques

SCE = SCT - SCτ - SCB Suma de cuadrados del error

Análisis de Varianza de un DBCA

Fuente de Suma de Grados de Cuadrados Fo


variación cuadrados libertad medios
Tratamientos SCt k-1 SCτ/(k-1) = CM t
Bloques SCB n-1 CMτ CM E
Error SCE (k-1) (n-1) SCB/(n-1) =
CMB
SCE/(k-
1)(n-1) =
CME
Total SCT kn-1

1.- Un ingeniero Industrial realiza un experimento para estudiar el


tiempo que tarda el ojo en enfocar. Esta interesado con la relación que
existe entre las distancias del objeto al ojo y el tiempo que el ojo tarda
en enfocar cuatro diferentes distancias resultan de interés, hay cinco
objetos disponibles para el experimento como pueden haber diferencias
entre los sujetos el decide efectuar un análisis de varianza. Los datos
son:

Distancia Sujeto
(pies) 1 2 3 4 5
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
Métodos Estadísticos Varela/Llanos/Asnate
Solución:
Realizando los cálculos

Distancia Sujeto
(pies) 1 2 3 4 5 yi. ni. 
y i.
4 10 6 6 6 6 34 5 6.8
6 7 6 6 1 6 36 5 5.2
8 5 3 3 2 5 18 5 3.6
10 6 4 4 2 3 19 5 3.8

y.i 28 19 19 11 20 y..
n.j 4 4 4 4 4 N=20
 7 4.75 4.75 2.75 5 
y. j y .. =
4.85

SCT =
y 2
97 2
 yij 2

N
..
 (102  7 2  ...  32 ) 
20
 84.55

SCτ =
y 2
i ..

y..2 (282  19 2  ...  20 2 )
  470.45 = 36.30
ti N 4

y..2
y 2

(34 2  26 2  ...  19 2 )
.j
SCB =    470.95
ni N 5
= 503.4 – 470.45 = 32.95
SCE = SCT - SCτ - SCB
= 84.55 – 36.30 – 32.95 = 15.30
CUADRO ANVA

Fuente de Suma de g.l. Cuadrados Fo


variación cuadrados medios
Sujeto 36.30 4 9.075 7.1176
Bloque 32.95 3 10.98 8.612
Error 15.30 12 1.275
Total 84.55 19

f0.95 (4.12) = 5.91


f 0.95 (3.12) =8.53
Métodos Estadísticos Varela/Llanos/Asnate
Los datos son confiables por lo tanto, el ojo que tarda en enfocar es
necesario.

ANALISIS DE VARIANZA CON DOS FACTORES EN EL DCA

2.- Tres especies de Drosophila pseudoobscura fueron producidos para


resistir un insecticida. Tres niveles de concentración de insecticida
fueron analizados en los tres especies engendradas proendogamia. Los
datos, expresados en porcentaje de mortalidad durante un período
determinado, están basadas en área duplicaciones por combinación de
tratamiento. Analizar con estos datos la diferencia significativa en la
tasa de mortalidad entre especies y entre niveles de insecticida, y
determinar si hay interacción entre la especie y el insecticida. Los datos
se dan a continuación

Especie Nivel de insecticida


1 2 3
60 44 46
58 37 51
52 54 63
A
38 57 66
31 65 74
58 63 63
53 59 44
B 50 54 46
35 38 66
30 38 71
37 59 51
43 51 80
57 53 68
C 60 62 71
66 71 55
Métodos Estadísticos Varela/Llanos/Asnate
Solución:

Especi Nivel de insecticida ni. yi. yi.


e 1 2 3
60 44 46
58 37 51
52 54 63
A
38 57 66
31 65 74
n1j 5 5 5 15 793 52.8667
y1i 236 257 300
58 63 63
53 59 44
50 54 46
B 35 38 66
30 38 71
n2j 5 5 5 15 768 51.2
y2j 226 252 290
37 59 51
43 51 80
57 53 68
C 60 62 71
66 71 55
n3j 5 5 5 15 884 58.933
y3j 263 296 325
15 15 15 N = 45
725 805 905 
n.j y =
48.333 53.667 60.333 ..
y.j.
2445
y.j. 
y .. =
54.1111

y...2 y...2 7932 7682 884 2 24452


Filas SCa =       
ni. N 15 15 15 45
134058.33 – 132845 = 1213.33
Métodos Estadísticos Varela/Llanos/Asnate
Columnas: SC(esp) =
2 2 2 2 2
y y 725 805 905
n . j.
 
...
N 15

15

15
 132845
.j
= 133341.93 – 132845 = 496.93
Interacción AB (insecticida, especie)
SCAB = Scsub total – SCA – SCB
= 1722 – 1213.33 – 496.93 = 11.7334
Scsub total =
yij2 y...2 2362 257 2 3252
 n 
N

5

5
 ... 
5
 132845
ij
= 134567 – 132845 = 1722
SCE = SCT – SCsub total = 6462 – 1722 = 4740
SCT =
y...2
 yij212  N
 60 2  582  ...712  552  132845
= 139307 – 132845 = 6462

CUADRO ANVA

Fuente de Suma de g.l. Cuadrados Fo


variación cuadrados medios
Insecticida 1213.33 2 606.6667 4.6076
Especie 496.93 2 248.4667 1.8871
Interacción 11.7334 4 2.9334 0.0223
Sub Total 1722 8
Error 4740 36 131.6667
Total 6462 44

F 0.95,2, 36 = 3.23 F0.95, 4, 36 = 2.61


Por lo tanto: Existe diferencia entre los insecticidas
No existe diferencia entre las especies
No existe efecto de interacción.
Métodos Estadísticos Varela/Llanos/Asnate

DISEÑO EN CUADRADO LATINO


Se usa frecuentemente en experimentos agrícolas e industriales. Este
diseño especial, en especial permite al investigador delimitar con toda
seguridad los efectos relativos de varios tratamientos, cuando se impone
a las unidades experimentales una restricción del tipo doble de bloqueo,
es decir el diseño cuadrado latino es una ampliación lógica de DBCA,
tanto los renglones como las columnas son ortogonales a los
tratamientos.
Modelo estadístico:
Yijk = μ + αi + τi + βk + εijk i  1, m ; j  1, m ; k  1, m
μ : es la media general
αi : es el i-ésimo efecto del renglón
τi : es el j-ésimo efecto de tratamiento
βk : es el k-ésimo efecto de columna
εijk : es el error aleatorio  DNI (0, σ2)
El modelo es completamente aditivo, es decir, no existe
interacción entre los renglones, las columnas y los tratamientos.
Donde:
αi = τi = βk = 0
A causa de las economías debidas a tamaños de muestras
reducidas; el DCL tiene mayor atracción para las investigaciones en
todos los campos.
* Cuando la información respecto a las interacciones es deficiente o
cuando la suposición de interacción o es de validez dudosa, deberá
emplearse un factorial completo.
FORMULAS:
m m m m m m

Y 2 Yij2(k )  Yij2(k )  Yij2( k )


i 1 j 1 i 1 k 1 j 1 k 1
2
T
M YY 
m2

RYY 
R i
2
Suma de cuadrado por renglón
m  M YY

CYY 
C i
2
Suma de cuadrados por columna
m  M YY
EYY = Y2 – MYY – RYY – CYY - TYY Suma de cuadrados del error
experimental
CUADRO DE ANALISIS DE VARIANZA (ANVA)
Métodos Estadísticos Varela/Llanos/Asnate

Fuente de Grados de Suma de Cuadrados Cuadrado medio Relación


variación libertad cuadrados medios esperado F
Media 1 MYY M  m m 2 T
Renglones m-1 RYY R 2 
 m  1 i 1
i
E
Columnas m-1 CYY C
Tratamientos m-1 TYY T  m m 2
Error (m-1) (m-2) EYY E 2   k 
 m  1 k 1
experimental
Y2  m m 2
Total m2
2   j
 m  1 j 1

σ2

Podría perderse u omitirse una observación en un experimento, de


acuerdo a un diseño cuadrado latino m x m ; su valor puede estimarse
usando.
m( R  C  T )  25
M
( M  1)( M  2)
R = Suma de las observaciones en el renglón faltante
C = Suma de las observaciones en la columna faltante
T = Suma de los tratamientos en la observación faltante
S = Suma de todas las observaciones disponibles
Después de sustituir el valor M en la tabla, las diversas sumas de
cuadrados se calculan como se indico anteriormente, pero debemos
recordar que la suma de cuadrados así calculada (T YY), precisa una
corrección, la misma que pueda hacerse calculando una nueva suma de
cuadrados de tratamientos (TYY) definida como:
TYY = TYY – Z
Donde:

Z
S  R  C  (m  1)T 2
(m  1) 2 (m  2) 2
Recuerde que los grados de libertad asociados con el error experimental
y el total reducidos cada uno en una unidad es decir (m-1) (m-2) – 1 y
m2 – 1, respectivamente.
Métodos Estadísticos Varela/Llanos/Asnate
EFICIENCIA DEL DCL CON RESPECTO AL DCA Y DBCA
R  C  (m  1) E
ER 
(m  1) E
C  ( m  1) E
ER 
mE
(Usando los renglones como bloque) si usamos las columnas como
bloque, reemplazar C por R.

1.- Se hace una investigación sobre la variedad en el orden que se toman


las presiones a un sujeto por distintos observadores. Se utilizo un
cuadrado latino de 8 por 8 para asignar los sujetos a los observadores.
Los bloques y el tratamiento fueron asignados de la siguiente forma:
(columnas) observadores, (filas) sujeto y (letras) orden de asignación de
sujetos a observadores. A continuación aparecen las presiones
sanguíneas leídas con la letra entre paréntesis indicando el diseño
utilizado.

Sujetos Observadores
1 2 3 4 5 6 7 8
1 A128 D108 C110 B106 E100 F102 G112 H110
2 B122 C100 D120 A128 F108 E130 H120 G110
3 D110 A 48 B110 C120 G102 H108 E108 F104
4 C 96 B 96 A 90 D106 H 96 G 90 F 98 G 98
5 E120 F128 G130 H128 A110 D132 C128 B134
6 F140 E128 H130 G130 B126 C108 D142 A140
7 G110 H108 E110 F106 D114 A110 B114 C118
8 H102 G118 F108 E110 C114 B110 A122 D110

Determine si hay diferencia significativa entre los ordenes con α = 5%


Métodos Estadísticos Varela/Llanos/Asnate
Solución:

Sujetos Observadores α = 5% yi
1 2 3 4 5 6 7 8
1 A128 D108 C110 B106 E100 F102 G112 H110 876
2 B122 C100 D120 A128 F108 E130 H120 G110 938
3 D110 A 48 B110 C120 G102 H108 E108 F104 810
4 C 96 B 96 A 90 D106 H 96 G 90 F 98 G 98 770
5 E120 F128 G130 H128 A110 D132 C128 B134 1010
6 F140 E128 H130 G130 B126 C108 D142 A140 1044
7 G110 H108 E110 F106 D114 A110 B114 C118 890
8 H102 G118 F108 E110 C114 B110 A122 D110 894

y.j 928 834 908 934 870 890 944 924 y.. =
Observ. A B C D E F G H 7232
yk 876 918 894 942 904 894 902 902

yi2. y..2 876 2  9382  ...  894 2 7232 2


SCfil(sujeto) =   2  
m m 8 64
= 824,699 – 817,216 = 7483
y.2j y..2 9282  ...  924 2 7232 2
SCcol (obs) = m 
m2

8

64
= 818,834 – 817,216 = 1218
y.2k y..2 876 2  ...  902 2 7232 2
SCtrata (orden)  m  m2  8

64
= 817,545 – 817216 = 329
SCerror = SCtotal - SCfil(sujeto) - SCcol (obs) - SCtrata (orden)
= 14000 –7483 – 1218 – 329 = 4970
y...2
SCtotal =  yijk2  m2

7232
= 1282  122 2  ...  110 2 
64
= 831216 – 817216 = 14,000
Métodos Estadísticos Varela/Llanos/Asnate

CUADRO ANVA

Fuente de Suma de g.l Cuadrados Fo


variación cuadrados medios
Sujeto 7483 7 1069 0.3972
Observador 1218 7 174
Tratamiento 029 7 47
Error 4970 42 118.333
Total 14000 63

EJERCICIOS RESUELTOS DE ANÁLISIS DE VARIANZA


1.- En un laboratorio hay muchos termómetros, los cuales se usan
indistintamente para medir temperaturas. Realizar un experimento con
todos los termómetros resulta muy costoso, por lo que se tomo una
muestra de 4 de ellos para ver si hay diferencia significativa entre los
termómetros. Estos fueron colocados en una célula, la cual se tiene a
temperatura constante. Los datos son los siguientes en °C y se
obtuvieron 3 lecturas de cada unote ellos.

TERMÓMETROS
1 2 3 4
0.95 0.33 -2.15 1.05
1.06 -1.46 1.70 1.27
1.96 0.20 0.48 -2.05

Haga una tabla de análisis de varianza


a) ¿Son los termómetros homogéneos?

Solución
Realizando los cálculos se tiene:

TERMÓMETROS
1 2 3 4
0.95 0.33 -2.15 1.05
1.06 -1.46 1.70 1.27
1.96 0.20 0.48 -2.05
muestra nj 3 3 3 3 N = 12
Sumas x.j 3.97 -0.93 0.03 0.27 X.. = 3.34
_ 1.323 -0.31 0.01 0.09 _
Promedio x . j x .. = 1.113
Métodos Estadísticos Varela/Llanos/Asnate

x 2 ..
S C total =
  X ij2 
N
2
= (0.95)2 + (1.06 ) + .... + (-2.5)2 - (3.34)
12
= 22.809 – 0.93 = 21.88

x 2 . j x 2 ..
S C tratam =
 nj

N
= (3.97)  (0.93)  (0.03)  (0.27)  0.93
2 2 2 2

3 3 3 3

= [5.254 + 0.288 + 0 + 0.024) – 0.93 = 4.64

x2 . j
S C error =   X ij2 
nj
= 22.809 -
 (3.97) (0.93) (0.03) (0.27) 
2 2 2 2

    
 3 3 3 3 
= 22-809 – 5.566 = 17.24

a) Cuadro ANVA.
b)
FUENTE SC G.L Cuadrados F calc F Teórico
Medios
Tratamiento 4.64 4 -1 = 3 1.55 0.718 F 0.95 (3) (8) =
Error 17.24 12 - 4 = 8 2.16 4.07
Total 21.88 12 - 1 = 11

H 0 : Todos los termómetros son iguales


H 1 : No todos los termómetros son iguales
 Aceptamos Ho, es decir los termómetros son iguales.
c) Los termómetros si son homogéneos.

2.- Se sospecha que cuatro maquinas llenadotas en una planta están


sacando productos con diferentes pesos. Se realizo un experimento para
comprobarlo para comprobarlo y los datos en onzas son los siguientes:
Métodos Estadísticos Varela/Llanos/Asnate

MAQUINA PESOS NETOS


A 12.25 12.27 12.24 12.25 12.20
B 12.18 12.25 12.26
C 12.24 12.23 12.23 12.20
D 12.20 12.17 12.19 12.18 12.16

a) Haga una tabla de ANVA


b) ¿Hay diferencia significativa entre las máquinas con
c) = 0.05?
Solución:
Realizando los cálculos se tiene
MAQUINA PESOS NETOS
A 12.25 12.27 12.24 12.25 12.20
B 12.18 12.25 12.26
C 12.24 12.23 12.23 12.20
D 12.20 12.17 12.19 12.18 12.16
MUESTRA Nj 4 4 4 3 2 N = 17

SUMAS x.j 48.87 48.92 48.92 36.63 24.366 X .. = 207.7

PROMEDIO 12.21 12.23 12.23 12.21 12.18 _


_ x .. = 61.06
x .j

2 2
(207.7) 2
2
S C total = (12.25) + (12.18) + ........ + (12.16) -
17
= 2537.6244 – 6953 = 0.019

SCtratam=
 (48.87) 2 (48.92) 2 (48.92) 2 (36.63) 2 (24.36) 2  (207.7) 2
     
 4 4 4 3 2  17

= 2537.616 – 2537.6053 = 0.0107

S C error = 2537.6244 – 2537.616 = 0.0084


Métodos Estadísticos Varela/Llanos/Asnate

a) CUADRO ANVA

Fuente SC G.L. SCM F.calc


(Varianza)
Tratam. 0.0107 4 – 1 = 3 0.003567 5.519 F 0.95 (3) (13) =
Error 0.0084 17-4 = 0.000646 3.411
13
Total 0.0191 17-1 =
16

H 0 : Todas las máquinas son iguales


H 1 : No todas las máquinas son iguales
 Rechazamos Ho
b) Si existe diferencia significativa entre las máquinas con  =
0.05

3.- Se realizo un experimento con germinado de semillas, el cual tenía


por objeto mejorara el contenido de proteínas de diferentes especies. El
experimento se realizo con un diseño completamente al azar,
obteniéndose los siguientes resultados:

SEMILLAS
lenteja trebol girasol trigo maíz Alegría
2.25 5.13 4.97 1.45 1.29 5.78
2.46 4.17 4.86 1.60 1.69 3.99
3.02 5.67 5.08 2.03 1.49 4.15
2.04 4.21 4.08 1.52 1.62 3.41
2.53 3.89 4.27 1.56 1.34 2.90
1.86 4.01 3.77 1.68 3.29 3.32

a) Existe diferencia el contenido de proteínas en las diferentes especies?


Use un nivel de significación
b) Indique los pares de medias, si los hay, que son los diferentes entre sí.
Solución:
Realizando los cálculos se tiene
Métodos Estadísticos Varela/Llanos/Asnate

SEMILLAS
lenteja trebol girasol trigo maíz Alegría
2.25 5.13 4.97 1.45 1.29 5.78
2.46 4.17 4.86 1.60 1.69 3.99
3.02 5.67 5.08 2.03 1.49 4.15
2.04 4.21 4.08 1.52 1.62 3.41
2.53 3.89 4.27 1.56 1.34 2.90
1.86 4.01 3.77 1.68 3.29 3.32

MUESTRA 6 6 6 6 6 6 N = 36
SUMAS 14.16 27.08 27.03 9.84 10.72 23.55 X..=112.38
PROMEDIO 2.366 4.513 4.505 1.64 1.787 2.925 _
X ..=
17.73

(112.38) 2
SC total = (2.25)2 + (2.46)2 + ........ + (3.32)2 -
36
= 418.212 – 350.813 = 67.399

S C Tratam =
 (1416) 2 (27.08) 2 (27.03) 2 (9.84) 2 (10.72) 2 (23.55) 2  (112.38) 2
      
 6 6 6 6 6 6  36

= [33.418 + 122.221 + 121.77 + 16.138 + 19.153 +


92.434] – 350.813

= 405.134 – 359.813 = 54.32

S C Tratam = 418.212 – 405.134 = 13.078


Métodos Estadísticos Varela/Llanos/Asnate
a) CUADRO ANVA = 0.05

SCM
Fuente SC G.L. Fcalc
(Varianza)
Tratam. 54.32 6-1 = 5 10.864 24.917 F 0.95 (5) (30) =
Error 13.078 36-6= 30 0.436 2.53
Total 67.078 36-1 = 35

H 0 : El contenido de proteína en las diferentes especies SON


IGUALES
H 1 : El contenido de proteína en las diferentes especies SON
DIFERENTES
 Rechazamos Ho
Si existe diferencia en el contenido de proteínas en las
diferentes especies
b)
MEDIDAS 2.36 4.513 4.505 1.64 1.787 2.925
1 2 3 4 5 6
Las parejas diferentes son :1,2; 1,3; 1,6; 2,4 ; 2,5 ; 3,4 ; 3,5 ; 4,6 ; 5,6.

4.- Se tratan por irradiación del tumor a 8 ratones con adenocarcino –


mamario, a razón de 667r, 3 veces por semana. Se toma una biopsia de
cada tumor a las 48 horas de cesar la radiación y se hacen recuentos
mitóticos de 3 minutos en serie, con los resultados siguientes:
NÚMERO DE RATÓN
1 2 3 4 5 6 7 8
19 73 50 11 1 26 12 47
26 70 59 10 11 15 12 47
12 12 11 9
11

¿Hay diferencia entre las recuentas mitóticas medias de los distintos


ratones?
Métodos Estadísticos Varela/Llanos/Asnate

Solución:
Realizando los cálculos se tiene:

NÚMERO DE RATÓN
1 2 3 4 5 6 7 8
19 73 50 11 1 26 12 47
26 70 59 10 11 15 12 47
12 12 11 9
11
MUESTRA 2 2 2 3 3 4 3 2 N = 21
SUMAS 45 143 109 33 24 63 33 94 X .. = 544
PROMEDIO 22 71.5 54.5 11 8 15.75 11 47 _
.5 X ..=241.25

(544) 2
5 C total = (19)2 + (26)2 + ........ + (47)2 -
21
= 23808 – 14092.19
= 9715.81

5CTratam=
 (45) 2 (143) 2 (109) 2 (33) 2 (24) 2 (63) 2 (33) 2 (94) 2  (544) 2
        
 2 2 2 2 3 4 3 2  21

= 23505.75 – 14092.19
= 9413.56
5 C Tratam = 23808.23505.75
= 302.25

a) CUADRO ANVA = 0.05

Fuente SC G.L. SCM F.calc


Tratam. 9413.56 8-1= 7 1344.794 57.841 F0.95 (7) (13) =
Error 302.25 21-8 = 13 23.25 2.832
Total 9715.81 21-1 = 20

H 0 : u1 = u2 = u3 = ...........= uk
Métodos Estadísticos Varela/Llanos/Asnate
H 1 : No todas las u; son iguales

 Rechazamos Ho
Si existe diferencia significativa entre los ratones)

5.- Un químico se interesa por determinar los efectos de la temperatura


de almacenamiento en la conservación de manzanas. La respuesta a este
estudio es el número de manzanas que se pudren después de un mes de
almacenamiento. Decide utilizar 5 lotes de manzanas como bloques de
material experimental. Escoge 120 manzanas de cada lote, las divide en
4 porciones de igual tamaño y asigna los tratamientos al azar a las
porciones. La variable tratamientos (temperatura) es fijada
deliberadamente en los siguientes niveles 50°F, 55°F, 60°F, y 70°F. Los
resultados en número de manzanas podridas, son como sigue:

LOTE TRATAMIENTOS
50ºF 55ºF 60ºF 70ºF
1 8 5 7 10
2 14 10 3 5
3 12 8 6 5
4 9 8 5 7
5 12 9 4 8

Solución:
Realizando los cálculos se tiene

LOTE TRATAMIENTOS Sumas Medias


(TEMPERATURA) Xiº _

LOTE 50ºF 55ºF 60ºF 70ºF


X i.
1 8 5 7 10 30 7.5
2 14 10 3 5 32 8
3 12 8 6 5 31 7.75
4 9 8 5 7 29 7.25
5 12 9 4 8 33 8.25

Sumas x. j 55 40 25 35 x.. = 155 --


_ 11 8 5 7 -- _
Medias X i. j X i. .= 7.75

n=5
N = nk = (5) (4) = 20
Métodos Estadísticos Varela/Llanos/Asnate
N = 20
 x 2 . j X 2 ..
5 C tratam = 
n N
(55)  (40) 2  (25) 2  (35) 2 (155) 2
2
= 
5 20
= 1295 – 1201.25
= 93.75
 x 2 . i X 2 ..
5 C bloques = 
K N
=
(30) 2  (32) 2  (31) 2  (29) 2  (33) 2 
 1201.25
4
= 1203.75 - 1201.25 = 2.50
X 2 ..
5 C total =   X i2j 
N
 2 2 2

= (8)  (14)  ........ (8)  1201.25

= 1361 –1201.25 = 159.75

5 C error = SC total – SC bloques – SC tratam

= 159.75 – 2.50 – 93.75 = 63.50

a) Son significativos los efectos de la temperatura con  = 5 %

b) Cuadro Anva.  = 0.05


FUENTE SC G.L SCM F F Teórico
Varianza calc
Tratamiento 5.905 F0.95 (3) (12) = 3.49
93.75 4-1 = 3 31.25
(Temperatura)
Bloques 2.50 5-1 = 4 0.625 0.118
Error 63.50 (3)(4) = 12 5.292
Total 159.75 20-1 = 19

H 0 : Los efectos de la temperatura son iguales


Métodos Estadísticos Varela/Llanos/Asnate
H 1 : No todos los efectos de la temperatura son iguales

Rechazamos Ho
Los efectos de la temperatura son significativamente diferentes
 Aceptamos Ho, es decir los termómetros son iguales.
b) 1 y 3 son diferentes

6.- Se utilizan cuatro medicamentos diferentes, Aj, para el tratamiento


de cierta enfermedad. Estos medicamentos son ensayados en pacientes
de tres diferentes hospitales. Los resultados siguientes muestran el
numero de casos que se han recuperado de la enfermedad por cada 100
personas que han tomado medicamentos. Eldiseño de bloques
aleatorizados ha sido empleado para eliminar los efectos de los
diferentes hospitales.

MEDICAMENTOS
HOSPITALES A1 A2 A3 A4
B1 10 11 12 10
B2 19 9 18 7
B3 11 8 23 5

¿Son efectivos los medicamentos de los medicamentos con  =


0.01
Solución:

Medias
MEDICAMENTOS Sumas _

HOSPITALES Xi xi.
A1 A2 A3 A4 X .. = 207.7
B1 10 11 12 10 43 10.75
B2 19 9 18 7 53 13.25
B3 11 8 23 5 47 11.75
Sumas X . j 40 28 53 22 X .. = 143 -
_ 13.333 9.333 17.667 7.33 -- _
Medias x i .j x .. = 1.917
n=3
(40) 2  (28) 2  (53) 2  (22) 2 (143) 2
SC tratam = 
3 12
= 1892.33 – 1704 – 083
= 188.25
Métodos Estadísticos Varela/Llanos/Asnate
(43)  (53)  (47)  (22) 2
2 2 2
SC bloques = 1704.083
4
= 1716.75 – 1704.083 = 12.667

(143) 2
SCtotal = (10)2 + (19)2 + ....... + (5)2 -
12
= 2019 – 1704.083 = 314.917

SC error = 314.917 – 12.667 – 188.25


= 114
CUADRO ANVA = 0.01
SCM
Fuente SC G.L. Fcalc F teórico
(Varianza)
Tratamiento 188.25 4-1 = 3 62.75 3.303
(Medicamentos)
Bloques 12.667 3-1 = 2 6.334 0.333 F0.99 (3) (6) = 9.78
Error 114 (3)(2)=16 19
Total 314.917 12-1 =11

H 0 : Los medicamentos son iguales


H 1 : Los medicamentos son diferentes
 Acepta Ho
No son significativamente diferentes, los medicamentos

7.- Se hizo un estudio para determinar la cantidad de piretrina (una


sustancia química extraída de una variedad de crisantemos usada en
insecticidas). Se usaron cuatro métodos de extracción y las muestras
fueron obtenidas de flores conservadas en tres condiciones diferentes:
flores frescas, flores secas y conservadas por un año, y flores secas y
conservadas por un año pero tratadas con un conservador. Los datos son
los siguientes:

MÉTODOS DE EXTRACCIÓN
Condiciones De
Conservación A B C D
1 1.35 1.13 1.06 0.98
2 1.40 1.13 1.26 1.22
3 1.49 1.46 1.40 1.35
Métodos Estadísticos Varela/Llanos/Asnate

¿Pueden considerarse los métodos de extracción diferentes con un nivel


de significación del 1%?
Solución:

Medias
MÉTODOS DE _
Condiciones De EXTRACCIÓN Sumas
Conservación Xi xi.
A B C D X .. = 207.7
1 1.35 1.13 1.06 0.98 4.52 1.13
2 1.40 1.13 1.26 1.22 5.010 1.253
3 1.49 1.46 1.40 1.35 5.70 1.425
Sumas X . j 4.24 3.72 3.72 3.55 X .. = 5.23 -
_ 1.413 1.24 1.24 1.183 -- _
Medias x i .j x .. = 1.267
n=3
N = NK = 12

SC Tratam =
(4.24)  (3.72)  (3.72)  (3.55)  (15.23) 
2 2 2 2 2

3 12
= 19.419 – 19.329 = 0.10

(4.52) 2  (5.010) 2  (5.70) 2


SC bloques =  19.329
4
= 19.505 – 19.329 = 0.176

SC total = (1.35)2 + (1.40)2 + ............. + (1.35)2 – 19.329


= 19.631 – 19.329
= 0.302
SC total = 0.302 – 0.176 – 0.10
= 0.026
Métodos Estadísticos Varela/Llanos/Asnate

CUADRO DE ANALISIS DE VARIANZA AL = 0.01

Fuente SC G.L. SCM F.calc


(Varianza)
Tratamiento
0.10 4-1 = 5 0.033 8.25
(Métodos)
Bloques 0.176 3-1 = 30 0.088 22 F0.99 (3) (6) = 9.78
Error 0.026 (3) (2)= 35 0.004
Total 0.302 12-1= 11

H 0 : Los métodos de extracción son iguales


H 1 : Los métodos de extracción son diferentes
 Aceptamos Ho, es decir los métodos de extracción no son
diferentes

8.- La rapidez con que sale la gasolina en tres tipos de llaves de


mangueras de las gasolineras fue objeto de estudio. Se
seleccionaron cinco operadores de un grupo de 25 para operar las
llaves. Los datos obtenidos fueron en cc/seg, los siguientes:

MÉTODOS DE EXTRACCIÓN

OPERADORES A B C

1 96.5 96.5 97.1


2 97.4 96.1 96.4
3 96.0 97.9 95.6
4 97.8 96.3 95.7
5 97.2 96.8 97.3

a) Existe diferencia significativa entre los tipos de llave a un


nivel de 1%?
b) Indique los pares demedias, si los hay, que son
significativamente diferentes entre sí.
Métodos Estadísticos Varela/Llanos/Asnate

Solución
N = (3) (5) = 15

MÉTODOS DE Medias
EXTRACCIÓN _
Sumas xi.
OPERADO Xi
RES A B C X .. = 207.7
1 96.5 96.5 97.1 290.1 96.7
2 97.4 96.1 96.4 289.9 96.633
3 96.0 97.9 95.6 289.5 96.5
4 97.8 96.3 95.7 289.8 96.6
5 97.2 96.8 97.3 291.3 97.1
Sumas X . j 484.9 483.6 482.1 X ..=1450.6 --

_ 96.98 96.72 96.42 -- _


Medias x i .j x .. = % 707
(484.9) 2  (483.6) 2  (482.1) 2 (1450.6) 2
SCtratam = 
5 15
= 140 283.476 – 140 282.691
= 0.785
(290.1)2  (289.9)2  (289.5)2  (289.8)2  (291.3)2
SCbloques=  140282.691
3
= 140.290 – 140282.691
= 0.642

SC total = (96.5)2 + (97.4)2 + ........ + (97.3)2 – 140282.691


= 140290 – 140282.691
= 5.882
Métodos Estadísticos Varela/Llanos/Asnate
a) CUADRO ANVA = 0.01

Fuente SC G.L. SCM F.calc


Varianzas
Tratamiento 0.535 F0.99 (2) (8) = 8.65
0.785 3-1= 2 0.393
(tipo de llave)
Bloques 0.642 5-1 = 4 0.161 0.219
error 5.882 (2)(4)= 8 0.735
total 7.309 N-1 = 14

H 0 : Los tipos de llave son iguales


H 1 : Los tipos de llave son diferentes

 Aceptamos Ho
No existe diferencia significativa entre los tipos de llave
b) No hay medidas que son significativamente diferentes entre sí.

9.- Se desea determinar de que manera la solubilidad del metronidazol


se ve afectada por los parabenos (conservadores) y las macromoléculas
no iónicas, para lo cual se realiza el siguiente experimento; se preparan
4 soluciones de macromoléculas no iónicas diferentes y se coloca cada
una con tres conservadores; luego se determinan las solubilidades de
cada una de las macromoléculas, obteniéndose los siguientes resultados:

MACROMOLÉCULA NO IÓNICA
CONSERVA
DORES Myrj Pluronic Tween Peg
52 F - 68 80 4000

Metilparabeno 146 107 158 107


Etilparabeno 199 114 310 104
Propilparaben 364 115 781 108
o

Haga una tabla ANVA y determinar si existe diferencia significativa entre


los conservadores con  = 0.05
Métodos Estadísticos Varela/Llanos/Asnate

Solución

Medias
MACROMOLÉCULA NO IÓNICA _
CONSERVA xi.
DORES Sumas
Myrj 52 Pluronic Tween Peg Xi
F - 68 80 4000

Metilparabeno 146 107 158 107 518 129.5


Etilparabeno 199 114 310 104 727 181.75
Propilparaben 364 115 781 108 1368 342
o
Sumas X . j 709 336 1249 319 X ..= 2613 --

_ 236.333 112 416.333 106.333 -- _


Medias x .j x .. =
217.75

N = (3) (4) = 12

(709) 2  (336) 2  (1249) 2  (319) 2 (2613) 2


SCtratam= 
3 12
= 759113 – 568 980.75
= 190132.25
(518)2  (727)2  (1368)2
SC bloques =  568980.75
3
= 667069.25 – 568980.75
= 98088.5
SC total = (146)2 + (199)2 + ........ + (108)2 – 568980.75
= 996037 – 568980.75
= 427 056.25
SC error = 427056.25 – 98088.5 – 190132.25
= 138 835.3
Métodos Estadísticos Varela/Llanos/Asnate

CUADRO ANVA = 0.01

Fuente SC G.L. SCM Fcalc


(Varianzas)
Tratamientos 190132.25 4-1 = 63377.417 2.739
3
Bloques 98088.5 3-1 = 2 49044.25 2.120 F0.95 (2)
(conservadores) (6) =5.14
Error 138835.5 (3)(2) 23139.25
=6
Total 427056.25 N-1 =
11

H 0 : Los conservadores son iguales


H 1 : Los conservadores son diferentes
 Aceptamos Ho
No existe diferencia significativa entre los conservadores

10. Una analista de un laboratorio farmacéutico necesita decidir si es


necesario agregar o no conservador a una solución de acacia al 25%.
Ella sabe que si no cambia el pH de la solución después de agregar el
conservador, no es necesario agregar mas de este; por lo que decide
agregar el siguiente experimento: prepara una solución de acacia al 25%
y la divide en cuatro porciones. Cada porción estará en almacenamiento
durante un tiempo definido; después de este tiempo se tomaran 6
muestras; a cada una de ellas se les agregara un conservador excepto a
una. Luego se mide el pH de la muestra, obteniéndose los siguientes
resultados.

TIEMPO DE
CONSERVADORES ALMACENAMIENTO
0 días 1 sem. 2 sem. 6 sem.
Ninguno 4.80 4.78 4.60 4.30
Ácido benzoico 4.72 4.70 4.48 4.47
Propil parabeno 4.79 4.60 4.65 4.35
Metilparabeno 4.79 4.70 4.70 4.25
Clorobutanol 4.80 4.78 4.62 4.34
Cloruro de 4.79 4.75 4.70 4.32
benzalconio
Métodos Estadísticos Varela/Llanos/Asnate

La química de éste laboratorio farmacéutico no sabe como analizar éstos


resultados que plantea el problema ¿de qué manera le ayudaría Usted?
Solución:
Haría un cuadro de análisis de varianza (ANVA) de un factor con
bloques y le diría que los tiempos son fuentes de varabilidad.

TIEMPO DE Medias
“BLOQUES” ALMACENAMIENTO _
Sumas xi.
0 días 1 sem. 2 sem. 6 sem.
Xi
CONSERVADO
RES
Ninguno 4.80 4.78 4.60 4.30 18.48 4.62
Ácido benzoico 4.72 4.70 4.48 4.47 18.37 4.59
Propil parabeno 4.79 4.60 4.65 4.35 18.39 4.598
Metilparabeno 4.79 4.70 4.70 4.25 18.44 4.61
Clorobutanol 4.80 4.78 4.62 4.34 18.54 4.635
Cloruro de 4.79 4.75 4.70 4.32 18.56 4.64
benzalconio
Sumas X . j 28.69 28.31 27.75 26.03 X ..= 110.78 --
_ 4.782 4.718 4.625 4.338 -- _
Medias x .j x .. = 4.616
n=6
N = (6) (4) = 24
(28.69) 2  (28.31) 2  (27.75) 2  (26.03) 2 (110.78) 2
SCtratam= 
6 24
= 512.033 – 511.342
= 0.691
(18.48)2  (18.37)2  (18.39)2  (18.44)2  (18.54)2  (18.56)2
SCbloques=  511.342
4
= 511.350 – 511.342 = 0.008

SC total = (4.80)2 + (4.72)2 + ........ + (4.32)2 – 511.342


= 512.121 – 511.342
= 0.779
SC error = 0.779 – 0.008 – 0.691
= 0.08
Métodos Estadísticos Varela/Llanos/Asnate
CUADRO ANVA

SCM
Fuente SC G.L. (Varianzas F.calc
)
Tratamientos 0.691 4-1 = 3 0.2303 43
Bloques 0.008 6-1 = 5 0.0016
Error 0.08 (3)(5) = 15 0.0053
Total 0.779 N-1 = 23

11. Considere el estudio siguiente para comparar 3 vitaminas. Se


reunieron para el estudio 7 conjuntos de trillizos de 1 año de edad. Cada
niño de una familia dada recibio al azar uno de 3 regimenes vitaminicos
por un periodo de 2 años. Se penso que un indicador del efecto global
de las vitaminas era el crecimiento. Supongase que los siguientes datos
son pesos ganados en libras.

VITAMINA
FAMILIA
A B C

1 11.2 9.3 10.4


2 9.7 12.0 11.5
3 8.2 9.4 8.9
4 9.1 10.1 7.9
5 11.0 10.3 10.8
6 7.3 9.1 8.4
7 8.2 8.5 10.1

Contrastar para ver si las vitaminas producen la misma de ganancia de


peso.
Métodos Estadísticos Varela/Llanos/Asnate
Solución:

“BLOQUES” VITAMINA
FAMILIA Medias
Sumas _
A B C Xi
xi.
1 11.2 9.3 10.4 30.9 10.3
2 9.7 12.0 11.5 33.2 11.067
3 8.2 9.4 8.9 26.5 8.833
4 9.1 10.1 7.9 27.1 9.033
5 11.0 10.3 10.8 32.1 10.7
6 7.3 9.1 8.4 24.8 8.26
7 8.2 8.5 10.1 26.8 8.933
Sumas X . j 64.7 68.7 68 X ..= --
201.4
_ 9.243 9.814 9.714 -- _
Medias x .j x .. = 9.59
n=7
N = 21

(647) 2  (68.7) 2  (68) 2 (201.4) 2


SCtratam = 
7 21
= 1932.826 – 1931.522
= 1.304
SCbloques= (30.9)  (33.2)  (26.5)  (27.1)  (32.1)  (24.8)  (26.8)  (201.4)
2 2 2 2 2 2 2 2

3 21
= 1952.467 – 1931.522
= 20.945
SC total = (11.2)2 + (9.7)2 + ........ + (10.1)2 – 1931.522
= 1964.36 – 1931.522 = 32.838
SC error = 32.838 – 20.945 – 1.304 = 10.589
Métodos Estadísticos Varela/Llanos/Asnate
CUADRO ANVA

Fuente SC G.L. SCM Fcalc F teórico


(Varianzas)
Tratamiento F0.95 (2) (12) =
1.304 3-1 = 2 0.652 0.739
(Vitaminas) 3.89
Bloques 20.945 7-1 = 6 3.491
Error 10.589 (2)(6)=12 0.882
Total 32.838 N-1 = 20
H 0 : Las vitaminas son iguales
H 1 : Las vitaminas son diferentes
 Aceptamos Ho
No existe diferencia significativa entre las 3 vitaminas

12. Tres métodos clínicos para determinar el contenido de hemoglobina


fueron ensayados para determinar si habia diferencia significativa entre
los resultados. Se emplearon seis sujetos, constituyendo cada sujeto un
bloque. Analizar los datos de la tabla siguiente, en la cual las cifras
representan g/100 ml
BLOQUES (Individuales)
MÉTODOS
A B C D E F
1 14 12 16 15 10 11
2 18 16 17 19 12 13
3 15 14 12 14 12 9

Determinar si hay diferencia significativa entre los métodos.


Solución

BLOQUES MÉTODOS Medias


(INDIVIDUOS) Sumas _
1 2 3 Xi xi.
A 14 18 15 47 15.667
B 12 16 14 42 14
C 16 17 12 45 15
D 15 19 14 48 16
E 10 12 12 34 11.333
F 11 13 9 33 11
Sumas X . j 78 95 76 X ..= 249 --
_ 13 15.833 12.667 -- _
Medias x .j x .. = 13.833
Métodos Estadísticos Varela/Llanos/Asnate

(78) 2  (95) 2  (76) 2 (249) 2


SCtratam = 
6 18
= 3480.833 – 3444.5
= 36.333
SC bloques =
(47)  (42)  (45)  (48)  (34)  (33)
2 2 2 2 2 2
 3444.5
3
= 3515.667 – 3444.5 = 71.167
SC total = (14)2 + (12)2 + ........ + (9)2 – 3444.5
= 3571 – 3444.5 = 126.5
SC error = 126.5 – 71.167 – 36.333 = 19

CUADRO ANVA = 0.05


SCM
Fuente SC G.L. Fcalc F teórico
Varianzas
Tratamiento 36.333 3-1 = 2 18.167 9.562 F0.95 (2) (10) =
(métodos) 4.10
Bloques 71.167 6-1 = 5 14.233
error 19 (2)(5)= 10 1.9
total 126.5 N-1 = 17

H 0 : Los métodos son iguales


H 1 : Los métodos son diferentes
Rechazamos Ho
Existe diferencia significativa entre los métodos

13.- Se probaron dietas de hamsters, en busca de diferencias


significativas en peso final medio después de un periodo de tiempo
especifico. Los sujetos fueron agrupados en bloques de dos, basándose
los bloques en una predicción del peso final. Los pesos se expresan en
gramos. Establezca si hay diferencia significativa entre las dietas.
BLOQUES
DIETA 1 2 3 4 5 6 7 8 9 10
A 105 101 103 108 106 109 105 106 104 103
B 110 108 106 112 110 112 110 106 108 108
Métodos Estadísticos Varela/Llanos/Asnate
Solución:
Realizando los cálculos
DIETA Medias
“BLOQUES” Sumas _
A B Xi xi.

1 105 110 215 107.5


2 101 108 209 104.5
3 103 106 209 104.5
4 108 112 220 110
5 106 110 216 108
6 109 112 121 110.5
7 105 110 215 107.5
8 106 106 212 106
9 104 108 212 106
10 103 108 211 105.5
Sumas X . j 1050 1090 X ..= 2140 --

_ 105 109 -- _
Medias x .j x .. = 107

n=10
N = (10) (2) = 20

(1050) 2  (1090) 2  (2140) 2


SCtratam = 
10 20
= 229060 – 228980 = 80
SC bloques =
(215)  (209)  (209)  (220)  (216)  (221)  .........  (211)
2 2 2 2 2 2 2
 228980
2

= 229059 – 228980 = 79
SC total = (105)2 + (101)2 + ........ + (108)2 – 228980
= 229154 – 228980 = 174
SC error = 174 – 79 – 80 = 15
Métodos Estadísticos Varela/Llanos/Asnate

Fuente SC G.L. SCM Fcalc F teórico


Varianzas
Tratamiento 80 2-1 = 1 80 47.99 F0.95 (1) (9) =
5.12
Bloques 79 10-1 = 9 8.778 5.266
error 15 (1)(9) = 9 1.667
total 174 N-1 = 19

H 0 : Las dietas son iguales


H 1 : Las dietas son diferentes
Rechazamos Ho
 Si existe diferencia significativa entre las dietas

 ANALISIS DE VARIANZA CON DOS FACTORES

14. Tres técnicos de laboratorio determinan colesterol en la sangre en


miligramos por centímetro. Para contrastar la conformidad de resultados
de los tres técnicos, se reparten sueros procedentes de cinco sujetos
normales en sextas partes para que cada técnico haga dos
determinaciones. Los datos son:
OBSERVADOR
SUJETO 1 2 3
1 190 193 187 186 192 190
2 172 170 167 166 168 169
3 180 178 176 177 178 181
4 206 204 200 201 203 205
5 175 173 172 173 176 177
a) Decir y examinar si cada factor es fijo o aleatorio.
b) Efectuar el análisis de varianza de dos factores adecuado.
Métodos Estadísticos Varela/Llanos/Asnate

Solución

OBSERVA SUJETO
DOR ni xi
1 2 3 4 5

1 190 172 180 206 175


193 170 178 204 173
nij 2 2 2 2 2 10
xij. 383 342 358 410 348 1841
2 187 164 176 200 172
186 166 177 201 173
nij 2 2 2 2 2 10
xij. 1802
3 192 168 178 203 176
190 169 181 205 177
nij 2 2 2 2 2 10
xij. 1839
n.j 6 6 6 6 6 N=
x.j. 1138 1009 1070 1219 1046 30 x... = 5482

I=3
FILAS (A)
 (1841) 2 (1802) 2 (1839) 2  (5482) 2
SCA =    
 10 10 10  30
= 1001840.6 – 1001744.133 = 96.467
COLUMNAS (B)
SCB =
(1138) 2 (1009) 2 (1070) 2 (1219) 2 (1046) 2
     1001744.133
6 6 6 6 6
= 1006350.333 – 1001744.133
= 4606.2

INTERACCIÓN (A, B)
SCAB = 4721.867 – 96.467 – 4606.2 = 19.2
SUB TOTAL
Métodos Estadísticos Varela/Llanos/Asnate
SCSUB TOTAL =
(383) 2 (342) 2 (358) 2 (410) 2 (353) 2 (5482) 2
    .....  
2 2 2 2 2 2
= 1006466 – 1001744.133 = 4721.867
ERROR
SCerror = 4747.867.867 – 4721.867 = 26
TOTAL
SCtotal = 1006492 – 1001744.133 = 4747.867
CUADRO ANVA = 0.05

Fuente SC G.L. SCM F.calc F teórico


Varianzas
Filas (A) 96.467 3-1 = 2 48.234 20.098 F0.95 (2) (15) =
3.68
Columna (B) 4606.2 5-1 = 2 1151.5 664.455 F0.95(2)( 15) =
3.06
Interacción 19.2 (2)(5) = 4 2.4 1.385 F0.95 (8) (15) =
(AB) 2.64
Subtotal 4721.867 (3)(5)-1 = 8 --
Error 26 30-(3)(5) = 1.733
15
Total 4747.867 30-1 = 29 --

Rechaza Ho
H1 : Existe diferencia entre los observadores (FACTOR FIJO)
Rechaza Ho
H1 : Existe diferencia entre los sujetos (FACTOR
ALEATORIO)
Acepta Ho
Ho : No hay efecto de interacción

15.- Considere el experimento siguiente como investigación del efecto


de fumar sobre la actividad física. Se clasificaron 27 individuos en tra
grupos según sus hábitos de fumar y se les asigno al azar a un de las tres
pruebas siguientes: ergómetro de bicicleta, banda de esfuerzo o
caminata, registrándose el tiempo en minutos hasta la máxima absorción
de oxigeno; los resultados son:
Métodos Estadísticos Varela/Llanos/Asnate
PRUEBA
HÁBITOS DE
FUMAR Banda
Bicicleta Caminata
esfuerzo
No fumadores 12.8 16.2 22.6
13.5 18.1 19.3
11.2 17.8 18.9
Fumadores 10.9 15.5 20.1
moderados 11.1 13.8 21
9.8 16.2 15.9
Grandes 8.7 14.7 16.2
fumadores 9.2 13.2 16.1
7.5 8.1 17.8

a) Decir de cada factor si es fijo o aleatorio.


b) Contrastar las diversas hipótesis valiéndose del análisis
apropiado de varianza de dos factores.

Solución:

HÁBITOS PRUEBA
DE ni xi
FUMAR Bicicleta Banda Caminata
esfuerzo
No 12.8 16.2 22.6
fumadores 13.5 18.1 19.3
11.2 17.8 18.9
nij 3 3 3 9
xij. 37.5 52.1 60.8 150.4
Fumadores 10.9 15.5 20.1
moderados 11.1 13.8 21
9.8 16.2 15.9
nij 3 3 3 9
xij. 31.8 45.5 57 134.3
Grandes 8.7 14.7 16.2
fumadores 9.2 13.2 16.1
7.5 8.1 17.8
nij 3 3 3 9
xij. 25.4 3.6 50.1 111.5
n.j 9 9 9 N = 27
x.j. 94.7 133.6 167.9 x... = 396.2
Métodos Estadísticos Varela/Llanos/Asnate

I=3
FILAS (A)
(150.4) 2 (134.3) 2 (111.5) 2 (396.2) 2
SCA =   
9 9 9 27
= 5898.767 – 5813.868 = 84.899

COLUMNAS (B)
(94.7) 2 (133.6) 2 (167.9) 2
SCB =    5813.868
9 9 9
= 6111.94 – 5813.868 = 298.072
= 4606.2

INTERACCIÓN (A B)
SCAB = 385.785 – 84.899 – 298.072 = 2.814

SUB TOTAL
SCSUB TOTAL =
2
(37.5) (52.1) 2 (60.8) 2 (31.8) 2 (50.1) 2
    .....   5813.868
3 3 3 3 3
= 6199.653 – 5813.868
= 385.785
ERROR
SCerror = 445.032 – 385.785 = 59.247

TOTAL
SCtotal = (12.8)2 + (113.5)2 + . . . . + (17.8)2 – 5813.868
= 6258.9 – 5813.868
= 445.032
Métodos Estadísticos Varela/Llanos/Asnate

CUADRO ANVA = 0.05

Fuente SC G.L. Varianza Modelo F teórico


Fijo
Filas (A) 84.899 3-1 = 2 42.45 12.895 F0.95 (2) (18) = 3.555
Columna (B) 298.072 3-1 = 2 149.036 45.272 F0.95 (2) ( 18) = 3.555
Interacción 2.814 (2)(2) = 4 0.704 0.214 F0.95 (4) (15) = 2.928
(AB)
Subtotal 385.785 (3)(3)-1 = 8 --
Error 59.247 2(9) = 18 3.292
Total 445.032 27-1 = 26 --

Rechaza Ho
H1 : Las pruebas son significativamente diferentes.
Rechaza Ho
H1 : Las pruebas son significativamente diferentes
Acepta Ho
Ho : Si existe efecto de interacción

16. Se realizo un experimento para fijar los efectos de la temperatura y


humedad en la resistencia efectiva de un tipo normal de resistencia. Se
obtuvieron los siguientes datos. Analice e interprete los datos.

VALORES CODIFICADORES DE RESISTENCIA


TEMPERATURA -29ºC 21ºC 71ºC
HUMEDAD 10% 50% 10% 50% 10% 50%
23 24 26 24 25 27
24 24 25 25 26 26
25 25 26 26 26 28
24 26 26 26 28 28
Métodos Estadísticos Varela/Llanos/Asnate
Solución:

VALORES HUMEDAD
CODIFICADOS ni
10% 50% xi
TEMPERATURA
23 24
24 24
-29ºC
25 25
24 26
nij 4 4
8
xij. 96 99 195
26 24
25 25
21ºC
26 26
26 26
nij 4 4
8
xij. 103 101 204
25 27
26 26
71ºC
26 28
28 28
nij 4 4
8
xij. 105 109 211
n.j 12 12
N = 24
x.j. 304 309 x... = 613

I=3

FILAS (A)
(195) 2 (204) 2 (214) 2 (613) 2
SCA =   
8 8 8 24
= 15679.625 – 15657.042
= 22.583
COLUMNAS (B)
(304) 2 (309) 2
SCB =   15657.042
12 12
= 15658.083 – 15657.042 = 1.041
Métodos Estadísticos Varela/Llanos/Asnate

INTERACCIÓN
SCAB = 26.808 – 22.583 – 1.041
= 2.584
SUB TOTAL
SCSUB TOTAL =
2 2
(96) (99) (103) 2 (101) 2 (105) 2 (109) 2
      15657.042
4 4 4 4 4 4
= 15683.25 – 15657.042
= 26.208
ERROR
SCerror = 41.958 – 26.208 = 15.75

TOTAL
SCtotal = (23)2 + (24)2 + ....... + (28)2 – 15657.042
= 15699 – 15657.042
= 41.958
CUADRO ANVA = 0.05

SCM
Fuente SC G.L. F.calc F teórico
Varianzas
Filas 22.583 3-1= 2 11.292 12.905 F0.95 (2) (18) = 3.555
Columna 1.041 2-1= 1 1.041 1.19 F0.95 (1) ( 18) = 4.414
Interacción 2.584 (2)(1) = 2 1.292 1.477 F0.95 (2) (18) = 3.555
Subtotal 26.208 3(2)-1 = 5 --
Error 15.75 24-6 =18 0.875
Total 41.958 N-1 = 23 --

Rechaza Ho
H1 : Existe diferencia significativa entre las temperaturas
Rechaza Ho
Ho : No existe diferencia entre las humedades
Acepta Ho
Ho : No existe efecto de interacción
Métodos Estadísticos Varela/Llanos/Asnate
17. Se probaron cinco variedades de duraznos y cuatro fertilizantes. De
cada parcela experimental se seleccionaron al azar 3 cuadros y se
anotaron sus cosechas como sigue:
Solución:

PRUEBA
FERTILIZANTES
1 2 3 4 5

1 57 26 39 23 48
46 38 329 36 35
28 20 43 18 48
2 67 44 57 74 61
72 68 61 47 60
66 64 61 69 75
3 95 92 91 98 78
90 89 82 85 89
89 99 98 85 95
4 92 96 98 99 99
88 95 93 90 98
99 99 98 98 99
Métodos Estadísticos Varela/Llanos/Asnate

PRUEBA
xi ..
ni .
FERTILI 1 2 3 4 5
ZANTES
57 26 39 23 48
1 46 38 329 36 35
28 20 43 18 48
nij 3 3 3 3 3 15
xij. 131 84 121 77 131 544
67 44 57 74 61
2 72 68 61 47 60
66 64 61 69 75
nij 3 3 3 3 3 15
xij. 205 176 179 190 196 946
95 92 91 98 78
3 90 89 82 85 89
89 99 98 85 95
nij 3 3 3 3 3 15
xij. 274 280 271 268 262 1355
92 96 98 99 99
4 88 95 93 90 98
99 99 98 98 99
nij 3 3 3 3 3 15
xij. 279 290 287 287 296 1441
n.j 12 12 12 12 12 N = 60
x.j. 889 830 822 822 885 x... = 4286
a)Construya una tabla de ANDEVA
b)Pruebe la hipótesis de iguales medias de variedad.
c)Pruebe la hipótesis de iguales medias de fertilizantes.
d)¿A qué conclusiones llega Ud. como resultado de éste
experimento?
Solución:

FILAS (A)
(544) 2 (946) 2 (1355) 2 (1441) 2 (4286) 2
SCA =    
15 15 15 15 60
= 340223.867 – 306163.267
= 34060.6
Métodos Estadísticos Varela/Llanos/Asnate
COLUMNAS (B)
SCB =
(889) 2 (830) 2 (860) 2 (822) 2 (885) 2
     306163.267
12 12 12 12 12
= 306477.5 – 306163.267
= 314.233

INTERACCIÓN (A B)
SCAB = 35282.733 – 34060.6 – 314.233 = 907.9
SUB TOTAL
SCSUB TOTAL =
(57) 2 (46) 2 (99) 2
  .....   306163.267
3 3 3
= 341446 – 306163.267
= 35282.733
TOTAL
SCtotal = (57)2 + (46)2 + . . . . + (99)2 – 306163.267
= 343854 – 306163.267
= 37690.733
CUADRO ANVA
= 0.05
Modelo
Fuente SC G.L. Varianzas F teórico
Fijo
Filas (A) 34060.6 4-1 =3 11353.533 188.597 F0.95 (3) (40) = 2.84
Columnas (B) 314.233 5-1 =4 78.558 1.305 F0.95 (4) ( 40) = 2.61
Interacción (AB) 907.9 (3)(4) = 12 75.658 1.257 F0.95 (12) (40) = 2
Subtotal 35282.733 20-1 = 19 --
Error 2408 60-20 = 40 60.20
Total 37690.733 60-1 = 59
Métodos Estadísticos Varela/Llanos/Asnate

PROBLEMAS PROPUESTOS
PROBLEMA 01 : “ Cada cual con su juego”

Robnert Shade es vicepresidente de marketing en el First City Bank de


Atlanta. En la campaña de promoción para atraer a nuevos depositantes
se incluyen determinados sorteos y premios en los emplazamientos de
las cuatro sucursales del banco. Shade está convencido de que diferentes
clases de premios promocionales atraerán a grupos de renta distintos.
Las personas de un determinado nivel de renta preferirá regalos,
mientras que a otro grupo de renta le interesarán más los viajes gratuitos
a lugares de vacaciones. Shade decide valerse de las cantidades
depositadas en el banco como medida aproximada de la renta. Quiere
determinar si hay diferencia en el nivel medio de depósitos entre las
cuatro sucursales. Si se halla alguna diferencia, Shade ofrecerá un
abanico de premios promociónales. Para esto Se eligen al azar siete
depósitos de cada sucursal, que son los que se recogen aquí,
redondeados a los 100 dólares más próximos. Hay C = 4 tratamientos
(muestras) y  j = 7 observaciones en cada tratamiento. El número total
de observaciones es: n =  c = 28.

Depósito Sucursal 1 Sucursal 2 Sucursal 3 Sucursal


4
1 1.3 1.9 3.6
5.1
2 1.5 1.9 4.2
4.9
3 0.9 2.1 4.5
5.6
4 1.0 2.4 4.8
4.8
5 1.9 2.1 3.9
3.8
6 1.5 3.1 4.1
5.1
7 2.1 2.5 5.1
4.8
Respuesta: F = 78.14, Shade tiene que rechazar la hipótesis nula
Métodos Estadísticos Varela/Llanos/Asnate

PROBLEMA 02:
Un fabricante de papel utilizado para fabricar bolsas para caramelos,
está interesado en mejorar la resistencia a la tensión del producto. El
grupo de ingeniería del producto piensa que la resistencia a la tensión es
una función de la concentración de madera dura en la pulpa, y que el
rango de interés práctico de las concentraciones de madera dura está
entre 5 y 20%. El equipo de ingenieros responsable del estudio decide
investigar cuatro niveles de concentración de madera dura: 5, 10, 15 y
20”. Para ello, decide fabricar seis especímenes de prueba para cada
nivel de concentración, utilizando una planta piloto. Los 24
especímenes se someten a prueba en un probador de tensión de
laboratorio, en un orden aleatorio. Los datos de este experimento
aparecen en la tabla siguiente:
Tabla Resistencia del papel a la tensión (psi).

Concentración de Observaciones Tota Prome


madera dura (%) 1 2 3 4 5 6 les dios
5 7 8 15 11 9 10 60 10.00
10 12 17 13 18 19 15 94 15.67
15 14 18 19 17 16 18 102 17.00
20 19 25 22 23 18 20 127 21.17
383 15.96

El análisis de varianza puede emplearse para probar la hipótesis de que


concentraciones de madera dura diferentes afectan la resistencia
promedio a la tensión del papel.
Respuesta: P  3.59 x 10-6 es mucho más pequeño que  = 0.01,
entonces se tiene evidencia fuerte para concluir que H0 no es verdadera.

PROBLEMA 03 :
En Design and Analysis of Experiments, tercera edicación (John Wiley,
1991),D.C. Montgomery describe un experimento de un solo factor
donde se utiliza un modelo de efectos aleatorios, en el que una
compañía textil produce una tela en varios telares. La compañía tiene
interés en la variabilidad de la resistencia a la tensión de un telar a
otro. Para investigar esta variabilidad, un ingeniero de producción
selecciona al azar cuatro telares y determina la resistencia da la tensión
de las muestras de tela domadas aleatoriamente de cada telar. Los datos
obtenidos aparecen en la tabla siguiente:
Métodos Estadísticos Varela/Llanos/Asnate
Telar Observaciones Total Prome
1 2 3 4 dio
1 98 97 99 96 390 97.5
2 91 90 93 92 366 91.5
3 96 95 97 95 383 95.8
4 95 96 99 98 388 97.0
1527 95.45

Respuesta: En este proceso mejorado, la reducción en la variabilidad de


la resistencia disminuye en gran medida la degradación del proceso, lo
que trae como resultado un costo menor, una calidad mayor, el cliente
más satisfecho y una posición competitiva mejor para la compañía.

PROBLEMA 04 :
Supóngase que en un experimento industrial un ingeniero está
interesado en cómo varía la absorción media de humedad en el concreto
de entre cinco diferentes mezclas de concreto. Las mezclas varían en el
porcentaje en peso de un cierto ingrediente importante. se exponen a la
humedad durante 48 horas. Se decide probar 6 para cada mezcla, lo que
requiere la prueba de un total de 30 muestras. Los datos se registran en
la tabla siguiente.
Absorción de humedad en mezclas de concreto
Mezcla (% de peso)
1 2 3 4 5
551 595 639 417 563
457 580 615 449 631
450 508 5.11 517 522
731 583 573 438 613
499 633 648 415 656
632 517 677 555 679
Total 320 3416 3663 2791 3664 16,854
Media 553.33 569.33 610.50 465.17 610.67 561.80

El modelo para esta situación puede considerarse como sigue. Se tienen


6 observaciones que se toman cada una de las 5 poblaciones con medias
1,  2 , ....., 5 , respectivamente. Se puede desear probar.
H 0 : 1,  2 , ....., 5 ,
H1 : Al menos dos de las medidas no son iguales.
Métodos Estadísticos Varela/Llanos/Asnate
Pruebe la hipótesis de que 1   2  .....  5 a nivel de significancia
de 0.05 para lo datos de la tabla acerca de la absorción de humedad de
varios tipos de mezcla de concreto.
Respuesta: Se rechaza H0 y se concluye que las mezclas no tienen la
misma absorción media. El valor P para f = 4.30 es menor que 0.01.

PROBLEMA 05 :
Parte del estudio “Serum Inorganic Phosphorus Levels in Children with
Seizure disorders Taking Anticonvulsant Drugs”, que se llevó a cabo en
la Virginia Polytechnic Institute and State University en 1982, se diseñó
para medir los niveles de actividad de fosfatasa alcalina de suero
(unidades Bessey – Lowry) en niños que padecían ataques convulsivos
y quienes habían recibido terapia anticonvulsionante bajo el cuidado de
un especialista privado. Se encontraron cuarenta y cinco sujetos para el
estudio y se clasificaron en cuatro grupos de acuerdo con la medicina
que se les proporcionó.

Tabla : Nivel de actividad del suero fosfatado alcalino.


Grupo de medicamento
G-1 G-2 G-3 G-4
49.20 97.50 97.07 62.10 110.60
44.54 105.00 73.40 94.95 57.10
45.80 58.05 68.50 142.50 117.60
95.84 86.60 91.85 53.00 77.71
30.10 58.35 106.60 175.00 150.00
36.50 72.80 0.57 79.50 82.90
82.30 116.70 0.79 29.50 111.50
87.85 45.15 0.77 78.40
105.00 70.35 0.81 127.50
95.22 77.40

G-1 :Control (sin recibir anticonvulsionantes y sin tener una historia de


desórdenes de este tipo).
G-2 :Fenobarbital.
G-3 :Carbamazepina.
G-4 :Otros anticonvulsionante.
A partir de muestras sanguíneas obtenidas de cada sujeto se
determinaron los niveles de actividad de fosfatasa alcalina del suero y se
registraron en la tabla prueba la hipótesis, a nivel de significancia de
0.05, de que el nivel promedio de actividad de fosfatasa alcalina en
suero es el mismo para los cuatro grupos anteriores.
Métodos Estadísticos Varela/Llanos/Asnate
Respuesta: Se rechaza H0 y se concluye que los niveles de actividad
promedio de fosfatasa alcalina del suero para los cuatro grupos de
medicamentos no son todos iguales. El valor P es 0.02.

PROBLEMA 06 :
Parte del estudio “Serum Inorganic Phosphorus Levels in Children with
Seizure disorders Taking Anticonvulsant Drugs”, que se llevó a cabo en
la Virginia Polytechnic Institute and State University en 1982, se diseñó
para medir los niveles de actividad de fosfatasa alcalina de suero
(unidades Bessey – Lowry) en niños que padecían ataques convulsivos
y quienes habían recibido terapia anticonvulsionante bajo el cuidado de
un especialista privado. Se encontraron cuarenta y cinco sujetos para el
estudio y se clasificaron en cuatro grupos de acuerdo con la medicina
que se les proporcionó.

Nivel de actividad del suero fosfatado alcalino.


Grupo de medicamento
G-1 G-2 G-3 G-4
49.20 97.50 97.07 62.10 110.60
44.54 105.00 73.40 94.95 57.10
45.80 58.05 68.50 142.50 117.60
95.84 86.60 91.85 53.00 77.71
30.10 58.35 106.60 175.00 150.00
36.50 72.80 0.57 79.50 82.90
82.30 116.70 0.79 29.50 111.50
87.85 45.15 0.77 78.40
105.00 70.35 0.81 127.50
95.22 77.40

G-1 :Control (sin recibir anticonvulsionantes y sin tener una historia de


desórdenes de este tipo).
G-2 :Fenobarbital.
G-3 :Carbamazepina.
G-4 :Otros anticonvulsionante.

A partir de muestras sanguíneas obtenidas de cada sujeto se


determinaron los niveles de actividad de fosfatasa alcalina del suero y se
registraron en la tabla anterior. Utilice la prueba de Bartlett para probar
la hipótesis a nivel de significancia de 0.01, de que las varianzas de la
población de los cuatro grupos son iguales.
Métodos Estadísticos Varela/Llanos/Asnate
Respuesta: Se acepta la hipótesis y se concluye que las variancias
poblacionales de los cuatro grupos son iguales.

PROBLEMA 07: DIFERENCIAS ENTRE k MEDIAS:


Se quiere comparar la acción de limpieza de tres detergentes con base
en las siguientes lecturas de blancura hechas de quince prendas blancas,
que primero se mancharon con tinta y luego se lavaron en una máquina
lavadora de agitación con los detergentes respectivos:

Detergente A: 77 81 71 76 80
Detergente B: 72 58 74 66 70
Detergente C: 76 85 82 80 77

Las medias de estas tres muestras son 77, 68 y 80 y querríamos saber si


las diferencias entre éstas son significativas o si se pueden atribuir al
azar.
Elaborar una tabla de análisis de la varianza y probar con una
significancia de 0.01 si los tres detergentes son igualmente efectivos o
no.
Respuesta: Dado que F = 8.48 es mayor que 6.93, el valor de F 0.01 para
2 y 12 grados de libertad, se debe rechazar la hipótesis nula de que los
tres detergentes son igualmente efectivos.

PROBLEMA 08 :
Un laboratorista quiere comparar la fuerza de ruptura de tres clases de
cuerda y originalmente había planificado repetir cada determinación seis
veces. No obstante al no contar con el tiempo suficiente, debe basar su
análisis en los resultados siguientes (en onzas);
Cuerda 1: 18.0 16.4 15.7 19.6 16.5
18.2
Cuerda 2: 21.1 17.8 18.6 20.8 17.9
19.0
Cuerda 3: 16.5 17.8 16.1

Efectúe un análisis de varianza para probar, en el nivel de significancia


0.05, si las diferencias entre las medias muestrales son significatvas.
Respuesta: F=4.06 es mayor que 3.89, se debe rechazar la hipótesis
nula: en otras palabras, podemos concluir que hay una diferencia en la
resistencia de las tres clases de cuerda.
Métodos Estadísticos Varela/Llanos/Asnate
PROBLEMA 09 :
Se realiza un experimento para determinar el efecto de cuatro
sustancias químicas diferentes sobre la resistencia de una tela. Las
sustancias se emplean como parte del proceso terminal de planchado
permanente. Para ello se escogen cinco muestras de tela y se aplica un
diseño aleatorizado por bloques completos mediante la prueba de cada
sustancia en un orden aleatorio sobre cada una de las muestras de tela.
Los datos aparecen en la tabla. Se probará la diferencia en las medias
utilizando para ello el análisis de varianza con  = 0.01.

Muestra de tela
Promedios
Totales por
Sustancia por
tratamiento
tratamiento
1 2 3 4 5

1 1.3 1.6 0.5 1.2 1.1 5.7 1.14


2 2.2 2.4 0.4 2.0 1.8 8.8 1.76
3 1.8 1.7 0.6 1.5 1.3 6.9 1.38
4 3.9 4.4 2.0 4.1 3.4 17.8 3.56
Totales
9.2 10.1 3.5 8.8 7.6 39.2(y..)
por bloque
Promedios
por bloque 2.30 2.53 0.88 2.20 1.90  
1.96 y..
y

Respuesta: Puesto que f0 = 75.13 > f0.01,3,12 = 5.95 (el valor P es 4.79 x
10-8), se concluye que existe una diferencia significativa en las
sustancias químicas en cuanto al efecto que tienen sobre la resistencia
promedio de la tela.

PROBLEMA 10:
En un número reciente de la revista Fortune se relata el intento de un
importante empresa de electrónica para establecer un sistema que diera
a los empleados la oportunidad de calificar el rendimiento de sus
supervisores y otro personal directivo. Supongamos que se eligen al
azar a cinco empleados y se les pide que califiquen a cuatro de sus
directivos conforme a una escala de 10 a 50. los resultados podrían ser
los de la tabla siguiente:
Métodos Estadísticos Varela/Llanos/Asnate

Directivo (tratamiento)

Empleados 1 2 3 4 Xi
1 31 35 46 38 37.50
2 29 32 45 36 35.50
3 13 17 35 20 21.25
4 28 38 52 39 39.25
5 14 20 40 20 23.50

Xi 23 28.4 43.6 30.6

X  31.4

El director gerente de la empresa de electrónica quiere saber si hay


diferencia entre las calificaciones medias de los cuatro directivos.
Respuesta: El valor 5.09 de la relación F es menor que el valor crítico
de 5.29 y, por tanto, el director no rechaza la hipótesis nula y llega a la
conclusión, con el 99% de confianza, de que no hay diferencia
significativa en las calificaciones medias de los cuatro directivos.

PROBLEMA 11 :
En un experimento se quieren comparar las capacidades de
reproducción de frecuencias bajas de 4 recubrimientos de cinta
magnética, y se van a efectuar 5 observaciones de cada uno. El
experimento podría realizarse en un DCA, simplemente obteniendo las
20 mediciones con la misma máquina reproductora y aleatorizando el
orden de las 20 observaciones. Nótese que aquí una unidad
experimental está definida por el orden de la observación. A pesar de lo
anterior el experimentador decir que es conveniente probar los
tratamientos bajo condiciones más diversas, y se propone utilizar 5
diferentes grabadoras para el experimento, utilizando cada grabadora
como un bloque en el que se probarán los 4 tratamientos
(recubrimientos). El propósito del experimento no es comparar las
grabadoras, las cuales han sido escogidas precisamente porque son de
diferentes calidades, sino comparar los 4 recubrimientos. En este caso
usar 4 grabadoras (bloques) distintas tiene el único propósito de que las
conclusiones del experimento sean válidas bajo diversas condiciones. Se
supone que el uso de varias grabadoras no introducirá mayor error en el
diseño porque las frecuencias se compararán exclusivamente dentro de
cada bloque. Una vez realizadas las 20 observaciones se obtiene los
Métodos Estadísticos Varela/Llanos/Asnate
siguientes resultados. Las respuestas son las frecuencias mínimas
reproducidas (en Hertz).

Bloque Tratamiento (recubrimiento) Y.j


(Grabadora)
Y. j
1 2 3 4
1 20 10 30 22 82 20.50
2 30 20 39 26 115 28.75
3 32 19 37 27 115 28.75
4 18 9 26 23 76 19.00
5 26 18 29 20 93 23.25
Yi. 126 76 161 118 481
Y i. 25.2 15.2 32.2 23.6

Posteriormente completaremos el análisis de estos datos. Por el


momento se presentan con objeto de que el lector se familiarice más con
la estructura de los datos de un DBAC, y para remarcar la idea de que el
término  j es indispensable en el modelo lineal para remover la
variabilidad debida al efecto de los bloques.
Respuesta: F0 > F12 ,  para  = 0.10,  = 0.05 y  = 0.01, la
3

conclusión es rechazar Ho con cualquier   0.01. es decir, que al


menos un recubrimiento tiene diferente capacidad de reproducir
frecuencias bajas que los demás   0.01 .

PROBLEMA 12 :
En un campo agrícola experimental se van a comparar 3 variedades de
maíz, con 6 repeticiones para cada variedad, o sea que se tienen 18
unidades experimentales (parcelas de igual tamaño y forma en este
caso). Una opción es realizar el experimento con aleatorización
irrestricta, pero el investigador sabe que la fertilidad del suelo en el
terreno disponible es tan variable que los resultados de un experimento
con aleatorización irrestricta pueden contaminarse por esa variabilidad.
En cambio su conocimiento del terreno le permite formar bloques de 3
unidades experimentales adyacentes dentro de los cuales la fertilidad del
suelo es más homogénea y, por lo tanto, decide realizar un experimento
en bloques aleatorizados completos. En este caso t = 3 y b = 6.
Antes de continuar con el problema vale al pena mencionar que
experimentos como el descrito son los más frecuentes en las ciencias
agrícolas. De hecho la idea de bloqie se originó en esta área
experimental, con la lógica de que unidades de terreno cercanas deben
Métodos Estadísticos Varela/Llanos/Asnate
tener una fertilidad similar, dando un criterio válido para el
agrupamiento. Esta idea no sólo es razonable, sino que es un excelente
problema de creatividad científica. Desafortunadamente, planear
experimentos con bloques se ha vuelto tan rutinario en la investigación
agrícola que el investigador raras veces se detiene a pensar si el criterio
de agrupación reduce la variabilidad en grado suficiente para compensar
la pérdida de grados de libertad en el C. M. ERROR. Nótese que con un
DCA. En el ejemplo que estamos examinando, se tendrían 15 grados de
libertad para el error, mientras que en el DBAC sólo se tienen 10. el
mensaje que queremos enviar es que realizar experimentos en bloques
no es necesariamente mejor que hacerlos con aleatorización irrestricta.
Pero dejando de lado la digresión anterior, supongamos que el
experimento descrito se realizó en bloques aleatorizados completos. En
la siguiente tabla se presenta los resultados de cálculos parciales
necesarios para obtener las S.C. Los números en la tabla son
rendimientos en Kg x Ha.
Tratamiento Bloque (grupo de 3 unidades con fertilidad Yi. Yi. 2
(variedad) similar) Y i.
1 2 3 4 5 6
1 2.3 2.9 3.1 3.4 3.0 2.0 16.7 2.78 278.89
2 2.1 2.7 3.5 3.6 2.9 2.5 17.3 2.88 299.29
3 1.9 3.1 3.6 3.5 3.1 2.4 17.6 2.93 309.76

Y.j 6.3 8.7 10.2 10.5 9.0 6.9 51.6 887.94


2.1 2.9 3.4 3.5 3.0 2.3
Y. j
39.69 75.69 104.04 110.25 81.00 47.61 458.28
Y.2j
t 13.31 25.31 34.82 36.77 27.02 16.01 t b
2 2
 Yij   Yij =
i 1 i 1 j1
153.24

2
Respuesta: F0 con F10 ,0.10 = 2.9245. Puesto que F0 < 2.9245, la
conclusión es que con un nivel de significancia de 0.10 las 3 variedades
de maíz tienen el mismo rendimiento.

PROBLEMA 13:
Para el ensamble de un artículo en particular se están considerando
cuatro máquinas diferentes, M1, M2, M3 y M4. Se decide que deben
Métodos Estadísticos Varela/Llanos/Asnate
utilizarse seis operadores diferentes en un experimento de bloques
aleatorizado para comparar las máquinas. Las máquinas se asignan a
cada operador en un orden aleatorio. La operación de las máquinas
requiere determinada destreza física y se anticipa que habrá una
diferencia entre los operarios en cuanto a la velocidad con la cual
operarán la maquinaria. Se registraron los siguientes tiempos, en
segundos, para el ensamble del producto determinado.

Operador 1 M2 M4 M3 M1
39.8 41.3 40.2 42.5

Operador 2 M3 M1 M2 M4
40.5 39.3 40.1 42.2

Operador 3 M2 M1 M4 M3
40.5 39.6 43.5 41.3

Operador 4 M4 M2 M1 M3
44.2 42.3 39.9 43.4

Operador 5 M1 M3 M2 M4
42.9 44.9 42.5 45.9

Operador 6 M2 M4 M3 M1
43.1 42.3 45.1 43.6

Tiempo en segundos para el ensamble del producto.


Operador
Máquina 1 2 3 4 5 6 Total
42.5 39.3 39.6 39.9 42.9 43.6 247.8
39.8 40.1 40.5 42.3 42.5 43.1 248.3
40.2 40.5 41.3 43.4 44.9 45.1 255.4
41.3 42.2 43.5 44.2 45.9 42.3 259.4
Total 163.8 162.1 164.9 169.8 176.2 174.1 010.9

Pruebe la hipótesis H’0, a nivel de significancia de 0.05, de que las


máquinas llevan a cabo la tarea a la misma velocidad promedio.
Métodos Estadísticos Varela/Llanos/Asnate
Respuesta: Se rechaza H0 y se concluye que las máquinas no se
comportan a la misma velocidad promedio. El valor P es ligeramente
inferior a 0.05.

PROBLEMA 14:
En relación con los datos, específicamente,
GPA GPA GPA
Bajo típico Alto

Escuela A 71 92 89
Escuela B
Escuela C 44 51 85
Escuela D 64 72
50
67 81 86
Pruebe en el nivel de significancia 0.05 si las diferencias entre las
medias obtenidas para las cuatro escuelas (tratamientos) son
significativas y también si las diferencias entre las medias obtenidas
para los tres niveles de GPA (bloques) son significativas.
Respuesta: F = 6.21 es mayor que 4.76, se debe rechazar l hipótesis
nula; en el caso de los bloques, puesto que F = 9.28 excede de 5.14, se
debe rechazar la hipótesis nula. En otras palabras, concluimos que la
lectura de comprensión promedio de los estudiantes de octavo grado no
es la misma para las cuatro escuelas y también que no es la misma para
los tres niveles de GPA.