Académique Documents
Professionnel Documents
Culture Documents
Unifac
Unifactorial
.
Sus Desventajas
Se puede obtener baja precisión cuando las unidades experimentales no sean
muy homogéneas y así ser ineficiente
Cuales son entonces en resumen las consideraciones previas que se deben hacer
al planificar un experimento donde se utilizará un diseño completamente al azar
Problema
Variable de Respuesta
Factor de Interés
Niveles
Unidades Experimentales
Tamaño de Muestra por cada nivel
Establecer el nivel de significancia
Ejemplo 1:
El supermercado Daly Gourmet está interesado en realizar un estudio sobre la
vida de anaquel de las carnes que venden en sus diferentes locales en la Ciudad
de Panamá. Para esto solicita los servicios de Ingenieros Consultores S.A.
(I.C.S.A)
La vida de anaquel de las carnes almacenadas es el tiempo que un corte
previamente empacado es sano y vendible. Un paquete normal expuesto al aire
ambiental tiene una vida aproximada de 48 horas, después de las cuales la carne
comienza a deteriorarse por contaminación de microbios, degradación del color y
encogimiento. El empaque al vacío es efectivo para suprimir el desarrollo de
microbios, sin embargo, continúan siendo un problema los otros aspectos.
Ejercicio 1:
Tome un experimento cualquiera y defina lo siguiente
• Defina el problema objeto de estudio
• Identifique la variable de respuesta (VD), unidad experimental
• Identifique el factor de interés (VI) y sus niveles
• Número de observaciones por cada nivel
A. Caso Balanceado
Si los niveles del FI se colocan en las columnas, la expresión (1) define el modelo
estadístico
Y ij=μ+τ j +ε ij
(1)
j=1. .. .. . k
i=1. . .. .. n
donde:
Si los niveles del FI se colocan en las filas, la expresión (2) define el modelo
estadístico
Y ij=μ+τ i +ε ij (2)
i=1. . .. .. k
j=1. .. .. . n
Y ij es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés
ε ij el error experimental
g ln=k−1
gld=k ( n−1 )
Donde
gln son los grados de libertad correspondientes a los niveles del factor
gld son los grados de libertad correspondientes al error experimental
2 2 2
:H 0 :σ 1 =σ 2=.. .. . .. .. σ k
H1 : al menos una de las varianzas de los niveles del FI es diferente (5)
Si se planteó el modelo estadístico con los niveles en las filas o en las columnas,
las hipótesis se plantean de la misma forma, tanto para un factor fijo como para
uno aleatorio.
Todos los puntos que hasta aquí se han mencionado constituyen la planificación
del experimento. Los pasos son los mismos independientemente de cómo se
haya escrito el modelo.
Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . n
Cuadro 3: Formato de registro de datos para un DCA
(7)
Figura 3
Como se verifican los supuestos mencionados?
Existen diferentes gráficos y pruebas analíticas que permiten comprobar el
cumplimiento de dichos supuestos. El cuadro 4 ofrece un resumen de los mismos
Colocar
Colocar la
la
Estadísticas Prueba de Seleccionar
Estadísticas
Estadísticas Variable
Variable de
de Aceptar
Aceptar
Básicas
Básicas Normalidad
Normalidad Ryan-Joiner
Ryan-Joiner
Respuesta
Respuesta
Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste
En el PASW:
FALTA BLOQUES
Para cualquiera de los software, al obtener los resultados se puede inferir que las
varianzas de los niveles del FI son iguales si el valor de p-value es mayor que el
nivel de significancia establecido.
Y ij=μ+τ j +ε ij (1)
2 2
n
Y..2
k
Y . j Y ..
SCT0 Y
k
nk
2
ij SCN =∑ j=1 −
i 1 j 1 n nk
(10) (11)
Yij i ij
El cálculo de la La prueba F se calcula siguiendo las ecuaciones del cuadro 6 .
Cuadro 6: Cálculo de la Prueba Estadística de Fisher
Donde las sumas de cuadrados para el total y los niveles se calculan
respectivamente por (12) y (13)
k n2
Y Y 2i . Y 2. .
k
SCT 0 =∑ ∑ Y 2ij − . . SCN =∑i=1 −
i=1 j=1 nk n nk
(12) (13)
Los datos experimentales permiten estimar los parámetros del modelo: la media,
la varianza y la desviación estándar.
Los cálculos para los parámetros son los mismos, independientemente del
formato que se haya elegido para el modelo. Se utilizan las ecuaciones (14) ,
(15) y (16) respectivamente, para la media, varianza y desviación estándar
n k
(14)
σ =∑√CMEE
∑ Y ij
(15)
2 CMEE (16)
i=1 j=1
μ=
nk
Para el cálculo de los Intervalos de Confianza del 100( 1 – α) % para la media de
cada nivel es importante recordar cómo se escribió el modelo estadístico y el
formato que se utilizo para la recolección de los datos experimentales.
Si el modelo se escribió de acuerdo a la forma 1 se utiliza la expresión (17):
(17)
IC μ j = y . j±t α/ 2 ,k (n−1 ) √ CMEE/n
Si el modelo se escribió de acuerdo a la forma (2) se utiliza la expresión (18)
(18)
IC μ i= y i. ±t α /2 ,k (n−1 ) √ CMEE/n
Otro indicador que es
importante calcular e interpretar es el Coeficiente de Determinación, para lo cual
(19) R 2 SCN 0 ≤ R2 ≤ 1
=
SCT o
Esta fórmula es la misma independientemente de la forma en que se haya escrito
el modelo.
Como se interpreta este indicador?
B. Experimento Desbalanceado
En algunos experimentos, puede ser diferente el número de observaciones que
se hacen dentro de cada tratamiento, es decir no es posible recolectar el mismo
número de observaciones para cada nivel, se dice entonces que este experimento
es desbalanceado.
Y ij=μ+τ j +ε ij
(20) j=1. .. .. . k
i=1. . .. .. n k
donde
Cuando se utilizan las filas para representar los niveles del factor el Modelo
Estadístico se escribe como la expresión (21)
(21)
Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . nk
donde
Y ij
es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés
ε ij el error experimental
H o : μ1 =μ2 =. .. .. . .. . μ k
H1 = al menos una de las medias de la variable de respuesta es diferente
H 0 :σ 12=σ 22=.. .. . .. .. σ 2k
H1 : al menos una de las varianzas de la variable de respuesta es diferente (5)
La Regla de Decisión para un nivel de significancia dado es la expresión (23 )
Descartar Ho si:
(23) F c≥F α , g ln,gld
donde
g ln=k−1
k
gld=∑ j n j −k
Si se utilizan las filas para representar los niveles del factor se recomienda el
cuadro 8 .
Cuadro 8: Formato de registro de datos para un experimento
desbalanceado
Si se utilizan las columnas para representar los niveles del factor El ANDEVA se
hace a través de las ecuaciones del cuadro 9.
Fuentes de Grados de Suma de Cuadrado Fc Fα
variación libertad cuadrados Medio
FV Gl SC CM
Entre Niveles k−1 SCN CMN F α,g ln, gld
(N) SCN k−1 CMEE
k SCEE
Error
∑ j=1 nk −k SCT O−SCN k
Experimental ∑ j=1 nk −k
k
Total
∑ j=1 nk −1 SCT O
Cuadro 9 : ANALISIS DE VARIANZA DCA desbalanceado.
(26) Y 2i.
k Y 2. .
SCN =∑ i=1 − k
nk
∑i=1 nk
k nk 2
(27) 2 Y ..
SCT o=∑ ∑ Y ij −
N
i=1 j=1
Las conclusiones se plantean de la misma forma que en el experimento
balanceado
Para el cálculo de los parámetros se utilizan las expresiones (28), (29) y (30)
respectivamente
2
n k σ =CMEE
∑ ∑ Y ij
i=1 j=1 (28)
μ=
N
σ = √CMEE
(29)
(30)
(32)
IC μ = y i. ±t α /2 ,k (n−1 ) √ CMEE/nk
i
R 2 SCN 0 ≤ R2 ≤ 1 (33)
=
SCT o
La interpretación es la misma que en el diseño balanceado.
Para ello, contrata los servicios de I.C.S.A. Los especialistas de esta agencia de
consultoría diseñan un experimento en que se prueban los cueros con una
máquina que hace pasar los zapatos por una superficie abrasiva, la suela de los
zapatos se desgasta al pasarla por dicha superficie. Como criterio de desgaste
se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en
orden aleatorio 24 zapatos, seis de cada tipo de cuero.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en
el formato correspondiente.
Yij = es la j-ésima pérdida de peso de la suela del zapato para el i-ésimo tipo de
cuero
m = desgaste promedio (pérdida de peso promedio)
t i = es el efecto del i-ésimo tipo de cuero sobre la pérdida de peso de la suela del
zapato
e ij= es el error experimental
Formulación de Hipótesis
En términos cualitativos esta hipótesis nula dice que la pérdida de peso promedio
para cada uno de los tipos de cuero es igual.
Para un nivel de significancia del 5% la Regla de Decisión se expresa por (4):
Región de Rechazo
Descartar Ho Si
Dado que en total se deben hacer seis observaciones por cada tipo de cuero se
enumeran las corridas del experimento de uno a veinticuatro. Luego se buscan
24 números aleatorios entre uno y veinticuatro. Finalmente se le asignan los
zapatos con cada uno tipos de cuero a cada una de las corridas del experimento.
En el cuadro 10 se resumen cada uno de los pasos expresados.
TC CORRIDAS
A 3 10 14 8 15 1
B 11 18 23 7 22 12
C 2 24 4 6 13 5
D 17 16 19 9 20 21
60
50
40
30
20
10
1
180 200 220 240 260 280
C1
Figura 4
Para que se cumpla el supuesto de normalidad los datos de la perdida de peso
deberán tener aproximadamente una línea recta. Observando el gráfico,
obtenido a través de minitab no se cumple con el supuesto de normalidad.
Versus Order
(response is C1)
30
20
Residual
10
-10
-20
2 4 6 8 10 12 14 16 18 20 22 24
Observation Order
Figura 6
Al observar está gráfica de Residuo vs Orden se observa que no hay
tendencias marcadas y los datos tienen un comportamiento aleatorio, es decir, las
pérdidas de peso de la suela de zapatos no muestra una tendencia por lo cual
se concluye que son independientes. Gráficamente se concluye que las
observaciones de la perdida promedio de pesos no están correlacionadas ya que
el gráfico no presenta ninguna tendencia.
Bartlett's Test
0 10 20 30 40 50 60
95% Bonferroni Confidence Intervals for StDevs
Figura 7
Esta grafica indica que los intervalos de confianza para los tipos de cuero
tienen aproximadamente la misma desviación estándar, sin embargo el intervalo
para el tipo de cuero C tiene un ancho mayor.
Analíticamente se puede usar la prueba de Levin, cuyos resultados están en la
parte superior derecha de la figura .En primer lugar es necesario plantea la
siguiente hipótesis:
Ho: σ12 = σ22 = σ32 = σ42
H1: al menos una varianza es diferente
Para un nivel de significancia del 5%. Se establece como regla de decisión No se
descarta la H0 si Pvalue ≥ 0.05
De acuerdo a la Prueba de Levene el Pvalue= 0.583
Conclusión: Dado que Pvalue (0.583) > 0.05, no se descarta Ho, esto significa que
se cumple el supuesto de Homocedasticidad que dice que las varianzas de las
observaciones de las pérdidas de peso de los tipos de cuero son iguales.
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la
perdida promedio de pesos son iguales para los tipos de cuero estudiados
TIPO
DE
CUERO ORDEN DE LAS PRUEBAS SUMA PROMEDIO
A 264 260 258 241 262 255 1540 256.7
B 208 220 216 200 213 206 1263 210.5
C 220 263 219 225 230 228 1385 230.8
D 217 226 215 224 220 222 1324 220.7
Responsable de las
mediciones Publio Medina 5512 229.68
Fecha de Medición
Primera semana enero 2014
ULTIMA PROMEDIO
TURNO D APARATO BALANZA CALIBRACION 13-Nov TOTAL TOTAL
Cuadro 13 : Pérdida de peso de la suela de los zapatos
Las datos obtenidos para la medición de las pérdidas de peso de las suelas de los
zapatos a través de la prueba realizada se muestran en el cuadro 13.
Error
2029 20 101.45
Experimental
9101.3333
Total 23
3
Cuadro 15: ANALISIS DE VARIANZA
n k
La pérdida de peso promedio total es:
∑ ∑ Y ij
i=1 j=1
μ=Ȳ¯ =5512/24=229. 67 μ=
nk
Del cuadro 15 se obtiene el Cuadrado medio del error experimental, el cual es
igual a la varianza.
2
σ =CMEE =101. 45
2
y la desviación estándar σ =CMEE
σ = √101 . 45
Tabla n°1.15
Lotes
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
Solución de problema
Primeramente, antes de analizar los datos se procede a definir el problema en
estudio y sus respectivos aspectos:
Modelo estadístico:
El modelo correspondiente a este experimento es el siguiente:
Y ij=μ+τ j +ε ij
j=1. .. .. . k
i=1. . .. .. n
Hipótesis:
H0: μ1 = μ2 = μ3= μ4 = μ5
H1: al menos uno de los contenidos de calcio en lotes materia prima es diferente.
Regla de Decisión:
Descartar Ho si:
F c≥F 0.05 ,4 ,20
Región de Rechazo
donde
gln=k−1=5−1=4
gld=k(n−1)=5(5−1)=20
F0.05, 4, 20=2.87
Luego de haber establecido, todo estos parámetros, es recomendable realizar la
aleatorización (la aleatorización puede hacerse una ves se han recogido los datos)
Procedimiento de aleatorización
Unidad Exp. Orden aleatorio asig de nivel 1
3 1
2 8 1
3 13 1
4 1 1
5 21 1
6 16 2
7 19 2
8 5 2
9 23 2
10 7 2
11 10 3
12 2 3
13 14 3
14 22 3
15 17 3
16 4 4
17 24 4
18 11 4
19 25 4
20 6 4
21 20 5
22 15 5
23 9 5
24 12 5
25 18 5
Normalidad
Se refiere a que los datos deben seguir una distribución de normalidad.
Antes de realizar la verificación, es necesario establecer las hipótesis y sus
respectivas reglas de decisión:
Hipótesis:
Ho: Las pérdidas de peso en la suela de los zapatos presentan una distribución
normal.
H1: Las pérdidas de peso en la suela de los zapatos no presentan una distribución
normal.
60
50
40
30
20
10
1
23.2 23.3 23.4 23.5 23.6 23.7
contenidodecalcio
En este grafico se muestra que los contenidos de calcio en los lotes de materia
prima, presentan una línea recta y también el valor de P-value (P>0.100 ¿ α =0.05
), por lo tanto se concluye que los contenido de calcio en los lotes de materia
prima sí siguen una distribución normal y se acepta la hipótesis Ho.
Homocedasticidad
Se refiere a que los datos deben tener varianzas iguales.
Antes de realizar la verificación de este supuesto también, es necesario establecer
las hipótesis y sus respectivas reglas de decisión:
Hipótesis:
Ho: α 21 = α 22 =α 23 =α 24=α 25
H1: al menos una de las varianzas es diferente.
Regla de decisión: no se descarta Ho si P-value≥α.
Prueba de Bartlett
1 Estadística de prueba 0.04
Valor P 1.000
Prueba de Lev ene
Estadística de prueba 0.03
2
Valor P 0.998
Lotes
De modo que este resultado nos indica que los datos tienen varianzas
aproximadamente iguales y por tanto se acepta Ho, ya que P-value=0.998 ¿
α=0.05.
Independencia
Se refiere a que los datos deben ser independientes del resto de los datos.
En este caso, no se establecen hipótesis pero si se requiere establecer la regla de
decisión, que en este caso seria:
vs. orden
(la respuesta es contenidodecalcio)
0.10
0.05
Residuo
0.00
-0.05
-0.10
2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación
En este grafico se puede observar que los datos no muestran una tendencia y
presentan un orden aleatorio por tanto no se descarta Ho y se comprueba el
supuesto de independencia.
n k 2
Y 2. j Y 2. .
k 2 Y ..
SCN =∑ j=1 − SCT 0 =∑ ∑ Y ij −
Utilizando las formulas: n nk y i=1 j=1 nk
2.87
Para el caso del Programa PASW el Análisis de Varianza se obtiene del resultado
que se obtiene cuando se hace la prueba de homogeneidad de varianzas:
kY 2. j Y 2. .
SCN =∑ j=1 −
1. n nk à Y ij=μ+τ j +ε ij
2 2
Yk Y
SCN =∑i=1 i . − . . Y ij=μ+τ i +ε ij
2. n nk à
R2 SCN 0. 097
=
SCT o = 0. 185 =0. 52=52 %
Interpretación: Existe una variabilidad del 52% en los contenidos de calcio en los
lotes de materia prima.
σ = √0 . 004= 0. 063
Adicional se deben calcularlos intervalos de confianza, los cuales para este caso
son:
>23.58
>23.44
Por ultimo se realizan las Conclusiones finales, las cuales deben contener la
conclusión de la hipótesis principal.
Y ij=μ+τ j +ε ij
i=1. . .. .. n k
j=1. .3
Yij = es el i-ésimo tiempo de reacción de un piloto para la j-ésima disposición
= es el tiempo de reacción promedio
j = es el efecto de la j-ésima disposición sobre el tiempo de reacción de cada
piloto.
ij= es el error experimental
HIPOTESIS
Ho = µ1=µ2=µ3
H1 = al menos uno de los tiempos de reacción promedio para cada disposición es
diferente
Regla de Decisión: Descartar Ho si Fc F0.05, 2, 25 = 3.385 glN= k-1 = 3-1 = 2glD= 28
– 3 = 25
Procedimiento de Aleatorización
Cuadro 16
Registro de Datos
Prueba de normalidad
Por medio de la gráfica de probabilidad normal se verifica el supuesto de la
normalidad, el que se presenta en la figura 8
Probability Plot of C1
Normal
99
Mean 10.18
StDev 2.525
95 N 28
RJ 0.999
90
P-Value >0.100
80
70
Percent 60
50
40
30
20
10
1
5.0 7.5 10.0 12.5 15.0 17.5
C1
Figura 8
Al observar la grafica de la figura 8 se observa que los tiempos de reacción
presentan aproximadamente una línea recta, por lo tanto se puede concluir
que los tiempos de reacción de los pilotos presentan una distribución
normal. Gráficamente se concluye que las observaciones de las reacciones
promedios de los pilotos se distribuyen normalmente, ya que el gráfico presenta
aproximadamente una línea recta.
Versus Order
(response is C1)
1
Residual
-1
-2
-3
-4
2 4 6 8 10 12 14 16 18 20 22 24 26 28
Observation Order
Bartlett's Test
Test Statistic 0.15
1 P-Value 0.926
Lev ene's Test
Test Statistic 0.02
P-Value 0.982
2
C2
1 2 3 4 5
95% Bonferroni Confidence Intervals for StDevs
Figura 10
Suma de Grados
Origen de las Cuadrad P-
cuadrado de Fc F2,25
variaciones o Medio value
s libertad
DISPOSICIONES 81.428571 2 40.71429 11.3095 0.00032 3.38519
ERROR 90 25 3.6
EXPERIMENTAL
Total 171.42857 27
Conclusiones
Observando el resultando el cuasdro 20, as conclusiones se describen de la
siguiente manera:
Se observa que Fc>F, por lo tanto se rechaza Ho y se concluye que los tiempos de
reacción promedio de los pilotos para las tres disposiciones del tablero de control
de un aeroplano, no son iguales.
Cálculo de Parámetros
284
µ¿ =10.14
28
El segundo parámetro a calcular es la varianza y la misma es igual al cuadrado
medio del error experimental,
2 = 3.60
Y la desvicion estándar
R2 SCN R2
=
81. 43
== =0.9047
90 .00
SCT o
1.5.2.2 Problema 2
Se realizó un experimento para determinar la influencia de dos medicamentos
sobre el tiempo en realizar una tarea por parte de unos estudiantes. Los datos se
presentan a continuación:
Requisito: Requiere que cada uno de los niveles del factor de interés se
prueben por lo menos una vez en cada uno de los bloques.
- Aquí, todos los posibles niveles del factor de interés son asignados en
forma aleatoria. Una variable bloque no presenta interacción con el factor
en estudio.
2.2 Generalidades
Consideraciones Previas
Definición del Problema
Identificación de la Variable de Respuesta
Selección del Factor de Interés
Selección de los Niveles
Definición de las Unidades Experimentales
Estimar el Tamaño de Muestra por cada nivel.
PROBLEMA A EXPLICAR
A cada bloque (persona) se le aplican los 3 niveles del factor por orden aleatorio:
BLOQUES ASIGNACION
Persona 1 C A G
Persona 2 A C G
Persona 3 G A C
Persona 4 C G A
Persona 5 . . .
Persona 6 . . .
Persona 7 . . .
Persona 8 . . .
Persona 9 . . .
Persona 10 . . .
Esto quiere decir que cada persona realiza cada una de las actividades y se mide
la variable de respuesta.
Primero que nada se debe comparar si existen diferencias significativas entre los
promedios de los niveles del factor de interés. De igual manera, se debe
determinar el efecto del factor de interés sobre la variable de respuesta.
Determinar la variable de respuesta, factor de interés, bloques y niveles.
Modelo Estadístico
Yij = + i + j + ij
i =1.….n
j= 1.….k
Donde:
Yij = es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés
= es la media total
Colocando los niveles del factor en las filas y los bloques en las
columnas
Modelo Estadístico
Yij = + j + i + ij
i =1.….k y j= 1.….n
Donde:
Yij= es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés.
= es la media total
Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.
En este caso, las hipótesis de los bloques serían solo para confirmar que hay
diferencias entre éstos. Si se ha considerado un diseño por bloques es porque
éstos influyen en el experimento.
Como se dijo al inicio de esta sección, las hipótesis que se han planteado
anteriormente para el Diseño de Bloques al Azar (DBA), sirven tanto para factores
fijos como para factores aleatorios.
Hipótesis
Cabe destacar que las hipótesis del factor de interés, en el caso que sean
Factores Aleatorios, se pueden escribir en términos de la varianza, por lo que
quedarían de la siguiente manera:
Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.
IMPORTANTE: Los factores de bloque no se incluyen en el experimento porque
no nos interesa su efecto, sino que es un medio de estudiar de manera más
adecuada el factor de interés.
Tiene un grado de importancia secundaria en relación al factor de interés.
Pueden existir otros factores que deben controlarse durante el experimento, pero
no se tiene que caer en el extremo de controlar todo. Se pueden controlar
entonces aquellos factores que por conocimiento del proceso o experiencia previa
se sabe que pueden afectar en forma sensible el resultado de las comparaciones.
B1 B2 .………… Bn
1 1 1
2 2 2
. . .
. . .
K k k
Por ejemplo:
3 Niveles: A,B,C para el factor de interés y 3 Bloques: 1,2,3
Una vez identificados los niveles, los bloques, la variable de respuesta y el modelo
estadístico con el que se realizará todo el experimento. Se debe proceder a de
realizar el registro de datos donde primeramente se debe señalar quien es el
responsable de la realización del reporte, la fecha en que se está efectuando e
identificar para qué empresa se realiza la investigación. También es necesario
señalar el motivo de realización de dicho experimento, el factor de interés y la
unidad de medida, para que toda la información que se plasme en el reporte, se
realice de forma clara, consistente y veraz.
Luego se procede a elegir el formato de registro de datos a utilizar para el
experimento, en el cual para el Diseño de Bloques al Azar, existen dos formas
dependiendo del modelo estadístico previamente seleccionado.
Para el Modelo: Y ij =μ+ β i +τ j+ ε ij
NINIVELES
Totales/
BLOQUES
1 2 … k
Bloque
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Nivel
BLOQUES
Totales/
NIVELES
1 2 … K
Nivel
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Bloque
Para este formato, los datos ya aleatorizados correspondientes a los niveles se
ubican en las filas y llevan el orden (Y11, Y12,…Y1k); los datos aleatorizados de los
niveles se ubican en las columnas y llevan el orden (Y21, Y22,…Y2k). Luego de esto
se procede a sumar todos los datos de cada fila y columna para obtener así los
totales por nivel (Y1.) y bloque (Y.1). Por último se suman los totales de los niveles y
de los bloques, los cuales deben coincidir para obtener el gran total (Y..)
Para estos supuestos se plantean las siguientes hipótesis, que luego mediante
software estadísticos se van a aceptar o rechazar.
Colocar la
Estadísticas Prueba de Seleccionar
Estadísticas Variable de Aceptar
Básicas Normalidad Ryan-Joiner
Respuesta
Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste
Seleccionar
Prueba de Colocar la Comparar
Gráfica de
Estadísticas ANOVA Varianzas Variable de con el Aceptar
Residuo vs
Iguales Respuesta Bloque
Ajuste
Al obtener los resultados se puede inferir que las varianzas de los factores
son iguales si el valor de p>0.05.
Para la columna de F crítica, los datos que se deben establecer son el nivel de
significancia con que se realizará la medición y búsqueda del valor de Fisher en la
tabla correspondiente; lo más recomendado es realizar el cálculo con un nivel de
significancia del 95% o del 99%, siendo a=0.05 y a=0.01, respectivamente.
Luego se procede a calcular para los niveles y bloques la gl n y gld correspondiente.
De igual manera el formato para este modelo es igual, pero la variante es la forma
de calcular y las fórmulas de los elementos que componen el ANDEVA.
2 Error Ex.:
k 2 Y ..
SCN = 1n ∑ Y −
i=1 i. nk
Niveles: SCEE=SCT 0 −(SCN +SCB )
2
2 Y ..
n n k 2
SCB= 1k ∑ Y − 2 Y ..
Bloques: j=1 . j nk SCT 0 =∑ ∑ Y ij − nk
Totales: i=1 j=1
Niveles: Fc=CMN/CMEE
Bloques: Fc=CMB/CMEE
2.3.8 Conclusión
Luego de finalizar el cálculo de todos los elementos del ANDEVA, se comparan los
valores obtenidos para la F calculada con el punto crítico de rechazo establecido
en la Regla de Decisión, tanto para los niveles del factor como para los bloques.
Los parámetros del modelo estadístico para el diseño de bloques al azar son:
Varianza s² = CMEE
n k
Media de los datos:
∑ ∑ Y ij
μ= i=1 j=1
nk
El cual indica la cantidad total de la variable distribuida a partes iguales entre cada
observación.
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
Donde:
ý . j = promedio de cada valor de los niveles.
CMEE
√ n
= Raíz cuadrada del Cuadrado medio del error entre n niveles.
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
Donde:
CMEE
√ k
= Raíz cuadrada del Cuadrado medio del error entre k niveles.
Estimadores
2.4 Ejemplo
2.4.1 EJEMPLO: ALEACIÓN DE ALUMINIO
Bloques : hornos
Niveles=4 Bloques= 4
2.4.1.2 Modelo Estadístico
Utilizando los bloques en las filas y los niveles del factor en las
columnas.
Modelo Estadístico
Donde:
Yij = es el tamaño del grano para la j-esima velocidad de agitación en el i-esimo horno
Se puede colocar también utilizando las columnas para representar los niveles
del factor.
Ho : m1 = m2 = m3 = m4
Bloques (Hornos)
Ho: m1 = m2 = m3 = m4
gln = ( n – 1) = 4 – 1=3
VELOCIDADES DE AGITACIÓN
H 4() 2() 1() 3()
O
R 2() 1() 3() 4()
N
4() 3() 1() 2()
O
S 3() 4() 2() 1 ()
Velocidades de Agitación
Hornos 5 10 15 20 Totales/horno
1 8 14 14 17 53
2 4 5 6 9 24
3 5 6 9 3 23
4 6 9 2 6 23
Totales/veloci 23 34 31 35 123
dad de
agitación.
ANÁLISIS DE VARIANZA
2.4.1.7 Conclusiones
Para las Velocidades de Agitación:
Fc es mayor que F 0.05,3,9 , por lo tanto se descarta Ho. Se concluye que existe
diferencia significativa en el tamaño promedio del grano para los cuatro hornos. Por lo
tanto se confirma que los hornos tienen características de operación propias.
123
μ= =7.69
16
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
8.67
IC μ =53 /4 ± t 0.025 , 9
j
√ 4
=
53 8.67
IC μ =
j
4
±(2.262)
4
=
√ 9.92 y 16.58
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
8.67
IC μ =23 /4 ± t 0.025 , 9
j
√ 4
=
23 8.67
IC μ =
j
4 √
±(2.262)
4
= 2.41 y 9.08
Estimadores:
τ =13.25−7.69=5.56
τ =6−7.69=−1.69
τ =7.67−7.69=−0.02
τ =7.67−7.69=−0.02
Para los Niveles:
τ =7.67−7.69=−0.02
τ =8.5−7.69=0.81
τ =7.75−7.69=0.06
τ =8.75−7.69=1.06
Coeficiente de Determinación:
Interpretación:
Es importante tener en cuenta que el nivel de experiencia que tienen los empleados en
el manejo de computadora puede afectar el resultado de la prueba por lo tanto existe la
necesidad de justificar el impacto de la experiencia y determinar los méritos relativos de
los sistemas de comunicación.
Operadores Sistemas
1 2 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
Bloques: operadores
Colocando los bloques en las filas y los niveles del factor en las columnas
Yij = µ + Bi + Tj + Eij
i = l,.....5 j = l,...3
Ho: µ1 = µ2 =... = µ5
Hi: al menos un promedio es diferente
Ho: µ1 = µ2 = µ3
œ = 0.05%
Operarios Sistemas
TIPOS DE SISTEMAS
OPERARIOS A B C
1 27 21 25 73
2 31 33 35 99
3 42 39 39 120
4 38 41 37 116
5 45 46 45 136
Totales 183 180 181 544
2.4.2.6 ANDEVA
FUENTE DE GL SC CM Fc Fcrítica
VARIACIÓN
TIPOS DE SISTEMAS 2 0.933 0.4665 0.09 4.46
Totales 14 806.93
2.4.2.7 Conclusión
Para el factor de interés se observa que Fc = 0.09 < F0.05,2, 8 = 4.46, por lo tanto no
se descarta Ho. Se concluye que no existe diferencia significativa en la productividad
promedio para los 3 tipos de sistemas.
Para los operadores se observa que Fc = 37.28 > F0.05, 4, 8 = 3.84, por lo tanto se
descarta Ho. Se concluye que existe diferencia significativa en la productividad
promedio de los operadores.
Varianza:
CMME = 15.13
544
μ= =36.27
15
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
15.13
IC μ =73 /3 ± t 0.025, 8
j
√ 3
=
73 15.13
IC μ =
j
3
±(2.306)
3 √
= 19.15 y 29.51
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
15.13
IC μ =183 /5 ± t 0.025 , 8
j
√ 5
=
183 15.13
IC μ =
j
5 √
±(2.306)
5
= 32.59 y 40.61
Estimadores
Coeficiente de Determinación:
Interpretación:
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
Yij = m + bj + ti + eij
i =1.….3 y j= 1.….4eij
Donde:
Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 2,6=5.14
gln= ( 4– 1) =3gld = ( 3– 1) (4 – 1)=6
Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 3,6= 4.76
gln= ( k – 1) : (3-1)= 2gld = ( k – 1) (n – 1)= (3-1)(4-1)= (2)(3)= 6
Días (B)
Solución A B C D TOTALE
(N) S
1 13 22 18 39 92
2 16 24 17 44 101
3 5 4 1 22 32
TOTALE 34 50 36 105 225
S
Homosedasticidad
Homocedasticidad
Niveles
Bloques
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN ANÁLISIS DE
Cuenta VARIANZA Promedio
Suma Varianza
Origen de las Suma
Fila 1 de Grados4 de Promedio
92 de los 23 F Probabilida
127.33 Valor
variaciones cuadrados
Fila 2 libertad
4 cuadrados 25.25
101 d168.917 crítico para
Fila 3 4 32 8 90 F
Filas 703.5 2 351.75 40.7 0.000323 5.14
2
Columna 1 3 34 11.33 32.33
Columnas 1106.92 3 368.97 42.7 0.000192 4.76
Columna 2 3 50 16.67 121.33
1
Columna 3 3 36 12 91
Error 51.83 6 8.64
Columna 4 3 105 35 133
Total 1862.25 11
2.4.3.8 Conclusión
Como Fc (40.72) ≤ F0.05,2,6 (5.14) por lo tanto se descarte Ho y al menos una de las
soluciones de lavado es diferente.
Como Fc (42.71) ≤ F0.05,3,6 (4.76) por lo tanto se descarte Ho y al menos una de los
días de observaciones es diferente.
Para el factor de interés se observa que Fc (40.72) ≥ F0.05,2,6 (5.14) por lo tanto se
descarte Ho . Se concluye que existe diferencia significativa en le efectividad para
reducir el crecimiento de las bacterias en un contenedor de cinco galones promedio
para las tres soluciones de lavado .
Para los días de estudio se observa que Fc (42.71) ≥ F0.05,3,6 (4.76) por lo tanto
se descarte Ho . Por lo cual concluimos que existen diferencia significativas en la
efectividad promedio de bacterias en los cuatros días pertinente a dicha
investigación
2.4.3.9 Cálculo de Parámetros
n k
∑ ∑ Y ij 225
μ= i=1 j=1
= =18.75
nk 12
σ 2=CMEE=8.64
σ =√ 8.64=2.94
8.64
IC μ =23± 2.1788
1
4
8.64
√
(19.80 ≤❑1 ≤ 26.20)
IC μ =25.25± 2.1788
2
8.64
4 √
(20.05 ≤❑2 ≤ 26.45)
IC μ =8 ±2.1788
3
4 √
(4.80 ≤❑3 ≤ 11.20)
CMEE
IC μ =Y´ j . ± t ∝
i
2
∑ nk−k √ k
8.64
IC μ =11.33 ±2.1788
1
3
8.64
√
(7.63 ≤❑1 ≤15.03)
IC μ =16.67± 2.1788
2
3 √
( 12.97≤❑2 ≤20.37)
8.64
IC μ =12± 2.1788
3
√ 3
(8.30 ≤❑3 ≤15.69)
8.64
IC μ =35 ±2.1788
4
√ 3
(31.30 ≤❑4 ≤ 39.70)
Estimadores
media de niveles
Media de los Bloques
τ i =Y´ i .−Y´ ..
τ1 = 23 – 18.75 = 4.25
τ2 = 25.25 – 18.75 = 6.5 β j=Y´ j .−Y´ ..
τ3 = 8 – 18.75= -10.75 β1 = 11.33 – 18.75 = -7.24
Coeficiente de determinación
β2 = 16.67 – 18.75 = -2.08
β3 = 12 – 18.75 = -6.75
Calculo del coeficiente de determinación
β4 = 35– 18.35 = 16.65
e interpretación
R² = (SCN + SCB) / SCTo0= 1810.41 / 1862.25 = 97.22% 0 ≤ R2 ≤ 1
Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
Determinar el efecto de la distancia del objeto al ojo del individuo sobre el tiempo de
enfoque.
Bloques: Distancias
Bloques: 4 y Niveles: 5
Yij = + i + j + ij
Donde:
j = es el efecto del j-ésimo sujeto o individuo sobre el tiempo de enfoque del ojo
Hipótesis:
Ho : 1 = 2 = 3 = 4 = 5
H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente
gln = ( k – 1) = 5 – 1= 4
Bloques (Distancias):
Ho : 1 = 2 = 3 = 4
H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente
gln = ( n – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (5-1)(4-1)= 12
SUJETOS O INDIVIDUOS
D
I 4 5 2 1 3
S
T 2 1 5 3 4
A 5 4 3 2 1
N
C 1 5 3 4 2
I
A
S
2.4.4.5 Registro de Datos
Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
S Total Promedio
ujeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6 34 6.8
6 7 6 6 1 6 26 5.2
8 5 3 3 2 5 18 3.6
10 6 4 4 2 3 19 3.8
totales 28 19 19 11 20 97
Promedios 7 4.75 4.75 2.75 5
Ho: Los valores del tiempo de enfoque del ojo presentan una distribución
normal.
H1: Los valores del tiempo de enfoque del ojo no presentan una distribución
normal.
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
TIEMP .207 20 .024 .921 20 .104
O
a. Lilliefors Significance Correction
2.4.4.8 Conclusión
= 97 / 20 = 4.85
² = CMEE = 1.2750
Estimadores
β j=Y´ j .−Y´ ..
β1 =6.8– 4.85 = 1.95
β2 = 5.2 - 4.85= 0.35
β3 = 3.6 – 4.85 = -1.25
β4 = 3.8– 4.85 = -1.05
τ i =Y´ i .−Y´ ..
τ1 = 7- 4.85= 2.15
τ1 = 4.75- 4.85= -0.1
τ1 = 4.75- 4.85= -0.1
τ1 = 2.75- 4.85= -2.1
τ1 = 5- 4.85= 0.15
Coeficiente de determinación
Interpretación:
El modelo tiene una variabilidad del 82% que existe en enfocar el objeto.
CAPÍTULO 3
3.2 Generalidades
El objetivo de este diseño es reducir el error de los residuos de un experimento. Por
esta razón se utiliza para eliminar la variación de dos variables problemáticas, por lo
cual los reglones y columnas son restricciones de aleatorización.
La manera en que se arregla el diseño procede de las letras del alfabeto latino
dispuestas en una matriz cuadrada, donde cada letra aparece una vez en cada fila y
una vez en cada columna de la matriz. Es decir el diseño cuadrado latino es un
cuadrado con t filas y t columnas. Donde cada una de las t² celdas contiene una de la t
letras latinas que corresponden a las observaciones.
Para poder garantizar la correcta aplicación del diseño cuadrado latino se debe cumplir
los siguientes requisitos:
Cada valor de la variable de respuesta debe aparecer una sola vez en cada fila y en
cada columna de la matriz.
El diseño debe ser equilibrado.
Las variables de bloque deben guardar estrecha relación con la variable dependiente.
Ya que la efectividad del diseño depende del grado de relación entre las variables de
bloque y la variable de respuesta.
El tamaño más adecuado para experimentos con este tipo de diseño es de 5 a 7
niveles.
Factor de interés: son las variables independiente o de bloqueo, cuyo efecto sobre la
variable de respuesta es de particular interés para el experimentador.
En este arreglo de diseño las variables de bloqueo son las que están colocadas en las
filas y columnas.
3.3.2 Modelo Estadístico
= es la media general
k = es el efecto del k-ésimo nivel del factor de interés (letra latina) sobre la
variable de respuesta
Para este experimento como tenemos tres fuentes de variación debemos formular un
juego de hipótesis para cada una, entonces serían tres juegos de hipótesis de la
siguiente manera:
H0 = 1 = 2 = ... t
H0 = 1 = 2 = ... t
Para aleatorizar los datos, se selecciona al azar uno de los cuadrados estándar, de tal
forma que a cada fila y a cada columna se le asignan aleatoriamente cada uno de los
niveles del Factor de Interés (representados por las letras latinas). Por ejemplo:
3.3.5 Registro de Datos
t 2
1 Y 1 Yt 2
SCF= ∑ Y 2i. .− 2.. . SCLL= ∑ Y 2. . k − .2. .
t i=1 t t k =1 t
2
1
t
Y 2.. . t t t
Y . ..
SCC= ∑ Y 2. j.− SCT 0 =∑ ∑ ∑ Y 2ijk−
t2
3.3.7 t j=1
Conclusión t2 i=1 j=1 k=1
t t t
∑ ∑ ∑ Y ijk
i=1 j=1 k=1
μ= 2
t
3.3.9 Intervalos de Confianza
τ . . k =Y . . k −Y . .. k= 1........t
β . j.=Y . j .−Y ..
j= 1........t
α i. .=Y i .. −Y .. .
i= 1........t
3.4 Ejemplo
3.4.1 EJEMPLO: METODOS DE ENSAMBLAJE
Al 5% de confiabilidad.
Columnas: operadores.
j=1 … … 4
i=1 … … 4
k =1 … … 4
Hipótesis
Orden de montaje.
Ho = μ1=μ 2=μ3=μ 4
Operadores.
Ho = μ1=μ 2=μ3=μ 4
H1 = al menos una de los tiempos de montaje promedio es diferente para los
operadores.
Método de ensamblaje.
Ho = μ1=μ 2=μ3=μ 4
Regla de decisión:
Descarta Ho si:
F c ≥ F 0.05,3,6
F 0.05,3,6=4.76
1 C D A B
2 B C D A
3 A B C D
4 D A B C
Prueba matemática.
P value = 0.475
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .489
Operador.
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .528
Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
operadores.
Métodos de ensamblaje.
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .493
Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
métodos de ensamblaje.
Regla de decisión:
Descarta Ho si:
F c ≥ F 0.05,3,6
F 0.05,3,6=4.76
3.4.1.8 Conclusión
Orden de montaje.
Fc = 3.524. Se acepta Ho, es decir los tiempos de montaje promedio son iguales
para los órdenes.
Operadores.
Método de ensamblaje.
Media Total
μ=10.25
σ 2=1.75
σ =1.332
1.75
IC μ A =7.5 ±t 0.025 ,6
√ 4
=7.5 ± 1.618
1.75
IC μ B=9.25 ± t 0.025 , 6
√ 4
=9.25 ±1.618
1.75
IC μ C =13.25± t 0.025, 6
√ 4
=13.25± 1.618
1.75
IC μ D=11± t 0.025, 6
√ 4
=11 ±1.618
Operadores
1.75
IC μ 1=8± t 0.025 ,6
√ 4
=8 ± ±1.618
1.75
IC μ 2=13 ± t 0.025, 6
√ 4
=13± 1.618
1.75
IC μ 3=10.25± t 0.025, 6
√ 4
=10.25± 1.618
1.75
IC μ 4 =9.75 ± t 0.025 ,6
√ 4
=9.75± 1.618
Orden de ensamblaje
1.75
IC μ 1=9.75± t 0.025, 6
√ 4
=9.75 ±± 1.618
1.75
IC μ 2=11± t 0.025, 6
√ 4
=11 ±1.618
1.75
IC μ 3=8.75± t 0.025 ,6
√ 4
=8.75 ±1.618
1.75
IC μ 4 =11.5± t 0.025 , 6
√ 4
=11.5 ±1.618
Estimadores
Metodos de ensamblaje
τ .. A =7.5−10.25=−2.75
τ .. B=9.25−10.25=−1
τ .. C =13.25−10.25=3
τ .. D=11−10.25=0.75
Operadores
β .1. =8−10.25=−2.25
β .2. =13−10.25=2.75
β .3. =10.25−10.25=0
β .4. =9.75−10.25=−0.50
Orden de ensamblaje
α 1.. =9.75−10.25=−0.50
α 2.. =11−10.25=0.75
α 3.. =8.75−10.25=−1.50
α 4.. =11.5−10.25=1.25
Coeficiente de determinación
Se encuentra bajo estudio el efecto que tienen cinco reactivos distintos (A, B,C,D y E)
sobre el tiempo de reacción de un proceso químico.
Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se
realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, una hora y media,
por lo que sólo pueden realizarse cinco ensayos por día.
Yijk = m + ai + bj + tk + εijk
H0 = m1 = m2 = m3 =m4 =m5
Días- ensayos
H0 = m1 = m2 = m3 =m4 =m5
H1 = menos una de los tiempo de reacción promedio es diferente
Reactivos
H0 = m1 = m2 = m3 =m4 =m5
Día
Lote 1 2 3 4 5
1 A B D C E
2 C E A D B
3 B A C E D
4 D C E B A
5 E D B A C
Día
Lote 1 2 3 4 5
Letras latinas
Día
Lote 1 2 3 4 5 Total por
lotes
1 A=8 B=7 D=1 C=7 E=3 26
2 C=11 E=2 A=7 D=3 B=8 31
3 B=4 A=9 C=10 E=1 D=5 29
4 D=6 C=8 E=6 B=6 A=10 36
5 E=4 D=2 B=3 A=8 C=8 25
Total por 33 28 27 25 34 147
día
A B C D E
42 28 44 17 16
Normalidad
Para lograr esto entramos al menu estadísticas > estadística básica > prueba de
normalidad. Seleccionamos los datos sin ponerle los factores porque queremos
ver la normalidad de todos los datos.
Prueba gráfica:
Homocedasticidad
Para comprobar este supuesto, vamos al menú estadísticas > anova > prueba
de varianzas iguales. Seleccionamos la variable, pero con un solo factor para
analizar la homocedasticidad para cada factor de variación. Hacemos esto para
las tres fuentes de variación
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
Días de ensayo
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
De acuerdo a Prueba de Levene nuestro Pvalue= 0.986 ≥ α= 0.05
Conclusión: Como Pvalue (0.986) > 0.05, no se descarta Ho, por lo cual las varianzas
de los días de ensayo son iguales.
Conclusión: Como Pvalue (0.775) > 0.05, no se descarta Ho, por lo cual las varianzas
de los reactivos son iguales
Independencia
Total 24 206.640
3.1.1.8 Conclusión
s² = CMEE= 3.126
t t t
∑ ∑ ∑ Y ijk
147 i=1 j=1 k=1
μ= μ==5 . 88
25 2
t
IC μk = y . . k ±t α / 2, (t −1)( t −2 ) √ CMEE /t
IC μk =8. 4 ±1 . 72
IC μk =5 . 6 ±1 . 72
IC μk =8. 8 ± 1. 72
IC μk =3 . 4 ±1 .72
IC μk =3 . 2 ±1 .72
IC μj =5 . 6 ± 1. 72
IC μj =5 . 4 ±1 .72
IC μj =5 ± 1. 72
IC μj =6 .8 ± 1. 7
IC μi =6 . 2 ±1 . 72
IC μi =5 . 8 ±1 . 72
IC μi =7 . 2 ±1 . 72
IC μi =5 ± 1. 7
Estimadores
τ . . k =Y . . k −Y . ..
k= 1........t
42
τ1= −5 .88=2 .52
5
28
τ1= −5 . 88=−0 . 28
5
44
τ1= −5 . 88=2. 92
5
17
τ1= −5. 88=−2 . 48
5
16
τ1= −5. 88=−2 .68
5
β . j.=Y . j .−Y ..
j= 1........t
33
β 1= −5 .88=0 . 72
5
28
β 2= −5 . 88=−0 . 28
5
27
β 3= −5 . 88=−0 . 48
5
25
β4= −5 . 88=−0 . 88
5
34
β 5= −5 . 88=1. 15
5
Estimación de las medias de los lotes
α i . .=Y i .. −Y .. .
i= 1........t
26
α 1= −5 . 88=−0 . 68
5
31
α 2= −5. 88=0 .32
5
29
α 3= −5 .88=−0 . 08
5
36
α 4= −5 . 88=1. 32
5
25
α 5= −5 . 88=−0 . 88
5
Coeficiente de determinación
4.1Definición
El diseño cuadrado Greco latino (DCGL) podría decirse que es una extensión
del cuadrado latino en el que se incluye una tercera variable de control (letras griegas).
Es por tanto una fracción del diseño completo en bloques aleatorizados con un factor
principal y 3 factores secundarios.
4.2 Generalidades
Se dice que los dos cuadrados son ortogonales si al sobreponerse poseen la
propiedad de que cada letra griega aparece sólo una vez con cada letra latina.
Puede utilizarse para controlar sistemáticamente tres fuentes extrañas de variabilidad,
en otras palabras, se usa para hacer un análisis por bloques en tres direcciones.
Permite analizar cuatro factores (renglón, columna, letra latina y letra griega).
Observaremos cuáles son los pasos necesarios para resolver un problema en el diseño
cuadrado greco-latino
4.3.1 Definición del Problema a Resolver
Determinar el efecto de las letras latinas, las filas, las columnas y las letras
griegas sobre la variable de respuesta.
Se define cual es el modelo estadístico en este caso y que representan cada una de las
variables.
Yijkl = es la observación de la i-ésima fila y la j-ésima columna con la k-ésima letra latina
y la l-ésima letra griega.
μ = media total
Formulamos las respectivas hipótesis por filas, columnas, letras latinas y letras griegas.
Las filas, columnas, letras latinas y letras griegas formarían 4 pares de hipótesis, una
para cada factor. Todas se definen de la misma manera:
Ho : μ1 = μ2 =...... ... μt
Esta regla de decisión es igual para las filas, las columnas, letras latinas y letras
griegas ya que todas tienen el mismo número de variables.
Lotes Operarios
1 Aα Bγ Cε Dβ Eδ
2 Bβ Cδ Dα Eγ Aε
3 Cγ Dε Eβ Aδ Bα
4 Dδ Eα Aγ Bε Cβ
5 Eε Aβ Bδ Cα Dγ
4.3.5 Registro de Datos
Una vez tomados los datos medidos se procede a la suma de las columnas Y. t.. y de
las filas Yt… seguido por el Gran Total Y…
Luego, se elaboran otras dos tablas para calcular los totales de las letras latinas y de
las letras griegas.
Letras Latinas … … … …
1 2 … t … … … …
Y11 Y11 … Y11 YttL Ytt … YttL
L. L. L. . L. .
Y22 Y22 … Y22 Y..1 Y..2 … Y..L
L. L. L. . . .
… … … …
Letras Griegas … … … …
1 2 … t … … … …
Y11. Y11. … Y11. Ytt. Ytt. … Ytt.
G G G G G G
Y22. Y22. … Y22. Y… Y...2 … Y…
G G G 1 G
… … … …
Una vez completado esto se procede a la suma de las letras latinas cuyo total se
representa por Y..t. y a la suma de las letras griegas cuyo total se representa por Y…t
4.3.6 Supuesto del Modelo
Antes de continuar con el siguiente paso, que consiste en el análisis de varianza, se
deben probar los supuestos del modelo. Hay tres supuestos: normalidad,
homocedasticidad u homogeneidad de varianzas e independencia.
Para probar los supuestos, se utilizan los mismos métodos mencionados en los
capítulos anteriores, ya sea gráfica o analíticamente, con la ayuda de programas como
Excel, MINITAB o PASW.
Al probar la normalidad con la gráfica de probabilidad normal, los puntos deben formar
una línea recta.
Se puede probar analíticamente con las pruebas Ryan-Joiner, Shapiro-Wilks y
Smirnov-Kolmogorov, dependiendo de la cantidad de observaciones totales del
experimento.
Luego de verificar que se cumplen los tres supuestos del modelo, se prosigue con el
análisis de varianzas. Para el mismo lo más conveniente es elaborar una tabla como se
muestra a continuación. Cada componente será explicado posteriormente.
SE CALCULA
Fα (t-1),(t-3)(t-1)
CMEE
Letras (t-1) SCLG CMLG CMLG /
Griegas CMEE
Error (t-3)(t-1) SCEE CMEE
Experimental
Total (t2-1) SCT
donde:
t = niveles
yi… = sumatoria por filas
y…. = sumatoria total
SCC suma de cuadrados debida al efecto columna
2
t 2 y
1
∑
t j=1 y − . .. .
2
t
. j ..
donde:
t = niveles
y.j.. = sumatoria por columnas
y…. = sumatoria total
donde:
t = niveles
y..k. = sumatoria por letras latinas
y…. = sumatoria total
donde:
t = niveles
y...l = sumatoria por letras griegas
y…. = sumatoria total
SCEE suma de cuadrados del error
SCF
t−1
Cuadrado Medio de las Columnas
SCC
t−1
Cuadrado Medio de las Letras Latinas
SCLL
t−1
SCLG
t−1
La Fα se calcula a partir del nivel de significancia “α” y los grados de libertad de los
factores “(t-1)” y del error experimental “(t-3)(t-1)”. Este valor es el mismo para
comparar todas las Fc por la particularidad del diseño de que todos los factores deben
tener el mismo número de niveles.
4.3.8 Conclusiones
Una vez completada la tabla de ANDEVA, se prosigue con las conclusiones respectivas
para las hipótesis, planteadas al inicio del experimento.
Esto quiere decir que para cada hipótesis planteada se debe analizar la regla de
decisión.
t t t t
∑∑∑∑ y
i=1 j=1 k=1 l=1
ijkl
μ= 2
t
4.3.10 Intervalos de Confianza
Para todos los casos se debe buscar el valor de t en la tabla T de Student para el nivel
de significancia “α” asignado al experimento.
Estimación de las medias de las filas, columnas, letras latinas y letras griegas
respectivamente:
Ψ . . .l =Y .. . l−Y .. . .
τ . j . . =Y . . j.−Y .. . .
donde l = 1…t
donde j = 1…t
σ2 = CMEE
SCTo
Este valor representa el porcentaje en el que el modelo explica la variabilidad de la
variable de respuesta
4.4 Ejemplos
Yijkl = m + ai + tj + dk + Y l + eijkl
Se plantea cuatro pares de hipótesis para: filas, columnas, letras latinas y letras
griegas.
Orden de métodos
H0 = m1 = m2 = ... m4
Operadores
H0 = m1 = m2 = ... m4
H0 = m1 = m2 = ... m4
H0 = m1 = m2 = ... m4
Regla de decisión
A Y..1.=35
B Y..2.=31
C Y..3.=56
D Y..4.=46
Y…1=45
Y…2=38
Y…3=44
Y…4=41
60
50
40
30
20
10
1
5 10 15 20
Tiempo de Ensamble
Prueba gráfica:
Ho: los datos siguen una distribución normal porque los puntos se acercan a la línea de
referencia
H1: los datos no siguen una distribución normal ya que los puntos no se acercan a la
línea de referencia.
Como los datos se acercan mucho a la línea de referencia descartando los valores
extremos, se acepta H0 para la prueba gráfica.
Homocedasticidad:
Prueba de Bartlett
Valor P 0.708
2
0 5 10 15 20 25 30
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Prueba gráfica Intervalos de confianza de Bonferroni al 95%:
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett.
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
(Pvalue > α)
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
(Pvalue < α)
Como 0.686 > 0.05, podemos concluir que los tiempos de ensamble para los métodos
de ensamble tienen varianzas iguales.
5.0
2.5
Residuo
0.0
-2.5
-5.0
9.5 10.0 10.5 11.0 11.5
Valor ajustado
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
Prueba de Bartlett
Valor P 0.179
2
0 5 10 15 20
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett.
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
(Pvalue > α)
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
(Pvalue < α)
Como 0.330 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.
1
Residuo
-1
-2
-3
7 8 9 10 11 12 13 14
Valor ajustado
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
Prueba de Bartlett
Valor P 0.757
2
0 5 10 15 20 25 30 35
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual
Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett
Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual
(Pvalue > α)
H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual
(Pvalue < α)
Como 0.383 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.
Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual
H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual
7.5
5.0
2.5
Residuo
0.0
-2.5
-5.0
Como las distancias
10.2
entre10.3
los puntos
10.4
es 10.5
aproximadamente
Valor ajustado
10.6 10.7
igual,
10.8
aceptamos H 0
Como un resultado grafico fallo, aceptamos el resultado analítico ya que es mas
preciso.
Prueba de Bartlett
0 5 10 15 20 25 30
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Ho: los tiempos de ensamble para los operadores tienen varianza igual
H1: los tiempos de ensamble para los operadores no tienen varianza igual
Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett
Ho: los tiempos de ensamble para los operadores tienen varianza igual (Pvalue > α)
H1: los tiempos de ensamble para los operadores no tienen varianza igual (Pvalue < α)
Como 0.135 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.
Ho: los tiempos de ensamble para los operadores tienen varianza igual
H1: los tiempos de ensamble para los operadores no tienen varianza igual
vs. ajustes para Operadores
(la respuesta es Tiempo de Ensamble)
5.0
2.5
Residuo
0.0
-2.5
-5.0
Suma de cuadrados
SC Orden de montaje = 1/4 [(43)2 +(42)2 +(42)2 + (41)2 ] - [(168)2/16] = 0.5
² = CMEE= 3.5
t t t
∑ ∑ ∑ Y ijk
μ= i=1
j=1 k=1
2
t = 168/16 = 10.5
4.4.1.9 Conclusiones
Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y
letras griegas.
1. 10.75±1.9432 √3.5/4
2. 10.50±1.9432 √3.5/4
3. 10.50±1.9432 √3.5/4
4. 10.25±1.9432 √3.55/4
1. 9.25±1.9432 √ 3.5/ 4
2. 10.25±1.9432 √3.5/4
3. 12.25±1.9432 √3.5/4
4. 10.25±1.9432 √3.5/4
1. 8.75±1.9432 √ 3.5/ 4
2. 7.75±1.9432 √ 3.5/4
3. 14±1.9432 √3.5/4
4. 11±1.9432 √3.5/4
Intervalos de confianza para el lugar de trabajo:
1.
11.25±1.9432 √ 3.5/ 4
2. 9.50±1.9432 √ 3.5/ 4
3.
11±1.9432 √3.5/4
4.
10.25±1.9432 √3.5/4
Estimadores
Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.
α i. . .=Y i . . . −Y . .. .
α1… =10.75-10.50=0.25
α2… =10.50-10.50=0
α3… =10.50-10.50=0
α4… =10.25-10.50=-0.25
τ . j .. =Y .. j.−Y ....
Τ.1.. = 9.25-10.50=-1.25
Τ.2.. = 10.25-10.50=-0.25
Τ.3.. = 12.25-10.50=1.75
Τ.4.. = 10.25-10.50=-0.25
Β..4. = 11.50-10.50 = 1
=11.25-10.50=0.75
=9.50-10.50=-1
=11=10.50=0.50
=10.25-10.50=-0.25
Coeficiente de Determinación
2
R = (0.5+19+95.5+7.5)/168 = 0.73 Indica que el modelo explica en 73% de las mediciones de
la variable de respuesta.
4.4.2.1 Definición
Determinar si existen diferencias significativas en la fuerza explosión promedio de la
dinamita para las cinco fórmulas preparadas con cinco lotes de materia prima distintas,
en cinco diferentes líneas de montaje, manejadas por cinco diferentes operarios.
Variable de respuesta: fuerza de explosión de la dinamita
Fila: Lotes
Columna: Operarios
Yijkl = μ + αi + j + k + l + eijkl
i= 1,2,3,4,5
j = 1,2,3,4,5
k= 1,2,3,4,5
Yijkl = es la fuerza explosiva para la k-ésima fórmula preparada por el j-ésimo operario
con el i-ésimo lote de materia prima en la l-ésima línea de montaje de prueba.
μ = fuerza explosiva promedio.
αi = es el efecto del i-ésimo lote de materia prima sobre la fuerza explosiva.
j = es el efecto del j-ésimo operario sobre la fuerza explosiva.
dk = es el efecto de la k-ésima fórmula sobre la fuerza explosiva.
l = es el efecto de la l-ésima línea de montaje de prueba sobre la fuerza explosiva.
eijkl = error experimental
Regla de decisión
Se descarta Ho si FC ³ Fα , glN, glD
donde:
glN = ( t -1) glD= (5-1) (5-3) = 8
glN= ( 5-1) = 4
glD= (t-1) (t-3)
F0.05, 4, 8 = 3.84
Esta regla de decisión es igual para los lotes de materia prima, los operarios, las
fórmulas y para las líneas de montaje dado que todos los factores tienen el mismo
número de niveles.
1.4.2.1 Aleatorización
Al realizar la aleatorización se debe asegurar que cada operador prepare cada fórmula
con cada tipo de lote de materia prima en cada línea de montaje.
Esta sería una posible configuración para un DCGL 5x5
Lotes Operarios
1 Aα Bγ Cε Dβ Eδ
2 Bβ Cδ Dα Eγ Aε
3 Cγ Dε Eβ Aδ Bα
4 Dδ Eα Aγ Bε Cβ
5 Eε Aβ Bδ Cα Dγ
1.4.2.2 Registro de Datos
Los datos se registran respectivamente para cada lote, operario, fórmula y línea de
montaje en la siguiente tabla:
Operarios
Lotes 1 2 3 4 5 Totales
1 Aα =24 Bγ =20 Cε =19 Dβ =24 Eδ =24 Y1...=111
2 Bβ =17 Cδ =24 Dα =30 Eγ =27 Aε =36 Y2...=134
3 Cγ = 18 Dε =38 Eβ =26 Aδ =27 Bα =21 Y3...=130
4 Dδ =26 Eα =31 Aγ =26 Bε =23 Cβ =22 Y4...=128
5 Eε =22 Aβ =30 Bδ =20 Cα = 29 Dγ =31 Y5...=132
Totales Y.1..=107 Y.2..=143 Y.3..=121 Y.4..=130 Y.5..=134 Y....=635
Como podemos ver en la misma tabla se calculan los totales por fila y por columna, sin
embargo, los totales por letra latina y por letra griega deben calcularse por separado.
Letras latinas
Totales por fórmula
A B C D E
24 17 18 26 22
36 20 24 38 31
27 20 19 30 26
26 23 29 24 27
30 21 22 31 24
Y..1.=143 Y..2.=101 Y..3.=112 Y..4.=149 Y..5.=130
Letras griegas
Totales por línea de montaje
α β Γ Ε
24 17 26 18 22
31 30 24 20 38
30 26 20 26 19
29 24 24 27 23
21 22 27 31 36
Y…1=135 Y…2=119 Y…3=121 Y…4=122 Y…5=138
Normalidad:
Gráfica de probabilidad normal
Homogeneidad de Varianzas
Para el caso de DCGL en Minitab, la igualdad de varianzas se debe calcular para cada
uno de los factores por separado.
178
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
H1 = al menos una varianza es diferente
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre los operarios ya que p >α.
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre los lotes ya que p >α.
179
Se formula la hipótesis para las fórmulas:
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
H1 = al menos una varianza es diferente
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre las fórmulas ya que p >α.
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre las líneas de montaje ya que p >α.
180
Independencia
Al verificar que se cumplen todos los supuestos del modelo, proseguimos con la
elaboración de la tabla ANDEVA.
Fuente de GL Suma de Cuadrado F F crítica
Variación Cuadrados Medio calculad
a
Lotes 4 68 17 2.06 3.84
Operarios 4 150 37.5 4.54 3.84
Fórmulas 4 330 82.5 10 3.84
Línea de 4 62 15.5 1.9 3.84
Montaje
Error 8 66 8.25
Experimenta
l
Total 24 676
181
Los cálculos realizados para la misma son los siguientes:
SCLOTES = 1/5 [(111)2 +(134)2 +(130)2 + (128)2 + (132)2 ] - [(635)2/25] = 6
SCOPERADORES = 1/5 [(107)2 + (143)2 +(130)2 +(134)2] - [(635)2/25] = 150
SCFORM= 1/5 [(143)2+ (101)2 +(112)2 + (149)2 + (130)2 ] - [(635)2/25] = 330
SCLINMONT = 1/5 [( 135)2 +(119)2 + (122)2+ (121)2 +(138)2] -[(635)2/25] = 62
1.4.2.5 Conclusión
Variabilidad: s2 = CMEE = 66
Promedio: m = Y..../ t2 = 635 / 25 =25.4
182
Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y letras
griegas.
4. 25.6±2.306 √ 8.25/5
1. 21.4±2.306 √8.25/5
2. 28.6±2.306 √ 8.25/5
3. 24.2±2.306 √ 8.25/5
1. 28.6±2.306 √ 8.25/5
2. 20.2±2.306 √ 8.25/5
3. 22.4±2.306 √8.25/5
4. 29.8±2.306 √ 8 .25/5
183
2. 23.8±2.306 √ 8.25/5
3. 24.2±2.306 √ 8.25/5
4. 24.4±2.306 √ 8. 25/5
Estimadores
Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.
α i . . .=Y i . . .−Y . .. .
α1… =22.2-25.4= -3.2
τ . j .. =Y .. j.−Y ....
Τ.1.. = 21.4-25.4= -4.0
184
Τ.3.. = 24.2-25.4= -1.2
185
Coeficiente de Determinación
CAPÍTULO 5
186
Etapa I: Es probar la Ho : μ1 = μ2 =…..μi por la prueba de F de tamaño α, si el valor
F no es significante se termina el análisis. Si el valor de F es significante, entonces
sigue la etapa II.
Esta prueba determina el valor mínimo necesario para considerar diferentes dos
muestras y lo utiliza para comparar los diferentes pares de medias que se deseen
evaluar.
HIPOTESIS:
H 0=μ i=μ j
H 1=μi ≠ μ j
REGLA DE DECISION:
Descartar H 0 si |Ý i−Ý j|≥ DMS i ≠ j
187
Para un Diseño Completamente al azar (DCA)
2 CMEE
DSM =t α /2 , glee
√ n
Donde:
N: Numero de observaciones por cada nivel del factor de interés.
1 1
√
DSM =t α /2 , ∑ nk −k CMEE ¿ +
nj [ ]
Donde:
N: Numero de observaciones por cada nivel del factor de interés.
2 CMEE
DSM =t α /2 ,(k −1)(n−1)
√ n
Donde:
T: Numero de letras latinas o # de files o # de columnas
Donde:
T: Numero de letras latinas o griegas o # de filas o #de columnas.
189
Glee = 20 CMEE = 8.06 Fc = 14.76 Fα = 2.87 Dado que el resultado fue
significativo se puede seguir adelante con otras comparaciones.
Los cinco promedios de tratamientos son: Y 1= 9.8; Y2= 15.4; Y3= 17.6; Y4= 21.6; Y5=
10.8 denotemos por µ1, µ2, µ3, µ4 y µ5 respectivamente a los medios de los tratamientos
con porcentaje 15, 20, 25, 30 y 35.
MEDIAS
ORDENADAS
Ῡ1 = 9.8
Ῡ5 = 10.8
Ῡ2 = 15.4
Ῡ3 = 17.6
Ῡ4 = 21.6
190
H 0 :μ 5=μ2 |Ý 5 −Ý 2|=|10.8−15.4|=4.6
H 1 : μ 5 ≠ μ2 descartar H 0 si|Ý 5−Ý 2|≥ DSM
2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05
2× 8.06
DSM =t 0.025 , 20
√ 5
DSM =3.75
191
4.6 vs 3.75 es significativa ya que el valor de las diferencias de medias es
mayor que el valor de DSM.
5.2.3.6 Conclusión
Existe diferencia significativa en la resistencia promedio a la tensión de la nueva fibra
sintética para los pares
μ5 y μ2 Para 35% y 20% de algodón
μ3 y μ4 Para 25% y 30% de algodón
Sin embargo, para los siguientes pares la resistencia a la tensión no varía
significativamente:
μ1 y μ5 Para 15% y 35 % de algodón
μ2 y μ3 Para 20% y 25% de algodón
Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se pueden
hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.
192
Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una
superficie abrasiva, la suela de los zapatos se desgasta al pasarla por dicha superficie.
Como criterio de desgaste se usa la pérdida de peso después de un número fijo de
ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero.
Al hacer las pruebas en orden completamente al azar se evitan sesgos y las
mediciones en un tipo de cuero resultan independientes de las demás.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en la
hoja de verificación previamente diseñada
FV SC GL CM Fc Fα
TIPOS 7072.3 3 2357.44 23.24 3.098
DE 3
193
CUERO
EE 2029 20 101.45
TOTAL 9101.3 23
3
194
2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05
2× 101.45
DSM =t 0.025 , 20
√ 4
DSM =14.857
5.2.4.6 Conclusión
195
Existe diferencia significativa en el desgaste promedio de suela de cada tipo de cuero
para μa y μc .
Sin embargo, para los siguientes tipos de cuero el desgaste promedio no varía
significativamente: μc y μd, μd y μb.
CAPÍTULO 6
6. DUNCAN
6.1 Definición
La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia
entre pares de medias después que se ha rechazado la hipótesis nula en el análisis de
varianza.
196
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios
"rangos" (Duncan los llama rangos significativos mínimos) dados por la fórmula:
6.2 Generalidades
197
Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.
Para un factor de interés con 5 niveles y que el orden por magnitud sea
A,B,C,D Y E
A B C D E
Posibles Comparaciones
A B C D
Posibles Comparaciones
D D-A D-B D-C - D Vs A
D Vs B
C C-A C-B - D Vs C
C Vs A
B B-A - C Vs B
B Vs A
A -
Para un factor de interés con 3 niveles y que el orden por magnitud sea
A,B y C
198
A B C Posibles Comparaciones
C Vs A
C C-A C-B -
C Vs B
B B-A - B Vs A
A -
6.3.5 Hipótesis
CMEE
S ȳ = √ n
DCA un solo factor
# de Medias (p) 2 3
D α, glee D2 D3
Sy Sy Sy
CD D2 S y D3 S y
199
CMEE
DBA S ý =
√ n
Para los niveles
CMEE
S ý =
√ k
Para los bloques
CMEE
DCL S ý =
√ t
En donde t es el número de las L.L o filas o columnas.
CMEE
DCGL S ý =
√ k
t el número de las L.L o L.G.
6.3.8 Conclusión
Se pueden realizar de forma general, o especificando el efecto de cada factor.
6.4 Ejemplos
6.4.1 Problema a Resolver
200
Se están comparando tres soluciones de lavado diferentes a fin de estudiar su
efectividad para retardar el crecimiento de bacterias en contenedores de leche de
cinco galones. El análisis se hace en un laboratorio y sólo pueden realizarse tres
ensayos en un día. Puesto que los días podrían representar una fuente potencial
de variabilidad, el experimentador decide usar un diseño de bloques
aleatorizados. Se hacen observaciones en cuatro días, cuyos datos se muestran
enseguida. Analizar los datos de este experimento (utilizar α = 0.05) y sacar las
conclusiones apropiadas.
Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
Sí es aplicable.
92
x́ solu .1 = =23
4
101
x́ solu .2 = =25.25
4
32
x́ solu .3 = =8
4
x́ solu .2 =25.25
x́ solu .1 =23
201
x́ solu .3 =8
6.4.1.5 Hipótesis
No. de 2 3
202
medias
Duncan al 3.113 3.256
5%
S ý S ý S ý
C.D. 3.113* S ý 3.256* S ý
Conclusión
Podemos concluir que los pares de medias no tienen diferencias significativas entre sí
en cuanto a su efectividad para retardar el crecimiento de bacterias en contenedores de
leche de cinco galones.
203
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error
de 141.6, los grados de libertad del error son 48 - 8 =40.
Sí es aplicable.
Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para a =
0.05, 2 £ p £ 8 y 40 grados de libertad.
El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".
204
El rango entre las medias máxima y mínima se compara con D8, esto es,
185 24 23 20 13 9 7 3 -
182 21 20 17 10 6 4 - -
178 17 16 13 6 2 - - -
176 15 14 11 4 - - - -
172 11 10 7 - - - - -
165 4 3 - - - - - -
162 1 - - - - - - -
161 - - - - - - - -
6.4.2.5 Hipótesis
Y i−Y j
Descartar Ho si │ │≥ C.D.
205
6.4.2.6 Cálculo de Comparador de DUNCAN para un DCA
, entonces
, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos
de seis medias.
, entonces
, entonces
, entonces
, entonces
, entonces
, entonces
206
, entonces
Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261 que
fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con
D4; por lo tanto,
, entonces
Los resultados se muestran gráficamente en la siguiente figura, donde las medias que
están debajo de una línea no son significativamente diferentes.
6.4.2.8 Conclusión
El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3
son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor
que las 8 y 7 y las demás grasas no son significativamente diferentes en relación con la
cantidad absorbida.
207
Los tratamientos evaluados fueron:
T1- Regar cuando la humedad en el suelo llegue a 0,40 bar (40 centibar).
T2- Regar cuando la humedad en el suelo llegue a 0,45 bar (45 centibar).
T3- Regar cuando la humedad en el suelo llegue a 0,5 bar (50 centibar).
T4- No regar.
Rendimiento expresado en toneladas por hectárea, los datos son los siguientes.
Réplicas
Tratamiento 1 2 3 4 5 Totales
s
1 47.99 48 47.98 48.78 47.2 239.95
2 44.22 44.01 44.45 44.13 44.31 221.12
3 42.58 42.3 42.86 42.11 43.06 212.91
4 37.66 37.3 38.02 37.25 37 187.23
∑ 172.45 171.61 173.31 172.27 171.57 861.21
239.95
x́ trat .1 = =47.99
5
221.12
x́ trat .2 = =44.224
5
208
212.91
x́ trat .3 = =42.582
5
187.23
x́ trat .4 = =37.446
5
x́ trat .1 =47.990
x́ trat .2 =44.224
x́ trat .3 =42.582
x́ trat .4 =37.446
6.4.3.5 Hipótesis
209
H0: m trat.2 = m trat.4 H1: m trat.2 ¹ m trat.4
No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý nivel S ý nivel S ý nivel
C.D. 3.082∗S ý nivel 3.225∗S ý nivel 3.313∗S ý nivel
CMEE
S ý nivel=
√ n
Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.
No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý bloques S ý bloques S ý bloques
C.D. 3.082∗S ý bloques 3.225∗S ý bloques 3.313∗S ý bloques
210
g.l.ee: (n-1)(k-1) = (5-1)(4-1) = 12
CMEE
S ý bloques=
√ k
Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.
211
CAPÍTULO 7
7. TUKEY
7.1 Definición
Es de fácil cálculo puesto que se define un solo comparador, resultante del producto
del error estándar de la media por el valor tabular en la tabla de Tukey usando como
numerador el número de tratamientos y como denominador los grados de libertad del
error.
7.2 Generalidades
Este procedimiento es llamado también «Diferencia Significativa Honesta»
Se utiliza para realizar comparaciones múltiples de medias
Esta prueba es similar a la prueba de Duncan en cuanto a su procedimiento y
además es más exigente.
Esta prueba es un procedimiento de comparación múltiple que también está
basado en los intervalos.
Su procedimiento requiere el uso de qµ (k,glee) para determinar el valor crítico
de todas las comparaciones por pares, independientes de cuantas medias estén
en el grupo.
Esta prueba declara dos medias significativas diferentes si el valor absoluto de
sus diferencias muéstrales excede al comparador
La prueba de Tukey es una prueba de comparación múltiple, al igual que otras
como Duncan, diferencia significativa mínima, entre otras. son utilizadas para la
comparación de promedios.
Es utilizada una vez hayamos realizado el análisis de varianza y hayamos
concluido con éste, que el factor de interés es significativo (Fc ≥ Fα).
212
Para la aplicación de la prueba de Tukey es necesario el uso de qµ (k,glEE) los
puntos porcentuales del estadístico del rango studentizador.
Se utiliza qµ (k,glEE) para determinar el valor crítico de todas las comparaciones
por pares,
Esta prueba declara dos medias significativas diferentes, si el valor absoluto de
sus diferencias muéstrales excede al comparador T µ = q µ (k,glEE) Syi.
A la versión de este método que trabaja con números de muestras desiguales o
desbalanceado se le llama Procedimiento Tukey-Kramer.
Para un factor de interés con 5 niveles y que el orden por magnitud sea A,B,C,D Y E.
213
7.3.3 Plantear Hipótesis y sus Reglas de Decisión
214
7.3.5 Comparar la diferencia de medias con el comparador Tukey
7.3.6 Hacer Conclusiones
7.4 Ejemplos
215
7.4.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
Análisis de Varianza
216
Se concluye que las cinco temperaturas ambientes determinadas afectan
significativamente el tiempo de activado de las baterías probadas.
217
7.4.5 Calcular los comparadores Tukey – puntos críticos de rechazo.
218
Se acepta la hipótesis nula para la pareja de medias (3,4) y se rechaza para
todas las demás parejas. Se concluye lo siguiente:
u3 = u4 ; u1 ¹ u2 ; u1 ¹ u3; u1 ¹ u4 ; u1 ¹ u5 ; u2 ¹ u4 ; u2 ¹ u5 ; u3 ¹ u5 ; u4 ¹ u5
7.4.2 Ejemplos
7.4.2.1 Problema a Resolver
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente
tabla.
219
7.4.2.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
El análisis de varianza:
Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa
(al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.
220
7.4.2.3 Ordenar en forma ascendente o descendente las medias de los
niveles, obtener las diferencias de las medias (cuadro de rangos
múltiples)
7.4.2.4 Plantear Hipótesis y sus Reglas de Decisión
H0= µ1=µ2 H1= µ1≠µ2
H0= µ1=µ3 H1= µ1≠µ3
H0= µ1=µ4 H1= µ1≠µ4
H0= µ2=µ3 H1= µ2≠µ3
H0= µ2=µ4 H1= µ2≠µ4
H0= µ3=µ4 H1= µ3≠µ4
Como se puede observar, las diferencias de tukey que exceden (DSH) están entre las
221
0.348 vs 0.3127 (1,4)
0.204 vs 0.3127 (1,2)
0.022 vs 0.3127 (1,3)
222
CAPÍTULO 8
8. NEWMAN KEULS
8.1 Definición
Es un procedimiento de comparaciones múltiples que ordena las medias de los grupos
de menor a mayor y establece el rango a utilizar para comprobar la hipótesis de que no
hay diferencias significativas entre las medias, en función del nº de pasos que hay
entre 2 medias a contrastar.
8.2 Generalidades
Esta prueba se basa en la separación de un par específico de medias que se
prueban del conjunto completo de medias ordenadas.
Fue desarrollada por Newman (1939) y Keuls (1952) en donde utilizaron
intervalos múltiples entre medias como criterio de conclusión.
8.3 Pasos
223
Fc>Fα
Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.
Ho: u5=u3 Ho: u2=u3 Ho: u1=u2 Ho: u5=u2 Ho: u1=u5
H1: u5=u3 H1: u2=u3 H1: u1=u2 H1: u5=u2 H1: u1=u5
Regla de decisión
224
8.3.5 Calcular el error estándar
DBA sy CMEE
n
sy CMEE
k
DCL
sy CMEE
t
DCGL
sy CMEE
t
Para un D. C. A (desbalanceado)
1 1 1 1
n n n n
...
i 1 2 k
225
8.3.7 Comparar los valores obtenidos en la diferencia de medias según su
posición, con los correspondientes valores obtenidos para los comparadores
newman-keuls.
8.3.9 Concluir
Para la solución de este problema debemos seguir los pasos antes descritos.
226
De aquí podemos observar que F calculada es mayor que la F crítica, por ende se dice
que si es significativo el ANDEVA.
Y 1 =2971 Y 4 =2666 . 25
Y 2 =3156 .25 Ordenadas Ascendente Y 3 =2933 .75
Y 3 =2933 . 75 Y 1 =2971
Y 4 =2666 . 25 Y 2 =3156 .25
Luego de esto se debe plantear las Hipótesis. En este caso de la siguiente forma:
Ho: μ2 =μ 4 H 1 : μ2 ≠μ 4
Ho: μ2 =μ3 H 1 : μ2 ≠μ 3
Ho: μ2 =μ1 H 1 : μ2 ≠μ 1
Ho: μ1 =μ4 H 1 : μ1 ≠μ 4
Ho: μ1 =μ3 H 1 : μ1 ≠μ 3
Ho: μ3 =μ 4 H 1 : μ3 ≠μ4
|Y i −Y j|≥NK 227
Descartar Ho si:
12825 .68
s y =√ CMEE
n
S ȳ = √ 4
= 56.62
NK=q α , p , glee S ȳ
i
228
Se debe calcular el comparador:
|490|≥NK 4
490 vs237 .804
|222 .5|≥NK 3
222.5vs 13.4574
|185 .25|≥NK 2 185 .25 vs174.3896
|304 . 75|≥NK 3 304 .75vs213.4574
|37 . 25|≥NK 2 37 .25 vs174.3896
|267 . 5|≥NK 2 267 .5 vs174.3896
229
n.s.
230
CAPÍTULO 9
9. DUNNETT
9.1 Definición
H0 = µi = µa
H1 = µi = µa
9.2 Generalidades
231
Por ejemplo, para un ANDEVA significativa a un nivel de 5% (α= 0,05), se realizan
comparaciones múltiples al 5%. Sin embargo, algunos investigadores realizan
comparaciones a niveles diferentes lo cual, desde el punto de vista estadístico también
es posible realizar. Lo que no puede hacerse, sin embargo, es realizar comparaciones
múltiples al nivel de 1% (α = 0,01) cuando el ANDEVA sólo muestra diferencias al 5%.
Como habíamos indicado, existen muchos métodos para llevar a cabo estas
comparaciones, que emplean tablas como la t de Student o tablas elaboradas
especialmente para este efecto, como las de Dunnett o las de Tuckey.
9.3 Pasos
En esta prueba se establece previamente un patrón o testigo para compararlo con los
otros niveles del factor de interés.
Se descarta Ho si Fc ≥ Fa,gln,gld
Se calculan cada una de las medias de los niveles del factor de interés de acuerdo al
modelo utilizado para realizar el experimento.
Ӯi. = ∑Ӯi.
n
232
9.3.3 Formular las hipótesis y la regla de decisión
Calculadas las medias de los niveles del factor de interés, se formula la hipótesis de
interés y la regla de decisión de la diferencia entre las medias y medir la diferencia
significativa entre estas.
∫ yi− yk ∫ ¿ CDU
Descartar Ho si:
Para calcular el comparador de Dunnett existe una fórmula específica para cada diseño
experimental, veamos.
Para un DCA:
2 CMEE
Balanceado: DU =d ¿ (k−1, glee )
√ n
1 1
No Balanceado: DU =d ¿ (k −1, glee ) CMEE∗ n + n
i j √ ( )
glee = grados de libertad del error
Para un DBA:
2 CMEE
DU =d ¿ (k−1, glee )
√ n
n= número de bloques
233
t= número de letra latina o letras griegas.
9.3.6 Conclusión
Al final el resultado demuestra que si la diferencia entre las medias es mayor que el
comparador de Dunnett existen diferencias en la variable respuesta sobre el efecto de
los noveles del factor de interés.
234
Comparando el cálculo de la Fc con F crítico para rechazar o aceptar la hipótesis
principal.
Se descarta Ho si Fc ≥ Fa,gln,gld
Cálculo de la ANDEVA
Origen SC GL CM Fc F crítico
Técnicas de 489740.188 3 163246.7 12.7281075 3.49029482
mezclado 29
EE 153908.25 12 12825.68
75
Total 643648.438 15
Y 4 =2666 . 25
Y 3 =2933 .75
Y 1 =2971
H o : u2 =u 4
Y 2 =3156 .25
H 1 : u2 ≠u4
9.4.1.3 Formular la hipótesis y la regla de decisión
H o : u1 =u 4
H 1 : u1 ≠u4
235
H o : u3 =u 4
H 1 : u3 ≠u4
Descarta Ho si ∫ yi− yk ∫ ¿ CDU
2 CMEE
CDunnet =d ¿ (k−1 ,f )
n √2(12825.68)
CDunnet =d 0 .05,(3,12)
4 √
CDunnet=2.14
¿ Ȳ 2−Ȳ 4 /¿ 490≻214 . 61
¿ Ȳ 1−Ȳ 4 /¿304 . 75≻214 .61
¿ Ȳ 3−Ȳ 4 /¿ 267 .5≻214 .61
9.4.1.6 Conclusión
236
En base a los resultados obtenidos podemos concluir que existen diferencias
significativas en la resistencia a la tensión del cemento Portland, al comparar las
técnicas de mezclado (1, 2, 3) con la técnica de mezclado 4 (patrón).
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requerimientos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes.
Cálculo de la ANDEVA
Origen SC GL CM Fc F crítico
Plantas 0,470255 3 0,1567 5.1708 3.2040
EE 0,48504 16 0,0303
Total 0,955295 19
237
9.4.2.2 Cálculo de las medias de los niveles del factor de interés.
H o : u D = uC
H 1 : u D≠uC
Descarta Ho si ∫ yi− yk ∫ ¿ CDU
H o : u B =uC
H 1 : uB ≠uC
H o : u A =uC
H 1 : u A ≠uC
1 1
√
CDunnet=d ¿ (k −1, glee) CMEE∗
( )+
ni n j
1 1
√
CDunnet=d 0 . 05( 3 ,16 ) 0 . 0303∗ +
CDunnet = 0.30068
( )
5 4
238
9.4.2.5 calcular las diferencias entre las medias y compararlas con el
comparador de Dunnett.
9.4.2.6 Conclusión
239
CAPÍTULO 10
.En los capitulo anteriores pudimos observar paso a paso como se utiliza el Diseño
Completamente al Azar para realizar diseño de experimentos para una sola variable.
El tipo más simple de experimento factorial comprende solamente dos factores, los
cuales serán denotados por A y B.
En este modelo los datos de muestra son clasificados en función de dos variables
aleatorias independientes (factores).
10.2 Generalidades
10.3 Pasos
240
Factor A: Variable experimental independiente. Cuyo efecto sobre la variable
de respuesta es de particular interés para el experimentador.
Yijk = es la k-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel del
factor B.
μ = promedio total
Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.
H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente
H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente
H o : μ11 =μ12=... .. . .. . μ ab
H1: al menos una es diferente
Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.
242
En el caso del factor A
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
H1: al menos una es diferente
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.
243
H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
Para las reglas de decisión los valores de F deben ser calculados con las tablas de
Fisher y los grados de libertad calculados dependiendo del caso.
244
aleatorización tiende a promediar entre los tratamientos cualquier efecto sistemático
presente de forma que las comparaciones entre tratamientos midan sólo los efectos de
los tratamientos mismos.
• En este diseño existirán abn observaciones, por lo tanto se buscan esta totalidad
de números aleatorios y las pruebas o unidades experimentales se enumeran en
orden aleatorio.
245
Tabla 10.1 Arreglo General de un diseño completamente al azar de dos factores.
246
Yi , mientras que el factor B representa las columnas, por ellos se suman
verticalmente los datos dándonos el total de los Y j. Así tenemos el resumen de
nuestros datos de manera ordenada y entendible para realizar nuestro experimento
como se ve en la Tabla 10.2.
10.3.6 ANDEVA
a
1
SCB = an ∑ Y 2. j.−Y 2. . . ¿ abn
i=1
a b 247
SCEE=SCTo−SCcom
a b n
SCT 0 =∑ ∑ ∑ Y 2ijk−Y 2. . . ¿ abn
i=1 j=1 k=1
De esta manera si, al obtener el Fcalculada se debe comparar con la F y así llegar a
concluir a través de las reglas de decisiones si las hipótesis se cumplen o no, y si los
factores tienen efectos significativos sobre la variable de respuesta.
10.3.7. Conclusiones
Se recomienda:
Decidir que medidas implementar para generalizar el resultado del estudio y garantizar
que los mejores se mantengan.
Por lo tanto para un Diseño Completamente al Azar de dos factores se debe tener en
cuenta cada factor con su interacción como se ve descrita en la formulación de
hipótesis con su respectiva regla de decisión.
248
Para Factor A, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor A son
significativos sobre la variable de respuesta
Para Factor A, Fc < Fa se acepta Ho. Se concluye que los efectos del factor A no
son significativos sobre la variable de respuesta.
Para Factor B, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor B son
significativos sobre la variable de respuesta
Para Factor B, Fc < Fa se acepta Ho. Se concluye que los efectos del factor B no
son significativos sobre la variable de respuesta.
s² = CMEE
Cálculo del Intervalo de Confianza del 100( 1 – α) % para la Media μi del i-ésimo nivel
del factor A, Media μj del j-ésimo nivel del factor B de un Diseño Completamente al
Azar de dos factores.
Factor B-----------
IC μj = y j.±t α /2 ,k (n−1) √ CMEE/n
249
10.3.10 Comparaciones Múltiples
Cuando las medias de los renglones o columnas difieren, por lo general es de interés
hacer comparaciones entre las medias individuales de los renglones o columnas para
descubrir diferencias específicas.
Una forma de manejar esta situación es fijar un nivel de B y aplicar la prueba a las
medias del factor A con ese nivel.
Las pruebas que se pueden realizar para esto son: Prueba de Duncan, prueba Tukey y
la Newman Keuls, que a continuación explicaremos como realizar en las DCA de dos
factores.
Prueba Duncan
• Conclusión
Para las pruebas Tukey y Newwman Keuls se siguen los mismos criterios que en la
prueba Duncan.
Considere el caso en que un ingeniero diseña una batería para su uso en un dispositivo
que será sometido a ciertas variaciones extremas de temperatura. El único parámetro
de diseño que él puede seleccionar en este punto es el material de la cubierta de la
batería y tiene tres alternativas.
Decide probar los tres materiales de la cubierta a tres niveles de temperatura (15, 70 y
125 F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías
a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se
ejecutan al azar.
251
Factor B: Temperatura
2. Existe una elección del material que de por resultado una duración uniformente
larga sin importar la temperatura?
O también,
252
εijk= error experimental
10.4.1.3 Hipótesis
H0: u1= u2 = u3
Factor B (Temperatura)
H0: u1= u2 = u3
Interacción AB
253
Unidad Orden Asignación
Experimental Aleatorio
1 10 a1b1
2 1
3 11
4 20
10.4.1.4 Aleatorización
5 16 a1b2
6 14
7 19
8 25
9 22 a1b3
10 36
11 30
12 27
13 34 a2b1
14 2
15 26
16 24
17 4 a2b2
18 6
19 7
20 5
21 35 a2b3
22 13
23 18
24 21
25 31 a3b1
10.4.1.5 26 9 Registros de
Datos 27 28
28 33
29 23 a3b2
30 8 254
31 15
32 17
Datos de duración (en horas) para el ejemplo de diseño de una batería
FACTORES Temperatura
15 70 125
Tipo 1 130 34 20
74 80 70
155 40 82
180 75 58
de 2 150 126 25
159 122 70
188 106 58
126 115 45
Material 3 138 174 96
168 150 104
110 120 82
160 139 60
Tabulamos los datos, sumando las observaciones en cada uno de los factores y
calculando los totales por filas y columnas (factor A y factor B).
255
/TEMPERATURA
Podemos resumir todos estos cálculos en un solo cuadro que nos facilitará el
cálculo del ANDEVA.
256
Descriptivos
Estadístico Error típ.
Duracion Media 105.2500 7.82420
Intervalo de confianza para la media al 95% Límite inferior
89.3660
Límite superior 121.1340
Media recortada al 5% 105.4630
Mediana 108.0000
Varianza 2203.850
Desv. típ. 46.94518
Mínimo 20.00
Máximo 188.00
Rango 168.00
Amplitud intercuartil 77.25
Asimetría -.056 .393
Curtosis -1.026 .768
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-
Wilk
Estadístico gl Sig.
Estadístico gl Sig.
Duracion .106 36 .200* .969 36
.396
a. Corrección de la significación de
Lilliefors
*. Este es un límite inferior de la
significación verdadera.
10.4.1.7 ANDEVA
257
Material(A)
Temperatura( 39083 2 19542 29.34 2E-07 3.354
B)
Interacción(A 9437.7 4 2359 3.543 0.019 2.728
xB)
EE 17981 27 666
Totales(To) 77135 35
Se realiza el análisis de varianza con las formulas anteriormente mencionadas y con
ayuda de los datos calculados al momento del registro de datos.
10.4.1.8 Conclusiones
Para tipo de material, Fc=7.91 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos del tipo material son significativos sobre la duración promedio de las
baterías.
Para temperatura, Fc=28.97 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos de la temperatura son significativos sobre la duración promedio de las
baterías.
Para la interacción, Fc=3.56 > Fa=2.73 \ Se rechaza H0. Se concluye que los
efectos de la interacción entre el tipo de material y la temperatura son
significativos sobre la duración promedio de las baterías.
R2 = 59416.22/77646.97=0.765= 77%
258
10.4.2 EJEMPLO. QUALITY CONTROL 2 = CMEE= 675.21
En un artículo publicado en Industrial Quality Control (1956, pp 5-8) se describe un
experimento para investigar el efecto del tipo de vidrio y el tipo de fósforo sobre la
brillantez de un cinescopio de televisor. La variable de respuesta es la corriente
necesaria (en microamperes) para obtener un nivel de brillantez especificado. Los
datos son como sigue:
Determinar el efecto que tiene el tipo de vidrio y fósforo sobre la corriente necesaria
para obtener un nivel de brillantez específico.
259
Ai = es el efecto del i-ésimo tipo de vidrio
10.4.2.3 Hipótesis
Vidrio (A)
H o : μ1 =μ2 =. μ 3
Operador (B)
H 0 : σ 12=σ 22
Interacción (AB)
260
H1: al menos una es diferente
Normalidad
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
261
Estadístic gl Sig. Estadístic gl Sig.
o o
Corriente .263 18 .002 .837 18 .005
Independencia
Homocedasticidad
262
H o =σ 12=σ 22=σ 23 =σ 24 . .. .. σ 218
H1: Al menos una varianza es diferente.
Total 17 13794.4
10.4.2.8 Conclusiones
263
Para los tipos de vidrio: dado que F C = 1.19 > Fcrítica = 0.363, se Rechaza Ho y se
concluye que hay efecto significativo en la corriente necesaria para obtener un nivel de
brillantez específico de acuerdo al tipo de vidrio.
Para los operarios: dado que F C = 0.92 > Fcrítica = 0.355, se rechaza Ho y se concluye que
hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido al tipo de fósforo.
Para la interacción: dado que F C = 0.40 < Fcrítica = 0.675 , se acepta Ho y se concluye que
no hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido a la interacción entre los vidrios y los fósforos.
10.5.1 EXCEL
264
• La tercera opción, “Alfa”, aparecerá predeterminada como 0.05, de ser
necesario un alfa diferente entonces hacemos el cambio escribiendo el nuevo
alfa en la casilla dada.
265
266
10.5.2 MINITAB
268
PARA LOS SUPUESTOS Y ANÁLISIS DE VARIANZA
269
270
10.5.3 PASW
271
En PASW las variables no se aleatorizan como en MINITAB, es por eso que al
insertar los datos se debe insertar cada uno de los valores de las variables,
aunque se repitan, especialmente en los casos en los que son 2 muestras o más
por factor.
Para calcular el ANDEVA, una vez se han insertado los datos en el programa,
los pasos que se deben seguir son:
Menú ANALIZAR, Modelo lineal general, Univariante
272
Aceptar.Para el resto de los supuestos, se recomienda utilizar otros
programas como MINITAB.
CAPÍTULO 11
Ya se han analizado los conceptos para la formación de bloques con un solo factor. En
este capítulo se presenta como realizar la formación de bloques en un diseño factorial.
11.2 Generalidades
273
El experimento tiene dos factores que se denominarán A y B , los cuales tendrán a y b
niveles respectivamente. Por lo tanto existirán ab combinaciones de niveles
Los factores podrán ser todos fijos o todos aleatorios o la combinación de ambos
Se consideran n bloques
Cada una de las combinaciones de niveles de los factores se asigna a cada uno de los
bloques. Por lo tanto existirán a*b*n observaciones en total en el experimento.
11.3 Pasos
11.3.1 Definición del problema
Determinar si existe diferencia altamente significativa en la variable de respuesta
promedio en un experimento usando el factor de interés A y B para el número de
bloques diferentes.
274
eijk error experimental.
PARA EL FACTOR A:
Ho: m1= m2 ........... = ma
Hi : al menos una de las mi es distinta a 0
PARA EL FACTOR B:
Ho: m1= m2 ........... = mb
Hi : al menos una de las mj es distinta a 0
INTERACCIÓN AxB:
Ho: m11= m21 ........... = mab
Hi : al menos una de las mijes distinta a 0
BLOQUES:
Ho: m1= m2 ........... = mn
Hi : al menos una de las mk es distinta a 0
Regla de decisión
SE RECHAZA Ho SI FC > Fa,gln,gld
gln grados de libertad del numerador
gld = grados de libertad del denominador
275
Interacción AxB( a - 1 ) ( b - 1 )
Bloques (n-1)
A cada uno de los bloques se le debe asignar cada una de las combinaciones de los
factores en forma aleatoria.
276
Y ijk Y ..k
277
Es importante tomar en cuenta a la hora de registrar los datos que el formato debe
contener quien hizo el reporte, la fecha de confección, el motivo, la unidad de medición
y el nombre de la empresa.
2 2 2
H0: σ 11 = σ 12 = σ ab
Nota: los supuestos deben verificarse en los programas minitab y pasw. En la sección
de ejemplos del capítulo se presentan.
F.V. GL SC CM FC Fα,gln,gld
A a-1 1
a
SCA CMA F ∝´ (a-1)(ab-1)(n-1)
∑ Y 2 ..−Y 2…/abn
bn i=1 i a−1 CMEE
B b-1 1
b
SCB CMB F ∝´ (b-1)(ab-1)(n-1)
∑ Y 2 .. j −Y 2…/abn b−1 CMEE
an j=1
278
Entre ab -1 1
a b
SCcomb . CMcomb F ∝´ (ab-1)(ab-1)(n-1)
∑ ∑ Y 2ij−Y 2…/abn CMEE
comb. n i=1 j=1 ( ab−1)
Entre n-1 1
n
SCBloq CMbloq F ∝´ (n-1)(ab-1)(n-1)
∑ Y 2..k −Y 2…/abn n−1 CMEE
bloque ab k=1
s
Error (ab-1)(n-1) SCTo-(SCComb. + SCEE
SCBloq) ( ab−1 )( n−1)
a b n
Total (abn-1)
∑ ∑ ∑ Y 2ijk−Y 2…/abn
i j k
11.3.8 Conclusiones
Y…
μ=
abn
σ 2=C . M . E . E .
S .C .Comb .+ S . C . Bloques
R 2=
S . C . Totales
279
11.4 EJEMPLO. CAPACIDAD DE DETECTAR OBJETOS
280
11.4.2 Modelo Estadístico
i=1,2,3
j=1,2
k=1,2,3,4
(tb)ij= es el efecto de la interacción entre el tipo de filtro (ti) y el nivel de ruido (bj)
11.4.3 Hipótesis
281
Para el nivel de ruido
Ho: 1= 2 = 3
Ho: 1= 2
InteracciónAxB:
282
Tipo De Filtro
nivel del 1 2 Yi..
Ruido
bajo 378 343 Y₁..=721
mediano 409 354 Y₂..=763
alto 432 362 Y₃..=794
Y.j. Y.₁.=1219 Y.₂.=1059 Y…=2278
Supuesto de Normalidad
Gráfica de probabilidad de C7
Normal
99
Media 94.92
Desv .Est. 9.436
95 N 24
RJ 0.990
90
Valor P >0.100
80
70
Porcentaje
60
50
40
30
20
10
1
70 80 90 100 110 120
C7
Supuesto de Homosedasticidad
283
2 2 2
H0: σ 11 = σ 12 = σ ab
Supuesto de independencia
vs. orden
(la respuesta es C7)
5.0
2.5
Residuo
0.0
-2.5
-5.0
2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación
284
Analisis de varianza (Andeva) por calculadora
Factor de gl SC CM Fc Fα
variacion
nivel de Ruido 2 335.583 167.7815 15.13 6.36(**)
(factor A)
Tipo de filtro 1 1066.667 1066.667 96.19 8.68(**)
(factor B)
11.4.8 Conclusiones
285
Se rechaza HO y se acepta H1; y se concluye que existe diferencia altamente
significativa en el nivel de intensidad promedio en la detección de objetivos en la
pantalla de un radar, debido a la habilidad de los operadores.
INTERACCIÓN axb
Se rechaza H1y se acepta Ho; y se concluye que la interacción entre los niveles
de ruido y el tipo de filtro, no son altamente significativos en el nivel de
intensidad promedio en la detección en la pantalla de un radar.
2278
µ¿ 24 = 94.917
σ 2= 11.089
Coeficiente de Determinación
1279.333+166.333
R 2= =80.4 %
2047.333
286
CAPÍTULO 12
Los diseños completamente al azar de tres factores, al igual que los DCA de dos
factores, son un conjunto de puntos experimentales que pueden formarse
considerando todas las posibles combinaciones de los niveles de los factores en cada
ensayo completo o réplica del experimento.
12.2 Generalidades
287
Permiten estimar los efectos de un factor en diversos niveles de los otros
factores produciendo conclusiones que son válidas sobre toda la
extensión de las condiciones experimentales
12.3 Pasos
288
i=1..........a
j=1.........b
k=1.........c
l=1..........n
Definición de los componentes del modelo:
m = media total
(AB)ij= efecto de la interación del i-ésimo nivel del factor A y el j-ésimo nivel del
factor B.
(BC)jk = efecto de la interación del j-ésimo nivel del factor B y el k-ésimo nivel del
factor.
(AC)ik = efecto de la interación del i-ésimo nivel del factor A y el k-ésimo nivel
del factor C.
(ABC)ijk = efecto de la interación del i-ésimo nivel del factor A, el j-ésimo nivel del
factor B y el k-ésimo nivel de C.
289
12.3.3 Formulación de la hipótesis
Realizamos la formulación de las hipótesis, de la misma forma que se lleva a
cabo en los Diseños anteriormente visualizados, pero debemos completarla para
cada uno de los factores de interés que estamos estudiando:
Para el factor A
Ho: m1 = m2 =. . . = ma
HI: al menos un promedio es diferente
Para el factor B
Ho: m1 = m2 = . . . = mb
HI: al menos un promedio es diferente
Para el factor C
Ho: m1 = m2 = . . . = mc
HI: al menos un promedio es diferente
INTERACCIONES:
290
Para la interacción (AC)ik
Ho: m11 = m12= . . . = mac
HI: al menos un promedio es diferente
Descartar Ho, si Fc³Fa,gl(AC)ij,glEE
291
En el formulario de recolección de información, se deben registrar los siguientes
datos, además de los obtenidos:
Nombre de la persona que hizo el reporte
Fecha en que se ejecutó el experimento
Mes
Motivo
Unidad de medición
Factores de Interés
Nombre de la Empresa
Suministrar toda la información adicional que se considere necesaria para
facilitar la comprensión de los datos.
: : : : :
: :
Y ijkl: : :
Y ijk.
Para una mejor comprensión de los cálculos se elaboran 3 tablas de dos
factores incluyendo los niveles de cada uno:
Tabla AxB
Tabla AxC
Tabla BxC
292
TABLA A X B:
1 .... b TA
: :
Y i...
A : : Y ij.. :
Y . j ..
TABLA DE B X C:
293
C
1 .... c TB
Y.1..
1 Y.11. .... Y.1c.
B : : : :
:
Y . j ..
....
b Y.b1. Y . jk . Y.bc. Y.b..
Y ..k.
TABLA A X C
294
1 .... c TA
A : :
:
:
:
Y i...
Y i.k .
a Ya.1. .... Ya.c. Ya...
Y ..k.
12.3.7 ANDEVA
295
A a-1 SCA SCA/(a-1) CMA/CMEE F,a-
1,abc(n-
1)
B b-1 SCB SCB/(b-1) CMB/CMEE F,b-
1,abc(n-
1)
C c-1 SCC SCC/(c-1) CMC/CMEE F,c-
1,abc(n-
1)
AB (a-1)(b-1) SC(AB) SC(AB)/ CM(AB)/CMEE F,(a-1)
(a-1)(b-1) (b-
1),abc(n-
1)
AC (a-1)(c-1) SC(AC) SC(AC)/ CM(AC)/CMEE F,(a-1)
(a-1)(c-1) (c-
1),abc(n-
1)
BC (b-1)(c-1) SC(BC) SC(BC)/ CM(BC)/CMEE F,(b-1)
(b-1)(c-1) (c-
1),abc(n-
1)
ABC (a-1)(b-1) SC(ABC) SC(ABC)/ CM(ABC)/CMEE F,(a-1)
(c-1) (a-1)(b-1)(c-1) (b-1)(c-
1),abc(n-
1)
CN abc-1 SCCN SCN/(abc-1)
EE abc(n-1) SCEE SCEE/(abc(n-1))
To abcn-1 SCTo
1
a
2 Y 2… .
SCA= ∑Y −
bcn i=1 i … abcn
296
1
b
2 Y 2… .
SCB= ∑Y −
acn j=1 . j .. abcn
1
c
2 Y 2… .
SCC= ∑ Y −
abn k=1 .. k. abcn
1
a b
2 Y 2….
SCAB= ∑ ∑ Y ij ..− −SCA−SCB
cn i=1 j=1 abcn
1
a c
2 Y 2… .
SCAC= ∑∑ Y − −SCA−SCC
bc i=1 k=1 … . abcn
1
b c
2 Y 2….
SCBC= ∑ ∑ Y . jk . − −SCB−SCC
an j=1 k =1 abcn
SCABC=SCCN −¿
1
a b c
2 Y 2… .
SCCN= ∑ ∑ ∑ Y ijk . −
n i=1 j=1 k=1 abcn
SCEE=SC T o −SCCN
a b c n
2 Y 2… .
SC T o=∑ ∑ ∑ ∑ Y ijkl−
i=1 j=1 k=1 l =1 abcn
297
12.3.8 Conclusiones
En cuanto se conozca si se acepta o se rechazan las hipótesis podremos
concluir si existe, o no, diferencias significativas entre los promedios de la
“variable de respuesta” para los 3 factores (A, B y C).
Se concluye también, si existe o no, diferencias significativas entre los
promedios de la “variable de respuesta” para los factores combinados (AB, AC,
BC y ABC).
a b c n
∑ ∑ ∑ ∑ Y 2ijkl
μ= Ý = i=1 j=1 k=1 l=1
n
σ 2=CMEE
En teoría, la máquina llenadora introduce líquido en cada botella hasta la altura objetivo
correcto, pero en la práctica existe variación alrededor de este objetivo, y el fabricante
quisiera comprender mejor las fuentes de esta variabilidad para poder hacer un estudio
que permita reducirla a un mínimo.
298
El ingeniero de proceso puede controlar tres variables durante el proceso de llenado:
porcentaje de carbonatación (A), la presión de operación en la llenadora (B) y el
número de botellas que se llenan por minuto o velocidad de la línea (C).
El ingeniero decide correr dos réplicas de un diseño factorial con estos tres factores,
haciendo las 24 corridas de manera aleatoria. Se mide la desviación de la altura de
llenado objetivo que se observa en una corrida de producción de botellas con cada
conjunto de condiciones.
299
12.4.1 Desarrollo del problema
Problema: Determinar si existe diferencias significativas en la
desviación de la altura de llenado promedio para los diferentes
porcentajes de carbonatación (10%, 12% y 14%), utilizando dos
diferentes presiones de operación en la llenadora (25 psi y 30 psi) y
dos diferentes velocidades en la línea (200 bpm y 250 bpm).
Definición de variables:
Interacciones:
i. Modelo estadístico
300
(AC)ik: Es el efecto del i-ésimo porcentaje de carbonatación y la k-ésima
rapidez de línea sobre la VR.
(BC)jk: Es el efecto de j-ésima presión de operación y la k-ésima rapidez de
la línea sobre la VR.
(ABC)ijk: Es el efecto del i-ésimo porcentaje de carbonatación, de la j-ésima
presión de operación y la k-ésima rapidez de la línea sobre la VR.
eijkl = error experimemtal
ii. Hipótesis:
Para el factor A Ho: m1= m2 =m3
H1: al menos una de las m de los promedios es diferente.
301
Regla de decisión:
Se descarta Ho si FC ³ Fa , glN,,glD
iii. Aleatorización
302
1 1 3 5
14 5 7 7 10
4 6 9 11
Tabla AxB
B
25 30 TA
10 -5 1 -4
12 4 16 20
14 22 37 59
TB 21 54 75
Tabla BxC
C
200 250 TB
25 6 15 21
30 20 34 54
TC 26 49 75
Tabla AxC
C
200 250 TA
10 -5 1 -4
12 6 14 20
14 25 34 59
TC 26 49 75
303
12.4.6 Supuestos del Modelo
MINITAB
Recordando los pasos:
1. Estadísticas
2. DOE
3. Factorial
4. Crear diseño factorial
5. Diseño factorial general, 3 factores
Proceso de aleatorización
A B C
3 1 2 7
2 1 2 2
2 1 2 1
3 1 1 5
1 1 1 -3
3 1 1 4
1 1 1 -1
2 2 1 2
1 2 2 1
3 2 2 1
1 1 2 6
2 1 1 11
1 2 1 3
3 1 2 10
3 2 1 5
2 1 1 9
2 2 2 6
3 2 1 7
1 2 2 -1
304
2 2 1 0
2 2 2 1
1 1 2 0
1 2 1 -1
3 2 2 0
1. Estadísticas
2. DOE
3. Factorial
4. Analizar diseño factorial
305
Se cumple el supuesto de independencia ya que los datos en la gráfica no se
encuentran correlacionados entre sí.
12.4.7 ANDEVA
306
SCN 328.13
R 2= = =0.9747=97.47 %
SC T o 336.63
75
μ= Ý = =3.125
24
σ 2=CMEE=0.708
12.4.9 Conclusión
Se concluye que existe diferencia significativa entre los promedios de las
desviaciones de las alturas de llenado para los 3 factores: 3 porcentajes de
carbonatación, 2 presiones de operación, 2 velocidades de línea.
Se concluye también que no existen diferencias significativas entre los
promedios de la desviación de alturas promedios de llenado para:
La combinación de factores: AB, AC, BC y ABC.
307
CAPÍTULO 13
308
Este es el más simple y quizás el ampliamente usado de los diseños de bloques al azar
que es definido por Hinkelman(1994) así: El material experimental es dividido en
grupos de unidades experimentales (UE) cada uno, donde es el número de
tratamientos, tales que las UE dentro de cada grupo son lo más homogénea posible y
las diferencias entre las UE sea dada por estar en diferentes grupos. Los conjuntos son
llamados bloques. Dentro de cada bloque las UE son asignadas aleatoriamente, cada
tratamiento ocurre exactamente una vez en un bloque.
13.2 Generalidades
13.3 Pasos
309
7. Tabla de datos
8. Verificación de los supuestos
9. Análisis de varianza ( andeva )
10. Conclusiones
11. Cálculos de parámetros
12. Calculo de intervalos de confianza
Yijkl = es la l-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel
del factor B y el k-ésimo nivel del factor C.
μ= promedio total
(AB)ij = efecto de la interacción entre i-ésimo nivel del factor A y el j-ésimo nivel
del factor B.
(BC)jk = efecto de la interacción entre j-ésimo nivel del factor B y el k-ésimo nivel
del factor C.
310
(AC)ik = efecto de la interacción entre i-ésimo nivel del factor A y el k-ésimo
nivel del factor C.
PARA EL FACTOR A
PARA EL FACTOR B
FACTOR C
BLOQUES
INTERACCIÓN AB
311
Hi : al menos una de las mediases diferente
NTERACCIÓN BC
INTERACCIÓN AC
INTERACCIÓN ABC
Factor A
Factor B
Factor C
Interacción AB
312
Interacción BC
Interacción AC
Interacción ABC
13.3.5 Aleatorización
Bloques
A =2 A1B1C2 A2B1C2
B =2 A1B2C1 A2B2C1
313
C =2 A1B2C2
n =3 A2B1C1
13.3.5.1 Esquemas
DBA:
Tabla AB.
314
Tabla AC.
Tabla BC.
Normalidad:
315
Donde: y es el mayor residual en valor absoluto. Si
este valor excede el valor crítico de tabla, la observación es declarada como un outlier
potencial. Estas deben ser localizadas y examinadas para buscar causas
asignables. La eliminación arbitraria de valores extremos debe evitarse.
Normalidad:
Homocedasticidad:
Homogeneidad de varianza
La prueba gráfica de igualdad de varianza es graficar los residuales contra los valores
316
Las pruebas analíticas para igualdad de varianza dadas por el DCA no son aplicables a
bloques ya que no se tienen estimadores independientes de las varianzas de los
tratamientos. Existen algunos procedimientos, pero quizá el más simple es el
Los errores son igualmente correlacionados dentro de los bloques, pero son
independientes entre bloques.
Donde es el número de bloques y los son los residuales en el tratamiento . Note
que la varianza no es calculada directamente de los datos, por ello la no independencia
de las varianzas. Observe que para el calculo de la varianza del tratamiento 1 utiliza a
317
Los valores críticos de la prueba estadística son basados sobre puntos de porcentaje
si . Los puntos de porcentaje de han sido tabulados por Harter
(1960) y pueden ser obtenidos en la tabla C-7 de Martin.
Hipótesis:
Ho: µ1 = µ2 = µ3
Independencia
318
Luego de haber visto los supuestos estamos en la capacidad de confeccionar la
tabla de ANDEVA. Las formulas y ecuaciones se describen en
319
13.3.8.1 Formulas:
Tabla 13.6
a
Y....2
Y
1
SCA 2
i ...
b cn i 1 abcn
b
Y....2
Y. 2j ..
1
SCB
a cn j 1 a b cn
c
Y....2
Y
1
SCC 2
.. k .
abn k 1 ab cn
a b
Y....2
Y
1
SCAB 2
ij.. SCA SCB
cn i 1 j 1 abcn
a c
Y....2
Y
1
SCAC 2
i .k . SCA SCC
bn i 1 k 1 abcn
b c
Y....2
Y
1
SCBC 2
. jk . SCB SCC
an j 1 k 1 abcn
a b c n
Y....2
SCTo
i 1 j 1 k 1 l 1
2
Yijkl
abcn
320
1 n 2 Y....2
SCBLOQUES Y... l abcn
abc l 1
1 n 2 Y....2
SCCN Yijk.
n l 1 abcn
13.3.9 Conclusiones
bloque o interacción.
Promedio μ = y..../abcn
Varianza s 2 = CMEE
321
BIBLIOGRAFÍA
MOODLE.
322