Dba 3 Factores 2019

CAPÍTULO 1: Diseño Completamente al Azar
Unifac
Unifactorial
.
El diseño completamente al azar (un solo factor) es el diseño más sencillo.

Consiste en asignar los niveles de un factor de interés (FI) a unidades
experimentales previamente aleatorizadas. Es necesario que dichas unidades
experimentales sean homogéneas.
Sus principales ventajas:
 Cualquier número de niveles y cualquier número de réplicas pueden ser

usadas, siempre y cuando se tengan suficientes sujetos u objetos
homogéneos.
 Análisis Estadístico simple
 Es muy preciso
Sus Desventajas
Se puede obtener baja precisión cuando las unidades experimentales no sean
muy homogéneas y así ser ineficiente
En la práctica los experimentos donde se aplican los diseños completamente al

azar pueden ser balanceados o desbalanceados. Un experimento balanceado es
aquel en el que el número de observaciones (n) por cada nivel del factor de
interés es igual, mientras que en el desbalanceado difiere el número de
observaciones de nivel a nivel.
Para aplicar cualquier diseño experimental es necesario hacer una serie de

consideraciones previas. En primer lugar es importante identificar cual es el
problema a estudiar para conocer cuales son las variables involucradas en el
mismo. Para el caso en el que se considera un solo factor el propósito principal
es medir el efecto de una variable independiente, conocida como factor de interés,
sobre una variable de respuesta o variable dependiente.
Además se debe considerar que objetos o sujetos constituyen la unidad
experimental, estimar el tamaño de muestra para cada nivel del FI, y cuál es el
nivel de significancia más adecuado para probar las hipótesis correspondientes.
Cuales son entonces en resumen las consideraciones previas que se deben hacer
al planificar un experimento donde se utilizará un diseño completamente al azar
 Problema
 Variable de Respuesta
 Factor de Interés
 Niveles
 Unidades Experimentales
 Tamaño de Muestra por cada nivel
 Establecer el nivel de significancia
Ejemplo 1:
El supermercado Daly Gourmet está interesado en realizar un estudio sobre la
vida de anaquel de las carnes que venden en sus diferentes locales en la Ciudad
de Panamá. Para esto solicita los servicios de Ingenieros Consultores S.A.
(I.C.S.A)
La vida de anaquel de las carnes almacenadas es el tiempo que un corte
previamente empacado es sano y vendible. Un paquete normal expuesto al aire
ambiental tiene una vida aproximada de 48 horas, después de las cuales la carne
comienza a deteriorarse por contaminación de microbios, degradación del color y
encogimiento. El empaque al vacío es efectivo para suprimir el desarrollo de
microbios, sin embargo, continúan siendo un problema los otros aspectos.
De acuerdo a experiencias y estudios recientes en el tema se sugieren las

atmósferas controladas de gas, como alternativa a los empaques actuales. Los
resultados de los mismos indican que dos atmósferas que prometen combinar la
capacidad de suprimir el desarrollo de microbios con la conservación de las
cualidades de la carne son: dióxido de carbono puro (CO2) y mezcla de monóxido
de carbono (CO), oxígeno (O2) y nitrógeno (N).
Con base en esta nueva información, los investigadores de I.C.S.A. sugieren

plantear una hipótesis para comparar las diferentes atmósferas en cuanto al
número de bacterias sicotrópicas en la carne, de tal manera que a través de los
resultados obtenidos en este experimento se puedan tomar para encontrar un
entorno más efectivo de empaque para el almacenamiento de las carnes.
El diseño experimental desarrollado por los mismos para evaluar la hipótesis

incluyó empaques con:
 Aire del ambiente con un empaque comercial de plástico
 Empaque al vacío
 Una mezcla de gases con 1% CO, 40% O2, y 59% N
 100% CO2.
A cada conjunto de condiciones de empaque le asignaron al azar 3 cortes del

mismo tamaño (75 kg). Cada corte se empacó por separado en las condiciones
asignadas y a cada uno se le midió el número de bacterias sicotrópicas en la
carne (el crecimiento bacterial se expresa como el logaritmo del número de
bacterias por centímetro cuadrado). Las bacterias sicotrópicas se encuentran en
la superficie de la carne y se asocian con la carne deteriorada.
Cuál es el problema objeto de estudio para esta situación?

Determinar si hay diferencias significativas en el número promedio de bacterias
sicotrópicas en la carne para diferentes condiciones de empaque.
De que otra forma se puede redactar el problema objeto de estudio?
Determinar el efecto de diferentes condiciones de empaque en el número de

bacterias sicotrópicas en los cortes de carne.
Que elementos contiene este problema?
Variable de Respuesta
Número de Bacterias Sicotrópicas en cada paquete de carne.
Factor de Interés o Variable Independiente
Condiciones de Empaque
Niveles:
• Aire del ambiente con un empaque comercial de plástico
• Empaque al vacío
• Una mezcla de gases con 1% CO,40% O2, y 59% N
• 100% CO2
Unidad experimental
Son los cortes de carne. Cada corte de carne se le empaca en las diferentes
condiciones, tomando tres cortes de carne para condición.
Ejercicio 1:
Tome un experimento cualquiera y defina lo siguiente
• Defina el problema objeto de estudio
• Identifique la variable de respuesta (VD), unidad experimental
• Identifique el factor de interés (VI) y sus niveles
• Número de observaciones por cada nivel
A. Caso Balanceado
Como se formula el Modelo Estadístico para un DCA, considerando un

experimento balanceado?
Tal como se ha mencionado, en un DCA se estudia el efecto de una variable

independiente denominada Factor de Interés (FI), sobre una variable de respuesta
a la que se le llama Variable Dependiente (VD).
Dependiendo de la estructura que el experimentador le quiera dar al formato

donde se registrarán los datos hay dos formas de escribir el modelo estadístico
para un DCA. El formato es una tabla de una vía donde se colocan en los
márgenes los niveles del FI y a través de la columna o la fila de cada uno se
escriben los valores medidos sobre la unidad experimental a la variable de
respuesta.
Si los niveles del FI se colocan en las columnas, la expresión (1) define el modelo
estadístico
Y ij=μ+τ j +ε ij
(1)
j=1. .. .. . k
i=1. . .. .. n
donde:
Y ij es la i-ésima medición realizada a la unidad experimental correspondiente

utilizando el j-ésimo nivel del factor de interés.
μ es la media total de los valores medidos sobre las unidades experimentales a la

variable de respuesta

τj es el efecto del j-ésimo nivel del factor de interés sobre los valores de la
variable
de respuesta

εij es el error experimental.
Si los niveles del FI se colocan en las filas, la expresión (2) define el modelo
estadístico
Y ij=μ+τ i +ε ij (2)
i=1. . .. .. k
j=1. .. .. . n
Y ij es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés
μ es la media total de los valores medidos sobre las unidades experimentales a

la variable de respuesta
τi es el efecto del i-ésimo nivel del factor de interés sobre la variable de

respuesta
ε ij el error experimental
En el diseño presentado en este capítulo, tanto en el diseño balanceado como en

el no balanceado siempre se utilizara k para representar a los niveles del FI y n
para el número de mediciones realizadas a la variable de respuesta para cada
nivel.
Dado que en un experimento donde se aplica un DCA se quiere comprobar si los
promedios de los valores observados por nivel son iguales, se requiere formular
una hipótesis estadística que permita comprobar si hay diferencias significativas
entre dichos promedios.
Cuando se plantea una hipótesis para un diseño experimental cualquiera primero

es necesario definir qué tipo de factor se está estudiando de acuerdo a la forma en
que son seleccionados los niveles del FI. De acuerdo a este criterio los factores
se clasifican en fijos y aleatorios. Para un DCA de un solo factor, este será o fijo o
aleatorio. En el capítulo 1 se explicó el significado de factores fijos y aleatorios.
Entonces de acuerdo a dicha clasificación como se formulan la Hipótesis Nula y

Alterna para un DCA?
Cuando el Factor es Fijo las Hipótesis Nula y Alterna se plantean

respectivamente, como en la expresión (3)
H o : μ1 =μ2 =. .. .. . .. . μ k
H1 = al menos una de las medias de los niveles del FI es diferente (3)
Y su respectiva regla de decisión para un nivel de significancia α dado, se plantea

a través de la prueba F de Fisher, como en la expresión (4)
F c≥F α , g ln, gld

Descartar Ho si: donde (4)
g ln=k−1
gld=k ( n−1 )
Donde
gln son los grados de libertad correspondientes a los niveles del factor
gld son los grados de libertad correspondientes al error experimental
Cuando el Factor es Aleatorio las Hipótesis Nula y Alterna se plantean

respectivamente, como la expresión (5)
2 2 2
:H 0 :σ 1 =σ 2=.. .. . .. .. σ k
H1 : al menos una de las varianzas de los niveles del FI es diferente (5)
Y su respectiva regla de decisión para un nivel de significancia α, se plantea a

través de la prueba F de Fisher, en la expresión (6)
F c≥F α , g ln, gld

donde
Descartar Ho si: g ln=k−1 (6)
gld=k ( n−1 )
donde
gln son los grados de libertad correspondientes a los niveles del factor
gld son los grados de libertad correspondientes al error experimental
La figura 1 representa la región de rechazo correspondiente a cualquier tipo de

factor (fijo o aleatorio). El área sombreada corresponde a la región de rechazo.
Figura 1: Región de rechazo de la prueba estadística
Si se planteó el modelo estadístico con los niveles en las filas o en las columnas,
las hipótesis se plantean de la misma forma, tanto para un factor fijo como para
uno aleatorio.
En el capítulo 1 se mencionó que uno de los principios del diseño experimental es

la ALEATORIZACION.
Como se realiza el procedimiento de aleatorización de un experimento balanceado
en un DCA unifactorial?
Para un experimento en el que se toman n observaciones para cada uno de los
niveles de un FI, el procedimiento de aleatorización independientemente de cómo
se formule el modelo estadístico, se hace a través de los siguientes pasos:
• Codificar las unidades experimentales desde 1 hasta nk, que representa el

número total de observaciones en el experimento.
• Establecer un orden aleatorio para las pruebas que serán realizadas sobre
las unidades experimentales, utilizando la tabla de números aleatorios o
cualquier herramienta computacional.
• Asignar los niveles del factor de interés a las unidades experimentales
aleatorizadas.
• Considerar los resultados anteriores en el orden de experimentación
Todos los puntos que hasta aquí se han mencionado constituyen la planificación
del experimento. Los pasos son los mismos independientemente de cómo se
haya escrito el modelo.
Luego de una minuciosa planificación del experimento se procede a realizar las

mediciones correspondientes a la variable de respuesta registrando dichas
observaciones en el formato previamente diseñado, lo cual permite hacer un
ordenado registro de los datos obtenidos en el experimento.
Es necesario que en el diseño del formato se coloque espacio para información

general sobre el experimento. (quien hizo las mediciones, la fecha,, motivo, unidad
de medición, factor de interés, nombre de la empresa, etc) que sirven de apoyo
para darle seguimiento al experimento.
En caso de que el modelo se haya escrito en la forma (1) el formato de

de registro de datos debe ser como en el cuadro 2
Y ij=μ+τ j +ε ij
j=1. .. .. . k
i=1. . .. .. n
Cuadro 2: Formato de registro de datos para un DCA
Si el modelo estadístico se escribe en la forma (2), el formato de registro de datos
debe ser como se muestra en el cuadro 3
Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . n
Cuadro 3: Formato de registro de datos para un DCA
Una vez que se ha ejecutado el experimento y se han generado los datos

experimentales es necesario comprobar si los datos recopilados cumplen con los
supuestos del Análisis de Varianza (ANDEVA).
EL ANDEVA es una de las técnicas estadísticas en el análisis de datos

experimentales. Se utiliza para comprobar las hipótesis principales de los diseños
experimentales, que son las que se plantean en base al propósito del experimento.
Es una potente herramienta estadística, de gran provecho :

 Para la Industria
 Para el control y mejora de los procesos
 Para el laboratorio de análisis
 Para el control de métodos analíticos
En el ANDEVA la variabilidad total se descompone en las partes con las que
contribuye cada fuente de variación en el experimento. En el caso de un DCA la
ecuación (7) es la base del ANDEVA, sea el experimento balanceado o no.
(7)
Cuáles son los supuestos en que se basa el ANDEVA?
NORMALIDAD: Los datos obtenidos para la variable de respuesta en cada

nivel deben seguir una distribución normal (figura 2)
HOMOCEDASTICIDAD: Las varianzas de las observaciones de la variable

de respuesta en cada nivel no deben diferir de forma significativa (figura 3)
INDEPENDENCIA: Cada conjunto de datos debe ser independiente uno del

otro.
Figura 2
.
Figura 3
Como se verifican los supuestos mencionados?
Existen diferentes gráficos y pruebas analíticas que permiten comprobar el
cumplimiento de dichos supuestos. El cuadro 4 ofrece un resumen de los mismos
SUPUESTO Prueba Analitica AplIcable para Grafico

Ryan Joyner MUESTRAS MENORES A 50 Probabilidad Normal
NORMALIDAD Shapiro Wilk MUESTRAS MENORES A 50
Smirnof-kolmorof MUESTRAS MAYORES A 50
VALORES PREDICHOS Vs
BARLETT
HOMOCEDASTICIDAD RESIDUOS
LEVIN NIVELES DE FACTOR VS RESIDUOS
ORDEN DE RECOLECCION Vs
INDEPENDENCIA
RESIDUOS
CUADRO 4: RESUMEN DE LAS PRUEBAS ANALITICAS Y GRAFICAS PARA VERIFICAR LOS SUPUESTOS DEL ANDEVA
Si se utilizan las pruebas analíticas se deben plantear las hipótesis

correspondientes, que luego mediante la aplicación de un software estadístico a
los datos experimentales, pueden ser comprobadas.
En el caso del supuesto de Normalidad se deben plantear las Hipótesis Nula y

Alterna de la siguiente manera, expresión (8):
:
Ho: Las mediciones de la variable de respuesta presentan una distribución normal.
Hi: Las mediciones de la variable de respuesta no presentan una distribución
normal. (8)
Para el supuesto de Homocedasticidad, las hipótesis son planteadas como en la

expresión (9)
Ho: Las varianzas de los niveles del FI son iguales.
Hi: Las varianzas de los niveles y de la variable respuesta no son iguales (9)
Verificación de los Supuestos
Para las pruebas analíticas o la elaboración de los gráficos es recomendable
apoyarse en un software estadístico. En este libro se hará referencia al
módulo de Análisis de Datos de Excel, al Minitab o al PASW.
Para comprobar la Normalidad, utilizando MINITAB se sugiere seleccionar

los siguientes comandos en la barra superior:
Colocar
Colocar la
la
Estadísticas Prueba de Seleccionar
Estadísticas
Estadísticas Variable
Variable de
de Aceptar
Aceptar
Básicas
Básicas Normalidad
Normalidad Ryan-Joiner
Ryan-Joiner
Respuesta
Respuesta
El MINITAB ofrece tres pruebas analíticas para verificar este supuesto:
 Anderson-Darling (muestras menores a 50)

 Ryan-Joiner (muestras menores a 50, es equivalente a la prueba de
Shapiro Wilk)
 Smirnof-Kolmorof (muestras mayores de 50)
Una vez seleccionada cualquiera de las pruebas anteriores la hoja de

resultados muestra el grafico de probabilidad normal, así como también los de
la prueba, en base al valor de p-value, el cual se compara con el nivel de
significancia establecido como criterio de rechazo. Si el gráfico de
probabilidad normal es aproximadamente lineal, se concluye que los datos
experimentales obtenidos presentan una distribución normal. Para la prueba
analítica seleccionada si el valor de p-value es mayor que el nivel de
significancia no se descarta la Hipótesis Nula planteada y se conlcuye que los
datos presentan una distribución normal. Si el p-value es menor que el nivel de
significancia se descarta la Hipótesis Nula y por lo tanto se concluye que no
secumple con el supuesto de normalidad.
Otro software estadístico en el que es posible apoyarse para verificar el supuesto
de normalidad es el PASW. En la barra principal seleccionar los comandos a
continuación:
Gráfica con Escoger la
Estadísticos
Analizar Explorar Pruebas de Variable de Aceptar
Descriptivas
Normalidad Respuesta
El PASW ofrece el gráfico de probabilidad normal y dos pruebas analíticas para

verificar este supuesto:
 Shapiro Wilk (muestras menores a 50)

 Smirnof-Kolmorof (muestras mayores de 50)

Los resultados que se obtienen son muy similares al del MINITAB y se interpretan
de la misma forma.
Para comprobar el supuesto de homocedasticidad, donde se comparan las

varianzas por nivel, también se pueden utilizar ambos softwares. En el MINITAB
se encuentra las pruebas de Levene y de Barlett. En el PASW solamente se
puede utilizar la de Levene.
En el MINITAB los pasos son los siguientes:
Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste
En el PASW:
FALTA BLOQUES
Para cualquiera de los software, al obtener los resultados se puede inferir que las
varianzas de los niveles del FI son iguales si el valor de p-value es mayor que el
nivel de significancia establecido.
Para comprobar el supuesto de independencia, se puede utilizar Minitab,

seleccionado el gráfico de residuos vs orden
Modelo Factores: Gráficos:

Variable de
Estadísticas
Estadísticas ANOVA
ANOVA Lineal
Lineal Bloques
Bloques yy Residuos
Residuos vs
vs Aceptar
Aceptar
Respuesta
Respuesta
General
General Niveles
Niveles Orden
Orden
El gráfico obtenido debe presentar un comportamiento aleatorio para que se

verifique el supuesto de independencia. Si este gráfico presentara alguna
tendencia no se cumple con dicho supuesto.
Luego que se verifican los supuestos del ANDEVA se procede a comprobar la

hipótesis principal del experimento, a través de la prueba estadística F de Fisher.
Recuerde que la hipótesis principal compara los promedios de la variable de
respuesta para cada nivel.
Las ecuaciones para el cálculo de la prueba F de Fisher, varían un poco en

relación a la forma en que el modelo estadístico se haya planteado:
Si el modelo se escribe de la forma (1)
Y ij=μ+τ j +ε ij (1)
Entonces el cálculo de la prueba F se hace a través de las ecuaciones

presentadas en el cuadro 5 .
Cuadro 5: Cálculo de la Prueba Estadística de Fisher
Donde las sumas de cuadrados para el total y para los niveles se calculan
respectivamente por (10) y (11)
2 2
n
Y..2
k
Y . j Y ..
SCT0   Y 
k
nk
2
ij SCN =∑ j=1 −
i 1 j 1 n nk
(10) (11)
Para el modelo de la forma (2)
Yij     i   ij
El cálculo de la La prueba F se calcula siguiendo las ecuaciones del cuadro 6 .
Cuadro 6: Cálculo de la Prueba Estadística de Fisher
Donde las sumas de cuadrados para el total y los niveles se calculan
respectivamente por (12) y (13)
k n2
Y Y 2i . Y 2. .
k
SCT 0 =∑ ∑ Y 2ij − . . SCN =∑i=1 −
i=1 j=1 nk n nk
(12) (13)
La demostración de las fórmulas ´presentadas en los cuadros (5) y (6) se

encuentran en el anexo…….
Los resultados encontrados con la prueba F permiten en primer lugar comprobar la

hipótesis principal, si se descarta o no la Hipótesis Nula( Ho), donde se
comparan los promedios de los niveles
Apoyándose en los cuadros 5 o 6, las conclusiones se describen de la siguiente

manera:
 Si Fc es mayor que Fα se descarta Ho, si Fc es menor que Fα, no se
descarta Ho.
En segundo lugar se da respuesta al problema objeto de estudio en base a la
conclusión estadística, es decir, se concluye si existen diferencias significativas o
no en los promedios de variable de respuesta para cada nivel.
Otra manera de llegar a determinar si se descarta o no la Hipótesis Nula es a
través del valor de p-value. El p-value se calcula a través del área que está a la
derecha del valor de Fc y se compara con el valor del nivel de significancia
establecido.
Si el valor de p-value es mayor que el valor del nivel de significancia α no se

descarta la hipótesis nula. Si es menor entonces se descarta Ho.
Los datos experimentales permiten estimar los parámetros del modelo: la media,
la varianza y la desviación estándar.
Los cálculos para los parámetros son los mismos, independientemente del
formato que se haya elegido para el modelo. Se utilizan las ecuaciones (14) ,
(15) y (16) respectivamente, para la media, varianza y desviación estándar
n k
(14)
σ =∑√CMEE
∑ Y ij
(15)
 2  CMEE (16)
i=1 j=1
μ=
nk
Para el cálculo de los Intervalos de Confianza del 100( 1 – α) % para la media de
cada nivel es importante recordar cómo se escribió el modelo estadístico y el
formato que se utilizo para la recolección de los datos experimentales.
Si el modelo se escribió de acuerdo a la forma 1 se utiliza la expresión (17):
(17)
IC μ j = y . j±t α/ 2 ,k (n−1 ) √ CMEE/n
Si el modelo se escribió de acuerdo a la forma (2) se utiliza la expresión (18)
(18)
IC μ i= y i. ±t α /2 ,k (n−1 ) √ CMEE/n
Otro indicador que es
importante calcular e interpretar es el Coeficiente de Determinación, para lo cual
(19) R 2 SCN 0 ≤ R2 ≤ 1
=
SCT o
Esta fórmula es la misma independientemente de la forma en que se haya escrito
el modelo.
Como se interpreta este indicador?
Es la variabilidad en los valores observados en la variable de respuesta, explicada

por el modelo estadístico, en el caso de un DCA de un solo factor, es debido a la
variable independiente.
B. Experimento Desbalanceado
En algunos experimentos, puede ser diferente el número de observaciones que
se hacen dentro de cada tratamiento, es decir no es posible recolectar el mismo
número de observaciones para cada nivel, se dice entonces que este experimento
es desbalanceado.
En este diseño existen ciertas variaciones en las fórmulas para el análisis de

varianza, con respecto al balanceado en este caso en la suma de cuadrados .
Para abordar un experimento desbalanceado se siguen los mismos pasos que

en uno balanceado, con la diferencias que habrá una cantidad desigual en el
número de observaciones para cada nivel.
Si el Modelo Estadístico se escribe utilizando las columnas para colocar los
niveles del factor, se representa por la expresión (20)
Y ij=μ+τ j +ε ij
(20) j=1. .. .. . k
i=1. . .. .. n k
donde
Y ij es la i-ésima medición realizada a la unidad experimental correspondiente

utilizando el j-ésimo nivel del factor de interés.
μ es la media total de los valores medidos sobre las unidades experimentales

τj es el efecto del j-ésimo nivel del factor de interés sobre los valores de variable
de respuesta

εij es el error experimental.
Se utililiza nk para indicar que es un experimento desbalanceado.
Cuando se utilizan las filas para representar los niveles del factor el Modelo
Estadístico se escribe como la expresión (21)
(21)
Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . nk
donde
Y ij
es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés
μ es la media total de los valores medidos sobre las unidades experimentales
τi es el efecto del i-ésimo nivel del factor de interés sobre la variable de

respuesta
ε ij el error experimental
Para la formulación de Hipótesis cuando el FI es Fijo se utiliza la misma expresión

que se usó en el caso balanceado (3)
H o : μ1 =μ2 =. .. .. . .. . μ k
H1 = al menos una de las medias de la variable de respuesta es diferente
La respectiva Regla de Decisión para un nivel de significancia α se escribe por la

expresión (22)
F c≥F α , g ln,gld
Descartar Ho si:
donde
gln=k−1
k
(22) gld=∑ j=1 n j−k
Para la formulación de Hipótesis cuando el FI es aleatorio, se utiliza la misma

expresión que se usó en el modelo balanceado (5)
H 0 :σ 12=σ 22=.. .. . .. .. σ 2k
H1 : al menos una de las varianzas de la variable de respuesta es diferente (5)
La Regla de Decisión para un nivel de significancia dado es la expresión (23 )
Descartar Ho si:
(23) F c≥F α , g ln,gld
donde
g ln=k−1
k
gld=∑ j n j −k
En este punto se hace referencia a la figura 1 donde se muestra gráficamente la

región de rechazo, que es la misma para el caso balanceado. Es la misma
independiente del tipo de factor que se presente en el experimento
Para realizar el procedimiento de aleatorización en el modelo completamente al
azar desbalanceado primero se deben codificar los elementos de la población de 1
hasta N, donde: N= n1 + n2 +…nk , para luego establecer un orden aleatorio, y
asignar los niveles del factor de interés a las unidades experimentales.
Para el registro de los datos experimentales se diseña el formato correspondiente

Si se utilizan las columnas para representar los niveles del FI se utiliza el cuadro
(7).
Cuadro 7 : Formato de registro de datos. Caso desbalanceado
Si se utilizan las filas para representar los niveles del factor se recomienda el
cuadro 8 .
Cuadro 8: Formato de registro de datos para un experimento
desbalanceado
También se deben verificar los supuestos del ANDEVA mencionados en el diseño

balanceado. Se utilizan las mismas técnicas estadísticas y es recomendable
apoyarse en herramientas como Minitab, y PASW.
Si se utilizan las columnas para representar los niveles del factor El ANDEVA se
hace a través de las ecuaciones del cuadro 9.
Fuentes de Grados de Suma de Cuadrado Fc Fα
variación libertad cuadrados Medio
FV Gl SC CM
Entre Niveles k−1 SCN CMN F α,g ln, gld
(N) SCN k−1 CMEE
k SCEE
Error
∑ j=1 nk −k SCT O−SCN k
Experimental ∑ j=1 nk −k
k
Total
∑ j=1 nk −1 SCT O
Cuadro 9 : ANALISIS DE VARIANZA DCA desbalanceado.
Para calcular la suma de cuadrados de los niveles y la suma de cuadrados del

total se deben utilizar las expresiones (24) y (25) respectivamente
2 2
k Y.j Y ..
(24) SCN =∑ j=1 − k
nk
∑ j=1 n k
nk k 2
2 Y ..
(25) SCT o =∑ ∑ Y ij −
N
i=1 j=1
El análisis de Varianza para el modelo completamente al azar desbalanceado

cuando los niveles del FI se colocan en las filas se presentan también en el
cuadro 9.
Sin embargo para calcular la suma de cuadrados de los niveles y los totales se
utilizan las expresiones (26) y (27) respectivamente
(26) Y 2i.
k Y 2. .
SCN =∑ i=1 − k
nk
∑i=1 nk
k nk 2
(27) 2 Y ..
SCT o=∑ ∑ Y ij −
N
i=1 j=1
Las conclusiones se plantean de la misma forma que en el experimento
balanceado
Para el cálculo de los parámetros se utilizan las expresiones (28), (29) y (30)
respectivamente
2
n k σ =CMEE
∑ ∑ Y ij
i=1 j=1 (28)
μ=
N
σ = √CMEE
(29)
(30)
Para el cálculo de los Intervalos de Confianza del 100( 1 – α) % para la media de

cada nivel del FI, es importante recordar cómo se escribió el modelo estadístico y
el formato que se utilizó para la recolección de los datos experimentales.
Si el modelo se escribió de acuerdo a la forma 1 se utiliza la expresión (31)
IC μ = y . j±t α/ 2 , ∑ n −k √CMEE /nk

(31) j k
Si el modelo se escribió de acuerdo a la forma (2) se utiliza la expresión (32)
(32)
IC μ = y i. ±t α /2 ,k (n−1 ) √ CMEE/nk
i
Modelo à Y ij=μ+τ j +ε ij Y ij=μ+τ i +ε ij

Calculo del intervalo
de confianza del Ecuación
100(1-α)% para la IC μj = y . j±t α /2 ,k (n−1) √ CMEE/n
media µj del j-esimo
nivel del factor de
interés
Calculo del intervalo

de confianza del Ecuación
100(1-α)% para la IC μi = y i.±t α /2 , k( n−1) √ CMEE/n
media µi del i-esimo
nivel del factor de
interés
Y el cálculo del Coeficiente de Determinación por la expresión (33)
R 2 SCN 0 ≤ R2 ≤ 1 (33)
=
SCT o
La interpretación es la misma que en el diseño balanceado.
EJEMPLO: FABRICACION DE CALZADO/ CASO BALANCEADO

La Zapatería Ultra Moderna como parte de sus estrategias desea mejorar la
calidad de las suelas de los zapatos que fabrica, los cuales se pueden hacer con
uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.
Para ello, contrata los servicios de I.C.S.A. Los especialistas de esta agencia de
consultoría diseñan un experimento en que se prueban los cueros con una
máquina que hace pasar los zapatos por una superficie abrasiva, la suela de los
zapatos se desgasta al pasarla por dicha superficie. Como criterio de desgaste
se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en
orden aleatorio 24 zapatos, seis de cada tipo de cuero.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en
el formato correspondiente.
Como se Define el Problema en este caso?

De acuerdo al propósito del estudio se puede redactar de dos formas diferentes:
 Determinar si hay diferencias significativas en la pérdida de peso promedio
para cuatro tipos de cuero (A,B,C y D) o…
 Determinar el efecto de cuatro tipos de cuero en la pérdida de peso
promedio de la suela de un zapato.
Cuál es la Variable de Respuesta: pérdida de peso promedio
Cuál es el Factor de Interés o variable independiente: tipos de cuero

Cuantos Niveles tiene el FI : 4 Cuales son? Tipos de Cuero A, B, C y D.
Cuál es la Unidad experimental: el zapato (suela de un zapato)
Cuantas observaciones se hacen por cada nivel? 6

Cuantas observaciones se hacen en total en el experimento? 24
El Modelo Estadístico se escribirá utilizando la forma (1)

Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . n
Donde:
Yij = es la j-ésima pérdida de peso de la suela del zapato para el i-ésimo tipo de
cuero
m = desgaste promedio (pérdida de peso promedio)
t i = es el efecto del i-ésimo tipo de cuero sobre la pérdida de peso de la suela del
zapato
e ij= es el error experimental
Formulación de Hipótesis
Dado que en este experimento no se seleccionan los niveles del factor

aleatoriamente se considera el factor tipo de cuero como fijo. Por lo tando la
hipótesis nula se plantea como:
H o : μ1 =μ2 =μ3 =μ4

H1 = al menos una de las pérdida promedio es diferente
En términos cualitativos esta hipótesis nula dice que la pérdida de peso promedio
para cada uno de los tipos de cuero es igual.
Para un nivel de significancia del 5% la Regla de Decisión se expresa por (4):
Región de Rechazo
Descartar Ho Si
F c≥F 0.05, 3 ,20

F 0.05,3,,2020
donde
g ln=4−1=3
gld=4(6−1)=20
Procedimiento de Aleatorización
Dado que en total se deben hacer seis observaciones por cada tipo de cuero se
enumeran las corridas del experimento de uno a veinticuatro. Luego se buscan
24 números aleatorios entre uno y veinticuatro. Finalmente se le asignan los
zapatos con cada uno tipos de cuero a cada una de las corridas del experimento.
En el cuadro 10 se resumen cada uno de los pasos expresados.
CODIFICACIO ORDEN ASIGNACIO

N ALEATORIO N
1 3 A
2 10 A
3 14 A
4 8 A
5 15 A
6 1 A
7 11 B
8 18 B
9 23 B
10 7 B
11 22 B
12 12 B
13 2 C
14 24 C
15 4 C
16 6 C
17 13 C
18 5 C
19 17 D
20 16 D
21 19 D
22 9 D
23 20 D
24 21 D
Cuadro 10 : Aleatorización
De acuerdo al resultado de la tabla anterior el experimento se ejecutar de la

manera representada en el cuadro 11.
TC CORRIDAS
A 3 10 14 8 15 1
B 11 18 23 7 22 12
C 2 24 4 6 13 5
D 17 16 19 9 20 21
Luego que se hacen las mediciones de la variable de respuesta pérdida de peso

se obtuvieron los datos del cuadro 12 .
TIPO ORDEN DE LAS PRUEBAS
DE
CUERO
A 3 10 14 8 15 1
B 11 18 23 7 22 12
C 2 24 4 6 13 5
D 17 16 19 9 20 21
Responsable de las
mediciones Publio Medina
Fecha de Medición Primera semana enero 2014
ULTIMA
TURNO D APARATO BALANZA CALIBRACION Nov-13
Comprobación de los Supuestos del ANDEVA
Verificación del supuesto de NORMALIDAD
Gráficamente a partir del Grafico De Probabilidad Normal se obtiene el

diagrama de la figura 4 .
Probability Plot of C1
Normal
99
Mean 229.7
StDev 19.89
95 N 24
AD 1.312
90
P-Value <0.005
80
70
Percent
60
50
40
30
20
10
1
180 200 220 240 260 280
C1
Figura 4
Para que se cumpla el supuesto de normalidad los datos de la perdida de peso
deberán tener aproximadamente una línea recta. Observando el gráfico,
obtenido a través de minitab no se cumple con el supuesto de normalidad.
Si se utiliza la prueba de Ryan Joiner para comprobar la normalidad se debe

plantear la hipótesis de la siguiente manera:
Ho: La pérdida de peso de la suela de los zapatos presentan una distribución

normal
H1: La pérdida de peso de la suela de los zapatos no presenta una distribución
normal
Para un nivel de significancia de 5% la Regla de decisión se redacta como : Si p-
value ≥ 0.05. No se descarta la Hipótesis Nula formulada
Conclusión: Al observar el valor de P- value en el recuadro que está en la parte

superior derecha del gráfico en la figura 5, p value = 0.005 0.005 < 0.05 . Por
lo tanto se descarta Ho, esto significa que los datos no muestran una distribución
normal.
La verificación del supuesto residuos versus orden (figura ), utilizando Minitab.
de independencia se realiza a través del gráfico
Versus Order
(response is C1)
30
20
Residual
10
-10
-20
2 4 6 8 10 12 14 16 18 20 22 24
Observation Order
Figura 6
Al observar está gráfica de Residuo vs Orden se observa que no hay
tendencias marcadas y los datos tienen un comportamiento aleatorio, es decir, las
pérdidas de peso de la suela de zapatos no muestra una tendencia por lo cual
se concluye que son independientes. Gráficamente se concluye que las
observaciones de la perdida promedio de pesos no están correlacionadas ya que
el gráfico no presenta ninguna tendencia.
Para el Supuesto de homocedasticidad, se puede usar Minitab para construir los

intervalos de confianza para la desviación standard. En la figura 7 se aprecian
dichos intervalos de confianza
Test for Equal Variances for C1
Bartlett's Test
1 Test Statistic 8.48

P-Value 0.037
Levene's Test
Test Statistic 0.67
P-Value 0.583
2
C2
0 10 20 30 40 50 60
95% Bonferroni Confidence Intervals for StDevs
Figura 7
Esta grafica indica que los intervalos de confianza para los tipos de cuero
tienen aproximadamente la misma desviación estándar, sin embargo el intervalo
para el tipo de cuero C tiene un ancho mayor.
Analíticamente se puede usar la prueba de Levin, cuyos resultados están en la
parte superior derecha de la figura .En primer lugar es necesario plantea la
siguiente hipótesis:
Ho: σ12 = σ22 = σ32 = σ42
H1: al menos una varianza es diferente
Para un nivel de significancia del 5%. Se establece como regla de decisión No se
descarta la H0 si Pvalue ≥ 0.05
De acuerdo a la Prueba de Levene el Pvalue= 0.583
Conclusión: Dado que Pvalue (0.583) > 0.05, no se descarta Ho, esto significa que
se cumple el supuesto de Homocedasticidad que dice que las varianzas de las
observaciones de las pérdidas de peso de los tipos de cuero son iguales.
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la
perdida promedio de pesos son iguales para los tipos de cuero estudiados
Aún cuando en este experimento no se cumple con el supuesto de normalidad se

presenta a continuación el Análisis de Varianza(ANDEVA).
TIPO
DE
CUERO ORDEN DE LAS PRUEBAS SUMA PROMEDIO
A 264 260 258 241 262 255 1540 256.7
B 208 220 216 200 213 206 1263 210.5
C 220 263 219 225 230 228 1385 230.8
D 217 226 215 224 220 222 1324 220.7
Responsable de las
mediciones Publio Medina 5512 229.68
Fecha de Medición
Primera semana enero 2014
ULTIMA PROMEDIO
TURNO D APARATO BALANZA CALIBRACION 13-Nov TOTAL TOTAL
Cuadro 13 : Pérdida de peso de la suela de los zapatos
Las datos obtenidos para la medición de las pérdidas de peso de las suelas de los
zapatos a través de la prueba realizada se muestran en el cuadro 13.
El Análisis Estadístico se resume en los cuadros (14) y (15) .

TIPOS DE Cuenta Suma Promedi Varianz
CUERO o a
A 6 1540 256.6667 68.6666
7
B 6 1263 210.5 52.7
C 6 1385 230.8333 266.966
7
D 6 1324 220.6667 17.4666
7
Cuadro 14 : Resumen de cálculos estadísticos por nivel
Origen de las Suma de Grados de Cuadrado

Fc P-value F3, 20
variaciones cuadrados libertad Medio
Tipos de 7072.3333 2357.4444 23.237500

3 1.00E-06 3.09839121
cuero 3 4 7
Error
2029 20 101.45
Experimental
9101.3333
Total 23
3
Cuadro 15: ANALISIS DE VARIANZA
Las conclusiones se describen de la siguiente manera:

 En el cuadro 15 se observa que Fc es mayor que F0.05, 3, 20, por lo
tanto se descarta Ho
 Se concluye que existen diferencias significativas en la pérdida promedio de

peso(miligramos) de la suela de los zapatos para los tipos de cuero en
estudio
También se puede utilizar el valor de p-value para hacer las conclusiones
comparando versus el nivel de significancia utilizado (5%)
n k
La pérdida de peso promedio total es:
∑ ∑ Y ij
i=1 j=1
μ=Ȳ¯ =5512/24=229. 67 μ=
nk
Del cuadro 15 se obtiene el Cuadrado medio del error experimental, el cual es
igual a la varianza.
2
σ =CMEE =101. 45
2
y la desviación estándar σ =CMEE
σ = √101 . 45
Los Cálculos de los Intervalos de Confianza del 100( 1 – α) % para la Pérdida de

peso promedio de cada tipo de cuero se muestran a continuación
IC μi=y i.±t α/2 ,k(n−1) √ CMEE/n

.5.1.1 Balanceado
Un fabricante supone que existe diferencia en el contenido de calcio en los lotes
de materia prima que le son suministrados por su proveedor. Actualmente hay
una gran cantidad de lotes en la bodega. Cinco de estos son elegidos
aleatoriamente. Un químico realiza cinco pruebas sobre cada lote y obtiene los
siguientes datos:
Tabla n°1.15
Lotes
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
Observación: Para el problema descrito, identifique las consideraciones previas

(Problema, identificación de la variable respuesta, selección del factor de interés,
selección de los niveles, definición de las unidades experimentales y estime el
tamaño de muestra por cada nivel)
Solución de problema
Primeramente, antes de analizar los datos se procede a definir el problema en
estudio y sus respectivos aspectos:
Problema: Determine si existe diferencia en el contenido de calcio en los lotes de

materia prima, para cinco lotes diferentes de la bodega.
Variable de respuesta: Contenido de calcio en los lotes de materia prima.

Factor de interés: lote de materia prima.
Nivel del factor de interés: lotes (1, 2, 3, 4, 5)
Diseño experimental viable a la situación: Diseño completamente al azar (DCA):

Balanceado.
Además, es necesario definir tamaño de muestra (número de observaciones por

cada nivel) e identificar las unidades experimentales que han ser medidas en el
estudio, que para este caso serian:
Tamaño de muestra: n=5 por cada lote
Unidad experimental: lotes de materia prima.
Una vez definidas las consideraciones previas, se procede a formular el modelo

estadístico y definir cada uno de sus componentes:
Modelo estadístico:
El modelo correspondiente a este experimento es el siguiente:
Y ij=μ+τ j +ε ij
j=1. .. .. . k
i=1. . .. .. n
Y ij : es el i-ésimocontenido de calcio para el j-ésimo lote de materia prima.

μ : Contenido Promedio (Media total)
τj : es el efecto del j-ésimolote de materia prima sobre el contenido de calcio en
lotes de materia prima.
εij : es el error experimental.
Luego, de haber formulado el modelo correspondiente se realiza el contraste de

hipótesis:
Hipótesis:
H0: μ1 = μ2 = μ3= μ4 = μ5
H1: al menos uno de los contenidos de calcio en lotes materia prima es diferente.
Para realizar el análisis de los datos, es importante establecer el nivel de

significancia, el cual sirve para establecer el punto crítico de rechazo y la regla de
decisión, la cual se basa en la Prueba F de Fisher para probar las hipótesis:
Nivel de significancia: α = 0.05
Regla de Decisión:
Descartar Ho si:
F c≥F 0.05 ,4 ,20
Región de Rechazo
donde
gln=k−1=5−1=4
gld=k(n−1)=5(5−1)=20
F0.05, 4, 20=2.87
Luego de haber establecido, todo estos parámetros, es recomendable realizar la
aleatorización (la aleatorización puede hacerse una ves se han recogido los datos)
Procedimiento de aleatorización
Unidad Exp. Orden aleatorio asig de nivel 1
3 1
2 8 1
3 13 1
4 1 1
5 21 1
6 16 2
7 19 2
8 5 2
9 23 2
10 7 2
11 10 3
12 2 3
13 14 3
14 22 3
15 17 3
16 4 4
17 24 4
18 11 4
19 25 4
20 6 4
21 20 5
22 15 5
23 9 5
24 12 5
25 18 5
Después de la aleatorización, se procede a proponer un formato para la

recolección de los datos en base a la aleatorización: se recomienda capturar los
datos en el orden en el que se hallan hecho las mediciones:
Tabla n°1.16: Aleatorización

Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
3 () 16 ( ) 10 ( ) 4 () 20 ( )
8 () 19 ( ) 2 () 24 ( ) 15 ( )
observacione 13 ( ) 5 () 14 ( ) 11 ( ) 9 ()
s 1 () 23 ( ) 22 ( ) 25 ( ) 12 ( )
21 ( ) 7 () 17 ( ) 6 () 18 ( )
Después se recurre a la toma de datos, que en este caso serian:
Tabla n°1.17: Datos post-aleatorización

Lotes
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
Obsevacione 23.56 23.42 23.46 23.37 23.37
s 23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38
Antes de realizar el análisis de varianza de los datos es recomendable verificar los

supuestos del ANDEVA, ya que estos datos deben cumplir con tres supuestos
para hacer el análisis:
Estos supuestos son: normalidad, homocedasticidad e independencia.
Para un mejor entendimiento de los casos, se utilizará tanto el programa minitab

como el PASW, para verificar los supuestos de la siguiente manera:
Verificación de supuestos del ANDEVA
Normalidad
Se refiere a que los datos deben seguir una distribución de normalidad.
Antes de realizar la verificación, es necesario establecer las hipótesis y sus
respectivas reglas de decisión:
Hipótesis:
Ho: Las pérdidas de peso en la suela de los zapatos presentan una distribución
normal.
H1: Las pérdidas de peso en la suela de los zapatos no presentan una distribución
normal.
Regla de decisión: no se descarta Ho si P-value≥α
Resultados, del supuesto de normalidad para el programa MINITAB:

Primeramente captar los datos, en columnas ya sea para los niveles del factor de
interés así como, los datos de las variables respuesta con sus respectivas
definiciones.
Se utiliza como referencia al valor de P-value para concluir y si se cuenta con la

tabla de Ryan-Joiner, también se puede concluir en base a esta.
Se concluye de la siguiente manera:
Grafica n°1.1: supuestos de normalidad

Gráfica de probabilidad de contenidodecalcio
Normal
99
Media 23.44
Desv.Est. 0.08770
95 N 25
RJ 0.992
90
Valor P >0.100
80
70
Porcentaje
60
50
40
30
20
10
1
23.2 23.3 23.4 23.5 23.6 23.7
contenidodecalcio
En este grafico se muestra que los contenidos de calcio en los lotes de materia
prima, presentan una línea recta y también el valor de P-value (P>0.100 ¿ α =0.05
), por lo tanto se concluye que los contenido de calcio en los lotes de materia
prima sí siguen una distribución normal y se acepta la hipótesis Ho.
Resultados, del supuesto de normalidad para el programa PASW:

Primeramente se definen las variables en el apartado vista de variables y luego se
capturan los datos.
Tabla n°1.18: Supuestos de normalidad

Grafica n°1.2: Supuestos de normalidad
En donde igualmente que el anterior se concluye en base al grafico,yel valor de P-

value (sig) (P= 0.847 ¿ α =0.05), y de este modo para este caso, se concluye que
los contenido de calcio en los lotes de materia prima si siguen una distribución
normal y se acepta Ho.
Homocedasticidad
Se refiere a que los datos deben tener varianzas iguales.
Antes de realizar la verificación de este supuesto también, es necesario establecer
las hipótesis y sus respectivas reglas de decisión:
Hipótesis:
Ho: α 21 = α 22 =α 23 =α 24=α 25
H1: al menos una de las varianzas es diferente.
Regla de decisión: no se descarta Ho si P-value≥α.
Resultados, del supuesto de homocedasticidad para el programa MINITAB:

De aquí se despliega el grafico, para observar la igualdad de varianzas.
De esta manera, se concluye en base a este grafico:
Grafica n°1.3: Supuesto de homocedasticidad
Prueba de igualdad de varianzas para contenidodecalcio
Prueba de Bartlett
1 Estadística de prueba 0.04
Valor P 1.000
Prueba de Lev ene
Estadística de prueba 0.03
2
Valor P 0.998
Lotes
0.00 0.05 0.10 0.15 0.20 0.25 0.30

Intervalos de confianza de Bonferroni de 95% para Desv.Est.
De donde podemos concluir, lo siguiente:

Este resultado nos indica que los datos tienen varianzas aproximadamente iguales
y por tanto se acepta Ho, ya que P-value=0.998 ¿ α=0.05. Tanto para la prueba de
Bartlett como la de Levene se puede verificar la igualdad de varianzas.
Resultados, del supuesto de homocedasticidad para el programa PASW:

En este caso también ya tenemos los datos capturados, de modo que se continúa
utilizando los mismos datos para esta prueba.
De donde se obtiene el resultado de la Prueba de Levene:
Tabla n°1.19: Supuestos de homocedasticidad
De modo que este resultado nos indica que los datos tienen varianzas
aproximadamente iguales y por tanto se acepta Ho, ya que P-value=0.998 ¿
α=0.05.
Independencia
Se refiere a que los datos deben ser independientes del resto de los datos.
En este caso, no se establecen hipótesis pero si se requiere establecer la regla de
decisión, que en este caso seria:
Regla de decisión: se descarta Ho si el grafico de independencia muestra una

tendencia.
Resultados, del supuesto de independencia para el programa MINITAB:
Ya que los datos están capados, solo se procede a analizar estos.
Y se obtiene el siguiente resultado, del cual podemos concluir:
Grafica n°1.4: Supuestos de independencia
vs. orden
(la respuesta es contenidodecalcio)
0.10
0.05
Residuo
0.00
-0.05
-0.10
2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación
En este grafico se puede observar que los datos no muestran una tendencia y
presentan un orden aleatorio por tanto no se descarta Ho y se comprueba el
supuesto de independencia.
Análisis estadístico de los datos

Posteriormente, se procede con el análisis estadístico de los datos, obteniéndose
para este caso:
Tabla n°1.20: Análisis de datos
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
Observacione 23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
s
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38

Suma 117.29 117.46 117.62 116.9 116.82
Promedios 23.458 23.492 23.524 23.38 23.364
Seguidamente, se procede con el análisis de varianza, el cual nos permite probar

la hipótesis principal:
Este análisis se puede realizar manualmente, utilizando las formulas

proporcionadas y llenando la tabla siguiente, el cual va a depender del modelo
escogido, en este caso, seria:
n k 2
Y 2. j Y 2. .
k 2 Y ..
SCN =∑ j=1 − SCT 0 =∑ ∑ Y ij −
Utilizando las formulas: n nk y i=1 j=1 nk
Tabla n°1.21: Análisis de varianza

Fuente de Grados de Suma de Cuadrado Fc F crítica
variable libertad Cuadrados Medio
FV Gl SC CM
Entre Niveles k-1 = 5-1= SCN = SCN/(k-1)= CMN/CMEE= F
N 4 0.097 0.024
0.05,4,20
5.54
=
2.87
Error K(n-1)= SCEE = SCEE/k(n-1)=

experimental (5)*(4)= 0.088 0.004
EE 20
Total Nk-1= SCTo =
To 24 0.185
En cuanto al ANÁLISIS DE VARIANZA PARA EL PROGRAMA MINITAB, este se
obtiene directamente de la hoja de respuesta que se obtuvo al realizar la
verificación del supuesto de independencia:
El análisis de varianza para MINITAB ES:
Modelo lineal general: contenidodecalcio vs. Lotes

Factor Tipo Niveles Valores
Lotes fijo 5 1, 2, 3, 4, 5
Análisis de varianza para contenidodecalcio, utilizando SC ajustada para pruebas
Fuente GL SC Sec. SC Ajust. CM Ajust. F P

Lotes 4 0.096976 0.096976 0.024244 5.54 0.004
Error 20 0.087600 0.087600 0.004380
Total 24 0.184576
S = 0.0661816 R-cuad. = 52.54% R-cuad.(ajustado) = 43.05%
Para el caso del Programa PASW el Análisis de Varianza se obtiene del resultado
que se obtiene cuando se hace la prueba de homogeneidad de varianzas:
Observación: para el caso del programa PASW, no tiene la

Tabla
opción de realizar la prueba de independencia
n°1.22:
Análisis de
datos
Posteriormente se buscar otros indicadores que se deben calcular, tales como:
Calculo del coeficiente de determinación: el cual hace referencia a la suma de
cuadrados de niveles, el cual se obtiene del ANDEVA o también se puede calcular
manualmente, con la formula: depende del modelo propuesto:
kY 2. j Y 2. .
SCN =∑ j=1 −
1. n nk à Y ij=μ+τ j +ε ij
2 2
Yk Y
SCN =∑i=1 i . − . . Y ij=μ+τ i +ε ij
2. n nk à
R2 SCN 0. 097
=
SCT o = 0. 185 =0. 52=52 %
Interpretación: Existe una variabilidad del 52% en los contenidos de calcio en los
lotes de materia prima.
También se deben hacer los cálculos de parámetros que son:

μ=586 .09/25=23. 44
2
σ =CMEE =0 . 004
σ = √0 . 004= 0. 063
Adicional se deben calcularlos intervalos de confianza, los cuales para este caso
son:
Cálculo del Intervalo de Confianza del 100( 1 – α) % para el contenido promedio

de calcio en lotes de materia prima.
IC μ i= y i. ±t α /2 ,k (n−1 ) √ CMEE/n
IC μ =23 . 46±t 0. 025, 20 √ 0 . 004/5 23.46±(2.086) √0.004/5 μi

1
= = 23.40 < >23.52
IC μ =23. 49±t 0 .025 ,20 √0 . 004 /5 23.49±(2.086)√ 0.004/5 μi

2
= = 23.43< >23.55
IC μ 3 =23. 52±t 0 .025 ,20 √0 . 004 /5 23.52±(2.086) √0.004/5 μi

= = 23.46<
>23.58
IC μ =23. 38±t 0. 025, 20 √ 0 .004 /5 23.38±(2.086) √ 0.004/5 μi

4
= = 23.32<
>23.44
IC μ 5=18 . 36±t0 . 025,20 √ 0 .004 /5 23.36±(2.086) √ 0.004/5 μi

= = 23.30< >23.42
Por ultimo se realizan las Conclusiones finales, las cuales deben contener la
conclusión de la hipótesis principal.
Para este caso podemos concluir de la siguiente manera:

Como Fc es mayor que F α (Fc = 5.535)¿(F 0.05,4,20 = 2.87),por lo tanto se descarta H 0
y se acepta la hipótesis H1.
De este modo se concluye que a un nivel de significancia de 0,05, si hay
diferencia y por tanto, uno de los contenidos promedio de calcio en los lotes de
materia prima es diferente.
EJEMPLO 2: TABLERO DE CONTROL DE UN AEROPLANO/ CASO

DESBALANCEADO
COPA es una aerolínea panameña, la cual mantiene un compromiso de mejora

continua con todas las partes interesadas. Continuamente se realizan
investigaciones para mejorar sus servicios. Conscientes de diferentes situaciones
de emergencia que se pueden presentar en un vuelo, COPA ha contratado los
servicios de I:C:S:A: para realizar un experimento donde se desea estudiar la
mejor disposición de los instrumentos sobre un tablero de control de un aeroplano,
se prueban tres distintos arreglos simulando una situación de emergencia, y
observando el tiempo de reacción requerido para corregir la avería.
Cuál es el propósito principal de este experimento, que persigue la aerolínea
COPA con la realización de este experimento.
Determinar si hay diferencia significativa en los tiempos de reacción promedio

para tres arreglos diferentes de los instrumentos del tablero de control de un
aeroplano.
Variable de Respuesta: Tiempo de reacción de los pilotos
Factor de interés: Los tres arreglos diferentes: Disposición 1, Disposición 2 y
Disposición 3
Niveles: D1, D2, D3
Unidades experimentales: los pilotos
Número de observaciones/Niveles: Nivel 1 (8), nivel 2 (12), nivel 3 ( 8)
Modelo Estadístico
Y ij=μ+τ j +ε ij
i=1. . .. .. n k
j=1. .3
Yij = es el i-ésimo tiempo de reacción de un piloto para la j-ésima disposición
 = es el tiempo de reacción promedio
j = es el efecto de la j-ésima disposición sobre el tiempo de reacción de cada
piloto.
ij= es el error experimental
HIPOTESIS
Ho = µ1=µ2=µ3
H1 = al menos uno de los tiempos de reacción promedio para cada disposición es
diferente
Regla de Decisión: Descartar Ho si Fc F0.05, 2, 25 = 3.385 glN= k-1 = 3-1 = 2glD= 28
– 3 = 25
Región de Rechazo F=3.385
Procedimiento de Aleatorización
El número total de unidades experimentales en este experimento es de 28. Se

codifican los pilotos dándoles un numero del 1 al 28. Luego se busca el orden
aleatorio. En una tabla de números aleatorios se seleccionan números entre 1 y
28. Después se procede a asignar la disposición a los pilotos que han sido
previamente aleatorizados, de acuerdo al número de observaciones establecidas
para cada disposición (ver cuadro 16)
Unidad Orden
Experimental Aleatorio Asignación
1 10
2 1
3 11
4 20
5 16
D1
6 17
7 2
Las corridas del experimento son como en el cuadro
8 23
9 9
17
10 19
D1 D2 D3
11
10 924 8
121 13
19 27
13
11 244 18
14
20 22
13 14
15
16 415 D2
26
16
17 22
21 28
172 153 7
23
18 216 25
19 312
20 65
12
21 8
5
22 27
23 18
24 14
Cuadro 17
25 26
D3
26 28
27 7
28 25
Cuadro 16
Registro de Datos
Los tiempos de reacción observados para cada piloto de acuerdo a la

disposición asignada se pueden ver en el cuadro 18
Toma de Datos
FI: DISPOSICIONES
Observaciones
Disposición 1 Disposición 2 Disposición 3
1 14 10 11
2 13 12 5
3 9 9 9
4 15 7 10
5 11 11 6
6 13 8 8
7 14 12 8
8 11 9 7
9 10
10 13
11 9
12 10
TOTALES 100 120 64
CUADRO 18: TIEMPO DE REACCION DE LOS PILOTOS
Luego se procede a verificar los supuestos del ANDEVA USANDO MINITAB
Prueba de normalidad
Por medio de la gráfica de probabilidad normal se verifica el supuesto de la
normalidad, el que se presenta en la figura 8
Probability Plot of C1
Normal
99
Mean 10.18
StDev 2.525
95 N 28
RJ 0.999
90
P-Value >0.100
80
70
Percent 60
50
40
30
20
10
1
5.0 7.5 10.0 12.5 15.0 17.5
C1
Figura 8
Al observar la grafica de la figura 8 se observa que los tiempos de reacción
presentan aproximadamente una línea recta, por lo tanto se puede concluir
que los tiempos de reacción de los pilotos presentan una distribución
normal. Gráficamente se concluye que las observaciones de las reacciones
promedios de los pilotos se distribuyen normalmente, ya que el gráfico presenta
aproximadamente una línea recta.
Aplicando la prueba de Ryan Joiner para validar el resultado gráfico se plantea la

siguiente hipótesis:
Ho: Tiempo de reacción de los pilotos presentan una distribución normal

H1:Tiempo de reacción de los pilotos no presenta una distribución normal
Regla de decisión: No se descarta la H0 si Pvalue ≥ α
Observando el resultado del p-value para la rueba de Ryan Joiner , en la parte
superior derecha de la figura, se concluye lo siguiente:
Pvalue: 0.100≥ 0.05. De acuerdo a la prueba RyanJoiner se observa que el p-

value es mayor que el nivel de significancia por lo tanto no se descarta la Hipótesis
Nula y se concluye que los datos presentan una distribución normal.
Independencia
Al observar la gráfica de Residuo vs Orden, en la figura 9, se verifica el

supuesto de independencia del Tiempo de reacción de los pilotos: estos datos
no muestran ninguna tendencia, tienen un comportamiento bastante aleatorio, por
lo tanto se cumple el supuesto de independencia. Por lo tanto gráficamente se
concluye que las observaciones del tiempo de reacción de los pilotos no están
correlacionadas ya que el gráfico no presenta ninguna tendencia.
Versus Order
(response is C1)
1
Residual
-1
-2
-3
-4
2 4 6 8 10 12 14 16 18 20 22 24 26 28
Observation Order
Para el supuesto de homocedasticidad

Se plantea la hipotesis
Ho: σ12 = σ22 = σ32
H1:al menos una varianza es diferente
Con la Regla de decisión: No se descarta la h 0 si Pvalue ≥ α
De acuerdo a Prueba de Levene el Pvalue= 0.982≥α= 0.05
Observando los valores obtenidos para el p-value, en la parte superior derechad e
la figura 10, en las pruebas de Barlett y Levine se concluye lo siguiente
Pvalue (0.982) > 0.05, no se descarta Ho, esto significa que la varianza del tiempo
de reacción para las tres disposiciones son aproximadamente iguales
Test for Equal Variances for C1
Bartlett's Test
Test Statistic 0.15
1 P-Value 0.926
Lev ene's Test
Test Statistic 0.02
P-Value 0.982
2
C2
1 2 3 4 5
95% Bonferroni Confidence Intervals for StDevs
Figura 10
Continuando con el anaálisis se procede a realizar el ANDEVA. El cuadro 19 hace

un resumen de las estadisticas por disposicion.
ANDEVA- Análisis de Varianza
DISPOSICIONES Cuenta Suma Promedio Varianza

Disposición 1 8 100 12.5 4
Disposición 2 12 120 10 3.090909
Disposición 3 8 64 8 4
Cuadro 19 : Estadísticas por Disposición
El cuadro 20 presenta los resultados del ANDEVA
Suma de Grados
Origen de las Cuadrad P-
cuadrado de Fc F2,25
variaciones o Medio value
s libertad
DISPOSICIONES 81.428571 2 40.71429 11.3095 0.00032 3.38519
ERROR 90 25 3.6
EXPERIMENTAL
Total 171.42857 27
Cuadro 20 : resultados de ANDEVA
Conclusiones
Observando el resultando el cuasdro 20, as conclusiones se describen de la
siguiente manera:
Se observa que Fc>F, por lo tanto se rechaza Ho y se concluye que los tiempos de
reacción promedio de los pilotos para las tres disposiciones del tablero de control
de un aeroplano, no son iguales.
Cálculo de Parámetros
284
µ¿ =10.14
28
El segundo parámetro a calcular es la varianza y la misma es igual al cuadrado
medio del error experimental,
2 = 3.60
Y la desvicion estándar
Los Intervalos de Confianza correspondientes a cada disposición son los

siguientes:
IC μ =12 .5±t 0. 025, 25 √ 3 .60 /28

1
IC μ 2 =10±t 0.025,25 √3.60/28

IC μ 3 =8±t 0.025,25 √3.60/28
Cálculo del Coeficiente de Determinación
R2 SCN R2
=
81. 43
== =0.9047
90 .00
SCT o
El 90.45% de la variabilidad de lo tioemposd e reacion permite concluir que el

90.45% de la variabilidad de los tiempos de reacción se debe a las disposiciones.
Hay un 9.6% restante que se debe a otros factores.
1.5.2 Problemas Propuestos
1.5.2.1 Problema 1
En una determinada fábrica de dulces se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante
un día 16 masas, 4 de cada tipo de harina, y mide su viscosidad. Los resultados
obtenidos son:
Proveedor Proveedor B Proveedor C Proveedor D

A
98 97 99 96
91 90 93 92
96 95 97 95
95 96 99 98
1.5.2.2 Problema 2
Se realizó un experimento para determinar la influencia de dos medicamentos
sobre el tiempo en realizar una tarea por parte de unos estudiantes. Los datos se
presentan a continuación:
Grupo 1 Grupo 2 Grupo 3 Grupo 1

(No medicamento) (Medicamento 1) (Medicamento 2) (Ambos medicamentos)
1 12 12 13
8 10 4 14
9 13 11 14
9 13 7 17
4 12 8 11
0 10 10 14
1 12 13
5 14
CAPÍTULO 2
1. DISEÑO DE BLOQUES AL AZAR- UN FACTOR

2.1 Definición
 Es el diseño experimental más ampliamente utilizado cuando se presenta el
caso de que las unidades experimentales no son homogéneas.
 Las unidades experimentales se dividen en grupos llamados bloques de modo

que las observaciones realizadas en cada bloque se realicen bajo condiciones
experimentales lo más parecidas posibles.
En este diseño, el experimentador agrupa las unidades experimentales en
bloques, y a continuación determina la asignación de los niveles del factor en
cada bloque.
 Requisito: Requiere que cada uno de los niveles del factor de interés se
prueben por lo menos una vez en cada uno de los bloques.
- Aquí, todos los posibles niveles del factor de interés son asignados en
forma aleatoria. Una variable bloque no presenta interacción con el factor
en estudio.
2.2 Generalidades
En muchos problemas de investigación es necesario diseñar experimentos en

los que pueda controlarse sistemáticamente la variabilidad producida por diversas
fuentes extrañas.
A estas variables se les denomina variables bloque, y se caracterizan porque:
• No son el motivo del estudio sino que aparecen de forma natural y obligada
en el mismo.
• Se asume que no tienen interacción con el factor en estudio.
• El experimentador no está interesado en investigar las posibles diferencias
de la respuesta entre los niveles de los factores bloque.
La ventaja de bloquear un factor que se supone que tiene una clara influencia en
la respuesta, pero en el que no se está interesado, convierte la variabilidad
sistemática no planificada en variabilidad sistemática planificada.
Consideraciones Previas
 Definición del Problema
 Identificación de la Variable de Respuesta
 Selección del Factor de Interés
 Selección de los Niveles
 Definición de las Unidades Experimentales
 Estimar el Tamaño de Muestra por cada nivel.
2.3 Pasos para la Resolución de Problemas en un DCA de 1 factor.
PROBLEMA A EXPLICAR
TEMA: Necesidades Energéticas del Individuo

Se quieren determinar las necesidades energéticas de una persona cuando anda,
come o hace deporte.
Supongamos que se tienen 10 personas para realizar el experimento y se
considera como variable respuesta o cuantitativa, el número de calorías
consumidas por segundo.
Los resultados varían según el individuo considerado. Aquí, el factor es la

actividad realizada, con 3 posibles niveles: andar, comer o hacer gimnasia
Si a cada una de las personas se le asigna una actividad distinta puede ser que la
variabilidad observada entre las distintas actividades sea debida a las diferencias
entre los propios individuos.
Una posible solución es que cada uno de los individuos realice las tres
actividades. De este modo, la variable bloque es el tipo de persona y cada uno de
los bloques es cada persona.
A cada bloque (persona) se le aplican los 3 niveles del factor por orden aleatorio:
BLOQUES ASIGNACION
Persona 1 C A G
Persona 2 A C G
Persona 3 G A C
Persona 4 C G A
Persona 5 . . .
Persona 6 . . .
Persona 7 . . .
Persona 8 . . .
Persona 9 . . .
Persona 10 . . .
Esto quiere decir que cada persona realiza cada una de las actividades y se mide
la variable de respuesta.
2.3.1 Definición del Problema
Primero que nada se debe comparar si existen diferencias significativas entre los
promedios de los niveles del factor de interés. De igual manera, se debe
determinar el efecto del factor de interés sobre la variable de respuesta.
Determinar la variable de respuesta, factor de interés, bloques y niveles.
2.3.2 Modelo Estadístico
Existen dos formas de representar el modelo estadístico y son las siguientes:

Colocando los bloques en las filas y los niveles del factor en las
columnas
Modelo Estadístico
Yij =  +  i + j + ij
i =1.….n
j= 1.….k
Donde:
Yij = es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés
 = es la media total
j = es el efecto del j-ésimo nivel del factor de interés
i= es el efecto del i-ésimo bloque.
ij = es el error experimental
Colocando los niveles del factor en las filas y los bloques en las
columnas
Modelo Estadístico
Yij =  +  j + i + ij
i =1.….k y j= 1.….n
Donde:
Yij= es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés.
 = es la media total
i = es el efecto del i-ésimo nivel del factor de interés
j = es el efecto del j-ésimo bloque.
ij = es el error experimental.
2.3.3 Formulación de las Hipótesis

Para la formulación de las Hipótesis, hay que considerar que tipos de factores se
están estudiando en el experimento, ya que pueden ser de dos tipos: fijos y
aleatorios.
Para factores fijos y aleatorios se formula lo siguiente:
Hipótesis
Factor de Efectos Fijos
 Para los bloques

Ho: 1 = 2 =. . . = n
H1: al menos una de las medias de los bloques es diferente
Regla de Decisión: Se descarta Ho si Fc ≥ F,gln,gld

gln = ( n – 1)
gld = ( k – 1) (n – 1)

 Para el factor de interés

Ho : 1 = 2 = . . . = k
H1 : al menos una de las medias de los niveles del factor de interés es diferente
gln = ( k – 1)
gld = ( k – 1) (n – 1)
Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.
En este caso, las hipótesis de los bloques serían solo para confirmar que hay
diferencias entre éstos. Si se ha considerado un diseño por bloques es porque
éstos influyen en el experimento.
Como se dijo al inicio de esta sección, las hipótesis que se han planteado
anteriormente para el Diseño de Bloques al Azar (DBA), sirven tanto para factores
fijos como para factores aleatorios.
Hipótesis
Factor Efectos aleatorios
Cabe destacar que las hipótesis del factor de interés, en el caso que sean
Factores Aleatorios, se pueden escribir en términos de la varianza, por lo que
quedarían de la siguiente manera:
 Para el factor de interés

Ho: 1² = 2² =......... k²
H1: al menos una de las varianzas de los niveles del factor de interés es diferente
gln = ( k – 1)
gld = ( k – 1) (n – 1)
Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.
IMPORTANTE: Los factores de bloque no se incluyen en el experimento porque
no nos interesa su efecto, sino que es un medio de estudiar de manera más
adecuada el factor de interés.
Tiene un grado de importancia secundaria en relación al factor de interés.
Pueden existir otros factores que deben controlarse durante el experimento, pero
no se tiene que caer en el extremo de controlar todo. Se pueden controlar
entonces aquellos factores que por conocimiento del proceso o experiencia previa
se sabe que pueden afectar en forma sensible el resultado de las comparaciones.
2.3.4 Procedimiento de Aleatorización

El procedimiento de aleatorización se puede definir de la siguiente forma:
Para el Modelo Yij =  +  i + j + ij

Se debe asignar aleatoriamente cada uno de los k niveles del factor de interés
a cada uno de los n bloques considerados en el experimento.
B1 B2 .………… Bn
1 1 1
2 2 2
. . .
. . .
K k k
Para el Modelo Yij =  +  j + i + ij

Se debe asignar aleatoriamente cada uno de los n niveles del factor de interés
a cada uno de los k bloques considerados en el experimento.
B1: 1 2 3 4 ........k ( en forma aleatoria)

B2: 1 2 3 4 .........k ( en forma aleatoria)
Bn: 1 2 3 4 ..........k ( en forma aleatoria)
Por ejemplo:
3 Niveles: A,B,C para el factor de interés y 3 Bloques: 1,2,3
Una posible configuración de la asignación aleatoria de los niveles podría ser la

siguiente:
Bloque 1 C( ) A( ) B( )
Bloque 2 A( ) C( ) B( )
Bloque 3 C( ) B( ) A( )
2.3.5. Registro De Datos
Una vez identificados los niveles, los bloques, la variable de respuesta y el modelo
estadístico con el que se realizará todo el experimento. Se debe proceder a de
realizar el registro de datos donde primeramente se debe señalar quien es el
responsable de la realización del reporte, la fecha en que se está efectuando e
identificar para qué empresa se realiza la investigación. También es necesario
señalar el motivo de realización de dicho experimento, el factor de interés y la
unidad de medida, para que toda la información que se plasme en el reporte, se
realice de forma clara, consistente y veraz.
Luego se procede a elegir el formato de registro de datos a utilizar para el
experimento, en el cual para el Diseño de Bloques al Azar, existen dos formas
dependiendo del modelo estadístico previamente seleccionado.
Para el Modelo: Y ij =μ+ β i +τ j+ ε ij
NINIVELES
Totales/
BLOQUES
1 2 … k
Bloque
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Nivel
Para este formato, los datos ya aleatorizados correspondientes a los bloques se

ubican en las filas y llevan el orden (Y11, Y12,…Y1k); los datos aleatorizados de los
niveles se ubican en las columnas y llevan el orden (Y21, Y22,…Y2k). Luego de esto
se procede a sumar todos los datos de cada fila y columna para obtener así los
totales por bloque (Y1.) y nivel (Y.1). Por último se suman los totales de los bloques
y de los niveles, los cuales deben coincidir para obtener el gran total (Y..).
Para el Modelo: Y ij =μ+ β j + τ i+ ε ij
BLOQUES
Totales/
NIVELES
1 2 … K
Nivel
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Bloque
Para este formato, los datos ya aleatorizados correspondientes a los niveles se
ubican en las filas y llevan el orden (Y11, Y12,…Y1k); los datos aleatorizados de los
niveles se ubican en las columnas y llevan el orden (Y21, Y22,…Y2k). Luego de esto
se procede a sumar todos los datos de cada fila y columna para obtener así los
totales por nivel (Y1.) y bloque (Y.1). Por último se suman los totales de los niveles y
de los bloques, los cuales deben coincidir para obtener el gran total (Y..)
2.3.6 Supuestos Del Modelo
Los supuestos que se tienen en consideración para la realización del experimento

del diseño bloques al azar son:
NORMALIDAD: Este supuesto indica que los resultados obtenidos para la

variable de respuesta en cada nivel deben seguir una distribución normal.
HOMOCEDASTICIDAD: Este supuesto indica que as varianzas de las

observaciones de la variable de respuesta en cada nivel no deben diferir
de forma significativa
INDEPENDENCIA: Este supuesto indica que cada conjunto de datos debe

ser independiente del resto, esto se comprueba cuando los datos en el
gráfico de independencia se muestran de forma aleatoria, sin ninguna
tendencia.
Para estos supuestos se plantean las siguientes hipótesis, que luego mediante
software estadísticos se van a aceptar o rechazar.
Hipótesis para la Normalidad:

Ho: Los datos del experimento presentan una distribución normal.
Hi: Los datos del experimento no presentan una distribución normal.
Hipótesis para la Homocedasticidad:
Para los niveles:

Ho: Las varianzas de los niveles y de la variable respuesta son iguales.
Hi: Las varianzas de los niveles y de la variable respuesta no son iguales.
Para los bloques:
Ho: Las varianzas de los bloques y de la variable respuesta son iguales.
Hi: Las varianzas de los bloques y de la variable respuesta no son iguales.
Hipótesis para la Independencia:

Ho: Los datos se muestran de forman independiente.
Hi: Los datos no se muestran de forman independiente.
Verificación de los Supuestos
Para comprobar los supuestos de normalidad, utilizaremos el software estadístico

Minitab. Los pasos son los siguientes:
Colocar la
Estadísticas Prueba de Seleccionar
Estadísticas Variable de Aceptar
Básicas Normalidad Ryan-Joiner
Respuesta
Otro software estadístico es el PASW, en donde se puede comprobar también es

supuesto de normalidad. Los pasos son los siguientes:
Gráfica con Colocar la
Estadísticos
Analizar Explorar Pruebas de Variable de Aceptar
Descriptivas
Para comprobar la hipótesis nula de acuerdo a la prueba de Ryan Joiner se

debe observar que el p-value es mayor que el nivel de significancia por lo
tanto se acepta la hipótesis nula y se concluye que los datos presentan una
distribución normal.
Para comprobar los supuestos de homocedasticidad, utilizaremos el software
estadístico Minitab. Los pasos son los siguientes:
Para Comparar las varianzas de Variable de Respuesta vs Niveles
Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste
Para Comparar las varianzas de Variable de Respuesta vs Bloques
Seleccionar
Prueba de Colocar la Comparar
Gráfica de
Estadísticas ANOVA Varianzas Variable de con el Aceptar
Residuo vs
Iguales Respuesta Bloque
Ajuste
Otro software estadístico es el PASW, en donde se puede comprobar también es

supuesto de homocedasticidad. Los pasos son los siguientes:
Para Comparar las varianzas de Variable de Respuesta vs Niveles

Comparar ANOVA de un Comparar con
Analizar Pruebas de Variable de Aceptar
Medias factor el Nivel
Para Comparar las varianzas de Variable de Respuesta vs Bloques

Comparar ANOVA de un Comparar con
Analizar Pruebas de Variable de Aceptar
Medias factor el Bloque
Al obtener los resultados se puede inferir que las varianzas de los factores
son iguales si el valor de p>0.05.
Para comprobar el supuesto de independecia, solamente se utiliza el software

Minitab, ya que el PASW no tiene la función disponible para comprobar este
supuesto.
Modelo Factores: Gráficos:

Variable de
Estadísticas
Estadísticas ANOVA
ANOVA Lineal
Lineal Bloques
Bloques yy Residuos
Residuos vs
vs Aceptar
Aceptar
Respuesta
Respuesta
General
General Niveles
Niveles Orden
Orden
2.3.7 Análisis De Varianza
El análisis de varianza se realiza con el propósito de comprobar si la hipótesis de
los niveles y de los bloques planteados se comprueba o se rechaza.
Existen dos formatos y modos de calcular el análisis de varianza dependiendo del
modelo estadístico elegido.
Para el modelo: Y ij =μ+ β i +τ j+ ε ij

Grados Suma de Cuadrado
Fuente de
de Cuadrados Medio Fc Fa
Variable
Libertad SC CM
Niveles CMN/CME
k-1 SCN SCN/k-1 Fa, gln,gld
N E
Bloques CMB/CME
n-1 SCB SCB/n-1 Fa, gln,gld
B E
Error SCEE/(n-1)(k-
(n-1)(k-1) SCEE
EE 1)
Total
nk-1 SCTo
T0
Al tener el formato para el cálculo del Análisis de Varianza (ANDEVA), donde ya

se han colocado en las columnas la fuente de variable, los grados de libertad, la
suma de cuadrado, el cuadrado medio, la F calculada y la F crítica, se procede a
colocar en la filas los cálculos correspondientes a los niveles, bloques, error
experimental y los totales para cada columna.
En la columna de grados de libertad se calculan los grados de libertad

correspondiente a:
Niveles: gln= k-1 Error Experimental: glee=(n-1)(k-1)

Bloques: glb= n-1 Total: nk-1
Para la columna de Suma de Cuadrados se realizan los siguientes cálculos:
2 Error Ex.:
k Y ..
SCN = 1n ∑ 2
Y −
j=1 . j nk
Niveles: SCEE=SCT 0 −(SCN +SCB )
2
2 Y ..
n n k 2
SCB= 1k ∑ Y − 2 Y ..
Bloques: i=1 i. nk SCT 0 =∑ ∑ Y ij − nk
Totales: i=1 j=1
En la columna de Cuadrado Medios se realizan los siguientes cálculos:
Niveles: CMN=SCN/k-1 Bloques: CMB=SCB/n-1

Error Experimental: CMEE=SCEE/=(n-1)(k-1)
En la columna de F calculada, la misma se calcula para los niveles y los

bloques.
Niveles: Fc=CMN/CMEE Bloques: Fc=CMB/CMEE
Para la columna de F crítica, los datos que se deben establecer son el nivel de
significancia con que se realizará la medición y búsqueda del valor de Fisher en la
tabla correspondiente; lo más recomendado es realizar el cálculo con un nivel de
significancia del 95% o del 99%, siendo a=0.05 y a=0.01, respectivamente.
Luego se procede a calcular para los niveles y bloques la gl n y gld correspondiente.
Niveles: gln= (k-1) gld=(k-1)(n-1) Bloques: gln= (k-1) gld=(k-1)(n-1)

Para el Modelo: Y ij =μ+ β j + τ i+ ε ij
Grados Suma de Cuadrado

Fuente de
de Cuadrados Medio Fc Fa
Variable
Libertad SC CM
Niveles CMN/CME
k-1 SCN SCN/k-1 Fa, gln,gld
N E
Bloques CMB/CME
n-1 SCB SCB/n-1 Fa, gln,gld
B E
Error SCEE/(n-1)(k-
(n-1)(k-1) SCEE
EE 1)
Total
nk-1 SCTo
T0
De igual manera el formato para este modelo es igual, pero la variante es la forma
de calcular y las fórmulas de los elementos que componen el ANDEVA.
Los grados de de libertad se calculan de la misma forma para el modelo

anterior:
Niveles: gln= k-1 Error Experimental: glee=(n-1)(k-1)

Bloques: glb= n-1 Total: nk-1
Para la columna de Suma de Cuadrados se realizan los siguientes cálculos:
2 Error Ex.:
k 2 Y ..
SCN = 1n ∑ Y −
i=1 i. nk
Niveles: SCEE=SCT 0 −(SCN +SCB )
2
2 Y ..
n n k 2
SCB= 1k ∑ Y − 2 Y ..
Bloques: j=1 . j nk SCT 0 =∑ ∑ Y ij − nk
Totales: i=1 j=1
En la columna de Cuadrado Medios se realizan los siguientes cálculos:

Niveles: CMN=SCN/k-1 Bloques: CMB=SCB/n-1
Error Experimental: CMEE=SCEE/=(n-1)(k-1)
En la columna de F calculada, la misma se calcula para los niveles y los

bloques.
Niveles: Fc=CMN/CMEE
Bloques: Fc=CMB/CMEE
Para la columna de F crítica, se realiza el mismo procedimiento para calcular el

punto crítico de rechazo, utilizando el nivel de significancia seleccionado y de igual
forma se procede a calcular para los niveles y bloques la gl n y gld correspondiente.
Niveles: gln= (k-1) gld=(k-1)(n-1)
Bloques: gln= (k-1) gld=(k-1)(n-1)
2.3.8 Conclusión
Luego de finalizar el cálculo de todos los elementos del ANDEVA, se comparan los
valores obtenidos para la F calculada con el punto crítico de rechazo establecido
en la Regla de Decisión, tanto para los niveles del factor como para los bloques.
La manera de comprobar si la hipótesis de los niveles y de los bloques se acepta,

es observar si la F calculada (F c) es menor a la F crítica (Fa), de lo contrario se
rechaza la hipótesis correspondiente porque habría diferencia significativa en las
medias de las variables de estudio.
2.3.9 Cálculo De Parámetros
Los parámetros del modelo estadístico para el diseño de bloques al azar son:
Varianza s² = CMEE
El cual indica la variabilidad que tiene la variable de respuesta del experimento al

realizar los cálculos correspondientes para cada bloque y nivel.
n k
Media de los datos:
∑ ∑ Y ij
μ= i=1 j=1
nk
El cual indica la cantidad total de la variable distribuida a partes iguales entre cada
observación.
2.3.10 Intervalos De Confianza
Se llama intervalo de confianza a un par de números entre los cuales se estima que

estará cierto valor desconocido con una determinada probabilidad de acierto, en el
caso del Diseño de Bloque Al Azar realizamos pruebas de intervalos de confianza para
cada una de las medias del experimento, tanto del factor de interés como de los
bloques, para la realización de los cálculos es importante poseer la tabla de valores
observada anteriormente (registro de datos) y utilizar la tabla de T de Student.
La siguiente formula es la utilizada para calcular dichos intervalos de confianza:
PARA LAS MEDIAS DE LOS NIVELES
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
Donde:
ý . j = promedio de cada valor de los niveles.
t ∝/2 ,(k−1)(n−1) = Valor de la tabla T de Student de ∝/2 para el grado (k −1)(n−1).
CMEE
√ n
= Raíz cuadrada del Cuadrado medio del error entre n niveles.
PARA LAS MEDIAS DE LOS BLOQUES
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
Donde:
ý .i = promedio de cada valor de los niveles.
t ∝/2 ,(k−1)(n−1) = Valor de la tabla T de Student de ∝/2 para el grado (k −1)(n−1).
CMEE
√ k
= Raíz cuadrada del Cuadrado medio del error entre k niveles.
Estimadores
Estimación de Media de Niveles:

τ i .=Y i. −Y . .
i= 1........k
Estimación de Media de Bloques:

β . j =Y . j −Y . . j= 1........n
Cálculo del Coeficiente de Determinación

R² = (SCN + SCB) / SCTotal
El coeficiente de determinación indica el porcentaje de la variabilidad en la variable de

respuesta debido a los bloques y niveles del factor de interés.
2.4 Ejemplo
2.4.1 EJEMPLO: ALEACIÓN DE ALUMINIO
Un fabricante de aleación de aluminio produce refinadores de textura en forma de

lingotes. La compañía manufactura el producto en cuatro hornos. Se sabe que cada
horno tiene sus propias características de operación, de modo que los hornos se
considerarán una variable problemática en cualquier corrida experimental en la
fundición que implique más de un horno.
Los ingenieros de proceso sospechan que la velocidad de agitación influye en el

tamaño de grano del producto. Cada horno puede operarse a cuatro velocidades de
agitación distintas.
Se ejecuta un diseño de bloques aleatorizados para un refinado en particular, y se

mide el tamaño de grano.
2.4.1.1 Definición del Problema.
Determinar si existe diferencia significativa en el tamaño de grano promedio para las

distintas velocidades de agitación utilizando cuatro diferentes hornos.
Variable de Respuesta: Tamaño del grano.
Factores de Interés: velocidades de agitación
Bloques : hornos
Niveles=4 Bloques= 4
2.4.1.2 Modelo Estadístico
Utilizando los bloques en las filas y los niveles del factor en las
columnas.
Modelo Estadístico
Yij = m + b i + tj + eij í i =1, ...,4 y j= 1,..., 4
Donde:
Yij = es el tamaño del grano para la j-esima velocidad de agitación en el i-esimo horno
μ= tamaño de grano promedio.
b i = es el efecto del i-esimo horno sobre el tamaño de grano.
tj = es el efecto de la j-esima velocidad de agitación sobre el tamaño de grano
eij = es el error experimental.
Se puede colocar también utilizando las columnas para representar los niveles
del factor.
2.4.1.3 Formulación de Hipótesis

Niveles (Velocidad de Agitación)
Ho : m1 = m2 = m3 = m4
H1 : al menos uno de los tamaños promedio de grano es diferente.
Regla de Decisión: Se descarta Ho si la Fc ≥ F0.05,gln,gld

gln = ( k – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9
Bloques (Hornos)
Ho: m1 = m2 = m3 = m4
H1: al menos uno de los tamaños promedio de grano es diferente.
gln = ( n – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9
2.4.1.4 Procedimiento de Aleatorización
VELOCIDADES DE AGITACIÓN
H 4() 2() 1() 3()
O
R 2() 1() 3() 4()
N
4() 3() 1() 2()
O
S 3() 4() 2() 1 ()
2.4.1.5 Registro de Datos
Velocidades de Agitación
Hornos 5 10 15 20 Totales/horno
1 8 14 14 17 53
2 4 5 6 9 24
3 5 6 9 3 23
4 6 9 2 6 23
Totales/veloci 23 34 31 35 123
dad de
agitación.
2.4.1.6 ANOVA- Análisis de Varianza
ANÁLISIS DE VARIANZA
Fuente de Grados de Suma de Suma de Fc F∝

variable libertad Cuadrados cuadrados
medios
Velocidad de 3 22.19 7.40 0.85 3.86
agitación
Hornos 3 165.19 55.06 6.35 3.86
Bloques
Error 9 78.06 8.67
Experimental
Total 15 265.44
2.4.1.7 Conclusiones
Para las Velocidades de Agitación:
Fc es menor que F 0.05,3,9 , por lo tanto no se descarta Ho . Se concluye que no

existe diferencia significativa en el tamaño de grano promedio para las distintas
velocidades de agitación.
Para los Hornos:
Fc es mayor que F 0.05,3,9 , por lo tanto se descarta Ho. Se concluye que existe
diferencia significativa en el tamaño promedio del grano para los cuatro hornos. Por lo
tanto se confirma que los hornos tienen características de operación propias.
2.4.1.8 Cálculo de Parámetros
Varianza: CMEE = 8.67
123
μ= =7.69
16
2.4.1.9 Intervalos de Confianza

Para las medias de los Bloques
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
8.67
IC μ =53 /4 ± t 0.025 , 9
j
√ 4
=
53 8.67
IC μ =
j
4
±(2.262)
4
=
√ 9.92 y 16.58
Y así para el valor promedio de cada fila de bloques…
Para las medias de los niveles
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
8.67
IC μ =23 /4 ± t 0.025 , 9
j
√ 4
=
23 8.67
IC μ =
j
4 √
±(2.262)
4
= 2.41 y 9.08
Así para el valor promedio de cada columna de los niveles…
Estimadores:
Para los Bloques:
τ =13.25−7.69=5.56
τ =6−7.69=−1.69
τ =7.67−7.69=−0.02
τ =7.67−7.69=−0.02
Para los Niveles:
τ =7.67−7.69=−0.02
τ =8.5−7.69=0.81
τ =7.75−7.69=0.06
τ =8.75−7.69=1.06
Coeficiente de Determinación:
R²= (22.19 + 165.19) / 265.44 = 0.71
Interpretación:
El modelo explica en un 71% la variabilidad en los tamaños de grano o el 71% de la

variabilidad en el tamaño del grano se debe a la velocidad de agitación.
2.4.2 EJEMPLO: SISTEMA DE COMPUTACIÓN
Una empresa de contabilidad grande trata de seleccionar un sistema de computación

integrado a la oficina entre los 3 modelos que están actualmente en estudio. La
selección final dependerá de la productividad del sistema. Se seleccionan
aleatoriamente 5 operadores para manejar cada sistema.
Es importante tener en cuenta que el nivel de experiencia que tienen los empleados en
el manejo de computadora puede afectar el resultado de la prueba por lo tanto existe la
necesidad de justificar el impacto de la experiencia y determinar los méritos relativos de
los sistemas de comunicación.
Los niveles resultantes de producción medidos en unidades por hora aparecen en la

siguiente tabla.
Operadores Sistemas
1 2 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
2.4.2.1 Definición del Problema
Determinar si existe diferencia significativa en la productividad promedio, de 3 tipos de

sistemas de computación manejado por cinco operarios con diferente grado de
experiencia.
Variable de Respuesta:
Es la productividad del j-esimo sistema de computación manejado por el i-esimo

operario.
Factor de Interés: Tipo de Sistema de computación
Bloques: operadores
Colocando los bloques en las filas y los niveles del factor en las columnas
Yij = µ + Bi + Tj + Eij
i = l,.....5 j = l,...3
Yij = es la productividad del i-esimo tipo de sistema de computación manejado por el

j-esimo operario.
µ = Productividad media Total.
Bi = Es el efecto del i-esimo operario sobre la productividad.
Tj = Es el efecto del j-esimo tipo de sistema de computadora sobre productividad.
Eij = Error experimental.
2.4.2.3 Formulación de la Hipótesis

Para Bloques ( operadores )
Ho: µ1 = µ2 =... = µ5
Hi: al menos un promedio es diferente
Para niveles ( sistemas )
Ho: µ1 = µ2 = µ3
H1: al menos un promedio es diferente.
Selección del nivel de significancia y regla de decisión
œ = 0.05%
Para los operadores: Descartar Ho Si Fc> F0.05, 4, 8
Para los tipos de sistemas: Descartar Ho si Fc> F0.05, 2, 8
5 bloques (operadores) = 1, 2, 3,4,5
3 niveles (tipos de sistemas) = 1, 2, 3, 4, 5
Operarios Sistemas
1 A(27) C(25) B(21)
2 A(31) B(33) C(35)
3 B(39) C(39) A(42)
4 B(41) A(38) C(37)

4 C(45) B(46) A(45)
TIPOS DE SISTEMAS
OPERARIOS A B C
1 27 21 25 73
2 31 33 35 99
3 42 39 39 120
4 38 41 37 116
5 45 46 45 136
Totales 183 180 181 544
2.4.2.6 ANDEVA
FUENTE DE GL SC CM Fc Fcrítica
VARIACIÓN
TIPOS DE SISTEMAS 2 0.933 0.4665 0.09 4.46
OPERARIOS 4 764.93 191.23 37.28 3.84
E.E 8 41.07 15.13
Totales 14 806.93
2.4.2.7 Conclusión
Para el factor de interés se observa que Fc = 0.09 < F0.05,2, 8 = 4.46, por lo tanto no
se descarta Ho. Se concluye que no existe diferencia significativa en la productividad
promedio para los 3 tipos de sistemas.
Para los operadores se observa que Fc = 37.28 > F0.05, 4, 8 = 3.84, por lo tanto se
descarta Ho. Se concluye que existe diferencia significativa en la productividad
promedio de los operadores.
Varianza:
CMME = 15.13
544
μ= =36.27
15

Para las medias de los Bloques
CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k
15.13
IC μ =73 /3 ± t 0.025, 8
j
√ 3
=
73 15.13
IC μ =
j
3
±(2.306)
3 √
= 19.15 y 29.51
Y así para el valor promedio de cada fila de bloques…
Para las medias de los niveles
CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n
15.13
IC μ =183 /5 ± t 0.025 , 8
j
√ 5
=
183 15.13
IC μ =
j
5 √
±(2.306)
5
= 32.59 y 40.61
Así para el valor promedio de cada columna de nivel.
Estimadores
Para los Bloques:

τ =24.33−36.27=−11.94
τ =33−36.27=−3.27
τ =40−36.27=3.73
τ =38.67−36.27=2.40
τ =45.33−36.27=9.06
Para los Niveles:
τ =36.6−36.27=0.33
τ =36−36.27=−0.27
τ =36.2−36.27=−0.07
Coeficiente de Determinación:
R²= (0.933 + 764.93) / 806.93 = 0.94
Interpretación:
El modelo explica en un 94% la variabilidad en la productividad o el 94% de la

variabilidad en la productividad se debe al tipo de sistema de computación.
2.4.3 EJEMPLO: SOLUCIONES DE LAVADO
Se están comparando tres soluciones de lavado diferentes a fin de estudiar su

efectividad para retardar el crecimiento de bacterias en contenedores de leche de cinco
galones. El análisis se hace en un laboratorio y sólo pueden realizarse tres ensayos en
un día. Puesto que los días podrían representar una fuente potencial de variabilidad, el
experimentador decide usar un diseño de bloques aleatorizados. Se hacen
observaciones en cuatro días, cuyos datos se muestran enseguida. Analizar los datos
de este experimento (utilizar α = 0.05) y sacar las conclusiones apropiadas.
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
Crecimiento de las bacterias en la leche
Determinar el efecto de las 3 soluciones de lavado en cada contenedor de leche,

sobre la efectividad para retardar el crecimiento de bacterias durante los 4 días de
observación.
V R: Efectividad para retardar el crecimiento de bacterias.

F I: Tres soluciones de Lavado
Bloques: 4 Días
Diseño apropiado: Diseño de Bloque al Azar
Yij = m + bj + ti + eij
i =1.….3 y j= 1.….4eij
Donde:
Yi j= es la medición de La efectividad para retardar crecimiento de bacterias en el i-

esimo día para la j-esima solución de lavado
m= es la efectividad promedio para retardar el crecimiento de bacterias
ti= es el efecto del i-esimo solución de lavado sobre la efectividad de retraso de
crecimiento de bacterias
bj= es el efecto del j-esimo día sobre la efectividad del crecimiento de bacterias
eij = es el error experimental.

Hipótesis para los bloques
Ho: m1 = m2 = m3=m4
H1: al menos una de las medias de los 4 días es diferente
Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 2,6=5.14
gln= ( 4– 1) =3gld = ( 3– 1) (4 – 1)=6
Hipótesis para los niveles

Ho: m1 = m2 =m3
H1: Al menos uno de las efectividades para retardar el crecimiento de las
bacterias promedio es diferente.
Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 3,6= 4.76
gln= ( k – 1) : (3-1)= 2gld = ( k – 1) (n – 1)= (3-1)(4-1)= (2)(3)= 6

Se le asigna al azar cada uno de los niveles del factor a cada uno de los bloques.
3 Días: 1,2,3,4. (B); 3 Soluciones: 1,2,3. (N)
S. Lavado Días (B)
(N)
1 A ( 13) D(39) C(18) B(22)
2 B(24) C(17) D(44) A(16)
3 B(4) A(5) D(22) C(1)
Días (B)
Solución A B C D TOTALE
(N) S
1 13 22 18 39 92
2 16 24 17 44 101
3 5 4 1 22 32
TOTALE 34 50 36 105 225
S
2.4.3.6 SUPUESTOS DEL ANOVA

Normalidad
Por medio de esta gráfica verificamos el supuesto de la normalidad:

Ho: Efectividad de retardar el crecimiento de bacterias presentan una distribución normal
H1: Efectividad de retardar el crecimiento de bacterias no presentan una distribución
normal
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
Conclusión: Pvalue: 0.100≥ 0.05 no se descarta ho, esto significa que los datos
muestran una distribución normal.
Los datos muestran una distribución normal, debido a que los puntos muestran una
secuencia.
Homosedasticidad
H0: Las varianzas son iguales
H1: Al menos una

varianza es diferente
El factor de interés presenta varianzas similares.

Los bloques presentan varianzas similares debido a la distribución de los puntos.
Observando está gráfica de Residuo vs Ajustes de la Solución de lavado podemos verificar

Independencia
que el factor de interés presentan varianzas similares.
Al observar está gráfica de Residuo vs Orden verificamos la independencias de las

soluciones de lavado y los días de estudio y vemos que lo datos no muestran una
tendencia por lo cual concluimos son independientes.
Homocedasticidad
Niveles
Observando está Lasgráfica

varianzas de lasvssoluciones
Residuo de lado son
Ajustes; verificamos la iguales o similares. de las
Homocedasticidad
soluciones de Lavado
Ho: σ12 = σ22 = σ32 = σ42
Regla de decisión:
De acuerdo a Prueba de Levene nuestro Pvalue= 0.870 ≥ α= 0.05
Conclusión: Como Pvalue (0.870) > 0.05, no se descarta Ho, esto significa que los datos
cumplen con el supuesto de Homocedasticidad que dice que las varianzas de las soluciones
de lado son iguales o similares.
Bloques
Las varianzas de los días

de observaciones son
iguales.
Observando está gráfica Residuo vs Ajustes; verificamos la Homocedasticidad de días
de observación del estudio
Ho: σ12 = σ22 = σ32 = σ42
Regla de decisión:
Conclusión: Como Pvalue (0.950) > 0.05, no se descarta Ho, esto significa que los datos
cumplen con el supuesto de Homocedasticidad que dice que las varianzas de los días
de observaciones son iguales o similares.
Análisis de varianza de dos factores con una sola muestra por grupo
RESUMEN ANÁLISIS DE
Cuenta VARIANZA Promedio
Suma Varianza
Origen de las Suma
Fila 1 de Grados4 de Promedio
92 de los 23 F Probabilida
127.33 Valor
variaciones cuadrados
Fila 2 libertad
4 cuadrados 25.25
101 d168.917 crítico para
Fila 3 4 32 8 90 F
Filas 703.5 2 351.75 40.7 0.000323 5.14
2
Columna 1 3 34 11.33 32.33
Columnas 1106.92 3 368.97 42.7 0.000192 4.76
Columna 2 3 50 16.67 121.33
1
Columna 3 3 36 12 91
Error 51.83 6 8.64
Columna 4 3 105 35 133

Total 1862.25 11
2.4.3.8 Conclusión
Como Fc (40.72) ≤ F0.05,2,6 (5.14) por lo tanto se descarte Ho y al menos una de las
soluciones de lavado es diferente.
Como Fc (42.71) ≤ F0.05,3,6 (4.76) por lo tanto se descarte Ho y al menos una de los
días de observaciones es diferente.
Para el factor de interés se observa que Fc (40.72) ≥ F0.05,2,6 (5.14) por lo tanto se
descarte Ho . Se concluye que existe diferencia significativa en le efectividad para
reducir el crecimiento de las bacterias en un contenedor de cinco galones promedio
para las tres soluciones de lavado .
Para los días de estudio se observa que Fc (42.71) ≥ F0.05,3,6 (4.76) por lo tanto
se descarte Ho . Por lo cual concluimos que existen diferencia significativas en la
efectividad promedio de bacterias en los cuatros días pertinente a dicha
investigación
n k
∑ ∑ Y ij 225
μ= i=1 j=1
= =18.75
nk 12
σ 2=CMEE=8.64
σ =√ 8.64=2.94
2.4.3.10 Intervalo de Confianza

CMEE
IC μ =Y´i . ± t ∝
i
2
∑ nk −k √ n
8.64
IC μ =23± 2.1788
1
4
8.64
√
(19.80 ≤❑1 ≤ 26.20)
IC μ =25.25± 2.1788
2
8.64
4 √
(20.05 ≤❑2 ≤ 26.45)
IC μ =8 ±2.1788
3
4 √
(4.80 ≤❑3 ≤ 11.20)
CMEE
IC μ =Y´ j . ± t ∝
i
2
∑ nk−k √ k
8.64
IC μ =11.33 ±2.1788
1
3
8.64
√
(7.63 ≤❑1 ≤15.03)
IC μ =16.67± 2.1788
2
3 √
( 12.97≤❑2 ≤20.37)
8.64
IC μ =12± 2.1788
3
√ 3
(8.30 ≤❑3 ≤15.69)
8.64
IC μ =35 ±2.1788
4
√ 3
(31.30 ≤❑4 ≤ 39.70)
Estimadores
 media de niveles
 Media de los Bloques
τ i =Y´ i .−Y´ ..
τ1 = 23 – 18.75 = 4.25
τ2 = 25.25 – 18.75 = 6.5 β j=Y´ j .−Y´ ..
τ3 = 8 – 18.75= -10.75 β1 = 11.33 – 18.75 = -7.24
Coeficiente de determinación
β2 = 16.67 – 18.75 = -2.08
β3 = 12 – 18.75 = -6.75
 Calculo del coeficiente de determinación
β4 = 35– 18.35 = 16.65
e interpretación
R² = (SCN + SCB) / SCTo0= 1810.41 / 1862.25 = 97.22% 0 ≤ R2 ≤ 1
Esto indica que la variabilidad en la efectividad del retraso de crecimiento en las

bacterias dependen un 97.22% de las soluciones de lavado en los 4 días de
estudio.
2.4.4 DISTANCIA DE ENFOQUE DEL OJO
Un ingeniero industrial está realizando un experimento sobre el tiempo de enfoque del

ojo. Se interesa en el efecto de la distancia del objeto al ojo sobre el tiempo de
enfoque. Cuatro distancias diferentes son de interés. Cuenta con cinco sujetos para el
experimento. Debido a que puede haber diferencias entre los individuos, el ingeniero
decide realizar el experimento en un diseño de bloques aleatorizados. Los datos
obtenidos se presentan a continuación. Analizar los datos de este experimento (utilizar
α = 0.05) y sacar las conclusiones apropiadas.
Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
Determinar el efecto de la distancia del objeto al ojo del individuo sobre el tiempo de
enfoque.
Variable de Respuesta: Tiempo del enfoque del ojo
Factores de interés: Sujetos o Individuos
Bloques: Distancias
Bloques: 4 y Niveles: 5
Yij =  +  i + j + ij
 i =1, ...,4 y j= 1,..., 5
Donde:
Yij = es el tiempo del enfoque del ojo del j-ésimo

Sujeto (individuo) a la i-ésima distancia
 = tiempo promedio del enfoque del ojo
 i = es el efecto de la i-ésima distancia sobre el tiempo de enfoque del ojo
j = es el efecto del j-ésimo sujeto o individuo sobre el tiempo de enfoque del ojo
ij = es el error experimental.
Hipótesis:
Niveles (Sujetos o Individuos)
Ho : 1 = 2 = 3 = 4 = 5
H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente
gln = ( k – 1) = 5 – 1= 4
gld = ( k – 1) (n – 1)= (5-1)(4-1)= 12
Bloques (Distancias):
Ho : 1 = 2 = 3 = 4
H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente
Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld
gln = ( n – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (5-1)(4-1)= 12
SUJETOS O INDIVIDUOS
D
I 4 5 2 1 3
S
T 2 1 5 3 4
A 5 4 3 2 1
N
C 1 5 3 4 2
I
A
S
Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3
S Total Promedio
ujeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6 34 6.8
6 7 6 6 1 6 26 5.2
8 5 3 3 2 5 18 3.6
10 6 4 4 2 3 19 3.8
totales 28 19 19 11 20 97
Promedios 7 4.75 4.75 2.75 5
2.4.4.6 SUPUESTOS DEL ANOVA

PRUEBA DE NORMALIDAD
Ho: Los valores del tiempo de enfoque del ojo presentan una distribución
normal.
H1: Los valores del tiempo de enfoque del ojo no presentan una distribución
normal.
Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
TIEMP .207 20 .024 .921 20 .104
O
a. Lilliefors Significance Correction
Se acepta Ho ya que el valor de Sig. de Shapiro-Wilk es 0.104 , y es mayor a 0.05, [

Pvalue (0.104) > 0.05] ; inferimos que los valores presentan una distribución normal.
Tests of Between-Subjects Effects

Dependent Variable:TIEMPO
Source Type III Sum of df Mean Square F Sig.
Squares
Corrected Model 42.490a 2 21.245 8.587 .003
Intercept 140.300 1 140.300 56.707 .000

DISTANCIAS 28.090 1 28.090 11.354 .004
SUJETOS 14.400 1 14.400 5.820 .027
Error 42.060 17 2.474
Total 555.000 20
Corrected Total 84.550 19
a. R Squared = .503 (Adjusted R Squared = .444)
2.4.4.8 Conclusión
Para los Sujetos:

La Fc es menor que F 8.74, por tanto no descartamos H0. Concluimos que no hay
diferencia significativa en el promedio del tiempo que tarde el ojo en enfocar el objeto.
Para los Distancia:

La Fc es mayor que F 5.71, por tanto se descarta
Ho. Podemos concluir que existe una diferencia significativa en las distancias sobre el
tiempo que tarda el ojo en enfocar el objeto. Por lo tanto se puede corroborar que las
distancias si afectan el tiempo en que tarda el ojo en enfocar objeto.
 = 97 / 20 = 4.85
² = CMEE = 1.2750
2.4.4.10 Intervalo de Confianza
Para los bloques:
IC μ = y . j±t α/ 2 ,(k−1 )(n−1 ) √CMEE /n

j =6.8±2.179√1.2750/5 5.69≤µ1≤7.90
Y así para cada Valor de y´i .
Para los niveles:
IC μ = y . j±t α/ 2 ,(k−1 )(n−1 ) √CMEE /n

j =2.15±2.179√1.2750/4 0.919≤µ1≤ 3.38
Y así para cada Valor de y´. j
Estimadores
Para los Bloques
β j=Y´ j .−Y´ ..
β1 =6.8– 4.85 = 1.95
β2 = 5.2 - 4.85= 0.35
β3 = 3.6 – 4.85 = -1.25
β4 = 3.8– 4.85 = -1.05
Para los Niveles
τ i =Y´ i .−Y´ ..
τ1 = 7- 4.85= 2.15
τ1 = 4.75- 4.85= -0.1
τ1 = 4.75- 4.85= -0.1
τ1 = 2.75- 4.85= -2.1
τ1 = 5- 4.85= 0.15
R²= (32.95 + 36.30) /84.55 = 0.82
Interpretación:
El modelo tiene una variabilidad del 82% que existe en enfocar el objeto.
CAPÍTULO 3
2. DISEÑO CUADRADO LATINO

3.1 Definición
El diseño cuadrado latino se define como una modalidad de diseño factorial fraccionado
que tiene la misma cantidad de factores y de niveles, y en que las interacciones se
consideran nulas (Arnau,1986). Es un diseño de bloques con un factor experimental y
dos variables de bloqueo. Este tipo de diseño estratifica la muestra de sujetos en
función de dos variables de clasificación y, posteriormente se aplican los distintos
tratamientos dentro de cada bloque.
Esto resulta en la combinación de tres dimensiones de variación, la de que se debe a

los tratamientos y las dos variables de bloqueo, las cuales concuerdan con las filas y
con las columnas de una matriz cuadrada.
3.2 Generalidades
El objetivo de este diseño es reducir el error de los residuos de un experimento. Por
esta razón se utiliza para eliminar la variación de dos variables problemáticas, por lo
cual los reglones y columnas son restricciones de aleatorización.
La manera en que se arregla el diseño procede de las letras del alfabeto latino
dispuestas en una matriz cuadrada, donde cada letra aparece una vez en cada fila y
una vez en cada columna de la matriz. Es decir el diseño cuadrado latino es un
cuadrado con t filas y t columnas. Donde cada una de las t² celdas contiene una de la t
letras latinas que corresponden a las observaciones.
Para poder garantizar la correcta aplicación del diseño cuadrado latino se debe cumplir
los siguientes requisitos:
 Cada valor de la variable de respuesta debe aparecer una sola vez en cada fila y en
cada columna de la matriz.
 El diseño debe ser equilibrado.
 Las variables de bloque deben guardar estrecha relación con la variable dependiente.
Ya que la efectividad del diseño depende del grado de relación entre las variables de
bloque y la variable de respuesta.
 El tamaño más adecuado para experimentos con este tipo de diseño es de 5 a 7
niveles.
3.3 Pasos para la Resolución de Problemas en un DCL.
Los pasos para la resolución de problemas de un diseño cuadrado latino se

muestran a continuación.
La definición del problema consiste en determinar si existen diferencias significativas en

la variable de respuesta con respecto a los efectos que le producen las dos variables
de bloqueo.
Variable de respuesta: es la característica o propiedad del producto cuyo valor interesa
medir para mejorar el desempeño de un proceso.
Factor de interés: son las variables independiente o de bloqueo, cuyo efecto sobre la
variable de respuesta es de particular interés para el experimentador.
En este arreglo de diseño las variables de bloqueo son las que están colocadas en las
filas y columnas.
El modelo estadístico para este experimento es el siguiente:
Y ijk =μ +α i + β j + τ k +¿ε ijk ¿i=1....t

j=1....t
Yijk = es la observación correspondiente al k-ésimo nivel del factor de interés
k=1.... t
(representado por las letras latinas) para la i-ésima fila y la j-ésima columna.
= es la media general
I = es el efecto de la i-ésima fila sobre la Variable de Respuesta
j = es el efecto de la j-ésima columna sobre la Variable de Respuesta
k = es el efecto del k-ésimo nivel del factor de interés (letra latina) sobre la
εijk= error experimental
3.3.3 Formulación de las Hipótesis
Para este experimento como tenemos tres fuentes de variación debemos formular un
juego de hipótesis para cada una, entonces serían tres juegos de hipótesis de la
siguiente manera:
 Para las filas

H0 = 1 = 2 = ... t
H1 = al menos una de las medias de las filas es diferente...
 Para las columnas
H0 = 1 = 2 = ... t
H1 = al menos una de las medias de las columnas es diferente...
 Para las letras latinas
H0 = 1 = 2 = ... t
H1 = al menos una de las medias de los niveles es diferente...
La regla de decisión es la siguiente para los tres juegos de hipótesis:
Descartar H0 si Fc  F, gln, gld

El procedimiento de aleatorización se puede definir de la siguiente forma:
Para aleatorizar los datos, se selecciona al azar uno de los cuadrados estándar, de tal
forma que a cada fila y a cada columna se le asignan aleatoriamente cada uno de los
niveles del Factor de Interés (representados por las letras latinas). Por ejemplo:
3.3.5 Registro de Datos
Diseñadores de experimento, S.A.
Hoja de Registro de datos
Nombre del Operador:__________________
Fecha de toma de datos:_________________
Última calibración del equipo:____________

3.3.6 ANDEVA- Análisis de Varianza
El ANDEVA parte de los supuestos que han de cumplirse:
 Independencia de las observaciones.
 La distribución de los residuales debe ser normal.
 Homocedasticidad: homogeneidad de las varianzas.
Al cumplirse estos supuestos procedemos a armar la tabla del ANDEVA.

F.V GL S.C C.M Fc Fα,gln,gld
FILAS (F) T-1 SCF SCF/(T-1) CMF/CMEE Fα,(T-1),(T-1)(T-2)
COLUMNAS T-1 SCC SCC/(T-1) CMC/CMEE Fα,(T-1),(T-1)(T-2)

(C)
LETRAS T-1 SCLL SCLL/(T-1) CMLL/CME Fα,(T-1),(T-1)(T-2)
LATINAS (LL) E
E.E (T-2)(T- SCEE SCEE/(T-1)
1) (T-2)
TOTAL (To) T2-1 SCTo
Formulas para calcular la suma de cuadrados:
t 2
1 Y 1 Yt 2
SCF= ∑ Y 2i. .− 2.. . SCLL= ∑ Y 2. . k − .2. .
t i=1 t t k =1 t
2
1
t
Y 2.. . t t t
Y . ..
SCC= ∑ Y 2. j.− SCT 0 =∑ ∑ ∑ Y 2ijk−
t2
3.3.7 t j=1
Conclusión t2 i=1 j=1 k=1
Al completar la tabla de ANDEVA, se procede hacer las conclusiones del problema de

interés, tomando en cuenta las hipótesis principales planteadas y basándose en la
regla de decisión.
3.3.8 Cálculo de Parámetros

Para el cálculo de los parámetros, los resultados los obtenemos con las siguientes
formulas:
 Para los parámetros del modelo
t t t
∑ ∑ ∑ Y ijk
i=1 j=1 k=1
μ= 2
t
3.3.9 Intervalos de Confianza
Para obtener los intervalos de confianza, seguimos la siguiente formulas
 Para la media de los niveles del factor de interés
IC μk = y ..k ±t α /2,(t−1)( t−2 ) √CMEE /t
 Para las medias de las columnas
IC μj = y . j.±t α /2, (t−1)( t−2) √CMEE /t

 Para las medias de las filas
IC μi = y i..±t α /2,(t−1)(t−2) √ CMEE/t

Estimadores
 Estimación de la media de los niveles
τ . . k =Y . . k −Y . .. k= 1........t
 Estimación de la media de las columnas
β . j.=Y . j .−Y ..
j= 1........t
 Estimación de la media para las filas.
α i. .=Y i .. −Y .. .
i= 1........t
3.4 Ejemplo
3.4.1 EJEMPLO: METODOS DE ENSAMBLAJE
Un ingeniero industrial está investigando el efecto que tienen cuatro métodos de

ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente para
televisores a color. Se seleccionan cuatro operadores para realizar este estudio. Por
otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo
que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el
primero, independientemente del método. En otras palabras, se produce un patrón
en el tiempo de ensamblaje. Para controlar esta posible fuente de variabilidad, el
ingeniero utiliza el diseño de cuadrados latinos que aparece a continuación. Analice
y haga conclusiones apropiadas.
Orden de Operador 1 Operador 2 Operador 3 Operador 4

Montaje
1 C=10 D=14 A=7 B=8
2 B=7 C=18 D=11 A=8
3 A=5 B=10 C=11 D=9
4 D=10 A=10 B=12 C=14
.Se ejecuta un diseño de bloques aleatorizados para un refinado en particular, y se

mide el tamaño de grano.
Determinar si hay diferencias significativas en el tiempo de ensamblaje promedio

de un componente de televisor para cuatro métodos de ensamblaje diferentes
realizado por cuatro operarios distintos en diferentes ordenes.
Al 5% de confiabilidad.
Variable de respuesta: tiempo de ensamblaje.
Filas: orden de montaje.
Columnas: operadores.
Factor de interés: efecto de cuatro métodos de ensamblaje.
El diseño experimental a utilizar será el cuadrado latino.

Modelo estadístico:
Y ijk =μ+α i+ βj + τ k +ℇ ijk
j=1 … … 4
i=1 … … 4
k =1 … … 4
Y ijk = es el tiempo de ensamblaje observado para el componente de televisor realizado

con el k-esimo método, con el i-esimo orden de montaje, por el j-esimo operador.
μ = es el tiempo de ensamblaje promedio.
α i=¿es el efecto del i-esimo orden de montaje.
τ k = es el efecto del k-ésimo método de ensamblaje (letra latina).
β k = es el efecto del k-ésimo operador.
ℇ ijk = es el error experimental.
Hipótesis
 Orden de montaje.
Ho = μ1=μ 2=μ3=μ 4
H1 = al menos una de los tiempos de montaje promedio es diferente para los

órdenes de montaje.
 Operadores.
Ho = μ1=μ 2=μ3=μ 4
operadores.
 Método de ensamblaje.
Ho = μ1=μ 2=μ3=μ 4

método de ensamblaje.
Regla de decisión:
Descarta Ho si:
F c ≥ F 0.05,3,6
F 0.05,3,6=4.76
Orden de Operador Operador Operador Operador

Montaje 1 2 3 4
1 C D A B
2 B C D A
3 A B C D
4 D A B C

Orden de Operador 1 Operador 2 Operador 3 Operador 4
montaje
1 C=10 D=14 A=7 B=8
2 B=7 C=18 D=11 A=8
3 A=5 B=10 C=11 D=9
4 D=10 A=10 B=12 C=14
3.4.1.6 Supuestos del ANDEVA

Observando el grafico podemos concluir que los datos no tienen una distribución
normal, debido a que un dato esta fuera de la línea de tendencia.
Prueba matemática.
P value = 0.475
Ho = los datos tienen un distribución normal.
H1 = los datos no tienen una distribución normal.
P-value > 0.05 con lo cual se acepta H0.
Se acepta la hipótesis nula porque el P value es mayor que el nivel de

significancia.
Orden de ensamblaje.
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .489
La varianzas son iguales para el orden de ensamblaje.
Operador.
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .528
Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
operadores.
Métodos de ensamblaje.
Ho = σ 1 =σ 2=σ 3
H1 =σ 1 ≠ σ 2 ≠ σ 3
P value = .493
Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
métodos de ensamblaje.
Fuente de Grados Suma de Cuadrado medio Fc Fα

Variable de cuadrados CM
libertad SC
Filas (Orden 3 18.500 6.617 3.524 4.76
de ensamble)
Columnas 3 51.500 17.167 9.810 4.76
(Operadores)
Letras 3 72.500 24.167 13.810 4.76
latinas
(métodos de
ensamble)
Error EE 6 10.500 1.750
Total 15 0.222
Regla de decisión:
Descarta Ho si:
F c ≥ F 0.05,3,6
F 0.05,3,6=4.76
3.4.1.8 Conclusión
Orden de montaje.
Fc = 3.524. Se acepta Ho, es decir los tiempos de montaje promedio son iguales
para los órdenes.
Operadores.
Fc = 9.810. Se acepta la hipótesis nula, concluyendo que al menos una de los

tiempos de montaje promedio es diferente para los operadores.
Método de ensamblaje.
Fc = 13.810. Se acepta la hipótesis nula, concluyendo que al menos una de los

tiempos de montaje promedio es diferente para los métodos de ensamblaje.
3.4.1.9 Cálculo de Par Cálculo de Parámetros
Media Total
μ=10.25
El tiempo promedio es = 10.25
σ 2=1.75
σ =1.332
La muestra tiene una desviación estándar de 1.322

R2=93.14 %
3.4.1.10 Intervalos De Confianza

Métodos de ensamblaje
1.75
IC μ A =7.5 ±t 0.025 ,6
√ 4
=7.5 ± 1.618
1.75
IC μ B=9.25 ± t 0.025 , 6
√ 4
=9.25 ±1.618
1.75
IC μ C =13.25± t 0.025, 6
√ 4
=13.25± 1.618
1.75
IC μ D=11± t 0.025, 6
√ 4
=11 ±1.618
Operadores
1.75
IC μ 1=8± t 0.025 ,6
√ 4
=8 ± ±1.618
1.75
IC μ 2=13 ± t 0.025, 6
√ 4
=13± 1.618
1.75
IC μ 3=10.25± t 0.025, 6
√ 4
=10.25± 1.618
1.75
IC μ 4 =9.75 ± t 0.025 ,6
√ 4
=9.75± 1.618
Orden de ensamblaje
1.75
IC μ 1=9.75± t 0.025, 6
√ 4
=9.75 ±± 1.618
1.75
IC μ 2=11± t 0.025, 6
√ 4
=11 ±1.618
1.75
IC μ 3=8.75± t 0.025 ,6
√ 4
=8.75 ±1.618
1.75
IC μ 4 =11.5± t 0.025 , 6
√ 4
=11.5 ±1.618
Estimadores
Metodos de ensamblaje
τ .. A =7.5−10.25=−2.75
τ .. B=9.25−10.25=−1
τ .. C =13.25−10.25=3
τ .. D=11−10.25=0.75
Operadores
β .1. =8−10.25=−2.25
β .2. =13−10.25=2.75
β .3. =10.25−10.25=0
β .4. =9.75−10.25=−0.50
Orden de ensamblaje
α 1.. =9.75−10.25=−0.50
α 2.. =11−10.25=0.75
α 3.. =8.75−10.25=−1.50
α 4.. =11.5−10.25=1.25
El coeficiente de determinación establece que los datos tienen una variabilidad

de 93.14%
3.1.1 EJEMPLO: METODOS DE ENSAMBLAJE
Se encuentra bajo estudio el efecto que tienen cinco reactivos distintos (A, B,C,D y E)
sobre el tiempo de reacción de un proceso químico.
Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se
realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, una hora y media,
por lo que sólo pueden realizarse cinco ensayos por día.
La investigadora decide efectuar el experimento usando un diseño de cuadrado latino,

con el fin de controlar sistemáticamente las variables lote de material y día. Ella
recolecta los siguientes datos. Analice y obtenga las conclusiones.
Determinar el efecto de cinco reactivos distintos (A, B,C,D y E) sobre el tiempo

de reacción de un proceso químico realizando cinco ensayos por día.
Determinar si hay diferencias significativas en el tiempo de reacción promedio

para cinco reactivos distintos realizado cinco ensayos por día.
Variable de Respuesta: tiempo de reacción de un proceso químico

Niveles: días (5 ensayos por día)
Bloques: lotes de material nuevo
Factor de Interés: distintos reactivos (A, B,C,D y E)
Yijk = m + ai + bj + tk + εijk
i = 1...5 j = 1...5 k = 1...5
Yijk = es el tiempo de reacción sobre un proceso químico realizando los k´-esimo

reactivos con el i-ésimo lote de material nuevo, por el j-ésimo de los ensayos.
m = tiempo de reacción promedio sobre un proceso químico.
ai = es el efecto del i-ésimo lote de material nuevo
bj = es el efecto de los j-ésimos días
tk = es el efecto del k-ésimo reactivo (letra latina)
εijk = es el error experimental.

Lotes de material nuevo
H0 = m1 = m2 = m3 =m4 =m5
H1 = al menos una de los tiempo de reacción promedio es diferente
Días- ensayos
H0 = m1 = m2 = m3 =m4 =m5
H1 = menos una de los tiempo de reacción promedio es diferente
Reactivos
H0 = m1 = m2 = m3 =m4 =m5
H1 = menos una de los tiempo de reacción promedio es diferente
Regla de decisión (igual para todas las hipótesis)
Descartar H0 si Fc ³ Fa, gln, gld gln= t -1, gld= (t -1)(t -2)
Descartar H0 si Fc ³ F0.05, 4, 12.

Día
Lote 1 2 3 4 5
1 A B D C E
2 C E A D B
3 B A C E D
4 D C E B A
5 E D B A C
Día
Lote 1 2 3 4 5
1 A=8 B=7 D=1 C=7 E=3
2 C=11 E=2 A=7 D=3 B=8
3 B=4 A=9 C=10 E=1 D=5
4 D=6 C=8 E=6 B=6 A=10
5 E=4 D=2 B=3 A=8 C=8
Letras latinas
Día
Lote 1 2 3 4 5 Total por
lotes
1 A=8 B=7 D=1 C=7 E=3 26
2 C=11 E=2 A=7 D=3 B=8 31
3 B=4 A=9 C=10 E=1 D=5 29
4 D=6 C=8 E=6 B=6 A=10 36
5 E=4 D=2 B=3 A=8 C=8 25
Total por 33 28 27 25 34 147
día
Totales por fórmula
A B C D E
42 28 44 17 16
Normalidad
Para lograr esto entramos al menu estadísticas > estadística básica > prueba de
normalidad. Seleccionamos los datos sin ponerle los factores porque queremos
ver la normalidad de todos los datos.
Prueba gráfica:
Como los datos se acercan mucho a la línea de referencia descartando los

valores extremos, podemos concluir que los datos siguen una distribución
normal.
Prueba analítica Ryan Joiner:
Ho: los datos siguen una distribución normal (Pvalue > α)
H1: los datos no siguen una distribución normal (Pvalue < α)
Como Pvalue > 0.05 se acepta H0
Homocedasticidad
Para comprobar este supuesto, vamos al menú estadísticas > anova > prueba
de varianzas iguales. Seleccionamos la variable, pero con un solo factor para
analizar la homocedasticidad para cada factor de variación. Hacemos esto para
las tres fuentes de variación
 Lotes de materia prima
Ho: σ12 = σ22 = σ32 = σ42 =σ52
Regla de decisión:

Conclusión: Como Pvalue (0.760) > 0.05, no se descarta Ho, por lo cual las
varianzas de los lotes son iguales
 Días de ensayo
Ho: σ12 = σ22 = σ32 = σ42 =σ52
Regla de decisión:
Conclusión: Como Pvalue (0.986) > 0.05, no se descarta Ho, por lo cual las varianzas
de los días de ensayo son iguales.
 Los Reactivos (Letras Latinas)
Ho: σ12 = σ22 = σ32 = σ42 =σ52
Regla de decisión: No se descarta la h0 si Pvalue ≥ α
De acuerdo a Prueba de Levene nuestro Pvalue= 0.775 ≥ α= 0
Conclusión: Como Pvalue (0.775) > 0.05, no se descarta Ho, por lo cual las varianzas
de los reactivos son iguales
 Independencia
Para comprobar este supuesto, cuando hacemos el análisis de varianza

(estadísticas > ANOVA > Modelo Lineal General), de lso gráficos que nos puede
generar solo seleccionamos el gráfico orden vs residuos.
Observando la grafica vemos que son independientes ya que no muestran un patrón

conocido
Análisis de varianza para Tiempo, utilizando SC ajustada para pruebas MINITAB
Lotes 4 15.440 15.440 3.860 1.23 0.348
Día 4 12.240 12.240 3.060 0.98 0.455
Reactivos 4 141.440 141.440 35.360 11.31 0.000
Error 12 37.520 37.520 3.127
Total 24 206.640
3.1.1.8 Conclusión
Observando los resultados del Análisis de Varianza se puede concluir lo siguiente:
El tiempo de reacción promedio es de 5.88 con una variabilidad de 3.126
El coeficiente de determinación es 81.8%, lo cual indica que el 81.8% de la variabilidad

en el tiempo de reacción se debe a los factores estudiados.
 Para las fórmulas:
Fc ³ Fa, gln, gld, por lo tanto se rechaza H0
Se concluye que existe diferencia significativa en la fuerza de explosión promedio

para las cinco fórmulas
 Para los días y los lotes:
Fc < Fa, gln, gld, por lo tanto se acepta H0
Se concluye que no existe diferencia significativa en la fuerza de explosión promedio

para los distintos lotes de materia prima o días.
s² = CMEE= 3.126
t t t
∑ ∑ ∑ Y ijk
147 i=1 j=1 k=1
μ= μ==5 . 88
25 2
t

Estimación de las medias de los reactivos
IC μk = y . . k ±t α / 2, (t −1)( t −2 ) √ CMEE /t
IC μk =8. 4 ±1 . 72
IC μk =5 . 6 ±1 . 72
IC μk =8. 8 ± 1. 72
IC μk =3 . 4 ±1 .72
IC μk =3 . 2 ±1 .72
Estimación de las medias de los días- ensayos
IC μj = y . j.±t α /2,(t−1)( t−2) √CMEE /t

IC μj =6 .6 ± 1. 72
IC μj =5 . 6 ± 1. 72
IC μj =5 . 4 ±1 .72
IC μj =5 ± 1. 72
IC μj =6 .8 ± 1. 7
Estimación de las medias de los lotes
IC μi = y i..±t α /2, (t−1)( t−2) √ CMEE/t

IC μi 5. 2 ±1 . 72
IC μi =6 . 2 ±1 . 72
IC μi =5 . 8 ±1 . 72
IC μi =7 . 2 ±1 . 72
IC μi =5 ± 1. 7
Estimadores
Estimación de las medias de los reactivos
τ . . k =Y . . k −Y . ..
k= 1........t
42
τ1= −5 .88=2 .52
5
28
τ1= −5 . 88=−0 . 28
5
44
τ1= −5 . 88=2. 92
5
17
τ1= −5. 88=−2 . 48
5
16
τ1= −5. 88=−2 .68
5
Estimación de las medias de los días- ensayos
β . j.=Y . j .−Y ..
j= 1........t
33
β 1= −5 .88=0 . 72
5
28
β 2= −5 . 88=−0 . 28
5
27
β 3= −5 . 88=−0 . 48
5
25
β4= −5 . 88=−0 . 88
5
34
β 5= −5 . 88=1. 15
5
Estimación de las medias de los lotes
α i . .=Y i .. −Y .. .
i= 1........t
26
α 1= −5 . 88=−0 . 68
5
31
α 2= −5. 88=0 .32
5
29
α 3= −5 .88=−0 . 08
5
36
α 4= −5 . 88=1. 32
5
25
α 5= −5 . 88=−0 . 88
5
R² = (SCF + SCC + SCLL) / SCT=(15.44+12.24+141.44) / (206.64)= 0.818
Existe un 81.8% en cuanto a la variabilidad de los datos.

CAPÍTULO 4
4. DISEÑO CUADRADO GRECO LATINO
4.1Definición
El diseño cuadrado Greco latino (DCGL) podría decirse que es una extensión
del cuadrado latino en el que se incluye una tercera variable de control (letras griegas).
Es por tanto una fracción del diseño completo en bloques aleatorizados con un factor
principal y 3 factores secundarios.
4.2 Generalidades
Se dice que los dos cuadrados son ortogonales si al sobreponerse poseen la
propiedad de que cada letra griega aparece sólo una vez con cada letra latina.
Puede utilizarse para controlar sistemáticamente tres fuentes extrañas de variabilidad,
en otras palabras, se usa para hacer un análisis por bloques en tres direcciones.
Permite analizar cuatro factores (renglón, columna, letra latina y letra griega).
1.3 Pasos para la Resolución de Problemas en un DCGL.
Observaremos cuáles son los pasos necesarios para resolver un problema en el diseño
cuadrado greco-latino
4.3.1 Definición del Problema a Resolver
El problema se puede definir de dos maneras:
 Determinar el efecto de las letras latinas, las filas, las columnas y las letras
griegas sobre la variable de respuesta.
 Determinar si existen diferencias significativas en la variable de respuesta

promedio para las letras latinas, las filas, las columnas y las letras griegas.
Se procede a la identificación del factor de interés, bloques y variable de

respuesta.
Se define cual es el modelo estadístico en este caso y que representan cada una de las
variables.
Yijkl = Yijkl = μ + αi + tj + d k + l + eijkl

i=1.....t
j=1.....t
k=1....t
l=1.....t
Yijkl = es la observación de la i-ésima fila y la j-ésima columna con la k-ésima letra latina
y la l-ésima letra griega.
μ = media total
αi = es el efecto de la i-ésima fila sobre la variable de respuesta.
tj = es el efecto de la j-ésima columna sobre la variable de respuesta

dk = es el efecto de la k-ésima letra latina sobre la variable de respuesta.
l = es el efecto de la l-ésima letra griega sobre la variable de respuesta.
eijkl = error experimental
4.3.3 Formulación de la Hipótesis
Formulamos las respectivas hipótesis por filas, columnas, letras latinas y letras griegas.
Las filas, columnas, letras latinas y letras griegas formarían 4 pares de hipótesis, una
para cada factor. Todas se definen de la misma manera:
Ho : μ1 = μ2 =...... ... μt
HI : al menos una μ es diferente
Regla de decisión: Se descarta Ho si Fc ³ Fa , glN, glD
glN = t-1 glD = ( t-3) (t-1)
Esta regla de decisión es igual para las filas, las columnas, letras latinas y letras
griegas ya que todas tienen el mismo número de variables.
En el procedimiento de aleatorizacion a cada fila y columna se le asignan cada una de

las letras latinas y cada una de las letras griegas.
Esta sería una posible configuración para un DCGL 5x5
Lotes Operarios
1 Aα Bγ Cε Dβ Eδ
2 Bβ Cδ Dα Eγ Aε
3 Cγ Dε Eβ Aδ Bα
4 Dδ Eα Aγ Bε Cβ
5 Eε Aβ Bδ Cα Dγ
Se va a llenar un reporte el cual es la prueba de lo que se va a realizar con el

siguiente formato:
Nombre de la empresa: ________________ Motivo de análisis: ______________
Elaborado por: ____________________ Unidad de medición: ____________
Fecha: __________________ Factor de interés: _______________
Se procede al llenado de datos medidos en los siguientes formatos:
Observaciones 1 2 … t Totales por

fila
1 Y11(LG) Y12(LG) … Y1t(LG) Y1…
2 Y21(LG) Y22(LG) … Y2t(LG) Y2…
… … … … … …
… … … … … …
… … … … … …
t Yt1(LG) Yt2(LG) … Ytt(LG) Yt…
Totales por Y.1.. Y.2.. … Y.t.. Y….
columna
Una vez tomados los datos medidos se procede a la suma de las columnas Y. t.. y de
las filas Yt… seguido por el Gran Total Y…
Luego, se elaboran otras dos tablas para calcular los totales de las letras latinas y de
las letras griegas.
Letras Latinas … … … …
1 2 … t … … … …
Y11 Y11 … Y11 YttL Ytt … YttL
L. L. L. . L. .
Y22 Y22 … Y22 Y..1 Y..2 … Y..L
L. L. L. . . .
… … … …
Letras Griegas … … … …
1 2 … t … … … …
Y11. Y11. … Y11. Ytt. Ytt. … Ytt.
G G G G G G
Y22. Y22. … Y22. Y… Y...2 … Y…
G G G 1 G
… … … …
Una vez completado esto se procede a la suma de las letras latinas cuyo total se
representa por Y..t. y a la suma de las letras griegas cuyo total se representa por Y…t
4.3.6 Supuesto del Modelo
Antes de continuar con el siguiente paso, que consiste en el análisis de varianza, se
deben probar los supuestos del modelo. Hay tres supuestos: normalidad,
homocedasticidad u homogeneidad de varianzas e independencia.
Para probar los supuestos, se utilizan los mismos métodos mencionados en los
capítulos anteriores, ya sea gráfica o analíticamente, con la ayuda de programas como
Excel, MINITAB o PASW.
Al probar la normalidad con la gráfica de probabilidad normal, los puntos deben formar
una línea recta.
Se puede probar analíticamente con las pruebas Ryan-Joiner, Shapiro-Wilks y
Smirnov-Kolmogorov, dependiendo de la cantidad de observaciones totales del
experimento.
Al probar la homocedasticidad con el gráfico de residuos vs orden, el espaciado de los

puntos debe ser aproximadamente igual para todos los factores.
Se puede probar analíticamente con la prueba de Barlett, donde se compara pvalue

con el nivel de significancia α. Si pvalue > α, las varianzas son iguales.
Al probar la independencia con el gráfico de residuos vs orden, no debe haber patrón
aparente en la distribución.
4.3.7 ANDEVA- Análisis de Varianza
Luego de verificar que se cumplen los tres supuestos del modelo, se prosigue con el
análisis de varianzas. Para el mismo lo más conveniente es elaborar una tabla como se
muestra a continuación. Cada componente será explicado posteriormente.
Fuente de Grados de Suma de Cuadrado Fc Fα

Variación Libertad Cuadrados Medio
Fila (t-1) SCF CMF CMF / CMEE
Columna (t-1) SCC CMC CMC / CMEE
Letras Latinas (t-1) SCLL CMLL CMLL /
SE CALCULA
Fα (t-1),(t-3)(t-1)
CMEE
Letras (t-1) SCLG CMLG CMLG /
Griegas CMEE
Error (t-3)(t-1) SCEE CMEE
Experimental
Total (t2-1) SCT
4.3.7.1 Grados de Libertad

Primeramente cabe resaltar que para elaborar un DCGL se requiere el mismo número
de niveles (t) para cada factor. Los grados de libertad se calculan a partir del número
de niveles en cada experimento.
4.3.7.2 Suma de Cuadrados

SCF suma de cuadrados debida al efecto fila
2
t 2 y
1
∑
t i=1 y − . .. .
2
t
i . ..
donde:
t = niveles
yi… = sumatoria por filas
y…. = sumatoria total
SCC suma de cuadrados debida al efecto columna
2
t 2 y
1
∑
t j=1 y − . .. .
2
t
. j ..
donde:
t = niveles
y.j.. = sumatoria por columnas
SCLL suma de cuadrados debida a las letras latinas

2
t
y
y −
1 2 ....
∑
t k=1 2
t
.. k .
donde:
t = niveles
y..k. = sumatoria por letras latinas
SCLG suma de cuadrados debida a las letras griegas

2
t
y
y −
1 2 . . ..
∑
t l=1 2
t
.. . l
donde:
t = niveles
y...l = sumatoria por letras griegas
SCEE suma de cuadrados del error
Se obtiene por diferencia SCEE = SCT – (SCF + SCC + SCLL + SCGL)
SCT suma total de cuadrados

2
t t t
∑ ∑ ∑ ∑ y ijkl−
t 2 y .. . .
2
i=1 j=1 k=1 l=1
t
donde:
t = niveles
yijkl = cada observación de la tabla de registro
4.3.7.3 Cuadrado Medio
Se calcula el cuadrado medio de cada factor basándonos en las sumas de cuadrados

anteriores y sus respectivos grados de libertad. Los valores esperados de los
cuadrados medios correspondientes a las filas, columnas, letras latinas, letras griegas y
error experimental, son, respectivamente:
Cuadrado Medio de las Filas
SCF
t−1
Cuadrado Medio de las Columnas
SCC
t−1
Cuadrado Medio de las Letras Latinas
SCLL
t−1
Cuadrado Medio de las Letras Griegas
SCLG
t−1
Luego de calcular los grados de libertad, la suma de cuadrados y los cuadrados

medios, se proceden a calcular las Fc de Fisher para cada factor del experimento. La
misma se calcula dividiendo el cuadrado medio de cada factor entre el cuadrado medio
del error experimental.
La Fα se calcula a partir del nivel de significancia “α” y los grados de libertad de los
factores “(t-1)” y del error experimental “(t-3)(t-1)”. Este valor es el mismo para
comparar todas las Fc por la particularidad del diseño de que todos los factores deben
tener el mismo número de niveles.
4.3.8 Conclusiones
Una vez completada la tabla de ANDEVA, se prosigue con las conclusiones respectivas
para las hipótesis, planteadas al inicio del experimento.
Recordando la regla de decisión, Se descarta H0, si Fc ³ Fa , glN, glD .
Esto quiere decir que para cada hipótesis planteada se debe analizar la regla de
decisión.
Filas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia significativa

entre las filas. Si FC < Fa, no se descarta H0 y se concluye que no existe
diferencia significativa entre las filas.
Columnas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia
significativa entre las columnas. Si F C < Fa, no se descarta H0 y se concluye que
no existe diferencia significativa entre las columnas.
Letras Latinas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia

significativa entre las letras latinas. Si F C < Fa, no se descarta H0 y se concluye
que no existe diferencia significativa entre las letras latinas.
Letras Griegas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia

significativa entre las letras griegas. Si F C < Fa, no se descarta H0 y se concluye
que no existe diferencia significativa entre las letras griegas.
4.3.9 Cálculo de los Parámetros
El gran promedio “μ” se calcula con la siguiente fórmula:
t t t t
∑∑∑∑ y
i=1 j=1 k=1 l=1
ijkl
μ= 2
t
4.3.10 Intervalos de Confianza
Para calcular los intervalos de confianza es necesario tener conocimientos básicos

acerca de la tabla T de Student, ya que es necesaria su utilización.
Para las filas:
IC μi = y i. . .±t α /2,( t−1)( t−3 ) √CMEE /t
Para las columnas:
IC μj = y . j. .±tα /2 ,(t−1)(t−3 ) √CMEE/t

Para las letras latinas (factor de interés)
IC μk = y ..k.±tα /2 ,(t−1)(t−3 ) √CMEE/t
Para las letras griegas
IC μl = y ...l ±t α /2, (t−1)( t−3) √ CMEE/t
Para todos los casos se debe buscar el valor de t en la tabla T de Student para el nivel
de significancia “α” asignado al experimento.
Estimación de las medias de las filas, columnas, letras latinas y letras griegas
respectivamente:
α i . . .=Y i . . .−Y . .. . β ..k .=Y .. k .−Y ... .
donde i = 1…t donde k = 1…t
Ψ . . .l =Y .. . l−Y .. . .
τ . j . . =Y . . j.−Y .. . .
donde l = 1…t
donde j = 1…t
La variabilidad en unidades cuadradas está representada por el valor del cuadrado

medio del error experimental, es decir:
σ2 = CMEE
El coeficiente de determinación R2 se calcula a partir de las sumas de cuadrados:
R2 = SCF + SCC + SCLL + SCLG
SCTo
Este valor representa el porcentaje en el que el modelo explica la variabilidad de la
4.4 Ejemplos
4.4.1 TIPO DE ENSAMBLAJE DE UN COMPONENTE
Un ingeniero industrial está investigando el efecto que tienen cuatro métodos de

ensamblaje (A,B,C y D) sobre el tiempo de ensamblaje de un componente para
televisores a color. Se seleccionan cuatro operadores para realizar este estudio. Por
otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo
que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el primero,
independientemente del método. En otras palabras, se produce un patrón en el tiempo
de ensamblaje. Para controlar esta posible fuente de variabilidad, el ingeniero utiliza el
diseño de cuadrados latinos que aparece a continuación.
Analice y haga conclusiones apropiadas. Suponga que en el problema el ingeniero

sospecha que el lugar de trabajo usado por los cuatro operadores puede representar
una fuente adicional de variabilidad. Es posible introducir el lugar de trabajo ( ,, y )
como un cuarto factor. Se produce el cuadrado greco-latino que se muestra a
continuación. Analice los datos y obtenga las conclusiones.
Orden de Operador Operador Operado Operador

Montaje 1 2 r3 4
1 C=11 B=10 D=14 A=8
2 B=8 C=12 A=10 D=12
3 A=9 D=11 B=7 C=15
4 D=9 A=8 C=18 B=6

Determinar el efecto que tienen cuatro métodos de ensamblaje (A,B,C y D) con los
distintos ordenes de montaje, en los diferentes lugares de trabajo (,, y ) y con los
diferentes operarios sobre el tiempo de ensamblaje de un componente para televisores
a color.
Variable de respuesta: tiempo de ensamble componente para televisor a color.

Fila: orden de montaje, Columna: operadores, Letra latina: métodos de ensamblaje,
Letra griega: lugar de trabajo.
Se define el modelo estadístico con la definición de cada una de ellas.
Yijkl = m + ai + tj + dk + Y l + eijkl
i = 1...4 j = 1...4 k = 1...4 l=1…4
Yijkl = es la tiempo de ensamble de componente de televisor para el k-ésimo método de

ensamble con el i-ésimo orden de montaje, por el j-ésimo operador en el l-ésimo lugar
de trabajo.
m = tiempo de ensamble promedio para el componente del televisor.
ai = es el efecto del i-ésimo orden de montaje sobre el tiempo de ensamble.
tj = es el efecto del j-ésimo operador sobre el tiempo de ensamble.
dk = es el efecto del k-ésimo método de ensamble sobre el tiempo de ensamble.
Y l = es el efecto del l-ésimo lugar de trabajo sobre el tiempo de ensamble.
eijkl = error experimemtal

Se plantea cuatro pares de hipótesis para: filas, columnas, letras latinas y letras
griegas.
Orden de métodos
H0 = m1 = m2 = ... m4
H1 = al menos uno tiempos promedio de ensamblaje es diferente...
Operadores
H0 = m1 = m2 = ... m4
H1 = al menos uno de los tiempos promedio de ensamblaje es diferente...
Factor de Interés (método de ensamble letra latina)
H0 = m1 = m2 = ... m4
H1 = al menos uno de los tiempos promedio de ensamble es diferente...
Lugar de trabajo (letras griegas)
H0 = m1 = m2 = ... m4
H1 = al menos uno de los tiempos promedio de ensamble es diferente...
Regla de decisión
Se define una regla de decisión igual para los 4 pares de hipótesis.
Descartar H0 si Fc ³ F0.05, 3, 3=9.28

4.4.1.4 ALEATORIZACIÓN
En el procedimiento de aleatorizacion a cada fila y columna se le asignan cada una de

las letras latinas y cada una de las letras griegas.
Orden de Operador Operador Operador Operador

Montaje 1 2 3 4
1 C B D A
2 B C A D
3 A D B C
4 D A C B
4.4.1.5 REGISTRO DE DATOS
Se va a llenar un reporte el cual es la prueba de lo que se va a realizar con el

siguiente formato:
Nombre de la empresa: Aplitec Panamá Motivo de análisis: Análisis de métodos
Elaborado por: Cristela Vega Unidad de medición: tiempo (min)
Fecha: 2 de Febrero de 2012 Factor de interés: lugar de trabajo.
Orden de Operador Operador Operador Operador Totales

Montaje 1 2 3 4 filas
1 C=11 B=10 D=14 A=8 Y1…=43
2 B=8 C=12 A=10 D=12 Y2…=42
3 A=9 D=11 B=7 C=15 Y3…=42
4 D=9 A=8 C=18 B=6 Y4…=41
Totales Y.1..=37 Y.2..=41 Y.3..=49 Y.4..=41 Y.…=168
columna
En este caso se procede a la suma de las columnas (operadores) y filas (orden de
montaje). También a la suma de las letras latinas que son los métodos de ensamble y
letras griegas lugar de trabajo.
Totales por método de ensamble
A Y..1.=35
B Y..2.=31
C Y..3.=56
D Y..4.=46
Totales Lugar de trabajo
 Y…1=45
 Y…2=38
 Y…3=44
 Y…4=41

Para la comprobación de los supuestos de este experimento se utilizó el programa
Minitab.
Grafica de Normalidad.
Gráfica de probabilidad de Tiempo de Ensamble

Normal
99
Media 10.5
Desv.Est. 3.162
95 N 16
RJ 0.974
90
Valor P >0.100
80
70
Porcentaje
60
50
40
30
20
10
1
5 10 15 20
Tiempo de Ensamble
Prueba gráfica:
Ho: los datos siguen una distribución normal porque los puntos se acercan a la línea de
referencia
H1: los datos no siguen una distribución normal ya que los puntos no se acercan a la
línea de referencia.
Como los datos se acercan mucho a la línea de referencia descartando los valores
extremos, se acepta H0 para la prueba gráfica.
Prueba analítica Ryan Joiner:
Ho: los datos siguen una distribución normal (Pvalue > α)
H1: los datos no siguen una distribución normal (Pvalue < α)
Como Pvalue > 0.05 se acepta H0
Homocedasticidad:
Para los lugares de trabajo (letra griega):
Prueba de igualdad de varianzas para Tiempo de Ensamble
Prueba de Bartlett

Valor P 0.686
Prueba de Levene
Lugar de trabajo
Valor P 0.708
2
0 5 10 15 20 25 30
Prueba gráfica Intervalos de confianza de Bonferroni al 95%:
Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett.
Prueba Analítica Barlett:
(Pvalue > α)
(Pvalue < α)
Como 0.686 > 0.05, podemos concluir que los tiempos de ensamble para los métodos
de ensamble tienen varianzas iguales.
Prueba gráfica usando el gráfico Residuo vs Valor ajustado:
vs. ajustes para Lugar de Trabajo

(la respuesta es Tiempo de Ensamble)
7.5
5.0
2.5
Residuo
0.0
-2.5
-5.0
9.5 10.0 10.5 11.0 11.5
Valor ajustado
Como las distancias entre los puntos es aproximadamente igual, aceptamos H 0

Para los métodos de ensamble (letra latina):
Prueba de Bartlett

Valor P 0.330
Prueba de Levene
Metodo de ensamble
Valor P 0.179
2
0 5 10 15 20
H1, esperando el resultado de la prueba analítica de Barlett.
(Pvalue > α)
(Pvalue < α)
Como 0.330 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.

vs. ajustes para Metodo de Ensamble
1
Residuo
-1
-2
-3
7 8 9 10 11 12 13 14
Valor ajustado
Como las distancias entre los puntos es aproximadamente igual, aceptamos H 0

Para las órdenes de montaje:
Prueba de Bartlett

Valor P 0.383
Prueba de Lev ene
Orden de Montaje
Valor P 0.757
2
0 5 10 15 20 25 30 35

Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual
H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual
H1, esperando el resultado de la prueba analítica de Barlett
(Pvalue > α)
(Pvalue < α)
vs. ajustes para Orden de Montaje

7.5
5.0
2.5
Residuo
0.0
-2.5
-5.0
Como las distancias
10.2
entre10.3
los puntos
10.4
es 10.5
aproximadamente
Valor ajustado
10.6 10.7
igual,
10.8
aceptamos H 0
Como un resultado grafico fallo, aceptamos el resultado analítico ya que es mas
preciso.
Para los operadores
Prueba de Bartlett

Valor P 0.135
Prueba de Lev ene
Valor P 0.031
2
Operador
0 5 10 15 20 25 30
Ho: los tiempos de ensamble para los operadores tienen varianza igual
H1: los tiempos de ensamble para los operadores no tienen varianza igual
H1, esperando el resultado de la prueba analítica de Barlett
Ho: los tiempos de ensamble para los operadores tienen varianza igual (Pvalue > α)
H1: los tiempos de ensamble para los operadores no tienen varianza igual (Pvalue < α)
Ho: los tiempos de ensamble para los operadores tienen varianza igual
H1: los tiempos de ensamble para los operadores no tienen varianza igual
vs. ajustes para Operadores
5.0
2.5
Residuo
0.0
-2.5
-5.0
9.0 9.5 10.0 10.5 11.0 11.5 12.0 12.5

Valor ajustado
4.4.1.7 ANDEVA (Análisis de varianza)
FUENTE DE GL SUMA DE CUADRADO Fcalculada Fcritica

VARIACION CUADRADOS MEDIO
Orden de montaje(F) 3 0.5 0.17 0.05 9.28
Operadores(C) 3 19 6.33 1.81 9.28
Método de ensamble(LL) 3 95.5 31.83 9.09 9.28
Lugar de trabajo(LG) 3 7.5 2.5 0.71 9.28
ERROR 3 10.5 3.5

EXPERIMENTAL
TOTAL 15 133
En el formato anterior es el análisis de varianza a continuación se presenta como se

realizan los cálculos respectivos.
Suma de cuadrados
SC Orden de montaje = 1/4 [(43)2 +(42)2 +(42)2 + (41)2 ] - [(168)2/16] = 0.5
SCOperadores = 1/4 [(37)2+ (41)2 +(49)2 +(41)2] - [(168)2/16] = 19
SCMensamble(LL) = 1/4 [(35)2+ (31)2 +(56)2 +(46)2] - [(168)2/16] = 95.5
SC Ltrabajo(LG) = 1/4 [(45)2+ (38)2 +(44)2 +(41)2] - [(168)2/16] = 7.5
4.4.1.8 Cálculo de los Parámetros
² = CMEE= 3.5
t t t
∑ ∑ ∑ Y ijk
μ= i=1
j=1 k=1
2
t = 168/16 = 10.5
Ordenes de montaje: FC < Fa,. No se descarta Ho, se concluye que no existe

diferencia significativa en los tiempos de ensamble para los órdenes de montaje.
Operadores :FC < Fa,. No se descarta Ho, se concluye que no existe diferencia
significativa en los tiempos de ensamble con los operadores.
Método de ensamble: FC < Fa,. No se descarta Ho, se concluye que no existe

diferencia significativa en los tiempos de ensamble entre los cuatro métodos de
ensamble.
Lugar de trabajo: FC < Fa . Se descarta HO y se concluye que no existe

diferencia significativa en la fuerza de explosión promedio para las cinco líneas
de montaje
El tiempo de ensamble promedio es de 10.5 con una variabilidad de 3.5, en la regla de

decisión no se descarta Ho.
El coeficiente de determinación es 73%, lo cual indica que el 73% de la variabilidad en
el tiempo de ensamble se debe a los factores estudiados.
Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y
letras griegas.
Intervalos de confianza para las órdenes de montaje:
1. 10.75±1.9432 √3.5/4
2. 10.50±1.9432 √3.5/4
3. 10.50±1.9432 √3.5/4
4. 10.25±1.9432 √3.55/4
Intervalos de confianza para los operadores:
1. 9.25±1.9432 √ 3.5/ 4
2. 10.25±1.9432 √3.5/4
3. 12.25±1.9432 √3.5/4
4. 10.25±1.9432 √3.5/4
Intervalos de confianza para el método de ensamble:
1. 8.75±1.9432 √ 3.5/ 4
2. 7.75±1.9432 √ 3.5/4
3. 14±1.9432 √3.5/4
4. 11±1.9432 √3.5/4
Intervalos de confianza para el lugar de trabajo:
1.
11.25±1.9432 √ 3.5/ 4
2. 9.50±1.9432 √ 3.5/ 4
3.
11±1.9432 √3.5/4
4.
10.25±1.9432 √3.5/4
Estimadores
Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.
Estimadores de medias para las órdenes de montaje.
α i. . .=Y i . . . −Y . .. .
α1… =10.75-10.50=0.25
α2… =10.50-10.50=0
α3… =10.50-10.50=0
α4… =10.25-10.50=-0.25
Estimadores de medias para las Operadores.
τ . j .. =Y .. j.−Y ....
Τ.1.. = 9.25-10.50=-1.25
Τ.2.. = 10.25-10.50=-0.25
Τ.3.. = 12.25-10.50=1.75
Τ.4.. = 10.25-10.50=-0.25
Estimadores de medias para el método de ensamble.
β ..k .=Y .. k .−Y ....
Β..1. = 8.75-10.50 = -1.75
Β..2. = 7.75-10.50 = -2.75
Β..3. = 14-10.50 = 3.50
Β..4. = 11.50-10.50 = 1
Estimadores de medias para el lugar de trabajo.
Ψ ...l =Y ...l−Y ....
=11.25-10.50=0.75
=9.50-10.50=-1
=11=10.50=0.50
=10.25-10.50=-0.25
Coeficiente de Determinación
2
R = (0.5+19+95.5+7.5)/168 = 0.73 Indica que el modelo explica en 73% de las mediciones de
la variable de respuesta.
4.4.2 MEZCLA DE DINAMITA

Supongamos que un experimentador está estudiando el efecto de cinco fórmulas
diferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Cada fórmula
se prepara usando un lote de materia prima lo suficientemente grande para que sólo se
hagan cinco mezclas. Se supone que tanto los lotes de materia prima como los
operadores representan restricciones en la aleatorización. Considérese que existen
cinco líneas de montaje representadas por las letras griegas a , b, g, d y e.
4.4.2.1 Definición
Determinar si existen diferencias significativas en la fuerza explosión promedio de la
dinamita para las cinco fórmulas preparadas con cinco lotes de materia prima distintas,
en cinco diferentes líneas de montaje, manejadas por cinco diferentes operarios.
Variable de respuesta: fuerza de explosión de la dinamita
Fila: Lotes
Columna: Operarios
Letras latinas: tipo de fórmula
Letras griegas: línea de montaje
Yijkl = μ + αi + j + k + l + eijkl
i= 1,2,3,4,5
j = 1,2,3,4,5
k= 1,2,3,4,5
Yijkl = es la fuerza explosiva para la k-ésima fórmula preparada por el j-ésimo operario
con el i-ésimo lote de materia prima en la l-ésima línea de montaje de prueba.
μ = fuerza explosiva promedio.
αi = es el efecto del i-ésimo lote de materia prima sobre la fuerza explosiva.
j = es el efecto del j-ésimo operario sobre la fuerza explosiva.
dk = es el efecto de la k-ésima fórmula sobre la fuerza explosiva.
l = es el efecto de la l-ésima línea de montaje de prueba sobre la fuerza explosiva.
eijkl = error experimental
Lote de materia prima

Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una μ es diferente
Operario
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una m es diferente
Fórmula
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
Línea de montaje
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
Regla de decisión
Se descarta Ho si FC ³ Fα , glN, glD
donde:
glN = ( t -1) glD= (5-1) (5-3) = 8
glN= ( 5-1) = 4
glD= (t-1) (t-3)
F0.05, 4, 8 = 3.84
Esta regla de decisión es igual para los lotes de materia prima, los operarios, las
fórmulas y para las líneas de montaje dado que todos los factores tienen el mismo
número de niveles.
1.4.2.1 Aleatorización
Al realizar la aleatorización se debe asegurar que cada operador prepare cada fórmula
con cada tipo de lote de materia prima en cada línea de montaje.
Esta sería una posible configuración para un DCGL 5x5
Lotes Operarios
1 Aα Bγ Cε Dβ Eδ
2 Bβ Cδ Dα Eγ Aε
3 Cγ Dε Eβ Aδ Bα
4 Dδ Eα Aγ Bε Cβ
5 Eε Aβ Bδ Cα Dγ
Los datos se registran respectivamente para cada lote, operario, fórmula y línea de
montaje en la siguiente tabla:
Nombre de la empresa: ________________ Motivo de análisis: ______________
Elaborado por: ____________________ Unidad de medición: ____________
Fecha: __________________ Factor de interés: _______________
Operarios
Lotes 1 2 3 4 5 Totales
1 Aα =24 Bγ =20 Cε =19 Dβ =24 Eδ =24 Y1...=111
2 Bβ =17 Cδ =24 Dα =30 Eγ =27 Aε =36 Y2...=134
3 Cγ = 18 Dε =38 Eβ =26 Aδ =27 Bα =21 Y3...=130
4 Dδ =26 Eα =31 Aγ =26 Bε =23 Cβ =22 Y4...=128
5 Eε =22 Aβ =30 Bδ =20 Cα = 29 Dγ =31 Y5...=132
Totales Y.1..=107 Y.2..=143 Y.3..=121 Y.4..=130 Y.5..=134 Y....=635
Como podemos ver en la misma tabla se calculan los totales por fila y por columna, sin
embargo, los totales por letra latina y por letra griega deben calcularse por separado.
Letras latinas
Totales por fórmula
A B C D E
24 17 18 26 22
36 20 24 38 31
27 20 19 30 26
26 23 29 24 27
30 21 22 31 24
Y..1.=143 Y..2.=101 Y..3.=112 Y..4.=149 Y..5.=130
Letras griegas
Totales por línea de montaje
α β Γ  Ε
24 17 26 18 22
31 30 24 20 38
30 26 20 26 19
29 24 24 27 23
21 22 27 31 36
Y…1=135 Y…2=119 Y…3=121 Y…4=122 Y…5=138

Para la comprobación de los supuestos de este experimento se utilizó el programa
Minitab.
Normalidad:
Gráfica de probabilidad normal
Gráficamente se concluye que las observaciones de la Fuerza de Explosión se

distribuyen normalmente, ya que el gráfico presenta aproximadamente una línea recta.
Homogeneidad de Varianzas
Para el caso de DCGL en Minitab, la igualdad de varianzas se debe calcular para cada
uno de los factores por separado.
Se formula la hipótesis para los operarios:
178
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
H1 = al menos una varianza es diferente
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre los operarios ya que p >α.
Se formula la hipótesis para los lotes:

2 2 2 2 2
H o =σ 1 =σ 2=σ 3 =σ 4 =σ 5
explosión son iguales entre los lotes ya que p >α.
179
Se formula la hipótesis para las fórmulas:
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
explosión son iguales entre las fórmulas ya que p >α.
Se formula la hipótesis para las líneas de montaje:

2 2 2 2 2
H o =σ 1 =σ 2=σ 3 =σ 4 =σ 5
explosión son iguales entre las líneas de montaje ya que p >α.
180
Independencia
No hay ningun patrón aparente en el recorrido de los puntos.
Al verificar que se cumplen todos los supuestos del modelo, proseguimos con la
elaboración de la tabla ANDEVA.
Fuente de GL Suma de Cuadrado F F crítica
Variación Cuadrados Medio calculad
a
Lotes 4 68 17 2.06 3.84
Operarios 4 150 37.5 4.54 3.84
Fórmulas 4 330 82.5 10 3.84
Línea de 4 62 15.5 1.9 3.84
Montaje
Error 8 66 8.25
Experimenta
l
Total 24 676
181
Los cálculos realizados para la misma son los siguientes:
SCLOTES = 1/5 [(111)2 +(134)2 +(130)2 + (128)2 + (132)2 ] - [(635)2/25] = 6
SCOPERADORES = 1/5 [(107)2 + (143)2 +(130)2 +(134)2] - [(635)2/25] = 150
SCFORM= 1/5 [(143)2+ (101)2 +(112)2 + (149)2 + (130)2 ] - [(635)2/25] = 330
SCLINMONT = 1/5 [( 135)2 +(119)2 + (122)2+ (121)2 +(138)2] -[(635)2/25] = 62
1.4.2.5 Conclusión
LOTE DE MATERIA PRIMA: FC < Fa,. no se descarta H0, se concluye que no

existe diferencia significativa en la fuerza de explosión promedio entre los lotes.
OPERADOR: porque FC >Fa, se descarta H0 y se concluye que existe diferencia

significativa en la habilidad del operario al preparar la fórmula.
FÓRMULA: FC >Fa se descarta H0, y se concluye que existe diferencia

significativa en las distintas fórmulas promedio para las cinco fórmulas
preparadas por los cinco operarios en las cinco líneas de montaje.
LÍNEAS DE MONTAJE: FC < Fa . no se descarta H0 y se concluye que no existe

diferencia significativa en la fuerza de explosión promedio para las cinco líneas
de montaje.
Variabilidad: s2 = CMEE = 66
Promedio: m = Y..../ t2 = 635 / 25 =25.4
182
Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y letras
griegas.
 Intervalos de confianza para los lotes de materia prima
1. 22. 2±2 . 306 √8 . 25/5
2. 26.8±2 .306 √8.25/5
3. 26.0±2 .306 √8 .25/5
4. 25.6±2.306 √ 8.25/5
5. 26. 4±2.306 √ 8.25/5
 Intervalos de confianza para los operarios
1. 21.4±2.306 √8.25/5
2. 28.6±2.306 √ 8.25/5
3. 24.2±2.306 √ 8.25/5
4. 26.0±2 .306 √8 .25/5
5. 26.8±2 .306 √8 .25/5
 Intervalos de confianza para las fórmulas
1. 28.6±2.306 √ 8.25/5
2. 20.2±2.306 √ 8.25/5
3. 22.4±2.306 √8.25/5
4. 29.8±2.306 √ 8 .25/5
5. 26.0±2 .306 √8 .25/5
 Intervalos de confianza para las líneas de montaje
1. 27.0±2 .306 √8 .25/5
183
2. 23.8±2.306 √ 8.25/5
3. 24.2±2.306 √ 8.25/5
4. 24.4±2.306 √ 8. 25/5
5. 27.6±2 .306 √8.25/5
Estimadores
Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.
 Estimadores de medias para los lotes de materia prima
α i . . .=Y i . . .−Y . .. .
α1… =22.2-25.4= -3.2
α2… =26.8-25.4= 1.4
α3… =26.0-25.4= 0.6
α4… =25.6-25.4= 0.2
α5… =26.4-25.4= 1.0
 Estimadores de medias para las operarios
τ . j .. =Y .. j.−Y ....
Τ.1.. = 21.4-25.4= -4.0
Τ.2.. = 28.6-25.4= 3.2
184
Τ.3.. = 24.2-25.4= -1.2
Τ.4.. = 26.0-25.4= 0.6
Τ.5.. = 26.8-25.4= 1.4
 Estimadores de medias para las fórmulas
β ..k .=Y .. k .−Y ....

Β..1. = 28.6-25.4= 2.2
Β..2. = 20.2-25.4= -5.2
Β..3. = 22.4-25.4= -3.0
Β..4. = 29.8-25.4= 4.4
Β..5. = 26.0-25.4= 0.6
 Estimadores de medias para las líneas de montaje
Ψ ...l =Y ...l−Y ....

…1 = 27.0-25.4= 1.6
…2 = 23.8-25.4= -1.6
…3 = 24.2-25.4= -1.2
…4 = 24.4-25.4= -1.0
…5 = 27.6-25.4= 2.2
185
R2 = [68+150+330+62] / 676 = 90%

EL 90 % de la variabilidad de la fuerza de explosión de la dinamita es explicada por el
modelo.
CAPÍTULO 5
2. DISEÑO MINIMO SIGNIFICATIVO

5.1 Definición y Generalidades
Es un prueba para comparar dos medias y posiblemente el mas utilizado, debido a

que es bastante sencillo de aplicar. Se utiliza usualmente para comparar una pareja
de medias de tratamientos, pero también puede ser utilizado para comparaciones
de mas de dos medias. Fisher la denominó Prueba protectora de Fisher LSD, en
la cual recomendó que para que la tasa de error juiciosa por comparación sea
aproximadamente igual a α se deben realizar dos etapas.
186
Etapa I: Es probar la Ho : μ1 = μ2 =…..μi por la prueba de F de tamaño α, si el valor
F no es significante se termina el análisis. Si el valor de F es significante, entonces
sigue la etapa II.
Etapa II: Se prueba cada comparación simple de Ho : μ1 = μ2 por una prueba τ al

nivel de significancia de α y con grados de libertad (gl) de CMee (en un DCA g.l=
k(n-1) , en un bloque g.l= (n-1)(k-1).
Esta prueba determina el valor mínimo necesario para considerar diferentes dos
muestras y lo utiliza para comparar los diferentes pares de medias que se deseen
evaluar.
5.2 Pasos para la Resolución de Problemas
5.2.1 Verificar si el resultado de el ANDEVA es significativo para el factor de

interés
5.2.2 Calcular y ordenar las medias de cada nivel por magnitud ( Orden
ascendente o descendente)
5.2.3 Plantear las hipótesis correspondientes con sus respectivas
reglas de decisión.
HIPOTESIS:
H 0=μ i=μ j
H 1=μi ≠ μ j
REGLA DE DECISION:
Descartar H 0 si |Ý i−Ý j|≥ DMS i ≠ j
5.2.4 Calculo del comparador DSM
187
Para un Diseño Completamente al azar (DCA)
2 CMEE
DSM =t α /2 , glee
√ n
Donde:
N: Numero de observaciones por cada nivel del factor de interés.
 Para un Diseño completamente al azar (desbalanceado)
1 1
√
DSM =t α /2 , ∑ nk −k CMEE ¿ +
nj [ ]
Donde:
N: Numero de observaciones por cada nivel del factor de interés.
 Para un Diseño de bloques al azar (DBA – Niveles)
2 CMEE
DSM =t α /2 ,(k −1)(n−1)
√ n
 Para un Diseño de bloques al azar (DBA –Bloques)

2 CMEE
DSM =t α /2 ,(k −1)(n−1)
√ k
 Para un Diseño Cuadrado Latino (DCL)

2 CMEE
DSM =t α /2 ,(t−1)(t−2)
√ t
Donde:
T: Numero de letras latinas o # de files o # de columnas
 Para un Diseño Cuadrado Greco-Latino

188
2CMEE
DSM =t α /2 ,(t−1)(t−3)
√ t
Donde:
T: Numero de letras latinas o griegas o # de filas o #de columnas.
5.2.5 Comparar las diferencias de las medias con el valor calculado

para DSM
Para cada una de las hipótesis |Y i −Y j|vs DSM
5.2.6 Concluir para cada una de las hipótesis
5.2.3 EJEMPLO: MAXIMIZAR LA RESISTENCIA A LA TENSIÓN

Un ingeniero de desarrollo de productos está interesado en maximizar la resistencia a
la tensión de una nueva fibra sintética que se empleará en la manufactura de tela para
camisas de hombre. El ingeniero sabe por experiencia que la resistencia es influida por
el porcentaje de algodón presente en la fibra. Además, él sospecha que elevar el
contenido de algodón incrementará la resistencia, al menos inicialmente. También sabe
que el contenido de algodón debe variar aproximadamente entre 10 y 40 % para que la
tela resultante tenga otras características de calidad que se desean (como capacidad
de recibir un tratamiento de planchado permanente). El ingeniero decide probar
muestras a cinco niveles de porcentaje de algodón: 15, 20, 25, 30 y 35 %. Así mismo,
decide ensayar cinco muestras a cada nivel del contenido de algodón.los datos
aparecen en la tabla.
5.2.3.1 Verificar si es Significativo

Los resultados del ANDEVA fueron los siguientes:
189
Glee = 20 CMEE = 8.06 Fc = 14.76 Fα = 2.87 Dado que el resultado fue
significativo se puede seguir adelante con otras comparaciones.
5.2.3.2 Calcular y ordenar las medias

Se procede a calcular y ordenar las medias de cada nivel en orden ascendente o
descendente.
NIVELES OBSERVACIONES TOTALES MEDIAS
% ALGODÓN 1 2 3 4 5
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8
Los cinco promedios de tratamientos son: Y 1= 9.8; Y2= 15.4; Y3= 17.6; Y4= 21.6; Y5=
10.8 denotemos por µ1, µ2, µ3, µ4 y µ5 respectivamente a los medios de los tratamientos
con porcentaje 15, 20, 25, 30 y 35.
MEDIAS
ORDENADAS
Ῡ1 = 9.8
Ῡ5 = 10.8
Ῡ2 = 15.4
Ῡ3 = 17.6
Ῡ4 = 21.6
5.2.3.3 Plantear Hipótesis
H 0 :μ 1=μ5 |Ý 1−Ý 5|=|9.8−10.8|=1

H 1: μ1≠ μ5 descartar H 0 si|Ý 1−Ý 5|≥ DSM
190
H 0 :μ 5=μ2 |Ý 5 −Ý 2|=|10.8−15.4|=4.6
H 1 : μ 5 ≠ μ2 descartar H 0 si|Ý 5−Ý 2|≥ DSM
H 0 :μ 2=μ3 |Ý 2− Ý 3|=|15.4−17.6|=2.2

H 0 :μ 3=μ4 |Ý 3 −Ý 4|=|17.6−21.6|=4

5.2.3.4 Calcular DSM
2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05
2× 8.06
DSM =t 0.025 , 20
√ 5
DSM =3.75
5.2.3.5 calcular el comparador DSM con la diferencias de medias
H 0 :μ 1=μ5 |Ý 1−Ý 5|=|9.8−10.8|=1

H 1: μ1≠ μ5
1 vs 3.75 es No significativa ya que el valor de las diferencias de medias es menor que

el valor de DSM.
H 0 :μ 5=μ2 |Ý 5 −Ý 2|=|10.8−15.4|=4.6

H 1 : μ 5 ≠ μ2
191
4.6 vs 3.75 es significativa ya que el valor de las diferencias de medias es
mayor que el valor de DSM.
H 0 :μ 2=μ3 |Ý 2− Ý 3|=|15.4−17.6|=2.2

H 1 : μ 2 ≠ μ3
2.2 vs 3.75 es No significativa ya que el valor de las diferencias de medias es

menor que el valor de DSM.
H 0 :μ 3=μ4 |Ý 3 −Ý 4|=|17.6−21.6|=4

H 1 : μ 3 ≠ μ4
4 vs 3.75 es significativa ya que el valor de las diferencias de medias es

mayor que el valor de DSM.
5.2.3.6 Conclusión
Existe diferencia significativa en la resistencia promedio a la tensión de la nueva fibra
sintética para los pares
μ5 y μ2 Para 35% y 20% de algodón
Sin embargo, para los siguientes pares la resistencia a la tensión no varía
significativamente:
μ1 y μ5 Para 15% y 35 % de algodón
5.2.4 EJEMPLO. MEJORAR LA CALIDAD DE LAS SUELAS
Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se pueden
hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.
192
Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una
superficie abrasiva, la suela de los zapatos se desgasta al pasarla por dicha superficie.
Como criterio de desgaste se usa la pérdida de peso después de un número fijo de
ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero.
Al hacer las pruebas en orden completamente al azar se evitan sesgos y las
mediciones en un tipo de cuero resultan independientes de las demás.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en la
hoja de verificación previamente diseñada
Tipo de OBSERVCIONES (miligramos)

Cuero
A 264 260 258 241 262 255
B 208 220 216 200 213 206
C 220 263 219 225 230 228
D 217 226 215 224 220 222
TC OBSERVACIONES SUM PROMEDI

A O
A 26 26 25 24 26 25 1540 256.7
4 0 8 1 2 5
B 20 22 21 20 21 20 1263 210.5
8 0 6 0 3 6
C 22 26 21 22 23 22 1385 230.8
Los 0 3 9 5 0 8 resultados
D 21 22 21 22 22 22 1324 220.7
del ANDEVA
7 6 5 4 0 2
fueron los siguientes:
FV SC GL CM Fc Fα
TIPOS 7072.3 3 2357.44 23.24 3.098
DE 3
193
CUERO
EE 2029 20 101.45
TOTAL 9101.3 23
3
5.2.4.1 Verificar si es Significativo

Dado que el resultado fue significativo se puede seguir adelante con otras
comparaciones.
5.2.4.2 Calculamos y ordenamos las medias de cada nivel en orden

descendente o ascendente.
MEDIAS
ORDENADA
S
Ῡa = 256.7
Ῡc = 230.8
Ῡd = 220.7
Ῡb = 210.5
5.2.4.3 Plantear Hipótesis
H 0 :μ a=μ c |Ý a −Ý c|=|256.7−230.8|=25.8

H 1 : μ a ≠ μc descartar H 0 si|Ý a−Ý c|≥ DSM
H 0 :μ c =μd |Ý c −Ý d|=|230.8−220.7|=10.1

H 1: μc ≠ μd descartar H 0 si|Ý c −Ý d|≥ DSM
H 0 :μ d =μ b |Ý d −Ý b|=|220.7−210.5|=10.2

H 1: μd ≠ μb descartar H 0 si|Ý d −Ý b|≥ DSM
5.2.4.4. Calcular DSM
194
2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05
2× 101.45
DSM =t 0.025 , 20
√ 4
DSM =14.857
5.2.4.5 Calcular el comparador DSM con las diferencias de medias

H 0 :μ a=μ c |Ý a −Ý c|=|256.7−230.8|=25.8
H 1 : μ a ≠ μc
25.8 vs 14.857 es significativa ya que el valor de las diferencias de medias es

Mayor que el valor de DSM.
H 0 :μ c =μd |Ý c −Ý d|=|230.8−220.7|=10.1

H 1: μc ≠ μd
10.1 vs 14.857 no es significativa ya que el valor de las diferencias de medias es menor

que el valor de DSM.
H 0 :μ d =μ b |Ý d −Ý b|=|220.7−210.5|=10.2

H 1: μd ≠ μb descartar H 0 si|Ý d −Ý b|≥ DSM
10.2 vs 14.857 no es significativa ya que el valor de las diferencias de medias es menor

que el valor de DSM.
5.2.4.6 Conclusión
195
Existe diferencia significativa en el desgaste promedio de suela de cada tipo de cuero
para μa y μc .
Sin embargo, para los siguientes tipos de cuero el desgaste promedio no varía
significativamente: μc y μd, μd y μb.
CAPÍTULO 6
6. DUNCAN
6.1 Definición
La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia
entre pares de medias después que se ha rechazado la hipótesis nula en el análisis de
varianza.
196
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios
"rangos" (Duncan los llama rangos significativos mínimos) dados por la fórmula:
Dónde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de la

tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.
6.2 Generalidades
 Este procedimiento es utilizado para realizar comparaciones múltiples de medias

 Es recomendable efectuar esta prueba después que la prueba F haya resultado
significativa.
6.3 Pasos para la Resolución de Problemas.
6.3.1 Verificar que sea aplicable al caso de estudio
Solamente es aplicable si el resultado del ANDEVA es significativo para el factor de interés
6.3.2 Cálculo de Medias

Se procede a calcular las medias de cada nivel.
6.3.3 Ordenar Medias

Se Ordenan las medias de cada nivel por magnitud.
6.3.4 Cuadro de Rangos Múltiples
197
Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.
Por ejemplo el cuadro de rangos múltiples para:
 Para un factor de interés con 5 niveles y que el orden por magnitud sea
A,B,C,D Y E
A B C D E
Posibles Comparaciones
E E-A E-B E-C E-D - E Vs A

E Vs B
D D-A D-B D-C - E Vs C
E Vs D
D Vs A
C C-A C-B
D Vs B
D Vs C
B B-A - C Vs A
C Vs B
A - B Vs A
 Para un factor de interés

con 4 niveles y que el orden por magnitud sea A, B, C y D
A B C D
Posibles Comparaciones
D D-A D-B D-C - D Vs A
D Vs B
C C-A C-B - D Vs C
C Vs A
B B-A - C Vs B
B Vs A
A -
 Para un factor de interés con 3 niveles y que el orden por magnitud sea
A,B y C
198
A B C Posibles Comparaciones
C Vs A
C C-A C-B -
C Vs B
B B-A - B Vs A
A -
6.3.5 Hipótesis
Plantear las hipótesis correspondientes con sus reglas de decisión:
Descartar Ho si |Ý i −Ý j|≥C . D.
6.3.6 Cálculo de Comparador de Duncan para DCA

CD = (Dα, Nodemedias, glee) Sy
CMEE
S ȳ = √ n
DCA un solo factor
Ejemplo para 3 niveles
# de Medias (p) 2 3
D α, glee D2 D3
Sy Sy Sy
CD D2 S y D3 S y
En los demás diseños, lo que varía es el cálculo de S ý
199
CMEE
DBA S ý =
√ n
Para los niveles
CMEE
S ý =
√ k
Para los bloques
CMEE
DCL S ý =
√ t
En donde t es el número de las L.L o filas o columnas.
CMEE
DCGL S ý =
√ k
t el número de las L.L o L.G.
6.3.7 Comparación de Medias

Comparar las diferencias de medias de los niveles del factor con su respectivo
Comparador Duncan.
6.3.8 Conclusión
Se pueden realizar de forma general, o especificando el efecto de cada factor.
6.4 Ejemplos
6.4.1 Problema a Resolver
200
Se están comparando tres soluciones de lavado diferentes a fin de estudiar su
efectividad para retardar el crecimiento de bacterias en contenedores de leche de
cinco galones. El análisis se hace en un laboratorio y sólo pueden realizarse tres
ensayos en un día. Puesto que los días podrían representar una fuente potencial
de variabilidad, el experimentador decide usar un diseño de bloques
aleatorizados. Se hacen observaciones en cuatro días, cuyos datos se muestran
enseguida. Analizar los datos de este experimento (utilizar α = 0.05) y sacar las
conclusiones apropiadas.
Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
6.4.1.1 Verificar si es aplicable.
Sí es aplicable.
6.4.1.2 Cálculos de las Medias de todos los tratamientos
92
x́ solu .1 = =23
4
101
x́ solu .2 = =25.25
4
32
x́ solu .3 = =8
4
6.4.1.3 Ordenamiento de las Medias
x́ solu .2 =25.25
x́ solu .1 =23
201
x́ solu .3 =8
6.4.1.4 Cuadro de Rangos Múltiples
x́ solu .3 =8 x́ solu .1 =23 x́ solu .2 =25.25

x́ solu .2 =25.25 17.25 2.25 -
x́ solu .1 =23 15 -
x́ solu .3 =8 -
6.4.1.5 Hipótesis
H0: m solu.2 = m solu.3 H1: m solu.2 ¹ m solu.3

Si |25.25-8| C.D. se descarta H0

Si |25.25-23| C.D. se descarta H0

Si |23-8| C.D. se descarta H0
6.4.1.6 Cálculo de los Comparadores DUNCAN (C.D)
No. de 2 3
202
medias
Duncan al 3.113 3.256
5%
S ý S ý S ý
C.D. 3.113* S ý 3.256* S ý
Para cada No. de medias se busca al 0.05. Para la media de 2 en la tabla de

Duncan sale 3.113 y para el de 3 medias nos da 3.256.
g.l.ee: nk-1 = (4*3)-1 = 11
Para ambos no. de medias es el mismo S ý tanto para la media 2 y la media 3.

CMEE
S ý =
√ n
Comparación de las medias
Para los niveles
|17.25| 18.491 se acepta H0

|2.25| 17.679 se acepta H0
|15| 17.679 se acepta H0
Conclusión
Podemos concluir que los pares de medias no tienen diferencias significativas entre sí
en cuanto a su efectividad para retardar el crecimiento de bacterias en contenedores de
leche de cinco galones.
6.4.2 EJEMPLO: DONAS
Se realizó un experimento para determinar la cantidad (en gramos) de grasa absorbida

por 48 donas (donuts) usando ocho tipos diferentes de grasas (aceites y mantecas).
Las medias para los ocho tratamientos se muestran a continuación:
203
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error
de 141.6, los grados de libertad del error son 48 - 8 =40.
6.4.2.1 Verificar que sea aplicable al caso de estudio
Sí es aplicable.
6.4.2.2 Cálculos de las Medias de todos los tratamientos
El problema las indica. Y por otro lado se calculan los rangos
Se calculan los rangos:
Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:
Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para a =
0.05, 2 £ p £ 8 y 40 grados de libertad.
6.4.2.3 Ordenamiento de las Medias
El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".
204
El rango entre las medias máxima y mínima se compara con D8, esto es,
entonces existe diferencia significativa entre las grasas 4 y 7.
6.4.2.4 Cuadro de rangos múltiples
161 162 165 172 176 178 182 185
185 24 23 20 13 9 7 3 -
182 21 20 17 10 6 4 - -
178 17 16 13 6 2 - - -
176 15 14 11 4 - - - -
172 11 10 7 - - - - -
165 4 3 - - - - - -
162 1 - - - - - - -
161 - - - - - - - -
6.4.2.5 Hipótesis
Y i−Y j
Descartar Ho si │ │≥ C.D.
205
6.4.2.6 Cálculo de Comparador de DUNCAN para un DCA
CD=( Dα ,Nodemedias , glee )S ȳ CMEE

S ȳ = √ n
En este caso, no tenemos los resultados del andeva.
6.4.2.7 Comparación de Medias
El próximo paso es comparar subconjuntos de siete medias con el rango D7.
, entonces
, entonces
Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos
de seis medias.
, entonces
, entonces
, entonces
Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos de cinco

medias
, entonces
, entonces
, entonces
206
, entonces
Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261 que
fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con
D4; por lo tanto,
, entonces
Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4

porque ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo
tanto, el proceso termina.
Los resultados se muestran gráficamente en la siguiente figura, donde las medias que
están debajo de una línea no son significativamente diferentes.
6.4.2.8 Conclusión
El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3
son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor
que las 8 y 7 y las demás grasas no son significativamente diferentes en relación con la
cantidad absorbida.
6.4.3 EJEMPLO: RIEGO EN EL CULTIVO DE PLÁTANO
En un experimento bajo el diseño de bloques al azar se compararon 4 normas de riego

en el cultivo del plátano fruta clón “Cavendish gigante” en el ciclo de fomento.
207
Los tratamientos evaluados fueron:
T1- Regar cuando la humedad en el suelo llegue a 0,40 bar (40 centibar).
T4- No regar.
Para evaluar los tratamientos se utilizó como variable principal:
Rendimiento expresado en toneladas por hectárea, los datos son los siguientes.
Réplicas
Tratamiento 1 2 3 4 5 Totales
s
1 47.99 48 47.98 48.78 47.2 239.95
2 44.22 44.01 44.45 44.13 44.31 221.12
3 42.58 42.3 42.86 42.11 43.06 212.91
4 37.66 37.3 38.02 37.25 37 187.23
∑ 172.45 171.61 173.31 172.27 171.57 861.21
6.4.3.1 Verificar que sea aplicable al caso de Estudio

Sí es aplicable.
6.4.3.2 Cálculos de las medias de todos los tratamientos
239.95
x́ trat .1 = =47.99
5
221.12
x́ trat .2 = =44.224
5
208
212.91
x́ trat .3 = =42.582
5
187.23
x́ trat .4 = =37.446
5
6.4.3.3 Ordenamiento de las medias
x́ trat .1 =47.990
x́ trat .2 =44.224
x́ trat .3 =42.582
x́ trat .4 =37.446
6.4.3.4 Cuadro de Rangos Múltiples
x́ trat .4 =37.446 x́ trat .3 =42.582 x́ trat .2 =44.224 x́ trat .1 =47.990

x́ trat .1 =47.990 10.544 5.408 3.766 -
x́ trat .2 =44.224 6.778 1.642 -
x́ trat .3 =42.582 5.136 -
x́ trat .4 =37.446 -
6.4.3.5 Hipótesis
H0: m trat.1 = m trat.4 H1: m trat.1 ¹ m trat.4
Si |47.990-37.446| C.D. se descarta H0
209
6.4.3.6 Cálculo de los Comparadores DUNCAN (C.D)

Para los niveles
No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý nivel S ý nivel S ý nivel
C.D. 3.082∗S ý nivel 3.225∗S ý nivel 3.313∗S ý nivel
.gl.ee: (n-1)(k-1) = (5-1)(4-1) = 12
Para Duncan al 5%, la media de 2 es 3.082, la media de 3 es de 3.225 y la media de 4

es de 3.313.
CMEE
S ý nivel=
√ n
Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.
Para los bloques
No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý bloques S ý bloques S ý bloques
C.D. 3.082∗S ý bloques 3.225∗S ý bloques 3.313∗S ý bloques
210
g.l.ee: (n-1)(k-1) = (5-1)(4-1) = 12
Para Duncan al 5%, la media de 2 es 3.082, la media de 3 es de 3.225 y la media de 4

es de 3.313.
CMEE
S ý bloques=
√ k
Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.
211
CAPÍTULO 7
7. TUKEY
7.1 Definición
La prueba Tukey se usa en experimentos que implican un número elevado de

comparaciones o se desea usar una prueba más rigurosa que la de Duncan.
Es de fácil cálculo puesto que se define un solo comparador, resultante del producto
del error estándar de la media por el valor tabular en la tabla de Tukey usando como
numerador el número de tratamientos y como denominador los grados de libertad del
error.
7.2 Generalidades
 Este procedimiento es llamado también «Diferencia Significativa Honesta»
 Se utiliza para realizar comparaciones múltiples de medias
 Esta prueba es similar a la prueba de Duncan en cuanto a su procedimiento y
además es más exigente.
 Esta prueba es un procedimiento de comparación múltiple que también está
basado en los intervalos.
 Su procedimiento requiere el uso de qµ (k,glee) para determinar el valor crítico
de todas las comparaciones por pares, independientes de cuantas medias estén
en el grupo.
 Esta prueba declara dos medias significativas diferentes si el valor absoluto de
sus diferencias muéstrales excede al comparador
 La prueba de Tukey es una prueba de comparación múltiple, al igual que otras
como Duncan, diferencia significativa mínima, entre otras. son utilizadas para la
comparación de promedios.
 Es utilizada una vez hayamos realizado el análisis de varianza y hayamos
concluido con éste, que el factor de interés es significativo (Fc ≥ Fα).
212
 Para la aplicación de la prueba de Tukey es necesario el uso de qµ (k,glEE) los
puntos porcentuales del estadístico del rango studentizador.
 Se utiliza qµ (k,glEE) para determinar el valor crítico de todas las comparaciones
por pares,
 Esta prueba declara dos medias significativas diferentes, si el valor absoluto de
sus diferencias muéstrales excede al comparador T µ = q µ (k,glEE) Syi.
 A la versión de este método que trabaja con números de muestras desiguales o
desbalanceado se le llama Procedimiento Tukey-Kramer.
7.3 Pasos para la Resolución de Problemas..

7.3.1 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
7.3.2 Ordenar en forma ascendente o descendente las medias de los
niveles, obtener las diferencias de las medias (cuadro de rangos
múltiples)
Para un factor de interés con 5 niveles y que el orden por magnitud sea A,B,C,D Y E.
213
7.3.3 Plantear Hipótesis y sus Reglas de Decisión
7.3.4 Calcular los comparadores Tukey – puntos críticos de rechazo.
214
7.3.5 Comparar la diferencia de medias con el comparador Tukey
7.3.6 Hacer Conclusiones
7.4 Ejemplos
7.4.1 Problema a Resolver
Se sospecha que la temperatura ambiente en la cual se activan las bacterias, afecta su

tiempo de activado. Se probaron treinta bacterias homogéneas, 6 a cada una de las 5
temperaturas y se obtuvieron los datos mostrados a continuación. Analice e intérprete
los datos.
Tabla de Datos Obtenidos:
215
7.4.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
Análisis de Varianza
Conclusiones para el análisis de varianza:
216
Se concluye que las cinco temperaturas ambientes determinadas afectan
significativamente el tiempo de activado de las baterías probadas.
7.4.3 Ordenar en forma ascendente o descendente las medias de los

múltiples)
7.4.4 Plantear Hipótesis y sus Reglas de Decisión
217
218
 Se acepta la hipótesis nula para la pareja de medias (3,4) y se rechaza para
todas las demás parejas. Se concluye lo siguiente:
u3 = u4 ; u1 ¹ u2 ; u1 ¹ u3; u1 ¹ u4 ; u1 ¹ u5 ; u2 ¹ u4 ; u2 ¹ u5 ; u3 ¹ u5 ; u4 ¹ u5
 Existe diferencia significativa entre todas las parejas de medias a excepción de

la pareja (3,4).
 El tiempo de activado promedio de las baterías que se probaron a T = 50 ºC y de

las que se probaron a T =75ºC no difieren significativamente. Mientras que para
el resto de las comparaciones de las medias de temperatura sí difiere
significativamente.
7.4.2 Ejemplos
7.4.2.1 Problema a Resolver
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente
tabla.
219
7.4.2.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
El análisis de varianza:
Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa
(al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.
Los valores absolutos de las diferencias entre del ejemplo se

muestran en la siguiente tabla.
220
7.4.2.3 Ordenar en forma ascendente o descendente las medias de los
múltiples)
7.4.2.4 Plantear Hipótesis y sus Reglas de Decisión
H0= µ1=µ2 H1= µ1≠µ2
H0= µ1=µ3 H1= µ1≠µ3
H0= µ1=µ4 H1= µ1≠µ4
H0= µ2=µ3 H1= µ2≠µ3
H0= µ2=µ4 H1= µ2≠µ4
H0= µ3=µ4 H1= µ3≠µ4

Para los datos obtenidos y un α = 0.05,
Como se puede observar, las diferencias de tukey que exceden (DSH) están entre las
medias ,y , por lo tanto, sólo difieren las medias u 4 de u 1 y de u 3.
221
0.348 vs 0.3127 (1,4)
0.204 vs 0.3127 (1,2)
0.022 vs 0.3127 (1,3)
0.226 vs 0.3127 (2,3)

0.144 vs 0.3127 (2,4)
0.370 vs 0.3127 (3,4)

Como se puede observar, las diferencias de tukey que exceden (DSH) están entre las
medias ,y , por lo tanto, sólo difieren las medias u 4 de u 1 y de u 3.

Existen diferencias significativas para las parejas (1,4) y (3,4)
222
CAPÍTULO 8
8. NEWMAN KEULS
8.1 Definición
Es un procedimiento de comparaciones múltiples que ordena las medias de los grupos
de menor a mayor y establece el rango a utilizar para comprobar la hipótesis de que no
hay diferencias significativas entre las medias, en función del nº de pasos que hay
entre 2 medias a contrastar.
8.2 Generalidades
 Esta prueba se basa en la separación de un par específico de medias que se
prueban del conjunto completo de medias ordenadas.
 Fue desarrollada por Newman (1939) y Keuls (1952) en donde utilizaron
intervalos múltiples entre medias como criterio de conclusión.
8.3 Pasos
 Verificar si el análisis de varianza es significativo mediante el ANDEVA

 Calcular y Ordenar en forma ascendente o descendente las medias.
 Elaborar el cuadro de Rangos Múltiples
 Plantear las Hipótesis y las reglas de decisión respectivas
 Calcular el error estándar
 Calcular los comparadores Newman-Keuls
 Comparar los valores obtenidos en la diferencia de medias según su posición,
con los correspondientes valores obtenidos para los comparadores Newman-Keuls
 Establecer que par de valores son significativos (mediante un asterisco) y
cuales no son significativos (mediante las letras n.s.)
 Concluir
8.3.1 Verificar si el análisis de varianza es significativo mediante el andeva.
223
Fc>Fα
8.3.2 Calcular y ordenar en forma ascendente o descendente las medias
8.3.3 Elaborar el cuadro de rangos múltiples
Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.
8.3.4 Plantear las

hipótesis y las reglas de decisión respectivas
Ho: u1= u4 Ho: u5=u4 Ho: u2=u4 Ho: u3=u4 Ho:u1=u3
H1: u1=u4 H1: u5=u4 H1: u2=u4 H1:u3=u4 H1:u1=u3
Ho: u5=u3 Ho: u2=u3 Ho: u1=u2 Ho: u5=u2 Ho: u1=u5
H1: u5=u3 H1: u2=u3 H1: u1=u2 H1: u5=u2 H1: u1=u5
Regla de decisión
Descartar ho, si l l ≥nk (respectivo)
224
8.3.5 Calcular el error estándar
Para un D. C. A (balanceado) s y =√ CMEE

n
DBA sy  CMEE
n
sy  CMEE
k
DCL
sy  CMEE
t
DCGL
sy  CMEE
t
Para un D. C. A (desbalanceado)
1 1 1 1
n n n n
   ...
i 1 2 k
8.3.6 Calcular los comparadores newman-keuls
Donde: p= número de medias (p= 2,3…k)
glee= grados de libertad del error
q = valor de la tabla correspondiente
225
8.3.7 Comparar los valores obtenidos en la diferencia de medias según su
posición, con los correspondientes valores obtenidos para los comparadores
newman-keuls.
8.3.8 Establecer que par de valores son significativos (mediante un asterisco)

y cuales no son significativos (mediante las letras n.s.)
8.3.9 Concluir
8.4 EJEMPLO. RESISTENCIA A LA TENSIÓN DEL CEMENTO
Se está estudiando la resistencia a la tensión de cemento Pórtland. Cuatro técnicas de

mezclado pueden ser usadas económicamente. Se han recolectado los siguientes
datos:
Para la solución de este problema debemos seguir los pasos antes descritos.
8.4.1 Se procede con la verificación de la significancia del ANDEVA, es decir

cuando Fc>Fα.
En este caso obtuvimos la siguiente tabla del Análisis de Varianza:
226
De aquí podemos observar que F calculada es mayor que la F crítica, por ende se dice
que si es significativo el ANDEVA.
8.4.2 Calcular y Ordenar en forma ascendente o descendente las medias.
Y 1 =2971 Y 4 =2666 . 25
Y 2 =3156 .25 Ordenadas Ascendente Y 3 =2933 .75
Y 3 =2933 . 75 Y 1 =2971
Y 4 =2666 . 25 Y 2 =3156 .25
8.4.3 Elaborar el cuadro de Rangos Múltiples, de la forma descrita al principio

de este capítulo.
Para este ejemplo queda de la siguiente forma:
Luego de esto se debe plantear las Hipótesis. En este caso de la siguiente forma:
Ho: μ2 =μ 4 H 1 : μ2 ≠μ 4
Ho: μ2 =μ3 H 1 : μ2 ≠μ 3
Ho: μ2 =μ1 H 1 : μ2 ≠μ 1
Ho: μ1 =μ4 H 1 : μ1 ≠μ 4
Ho: μ1 =μ3 H 1 : μ1 ≠μ 3
Ho: μ3 =μ 4 H 1 : μ3 ≠μ4
8.4.4 Plantar la regla de decisión, para este caso:
|Y i −Y j|≥NK 227
Descartar Ho si:
|3156 .25−2666.25|≥NK 4 |2971−2666.25|≥NK 3

|3156 .25−2933.75|≥NK 3 |2971−2933.75|≥NK 2
|3156 .25−2971|≥NK 2 |2933 .75−2666 .25|≥NK 2
8.4.5 Calcular el error estándar
12825 .68
s y =√ CMEE
n
S ȳ = √ 4
= 56.62
8.4.6 Se deben calcular los comparadores Newman-Keuls
NK=q α , p , glee S ȳ
i
Donde: p= número de medias ( p= 2,3…k)
glee= grados de libertad del error
q = valor de la tabla VIII (Montgomery)
Del cuadro del ANDEVA el CMEE = 12825.68, gl del error = 12
228
Se debe calcular el comparador:
Comparar este cuadro con el de la diferencia de medias
8.4.7 De esta comparación obtenemos lo siguiente:
|490|≥NK 4
490 vs237 .804
|222 .5|≥NK 3
222.5vs 13.4574
|185 .25|≥NK 2 185 .25 vs174.3896
|304 . 75|≥NK 3 304 .75vs213.4574
|37 . 25|≥NK 2 37 .25 vs174.3896
|267 . 5|≥NK 2 267 .5 vs174.3896
8.4.8 Establecer que par de valores son significativos (mediante un

asterisco) y cuales no son significativos (mediante las letras n.s.)
229
n.s.
8.4.9 Concluimos para este ejemplo lo siguiente:
230
CAPÍTULO 9
9. DUNNETT
9.1 Definición
En muchos experimentos uno de los tratamientos es el control, y el investigador está

interesado en comparar cada una de las otras a - 1 medias de los tratamientos contra
el control, por lo tanto, existen a - 1 comparaciones. Un procedimiento para realizar
estas comparaciones es la prueba de Dunnett (desarrollada en 1964 por Charles W.
Dunnett). Si se supone que el control es el tratamiento a, entonces se desea probar las
hipótesis.
H0 = µi = µa
H1 = µi = µa
Esta prueba es útil cuando el experimentador está interesado en determinar que

tratamiento es diferente de un testigo, control o tratamiento estándar.
9.2 Generalidades
Una vez que el análisis de varianza de un experimento ha mostrado que un valor de F

es significativo (rechazo de la hipótesis nula), se puede aplicar una prueba como la
Dunnett, entre otras pruebas como Duncan, Newman-Keuls, Tuckey o la prueba de
Diferencia Significativa.
Todos los procedimientos involucran el cálculo de un valor que es comparado con la

diferencia entre promedios. Si este valor es más pequeño que las diferencias quieren
decir que éstas son significativamente diferentes. Normalmente las comparaciones
múltiples se realizan al mismo nivel de significancia que la ANDEVA.
231
Por ejemplo, para un ANDEVA significativa a un nivel de 5% (α= 0,05), se realizan
comparaciones múltiples al 5%. Sin embargo, algunos investigadores realizan
comparaciones a niveles diferentes lo cual, desde el punto de vista estadístico también
es posible realizar. Lo que no puede hacerse, sin embargo, es realizar comparaciones
múltiples al nivel de 1% (α = 0,01) cuando el ANDEVA sólo muestra diferencias al 5%.
Como habíamos indicado, existen muchos métodos para llevar a cabo estas
comparaciones, que emplean tablas como la t de Student o tablas elaboradas
especialmente para este efecto, como las de Dunnett o las de Tuckey.
9.3 Pasos
La prueba de Dunnett para las comparaciones de medias se puede realizar ya a partir

de un diseño completamente al azar DCA, diseño de bloques al azar DBA o un diseño
cuadrado latino DCL, la prueba se realiza en seis pasos.
En esta prueba se establece previamente un patrón o testigo para compararlo con los
otros niveles del factor de interés.
9.3.1 Verificar si el ANDEVA es significativo
Luego de realizado el experimento y los cálculos del análisis de varianza, se

comprueba a través de la hipótesis principal (factor de interés), si existen diferencias
significativas entre la variable respuesta sobre el efecto del factor de interés.
Se descarta Ho si Fc ≥ Fa,gln,gld
9.3.2 Calcular las medias de cada uno de los niveles
Se calculan cada una de las medias de los niveles del factor de interés de acuerdo al
modelo utilizado para realizar el experimento.
Y se colocan en orden ya ascendente o descendente.
Ӯi. = ∑Ӯi.
n
232
9.3.3 Formular las hipótesis y la regla de decisión
Calculadas las medias de los niveles del factor de interés, se formula la hipótesis de
interés y la regla de decisión de la diferencia entre las medias y medir la diferencia
significativa entre estas.
∫ yi− yk ∫ ¿ CDU
Descartar Ho si:
9.3.4 Calcular el comparador Dunnett
Para calcular el comparador de Dunnett existe una fórmula específica para cada diseño
experimental, veamos.
Para un DCA:
2 CMEE
 Balanceado: DU =d ¿ (k−1, glee )
√ n
1 1
 No Balanceado: DU =d ¿ (k −1, glee ) CMEE∗ n + n
i j √ ( )
glee = grados de libertad del error
n= número de observaciones por nivel
Para un DBA:
2 CMEE
DU =d ¿ (k−1, glee )
√ n
n= número de bloques
Para un DCL y DCGL:

2 CMEE
DU =d ¿ (k−1, glee )
√ t
233
t= número de letra latina o letras griegas.
Donde la constante se encuentra en la tabla de distribución de Dunnett para la

comparación de medias, (tabla en el apéndice).
9.3.5 Calcular la diferencia de las medias y compararlas con el

comparador de Dunnett
Luego de calcular el comparador de Dunnett y teniendo el valor de las medias, se

calcula la diferencia de las medias y se compara con el comparador.
9.3.6 Conclusión
Al final el resultado demuestra que si la diferencia entre las medias es mayor que el
comparador de Dunnett existen diferencias en la variable respuesta sobre el efecto de
los noveles del factor de interés.
9.4 EJEMPLO. RESISTENCIA AL CEMENTO
Se está estudiando la resistencia a la tensión de cemento Portland. Cuatro técnicas de

mezclado pueden ser usadas económicamente. Se han recolectado los siguientes
datos:
Técnica Resistencia a la tensión (lb/plg 2) Total Promedio

de
mezclado
1 3129 3000 2865 2890 11884 2971
2 3200 3300 2975 3150 12625 3156,25
3 2800 2900 2985 3050 11735 2933,75
4 2600 2700 2600 2765 10665 2666,25
Luego de haber realizado el experimento y el desarrollo de los procesos del diseño

experimental, incluyendo el análisis de varianza y este ha demostrado que Fc posee un
valor significativo se puede aplicar la Prueba de Dunnett.
9.4.1.1 Verificar si el ANDEVA es significativo.
234
Comparando el cálculo de la Fc con F crítico para rechazar o aceptar la hipótesis
principal.
Se descarta Ho si Fc ≥ Fa,gln,gld
Cálculo de la ANDEVA
Origen SC GL CM Fc F crítico
Técnicas de 489740.188 3 163246.7 12.7281075 3.49029482
mezclado 29
EE 153908.25 12 12825.68
75
Total 643648.438 15
Conclusión del experimento: Fc>F crítica, concluimos entonces que existen

diferencias significativas en la resistencia a la tensión del cemento Portland debido a
las técnicas de mezclado.
Al verificar el cálculo de la ANDEVA notamos que si existen diferencias significativas,

por lo que el experimento permite realizar la prueba de Dunnett.
9.4.1.2 cálculo de las medias de los niveles del factor de interés.
Y colocarlas de manera descendente.
Y 4 =2666 . 25
Y 3 =2933 .75
Y 1 =2971
H o : u2 =u 4
Y 2 =3156 .25
H 1 : u2 ≠u4
9.4.1.3 Formular la hipótesis y la regla de decisión
H o : u1 =u 4
H 1 : u1 ≠u4
235
H o : u3 =u 4
H 1 : u3 ≠u4
Descarta Ho si ∫ yi− yk ∫ ¿ CDU
9.4.1.4 calcular el comparador de Dunnett
2 CMEE
CDunnet =d ¿ (k−1 ,f )
n √2(12825.68)
CDunnet =d 0 .05,(3,12)
4 √
CDunnet=2.14
9.4.1.5 calcular las diferencias entre las medias y compararlas con el

comparador de Dunnett
¿ Ȳ 2−Ȳ 4 /¿ 490≻214 . 61
¿ Ȳ 1−Ȳ 4 /¿304 . 75≻214 .61
¿ Ȳ 3−Ȳ 4 /¿ 267 .5≻214 .61
9.4.1.6 Conclusión
236
En base a los resultados obtenidos podemos concluir que existen diferencias
significativas en la resistencia a la tensión del cemento Portland, al comparar las
técnicas de mezclado (1, 2, 3) con la técnica de mezclado 4 (patrón).
9.4.2 EJEMPLO. PLANTAS
Una empresa tiene cuatro plantas y sabe que la planta A satisface los requerimientos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes.
Los resultados de los experimentes se presentan en la siguiente tabla.
Plantas Contaminantes Total Promedi

o
A 1,65 1,72 1,50 1,35 1,60 7,82 1,56
B 1,70 1,85 1,46 2,05 1,80 8,86 1,77
C 1,40 1,75 1,38 1,65 1,55 7,73 1,55
D 2,10 1,95 1,65 1,88 2,00 9,58 1,92
9.4.2.1 Verificar si el ANDEVA es significativo.
Cálculo de la ANDEVA
Origen SC GL CM Fc F crítico
Plantas 0,470255 3 0,1567 5.1708 3.2040
EE 0,48504 16 0,0303
Total 0,955295 19
Conclusión del experimento: Fc>F crítica, concluimos entonces que existen

diferencias significativas en el nivel de contaminación de las diferentes plantas.
Al verificar el cálculo de la ANDEVA notamos que si existen diferencias significativas,

por lo que el experimento permite realizar la prueba de Dunnett.
237
9.4.2.2 Cálculo de las medias de los niveles del factor de interés.
Y colocarlas de manera descendente.

Y C =1 .55
Y A =1. 56
Y B =1. 77
Y D=1 .92
9.4.2.3 Formular la hipótesis y la regla de decisión
H o : u D = uC
H 1 : u D≠uC
Descarta Ho si ∫ yi− yk ∫ ¿ CDU
H o : u B =uC
H 1 : uB ≠uC
H o : u A =uC
H 1 : u A ≠uC
9.4.2.4 Calcular el comparador de Dunnett
1 1
√
CDunnet=d ¿ (k −1, glee) CMEE∗
( )+
ni n j
1 1
√
CDunnet=d 0 . 05( 3 ,16 ) 0 . 0303∗ +
CDunnet = 0.30068
( )
5 4
238
9.4.2.5 calcular las diferencias entre las medias y compararlas con el
comparador de Dunnett.
¿ Ȳ D−Ȳ A /¿ 0 .36≻0 .30068

¿ Ȳ B−Ȳ A /¿ 0. 21≻0 . 30068
¿ Ȳ C−Ȳ A /¿ 0 . 01≻0 . 30068
9.4.2.6 Conclusión
En base a los resultados obtenidos podemos concluir que existen diferencias

significativas en la planta D debido a los niveles de contaminación y en las plantas C,B
no hay diferencia significativa, todos estos comparados con el patrón que es la fabrica
A que cumple con los requerimientos establecidos.
239
CAPÍTULO 10
10. DISEÑO COMPLETAMENTE AL AZAR DE 2 FACTORES

10.1 Definición
.En los capitulo anteriores pudimos observar paso a paso como se utiliza el Diseño
Completamente al Azar para realizar diseño de experimentos para una sola variable.
En este capítulo veremos cómo se puede realizar un Diseño Completamente al Azar

pero para dos factores. En general, el procedimiento utilizado en un experimento DCA
de dos factores es muy similar al utilizado en un DCA de un factor.
El tipo más simple de experimento factorial comprende solamente dos factores, los
cuales serán denotados por A y B.
En este modelo los datos de muestra son clasificados en función de dos variables
aleatorias independientes (factores).
10.2 Generalidades
En general, el procedimiento utilizado en un experimento DCA de dos factores es muy

similar al utilizado en un DCA de un factor.
Es de importancia considerar si el experimento comprende un modelo de efectos fijos,

aleatorios o mixtos. Los cuadrados medios deben examinarse a fin de determinar las
estadísticas de pruebas adecuadas.
10.3 Pasos
A continuación explicaremos paso a paso como se debe realizar un Diseño

Completamente al Azar de dos factores correctamente.
10.3.1. Definición del Problema
Este es el primer paso, del diseño y consiste en los siguientes puntos:
 Definición del Problema: Consiste en determinar si hay diferencias

significativas en la variable de respuesta de acuerdo a los factores A y B.
 Variable de Respuesta: Es la característica, variable o salida o propiedad, cuyo

valor interesa medir para mejorar el desempeño de un proceso.
240
 Factor A: Variable experimental independiente. Cuyo efecto sobre la variable
de respuesta es de particular interés para el experimentador.
 Factor B: Variable experimental independiente. Cuyo efecto sobre la variable

de respuesta es de particular interés para el experimentador.
 Niveles: Es la intensidad asignada a un factor. Es decir los tipos o grados

específicos del factor que tendrán en cuenta en la realización del experimento.
 Unidad Experimental: Es el objeto o sujeto sobre el cual se medirá la

variable de respuesta.
Yijk = es la k-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel del
factor B.
μ = promedio total
Ai = efecto del i-ésimo nivel del factor A.
Bj = efecto del j-ésimo nivel del factor B.
(AB)ij = efecto de la interacción entre los factores Ai y Bj.
εijk = error experimental
10.3.3 Formulación de la hipótesis

241
Para formular la hipótesis de un DCA de dos factores se deben tomar en cuenta un
aspecto muy importante, y es si los factores del experimento del problema son fijos,
aleatorios o mixto.
Si ambos factores son fijos
Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.
 En el caso del factor A
H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente
La regla de decisión para esta hipótesis del factor A:
Se descarta H0, si Fc > F , a-1, ab(n-1)
 Igualmente se hace con el factor B
H o : μ1 =μ2 =. .. .. . .. . μ a
La regla de decisión para esta hipótesis del Factor B:
Se descarta H0, si FC > F , b-1, ab(n-1)
 Y finalmente la hipótesis para la interacción de AB
H o : μ11 =μ12=... .. . .. . μ ab
La regla de decisión para la Interaccion AB:
Se descarta H0 si, Fc  F, (a-1) (b-1), ab(n-1)
Si ambos factores son aleatorios:
242
 En el caso del factor A
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
Se descarta H0, si Fc > F , a-1, (a-1)(b-1)
 Igualmente se hace con el factor B
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
Se descarta H0, si FC > F , b-1, (a-1)(b-1)
H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 2ab

La regla de decisión para la Interacción AB:
Si un factor es aleatorio y el otro fijo, es decir mixto:
 En el caso del factor A (fijo)
243
H o : μ1 =μ2 =. .. .. . .. . μ a
Se descarta H0, si Fc > F , a-1, (a-1)(b-1)
 Igualmente se hace con el factor B (aleatorio)
H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
Se descarta H0, si FC > F , b-1, ab(n-1)
H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 2ab

La regla de decisión para la Interacción AB:
Para las reglas de decisión los valores de F deben ser calculados con las tablas de
Fisher y los grados de libertad calculados dependiendo del caso.
10.3.4 procedimiento de aleatorizacion
Se utiliza para validar la estimación de la variancia del error experimental. Consiste en

aplicar en forma aleatoria los tratamientos a las unidades experimentales. La
244
aleatorización tiende a promediar entre los tratamientos cualquier efecto sistemático
presente de forma que las comparaciones entre tratamientos midan sólo los efectos de
los tratamientos mismos.
• Codificar las unidades experimentales.
• En este diseño existirán abn observaciones, por lo tanto se buscan esta totalidad
de números aleatorios y las pruebas o unidades experimentales se enumeran en
orden aleatorio.
• En este diseño existe ab combinaciones de niveles, por lo tanto estas

combinaciones son asignadas a las pruebas o unidades experimentales
previamente aleatorizadas
• Luego se procede a realizar las mediciones de acuerdo a esta planificación
10.3.5. Registro de datos
En un Diseño Completamente al Azar de dos factores, ya sea Y ijk la respuesta

observada cuando el factor A tiene el nivel i-ésimo (i=1,2,3…..,a) y el factor B tiene el
nivel j-ésimo (j=1,2,3….,b). En general, el experimento factorial de dos factores
aparece en la tabla 10.1. El orden en que se hacen las abn observaciones se
seleccionar al azar.
245
Tabla 10.1 Arreglo General de un diseño completamente al azar de dos factores.
Tabla 10.2 Resumen de Registro de Datos
Observamos la distribución de el factor A con el i-ésimo nivel y el Factor B con el j-

ésimo nivel y ambos forman el conjunto Y ij el cual nos da la combinación toral d e
los factores que influyen en el proceso de el experimento. De esa manera el factor
A representa las filas las cuales se suman horizontalmente y nos da el total de las
246
Yi , mientras que el factor B representa las columnas, por ellos se suman
verticalmente los datos dándonos el total de los Y j. Así tenemos el resumen de
nuestros datos de manera ordenada y entendible para realizar nuestro experimento
como se ve en la Tabla 10.2.
10.3.6 ANDEVA
Para calcular el Fc y poder comparar el resultado con el F utilizamos el análisis de

varianzas. De esta manera a través de la regla decisión se puede concluir si las
hipótesis de descartan o no.
Para el análisis de varianza (ANDEVA) de un Diseño completamente al azar de dos

factores, se utiliza el siguiente cuadro:
Fuente de gl Suma de Cuadrado medio

Variacion cuadrados
Factor A a-1 SCA SCA/(a-1)
Factor B b-1 SCB SCB/(b-1)
Interaccion AB (a-1)(b-1) SCAB SCAE/(a-1)(b-1)
Entre ab-1 SCComb SCCokmb/(ab-1)

combinaciones
de niveles
(COMB)
Error ab(n-1) SCEE SCE/ab(n-1)

Experimental
(EE)
Total (To) abn-1 SCTo
Donde las formulas para calcular la suma de cuadrado es:

a
1 2 2
SCA = bn ∑ Y i . . −Y . .. ¿ abn
i=1
a
1
SCB = an ∑ Y 2. j.−Y 2. . . ¿ abn
i=1
a b 247
SCComb=1 n ∑ ∑ Y 2ij. −Y 2. .. ¿ abn

i=1 j=1
SCAB=SCComb−(SCA+SCB)
SCEE=SCTo−SCcom
a b n
SCT 0 =∑ ∑ ∑ Y 2ijk−Y 2. . . ¿ abn
i=1 j=1 k=1
Finalmente para calcular la Fc, dependiendo si el diceno es de factores fijos, aleatorios

o mixtos, se utilizan las siguientes formulas:
Fuente de Fcalculada para Fcalculada para Fcalculada para

Variación Factores Fijos factores factores mixtos
aleatorios
Factor A CMA/CME CMA/CMAB CMA/CMAB
Factor B CMB/CME CMB/CMAB CMB/CME
Interacción AB CMAB/CME CMAB/CME CMAB/CME
De esta manera si, al obtener el Fcalculada se debe comparar con la F y así llegar a
concluir a través de las reglas de decisiones si las hipótesis se cumplen o no, y si los
factores tienen efectos significativos sobre la variable de respuesta.
10.3.7. Conclusiones
Se recomienda:
Decidir que medidas implementar para generalizar el resultado del estudio y garantizar
que los mejores se mantengan.
Por lo tanto para un Diseño Completamente al Azar de dos factores se debe tener en
cuenta cada factor con su interacción como se ve descrita en la formulación de
hipótesis con su respectiva regla de decisión.
248
Para Factor A, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor A son
significativos sobre la variable de respuesta
Para Factor A, Fc < Fa se acepta Ho. Se concluye que los efectos del factor A no
son significativos sobre la variable de respuesta.
Para Factor B, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor B son
significativos sobre la variable de respuesta
Para Factor B, Fc < Fa se acepta Ho. Se concluye que los efectos del factor B no
son significativos sobre la variable de respuesta.
Para la interacción, Fc < Fa se acepta Ho. Se concluye que los efectos de la

interacción no son significativos sobre la variable de respuesta.
Para la interacción, Fc > Fa Se rechaza H0. Se concluye que los efectos de la

interacción son significativos sobre la variable de respuesta.
s² = CMEE
Variabilidad es como decir varianza. La varianza es, pues, una medida de la

diseminación o dispersión de las puntuaciones, que expresa el grado en que las
puntuaciones de los sujetos de un grupo difieren entre sí.
10.3.9. Intervalos De Confianza
Cálculo del Intervalo de Confianza del 100( 1 – α) % para la Media μi del i-ésimo nivel
del factor A, Media μj del j-ésimo nivel del factor B de un Diseño Completamente al
Azar de dos factores.
Factor A------------ IC μi = y i.±t α /2 ,k( n−1) √ CMEE/n
Factor B-----------
IC μj = y j.±t α /2 ,k (n−1) √ CMEE/n
249
10.3.10 Comparaciones Múltiples
Cuando las medias de los renglones o columnas difieren, por lo general es de interés
hacer comparaciones entre las medias individuales de los renglones o columnas para
descubrir diferencias específicas.
El procedimiento es el mismo que el desarrollado para un solo factor.
Cuando la interacción es significativa, las comparaciones entre las medias de uno de

los factores pueden ser AB.
Una forma de manejar esta situación es fijar un nivel de B y aplicar la prueba a las
medias del factor A con ese nivel.
Las pruebas que se pueden realizar para esto son: Prueba de Duncan, prueba Tukey y
la Newman Keuls, que a continuación explicaremos como realizar en las DCA de dos
factores.
Prueba Duncan
Anteriormente pudimos observar cómo utilizar el método de Duncan, a continuación

volveremos a mencionar brevemente los pasos para realizar la prueba Duncan para
DCA de dos factores.
• Verificar que el análisis de varianza en la interacción sea

significativo.
• Fijar al azar un nivel de cualquiera de los 2 factores y aplicar la

prueba a las medias del nivel del otro factor
• Calcular las medias.
• Elaborar el cuadro de rangos múltiples
• Plantear las hipótesis y las regla de decisión respectiva
• Se descarta Ho si │yi-yj│≥ Comparador Duncan
• Cálculo de los Comparadores Duncan (CD).
CD=Dα ,numdemedias, glee S ȳ

250
CMEE
S ȳ =
√ n
• Comparar las diferencias de medias con el valor del CD

respectivo.
• Conclusión
Para las pruebas Tukey y Newwman Keuls se siguen los mismos criterios que en la
prueba Duncan.
10.4 EJEMPLOS. DISEÑO DE UNA BATERÍA
Considere el caso en que un ingeniero diseña una batería para su uso en un dispositivo
que será sometido a ciertas variaciones extremas de temperatura. El único parámetro
de diseño que él puede seleccionar en este punto es el material de la cubierta de la
batería y tiene tres alternativas.
Cuando el dispositivo se manufactura y se envía al campo, el ingeniero no tiene control

sobre los extremos de temperatura a que será expuesto el dispositivo, y sabe por
experiencia que es probable que la temperatura influya en la duración efectiva de la
batería. Sin embargo, es posible controlar la temperatura en el laboratorio de
desarrollo de productos para los fines de ensayo.
Decide probar los tres materiales de la cubierta a tres niveles de temperatura (15, 70 y
125 F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías
a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se
ejecutan al azar.
El ingeniero decide probar los tres materiales de la cubierta a tres niveles de

temperatura (15, 70 y 125 F) consistentes en el entorno de uso final del producto. Se
prueban cuatro baterías a cada combinación de material de la cubierta y temperatura, y
las 36 pruebas se ejecutan al azar.
Factor A. Tipo de Material
251
Factor B: Temperatura
Variable de Respuesta: Duración (en horas)
1. Qué efecto tienen el tipo de material y la temperatura sobre la duración de las

baterías
2. Existe una elección del material que de por resultado una duración uniformente
larga sin importar la temperatura?
Determinar el efecto que tiene el tipo de material y la temperatura sobre la duración

efectiva de las baterías.
O también,
Determinar el efecto de los tres materiales de la cubierta de las baterías y la aplicación

de tres niveles de temperatura (15, 70 y 125 F) sobre la duración efectiva de las
baterías.

Y ijk =μ +Α i +Β j +( AB)ij +ε ijk
i=1. . .. .3
j=1. .. .. 3
k =1. .. . . 4
Yijk = es la k-ésima duración efectiva de las baterías para el i-ésimo tipo de material y la
j-ésima temperaura
μ = promedio de la duración efectiva de las baterías
Ai = es el efecto del i-ésimo tipo de material
Bj = es el efecto de la j-ésima temperatura
(AB)ij = es el efecto de la interacción entre el tipo de material (A i) y la temperatura (Bj)
252
10.4.1.3 Hipótesis
 Factor A (Tipo de Material)
H0: u1= u2 = u3
RD: se descarta H0 si Fc ³ F0.05, 2, 27 = 3.35
gln = a-1 = 3-1 = 2
gld = ab(n-1) = 3*3(4-1)= 27
 Factor B (Temperatura)
H0: u1= u2 = u3
gln = b-1 = 3-1 = 2
gld = ab(n-1) = 3*3(4-1)= 27
 Interacción AB
H0: u11= u12 =...= u33
gln = (a-1)(b-1) = (3-1)(3-1) = 4
gld = ab(n-1) = 3*3(4-1)= 27
253
Unidad Orden Asignación
Experimental Aleatorio
1 10 a1b1
2 1
3 11
4 20
10.4.1.4 Aleatorización
5 16 a1b2
6 14
7 19
8 25
9 22 a1b3
10 36
11 30
12 27
13 34 a2b1
14 2
15 26
16 24
17 4 a2b2
18 6
19 7
20 5
21 35 a2b3
22 13
23 18
24 21
25 31 a3b1
10.4.1.5 26 9 Registros de
Datos 27 28
28 33
29 23 a3b2
30 8 254
31 15
32 17
Datos de duración (en horas) para el ejemplo de diseño de una batería
FACTORES Temperatura
15 70 125
Tipo 1 130 34 20
74 80 70
155 40 82
180 75 58
de 2 150 126 25
159 122 70
188 106 58
126 115 45
Material 3 138 174 96
168 150 104
110 120 82
160 139 60
Tabulamos los datos, sumando las observaciones en cada uno de los factores y
calculando los totales por filas y columnas (factor A y factor B).
TIPO DE Temperatura TOTALES

MATERIAL
15 70 125
1 539 229 230 998
2 623 469 198 1290
3 576 583 342 1501
TOTALES 1738 1281 770 3789
Igualmente con los promedios de los factores.
TIPO DE MATERIAL TEMPERATURAS DURACION

PROMEDIOS/TIPO
15 70 125 DE MATERIAL
1 134.75 57.25 57.5 83.17
2 155.75 117.25 49.5 107.5
3 144 145.75 85.5 125.08
DURACION 144.83 106.75 64.17 105.25
PROMEDIO
255
/TEMPERATURA
Podemos resumir todos estos cálculos en un solo cuadro que nos facilitará el
cálculo del ANDEVA.
FACTORES Temperatura TOTALES/TIPO DE

MATERIAL
15 70 125 998
Tipo 1 130 34 20
74 80 70
155 40 82
180 75 58
suma 539 229 230
medias 134.75 57.25 57.5 83.16666667
de 2 150 126 25 1290
159 122 70
188 106 58
126 115 45
suma 623 469 198
medias 155.75 117.25 49.5 107.5
Materi 3 138 174 96 1501
al
168 150 104
110 120 82
160 139 60
suma 576 583 342
medias 144 145.75 85.5 125.0833333
TOTALES/TEMP 1738 1281 770 3789
ERATURA
10.4.1.6 Verificación de los supuestos del modelo
256
Descriptivos
Estadístico Error típ.
Duracion Media 105.2500 7.82420
Intervalo de confianza para la media al 95% Límite inferior
89.3660
Límite superior 121.1340
Media recortada al 5% 105.4630
Mediana 108.0000
Varianza 2203.850
Desv. típ. 46.94518
Mínimo 20.00
Máximo 188.00
Rango 168.00
Amplitud intercuartil 77.25
Asimetría -.056 .393
Curtosis -1.026 .768
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-
Wilk
Estadístico gl Sig.
Estadístico gl Sig.
Duracion .106 36 .200* .969 36
.396
a. Corrección de la significación de
Lilliefors
*. Este es un límite inferior de la
significación verdadera.
10.4.1.7 ANDEVA
Fuente de SC gl CM Fc Pvalue Fcritico

Variación
Tipo de 10633 2 5317 7.983 0.0019 3.354
257
Material(A)
Temperatura( 39083 2 19542 29.34 2E-07 3.354
B)
Interacción(A 9437.7 4 2359 3.543 0.019 2.728
xB)
EE 17981 27 666
Totales(To) 77135 35
Se realiza el análisis de varianza con las formulas anteriormente mencionadas y con
ayuda de los datos calculados al momento del registro de datos.
 Para tipo de material, Fc=7.91 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos del tipo material son significativos sobre la duración promedio de las
baterías.
 Para temperatura, Fc=28.97 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos de la temperatura son significativos sobre la duración promedio de las
baterías.
 Para la interacción, Fc=3.56 > Fa=2.73 \ Se rechaza H0. Se concluye que los
efectos de la interacción entre el tipo de material y la temperatura son
significativos sobre la duración promedio de las baterías.
10.4.1.9 Calculo de los parámetros
μ=3799 /36=105 .33
10.4.1.10 Coeficiente de Determinación
R2 = (SCAB + SCA + SCB)/SCTO
R2 = 59416.22/77646.97=0.765= 77%
El 77% de la variabilidad en la duración efectiva de las baterías se explica por la

temperatura, tipo de material y por la interacción entre el tipo de material y la
temperatura.
258
10.4.2 EJEMPLO. QUALITY CONTROL 2 = CMEE= 675.21
En un artículo publicado en Industrial Quality Control (1956, pp 5-8) se describe un
experimento para investigar el efecto del tipo de vidrio y el tipo de fósforo sobre la
brillantez de un cinescopio de televisor. La variable de respuesta es la corriente
necesaria (en microamperes) para obtener un nivel de brillantez especificado. Los
datos son como sigue:
Tipo de Vidrio Tipo de Fósforo

1 2 3
1 280 300 290
290 310 285
285 295 290
2 230 260 220
235 240 225
240 235 230
Factor A: Tipo de Vidrio
Factor B: Tipos de Fósforo(aleatorio)
Variable de Respuesta: Corriente necesaria para obtener un nivel de brillantez

específico.
1. Definición del Problema
Determinar el efecto que tiene el tipo de vidrio y fósforo sobre la corriente necesaria
para obtener un nivel de brillantez específico.
Y ijk =μ +Α i +Β j +( AB)ij +ε ijk

i=1. . .. .3
j=1. .. .. 2
k =1. .. 3
Yijk = es la k-ésima corriente necesaria para obtener un nivel de brillantez específico
para el i-ésimo tipo de vidrio y el j-ésimo tipo de fósforo
μ = promedio de la corriente necesaria para obtener un nivel de brillantez

específico.
259
Ai = es el efecto del i-ésimo tipo de vidrio
Bj = es el efecto del j-ésimo tipo de fósforo
(AB)ij = es el efecto de la interacción entre el tipo de vidrio (A i) y tipo de fósforo (Bj)
10.4.2.3 Hipótesis
Vidrio (A)
H o : μ1 =μ2 =. μ 3
RD: se descarta H0 si FC > F0.05,3.89
gln: a-1 = 3-1 = 2
gld: ab(n-1) = 3*2(3-1) = 12
Operador (B)
H 0 : σ 12=σ 22
gln: b-1 = 2-1 = 1
gld: ab(n-1) = 3*2(3-1) = 12
Interacción (AB)
H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 243
260
gln: (a-1)(b-1) = 2*1 = 2
gld: ab(n-1) = 3*2(3-1) = 12
Tipo de Vidrio Tipo de Fósforo

1 2 3
1 280 300 290
290 310 285
285 295 290
2 230 260 220
235 240 225
240 235 230
Tipos de Fósforo Totales

Tipos de Vidrio 1 2 3
1 855 905 865 2625
2 705 735 675 2115
Totales 1560 1640 1540 4740
10.4.2.6 Verificación de Supuestos
Normalidad
Ho: Los datos se distribuyen normalmente
H1: Los datos no se distribuyen normalmente
Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk
261
Estadístic gl Sig. Estadístic gl Sig.
o o
Corriente .263 18 .002 .837 18 .005
De acuerdo a la Prueba de Shapiro-Wilk se observa que el p-value es menor a 0.05

que el nivel de significancia, por lo tanto se acepta la hipótesis nula y se concluye que
los datos no presentan una distribución normal.
Gráficamente se concluye que las observaciones de las corrientes necesarias para

obtener un nivel de brillantez específico no se distribuyen normalmente, ya que el
gráfico presenta aproximadamente una curva.
Independencia
Gráficamente se concluye que las

observaciones de las corrientes
necesarias para obtener un nivel de
brillantez específico están
correlacionadas ya que el gráfico no
presenta ninguna tendencia.
Homocedasticidad
262
H o =σ 12=σ 22=σ 23 =σ 24 . .. .. σ 218
H1: Al menos una varianza es diferente.
Tanto la prueba de Levene como

la de Barlett indican que la
varianza de los tipos de vidrios y
los tipos de fósforos son iguales
con respecto a la corriente para
obtener un nivel de color
específico.
10.4.2.7 Análisis de Varianza
Análisis de varianza para Corriente, utilizando SC ajustada para pruebas
Fuente GL SC sec. SC ajust. MC ajust. F P
A 2 1911.1 1911.1 955.6 1.10 0.363
B 1 800.0 800.0 800.0 0.92 0.355
A*B 2 700.0 700.0 350.0 0.40 0.676
Error 12 10383. 10383.3 865.3
Total 17 13794.4
263
Para los tipos de vidrio: dado que F C = 1.19 > Fcrítica = 0.363, se Rechaza Ho y se
concluye que hay efecto significativo en la corriente necesaria para obtener un nivel de
brillantez específico de acuerdo al tipo de vidrio.
Para los operarios: dado que F C = 0.92 > Fcrítica = 0.355, se rechaza Ho y se concluye que
hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido al tipo de fósforo.
Para la interacción: dado que F C = 0.40 < Fcrítica = 0.675 , se acepta Ho y se concluye que
no hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido a la interacción entre los vidrios y los fósforos.
10.5 USO DE PROGRAMAS ESTADISTICOS
10.5.1 EXCEL
• Activar la aplicación de Excel en Windows
• Ingresar los datos obtenidos en el experimento en una hoja de Excel.
• Hacer click sobre la opción “Herramientas” de la barra principal (ver barra

superior).
• Hacer click sobre la opción “Análisis de Datos...”, la cual generalmente es la

última opción de la caja desplegada.
• En la nueva ventana, seleccionar “Análisis de varianza de dos factores con

varias muestras por grupo” y hacer click sobre “Aceptar”
• La siguiente ventana abierta será completada con la información de los datos

previamente ingresados en la hoja de Excel.
• En la primera opción, “Rango de Entrada”, debemos definir el rango (celdas) en

las cuales fueron escritas las observaciones. Una forma sencilla de hacerlo es
sombrear el área de las observaciones arrastrando el mouse sobre ellas.
• En la segunda opción, “Fila por muestra”, se debe especificar el número de filas

que cada muestra posee.
264
• La tercera opción, “Alfa”, aparecerá predeterminada como 0.05, de ser
necesario un alfa diferente entonces hacemos el cambio escribiendo el nuevo
alfa en la casilla dada.
• En la parte inferior de la ventana están desplegadas las “Opciones de Salida”.

Aparecerá predeterminada la opción “En una hoja nueva”, lo que significa que
el ANDEVA será presentado en una hoja diferente a la hoja que contiene las
observaciones.
• Finalmente, hacer click en en botón de “Aceptar” y el análisis será presentado en

la nueva hoja.
265
266
10.5.2 MINITAB
• Activar la aplicación de Minitab en Windows

• Hacer click sobre la opción “Estadística” de la barra principal (ver barra superior).
• Hacer click sobre la opción DOEFACTORIALCREAR DISEÑO FACTORIAL
 En la primera opción, “Diseño Factorial completo General”, debemos definir el

número de factores como es de 2 factores serían dos.
267
• En la segunda opción, “Diseño”, se debe especificar el número de niveles que
posee ambos factores tanto el A como el B.
• La tercera opción, “Número de Réplicas”, será el total de interacciones
correspondientes en el factor A y B.
• Finalmente, hacer click en en botón de “Aceptar”.
268
PARA LOS SUPUESTOS Y ANÁLISIS DE VARIANZA
• Estadística  DOEFACTORIAL Analizar Diseño Factorial Gráficas-

Normalidad, Residuo vs Orden, Residuo vs Ajustes- Aceptar.
• Al hacer Click en Aceptar se despliegan todas las tablas y gráficos necesarios al
análisis de Varianza de Dos Factores.
269
270
10.5.3 PASW
Al abrir PASW, lo primero que se debe hacer es definir las variables.
271
 En PASW las variables no se aleatorizan como en MINITAB, es por eso que al
insertar los datos se debe insertar cada uno de los valores de las variables,
aunque se repitan, especialmente en los casos en los que son 2 muestras o más
por factor.
 Para calcular el ANDEVA, una vez se han insertado los datos en el programa,
los pasos que se deben seguir son:
 Menú ANALIZAR, Modelo lineal general, Univariante
 En el cuadro que aparece, colocamos la variable de respuesta en el cuadro de

las variables dependientes. Y seleccionamos los otros dos factores y los
colocamos en el cuadro de variables aleatorias. (si son fijos se colocan en
variables fijas).
 Del lado derecho del cuadro, seleccionamos la opción: MODELO ->
PERSONALIZAR.
 En el cuadro derecho podremos observar las diferentes variables que
anteriormente identificamos, pasamos el factor A y el factor B al cuadro de la
derecha.
 Seleccionamos la opción, Interacción. Y luego seleccionamos el factor A y B al
mismo tiempo y los colocamos en el cuadro derecho. Aceptar.
Para verificar el supuesto de normalidad, los pasos son:
 ANALIZAR -> ESTADISTICOS ESTADÍSTICOS -> EXPLORAR

 Seleccionamos la variable de respuesta como variable dependiente.
 Seleccionamos la opción AMBOS (para obtener resultado gráfico y analítico)
272
 Aceptar.Para el resto de los supuestos, se recomienda utilizar otros
programas como MINITAB.
CAPÍTULO 11
11. DISEÑO DE BLOQUES AL AZAR DE 2 FACTORES

11.1 Definición
.Algunas veces no es posible hacer la aleatorización completa de todas las corridas de

un diseño factorial. La presencia de un factor perturbador puede hacer necesario que el
experimento se realice en bloques.
Ya se han analizado los conceptos para la formación de bloques con un solo factor. En
este capítulo se presenta como realizar la formación de bloques en un diseño factorial.
11.2 Generalidades
273
El experimento tiene dos factores que se denominarán A y B , los cuales tendrán a y b
niveles respectivamente. Por lo tanto existirán ab combinaciones de niveles
Los factores podrán ser todos fijos o todos aleatorios o la combinación de ambos
Se consideran n bloques
Cada una de las combinaciones de niveles de los factores se asigna a cada uno de los
bloques. Por lo tanto existirán a*b*n observaciones en total en el experimento.
11.3 Pasos
11.3.1 Definición del problema
Determinar si existe diferencia altamente significativa en la variable de respuesta
promedio en un experimento usando el factor de interés A y B para el número de
bloques diferentes.
11.3.2 Modelo estadístico
Y ijk =μ +A i +B j +( AB)ij +δ k +ε ijk

i=1,2,....,a
j=1,2,.....,b
k=1,2,.....,n
Yijk es la observación del k-ésimo bloque para el i-ésimo nivel del factor A y el j-
ésimo nivel del factor B
Ai es el efecto del i-ésimo nivel del factor A
Bj es el efecto del j-ésima nivel del factor B
(AB)ij es el efecto de la interacción entre el factor A y el factor B
dk es el efecto del k-ésimo bloque
274
eijk error experimental.
11.3.3 Formulación de Hipótesis para el modelo
PARA EL FACTOR A:
Ho: m1= m2 ........... = ma
Hi : al menos una de las mi es distinta a 0
PARA EL FACTOR B:
Ho: m1= m2 ........... = mb
Hi : al menos una de las mj es distinta a 0
INTERACCIÓN AxB:
Ho: m11= m21 ........... = mab
Hi : al menos una de las mijes distinta a 0
BLOQUES:
Ho: m1= m2 ........... = mn
Hi : al menos una de las mk es distinta a 0
Regla de decisión
SE RECHAZA Ho SI FC > Fa,gln,gld
gln grados de libertad del numerador
gld = grados de libertad del denominador
 Para ambos factores fijos

Grados de Libertad del Numerador
Factor A a-1
Factor B b-1
275
Interacción AxB( a - 1 ) ( b - 1 )
Bloques (n-1)
11.3.4 Proceso de Aleatorización
A cada uno de los bloques se le debe asignar cada una de las combinaciones de los
factores en forma aleatoria.
Combinaciones: A1B1 A1B2 A2B1…AaBb

bloques
1 A1B1 A1B2 A2B1 A2B2 AaBb
2 A1B2 A2B1 A2B2 AaBb A1B1
n A2B1 A2B2 AaBb A1B1 A1B2
11.3.5 Registro de datos
276
Y ijk Y ..k
277
Es importante tomar en cuenta a la hora de registrar los datos que el formato debe
contener quien hizo el reporte, la fecha de confección, el motivo, la unidad de medición
y el nombre de la empresa.
11.3.6 Hipótesis de los supuestos
11.3.6.1 Supuesto de Normalidad
H0: los datos presentan una distribución normal
H1: los datos no presentan una distribución normal
11.3.6.2 Supuesto de Homosedasticidad
2 2 2
H0: σ 11 = σ 12 = σ ab
11.3.6.3 Supuesto de independencia
En este supuesto sólo se analiza la gráfica del mismo.
Nota: los supuestos deben verificarse en los programas minitab y pasw. En la sección
de ejemplos del capítulo se presentan.
11.3.7 Análisis de varianza: ANDEVA
F.V. GL SC CM FC Fα,gln,gld
A a-1 1
a
SCA CMA F ∝´ (a-1)(ab-1)(n-1)
∑ Y 2 ..−Y 2…/abn
bn i=1 i a−1 CMEE
B b-1 1
b
SCB CMB F ∝´ (b-1)(ab-1)(n-1)
∑ Y 2 .. j −Y 2…/abn b−1 CMEE
an j=1
AB (a-1)(b-1) SCCN –(SCA+SCB) SC ( AB) CM ( AB) F ∝´ (a-1)(b-1)(ab-1)

( a−1 )( b−1) CMEE
(n-1)
278
Entre ab -1 1
a b
SCcomb . CMcomb F ∝´ (ab-1)(ab-1)(n-1)
∑ ∑ Y 2ij−Y 2…/abn CMEE
comb. n i=1 j=1 ( ab−1)
Entre n-1 1
n
SCBloq CMbloq F ∝´ (n-1)(ab-1)(n-1)
∑ Y 2..k −Y 2…/abn n−1 CMEE
bloque ab k=1
s
Error (ab-1)(n-1) SCTo-(SCComb. + SCEE
SCBloq) ( ab−1 )( n−1)
a b n
Total (abn-1)
∑ ∑ ∑ Y 2ijk−Y 2…/abn
i j k
11.3.8 Conclusiones
Con la evaluación de FC>Fα,gln,gld en el análisis de varianza podemos descartar o

aceptar H0 y concluir si existe diferencia significativa en las medias.
11.3.9 Cálculo de los Parámetros
Y…
μ=
abn
σ 2=C . M . E . E .
11.3.10 Coeficiente de Determinación
S .C .Comb .+ S . C . Bloques
R 2=
S . C . Totales
Mide o explica el % de la variabilidad de la Variable de Respuesta.
279
11.4 EJEMPLO. CAPACIDAD DE DETECTAR OBJETOS
Una Ingeniera Electrónica está estudiando diferentes métodos para mejorar la

capacidad de detectar objetos sobre la pantalla de un radar. Ella considera que los dos
factores más importantes son cantidad de ruido de fondo sobre la misma y el tipo de
filtro que se pone sobre la pantalla. Se diseña un experimento usando tres niveles de
ruido de fondo y dos tipos de filtro. El experimento se lleva a cabo eligiendo
aleatoriamente una combinación de tratamientos (nivel de ruido y tipo de filtro) e
introduciendo una señal que representa al objetivo en la pantalla del radar. La
intensidad del objetivo se incrementa hasta que el operador lo detecta. El nivel de
intensidad del objetivo se mide como la variable de respuesta. A causa de la
disponibilidad de los operadores, es conveniente seleccionarlo y mantenerlo en el lugar
del experimento hasta haber realizado todas las mediciones. Por otra parte, existen
diferencias en la capacidad y experiencia de los operadores. En consecuencia, resulta
lógico considerar a los operarios como bloques. Se eligieron cuatro operadores al azar.
Una vez que se elige al operador, el orden en el que se efectúan las combinaciones de
tratamientos es aleatorio.
tabla 11.4 nivel de intensidad en la detección de objetivos

operarios 1 2 3 4
tipo de filtro 1 2 1 2 1 2 1 2
nivel de ruido
bajo 90 86 96 84 100 92 92 81
mediano 102 87 106 90 105 97 96 80
alto 114 93 112 91 108 95 98 83
Determinar si existe diferencia significativa en el promedio de la intensidad de objetivo

utilizando tres niveles de ruido de fondo y dos tipos de filtrode acuerdo a cada una de
las condiciones del operario.
280
Y ijk =μ + A i + B j +( AB )ij + δ k +ε ijk
i=1,2,3
j=1,2
k=1,2,3,4
Yijk= es el nivel de intensidad en la detección de objetivos para el i-ésimo nivel de ruido

con el j-ésimo tipo de filtro para el k-ésimo operario.
ti = es el efecto del i-ésimo nivel de ruido
bj = es el efecto del j-ésimo tipo de filtro
dk = es el efecto del k-ésimo operario
(tb)ij= es el efecto de la interacción entre el tipo de filtro (ti) y el nivel de ruido (bj)
eijk = error experimental.
11.4.3 Hipótesis
Para los operarios
Ho: 1= 2 = 3= 4
Hi : al menos una de las k es distinta a 0
Regla de decisión: Se rechaza HO si FC > F0.01,3,15 = 5.42
281
Para el nivel de ruido
Ho: 1= 2 = 3
Hi : al menos una de las i es distinta a 0
Regla de decisión: Se rechaza HO si FC >F0.01,2,15 = 6.36
Para el tipo de filtro
Ho: 1= 2
Hi : al menos una de las j es distinta a 0
Regla de decisión: Se rechaza HO si FC >F0.01,1,15 = 8.68
InteracciónAxB:
Ho: 11= 21= ……….32
Hi : al menos una de las ijes distinta a 0
Regla de decisión: Se rechaza HO siFC > F0.01, 2, 15 = 6.36
Combinacion de tratamientos (AxB)

operadore A₁B₁ A₁B₂ A₂B₁ A₂B₂ A₃B₁ A₃B₂ Totales de
s operadore
s
1 90 86 102 87 114 93 Y..₁=572
2 96 84 106 90 112 91 Y..₂=579
3 100 92 105 97 108 95 Y..₃=597
4 92 81 96 80 98 83 Y..₄=530
282
Tipo De Filtro
nivel del 1 2 Yi..
Ruido
bajo 378 343 Y₁..=721
mediano 409 354 Y₂..=763
alto 432 362 Y₃..=794
Y.j. Y.₁.=1219 Y.₂.=1059 Y…=2278
11.4.6 Supuestos del modelo
Supuesto de Normalidad
H0: los datos presentan una distribución normal
H1: los datos no presentan una distribución normal
Gráfica de probabilidad de C7
Normal
99
Media 94.92
Desv .Est. 9.436
95 N 24
RJ 0.990
90
Valor P >0.100
80
70
Porcentaje
60
50
40
30
20
10
1
70 80 90 100 110 120
C7
De acuerdo a la gráfica los datos presentan una distribución normal.
Supuesto de Homosedasticidad
283
2 2 2
H0: σ 11 = σ 12 = σ ab
Supuesto de independencia
vs. orden
(la respuesta es C7)
5.0
2.5
Residuo
0.0
-2.5
-5.0
2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación
11.4.7 Análisis de varianza

Bloques 3 402.17 402.17 134.06 12.09 0.000
A 2 335.58 335.58 167.79 15.13 0.000
B 1 1066.67 1066.67 1066.67 96.19 0.000
A*B 2 77.08 77.08 38.54 3.48 0.058
Error 15 166.33 166.33 11.09
Total 23 2047.83
284
Analisis de varianza (Andeva) por calculadora
Factor de gl SC CM Fc Fα
variacion
nivel de Ruido 2 335.583 167.7815 15.13 6.36(**)
(factor A)
Tipo de filtro 1 1066.667 1066.667 96.19 8.68(**)
(factor B)
InteraccionAxB 2 77.083 38.5415 3.48 6.38
Entre 5 1479.333 295.867

combinaciones
de los niveles
operadores 3 402.167 134.056 12.09 5.42(**)
(bloques)
Error 15 166.333 11.089
Experimental
Totales 23 2047.333 **= son altamente significativas
11.4.8 Conclusiones
Para los factores
Se rechaza HO y se acepta H1; y se concluye que existe diferencia altamente

significativa en el nivel de intensidad promedio en la detección de objetivos en la
pantalla de un radar, para el nivel de ruido y para el tipo de filtro.
Para los operadores
285
Se rechaza HO y se acepta H1; y se concluye que existe diferencia altamente
significativa en el nivel de intensidad promedio en la detección de objetivos en la
pantalla de un radar, debido a la habilidad de los operadores.
INTERACCIÓN axb
Se rechaza H1y se acepta Ho; y se concluye que la interacción entre los niveles
de ruido y el tipo de filtro, no son altamente significativos en el nivel de
intensidad promedio en la detección en la pantalla de un radar.
11.4.9 Calculo de Parámetros
2278
µ¿ 24 = 94.917
σ 2= 11.089
1279.333+166.333
R 2= =80.4 %
2047.333
El 80.4 % de la variabilidad nivel de intensidad promedio en la detección en la pantalla

de un radar es explicada por el modelo.
286
CAPÍTULO 12
12. DISEÑO COMPLETAMENTE AL AZAR DE 3 FACTORES

12.1 Definición
Los diseños completamente al azar de tres factores, al igual que los DCA de dos
factores, son un conjunto de puntos experimentales que pueden formarse
considerando todas las posibles combinaciones de los niveles de los factores en cada
ensayo completo o réplica del experimento.
12.2 Generalidades
Algunas características de este modelo son:
 Flexibilidad: Cualquier número de tratamientos y cualquier número de

réplicas pueden ser usadas, siempre y cuando se tengan suficientes UE
homogéneas.
 Análisis Estadístico simple: el análisis estadístico es simple ya sea
cuando todos los tratamientos tengan igual número de réplicas
(balanceado), diferente número de réplicas (desbalanceado) o pérdida de
datos, caso en el cual se trata como un análisis desbalanceado.
 Se pueden estudiar los efectos de diversos factores en el mismo
experimento, por lo tanto son más eficientes, al igual que se puede
estudiar el efecto de cada factor en todos los niveles de los otros factores
y descubrir si determinado efecto, cambia o no al cambiar el otro.
También se puede estudiar las interacciones, que es el efecto conjunto de
dos o más factores combinados.
 Son necesarios cuando alguna interacción puede estar presente con el
propósito de evitar hacer conclusiones engañosas.
287
 Permiten estimar los efectos de un factor en diversos niveles de los otros
factores produciendo conclusiones que son válidas sobre toda la
extensión de las condiciones experimentales
12.3 Pasos
Consisten en una serie de puntos que se deben ir cumpliendo o realizando en un

respectivo orden, al igual que en los capítulos anteriores, a la hora de desarrollar un
problema de diseño completamente al azar de tres factores. Los mismos son
mencionados y explicados a continuación
12.3.1 Definición del problema

El objetivo fundamental de esta etapa es delimitar el problema de investigación, con
lo cual se logra tener claridad desde un comienzo de las dimensiones del estudio y
realizar una eficiente planeación de las etapas posteriores. En esta etapa se selecciona
la(s) variable(s) respuesta(s) o variable (s) dependiente(s). El experimentador debe
estar seguro que la respuesta que se va a medir realmente provee información útil
acerca de la investigación.
Paradefinir un problema de un DCA de tres factoresse debe identificar tres factores
que se denominarán A, B y C, los cuales tendrán a, b y c niveles respectivamente. Por
lo tanto existirán “abc” combinaciones de niveles.Los factores podrán ser todos fijos o
todos aleatorios o la combinación de ambos. Por cada combinación de niveles de los
factores se tomarán “n” observaciones. Por lo tanto existirán “abcn” observaciones en
total en el experimento.
12.3.2 Modelo estadístico
Y ijkl=μ+ A i +B j +C k +( AB)ij +( AC )ik +(BC ) jk +( ABC )ijk +ε ijkl
288
i=1..........a
j=1.........b
k=1.........c
l=1..........n
Definición de los componentes del modelo:
Yijkl= es la l-ésima observación del k-ésimo nivel de factor C, el j-ésimonivel de

factor B y el i-ésimo nivel de factor A.
m = media total
Ai= efecto del i-ésimo nivel del factor A.
Bj = efecto del j-ésimo nivel del factor B.
Ck = efecto del k-ésimo nivel del factor C.
(AB)ij= efecto de la interación del i-ésimo nivel del factor A y el j-ésimo nivel del
factor B.
(BC)jk = efecto de la interación del j-ésimo nivel del factor B y el k-ésimo nivel del
factor.
(AC)ik = efecto de la interación del i-ésimo nivel del factor A y el k-ésimo nivel
del factor C.
(ABC)ijk = efecto de la interación del i-ésimo nivel del factor A, el j-ésimo nivel del
factor B y el k-ésimo nivel de C.
εijkl= error experimental
289
12.3.3 Formulación de la hipótesis
Realizamos la formulación de las hipótesis, de la misma forma que se lleva a
cabo en los Diseños anteriormente visualizados, pero debemos completarla para
cada uno de los factores de interés que estamos estudiando:
 Para el factor A
Ho: m1 = m2 =. . . = ma
HI: al menos un promedio es diferente
 Para el factor B
Ho: m1 = m2 = . . . = mb
 Para el factor C
Ho: m1 = m2 = . . . = mc
Para cualquiera de la hipótesis de los efectos principales la regla de decisión se

plantea como: Descartar Ho, si Fc³Fa,gln,glEE
INTERACCIONES:
La Regla de Decisión será (R:D)
 Para la interacción (AB)ij

Ho: m11 = m12 = . . . = mab
Descartar Ho, si Fc³Fa,gl(AB)ij,glEE
 Para la interacción (BC)jk

Ho: m11 = m12= . . . = mbc
Descartar Ho, si Fc³Fa,gl(BC)ij,glEE
290
 Para la interacción (AC)ik
Ho: m11 = m12= . . . = mac
Descartar Ho, si Fc³Fa,gl(AC)ij,glEE
 Para la interacción (ABC)ijk

Ho: m111 = m121 = . . . = mabc
Descartar Ho, si Fc³Fa,gl(ABC)ij,glEE
12.3.4 Procedimiento de aleatorizacion

Debemos llevar a cabo la Asignación al azar de tratamiento a las unidades
experimentales. Para realizar el procedimiento de aleatorización de un DCA de 3
factores es necesario tener en cuenta los siguientes aspectos:
 Codificar cada unidad experimental.
 Aleatorizar las pruebas o unidades experimentales.
 Asignar cada una de las combinaciones de niveles a cada grupo de n
pruebas o unidades experimentales.
De esta forma obtenemos la tabla:
Cod. Orden aleatorio Asignación

1 11 A1B1C1
2 3
3 2 A1B1C2
: : :
: : :
: : :
abcn AaBbCc
291
En el formulario de recolección de información, se deben registrar los siguientes
datos, además de los obtenidos:
 Nombre de la persona que hizo el reporte
 Fecha en que se ejecutó el experimento
 Mes
 Motivo
 Unidad de medición
 Factores de Interés
 Nombre de la Empresa
 Suministrar toda la información adicional que se considere necesaria para
facilitar la comprensión de los datos.
FORMATO DE REGISTRO DE DATOS
A1B1C1 A1B1C2 A1B1C3 ............. AaBbCc
Y1111 Y1121 Y1131 ............ Yabc1
Y1112 Y1122 Y1132 ............ Yabc2
Y1113 Y1123 Y1133 ............ Yabc3
: : : : :
: :
Y ijkl: : :
Y111n Y112n Y113n ............ Yabcn
Y111. Y112. Y113. ............ Yabc.
Y ijk.
Para una mejor comprensión de los cálculos se elaboran 3 tablas de dos
factores incluyendo los niveles de cada uno:
 Tabla AxB
 Tabla AxC
 Tabla BxC
292
TABLA A X B:
Realizamos la sumatoria de los componentes de cada cuadrante Y ij .. y

posteriormente totalizamos las cifras de las columnas y las filas, como
corresponde:
1 .... b TA
1 Y11.. .... Y1b.. Y1...
: :
Y i...
A : : Y ij.. :
a Ya1.. .... Yab.. Ya...
TB Y.1.. .... Y.b.. Y....
Y . j ..
TABLA DE B X C:
Realizamos la sumatoria de los componentes de cada cuadrante Y . jk . y

corresponde:
293
C
1 .... c TB
Y.1..
1 Y.11. .... Y.1c.
B : : : :
:
Y . j ..
....
b Y.b1. Y . jk . Y.bc. Y.b..
TC Y..1. .... Y..c. Y....
Y ..k.
TABLA A X C
Llevamos a cabo la sumatoria de los componentes de cada cuadrante Y .ik . y

corresponde:
294
1 .... c TA
1 Y1.1. .... Y1.c. Y1...
A : :
:
:
:
Y i...
Y i.k .
a Ya.1. .... Ya.c. Ya...
TC Y..1. .... Y..c. Y....
Y ..k.
12.3.6 SUPUESTOS DEL MODELO

Los supuestos que se deben verificar para este modelo, DCA de 3 factores, son:
 Independencia: Indica que cada conjunto de datos debe ser
independiente del resto.
 Normalidad: La cual indica que los resultados obtenidos para la variable
de respuesta en cada factor debe seguir una distribución normal.
 Homocedasticidad: Este indica que las varianzas de las observaciones de
la variable de respuesta en cada factor no deben diferir de forma
significativa.
12.3.7 ANDEVA
El Análisis de varianza se realiza siguiendo el cuadro descrito a continuación:
FV. GL. S.C. C.M. Fc. F
295
A a-1 SCA SCA/(a-1) CMA/CMEE F,a-
1,abc(n-
1)
B b-1 SCB SCB/(b-1) CMB/CMEE F,b-
1,abc(n-
1)
C c-1 SCC SCC/(c-1) CMC/CMEE F,c-
1,abc(n-
1)
AB (a-1)(b-1) SC(AB) SC(AB)/ CM(AB)/CMEE F,(a-1)
(a-1)(b-1) (b-
1),abc(n-
1)
AC (a-1)(c-1) SC(AC) SC(AC)/ CM(AC)/CMEE F,(a-1)
(a-1)(c-1) (c-
1),abc(n-
1)
BC (b-1)(c-1) SC(BC) SC(BC)/ CM(BC)/CMEE F,(b-1)
(b-1)(c-1) (c-
1),abc(n-
1)
ABC (a-1)(b-1) SC(ABC) SC(ABC)/ CM(ABC)/CMEE F,(a-1)
(c-1) (a-1)(b-1)(c-1) (b-1)(c-
1),abc(n-
1)
CN abc-1 SCCN SCN/(abc-1)
EE abc(n-1) SCEE SCEE/(abc(n-1))
To abcn-1 SCTo
Para completar el cuadro de ANDEVA es necesario conocer las fórmulas para la

Suma de Cuadrados (SC), por tanto las describimos a continuación:
1
a
2 Y 2… .
SCA= ∑Y −
bcn i=1 i … abcn
296
1
b
2 Y 2… .
SCB= ∑Y −
acn j=1 . j .. abcn
1
c
2 Y 2… .
SCC= ∑ Y −
abn k=1 .. k. abcn
1
a b
2 Y 2….
SCAB= ∑ ∑ Y ij ..− −SCA−SCB
cn i=1 j=1 abcn
1
a c
2 Y 2… .
SCAC= ∑∑ Y − −SCA−SCC
bc i=1 k=1 … . abcn
1
b c
2 Y 2….
SCBC= ∑ ∑ Y . jk . − −SCB−SCC
an j=1 k =1 abcn
SCABC=SCCN −¿
1
a b c
2 Y 2… .
SCCN= ∑ ∑ ∑ Y ijk . −
n i=1 j=1 k=1 abcn
SCEE=SC T o −SCCN
a b c n
2 Y 2… .
SC T o=∑ ∑ ∑ ∑ Y ijkl−
i=1 j=1 k=1 l =1 abcn
Cálculo del coeficiente de Determinación:
SCN SCA + SCB+ SCC + SCAB+ SCAC +SCBC + SCAB

R 2= =
SC T o SC T o
Este coeficiente de determinación indicará que el porcentaje de variabilidad que se

da en la “variable de respuesta” debido al porcentaje de los Factores A, B y C
utilizados.
297
12.3.8 Conclusiones
En cuanto se conozca si se acepta o se rechazan las hipótesis podremos
concluir si existe, o no, diferencias significativas entre los promedios de la
“variable de respuesta” para los 3 factores (A, B y C).
Se concluye también, si existe o no, diferencias significativas entre los
promedios de la “variable de respuesta” para los factores combinados (AB, AC,
BC y ABC).
12.3.9 Cálculo de los parámetros

Para buscar el resultado de la media, la fórmula es la siguiente:
a b c n
∑ ∑ ∑ ∑ Y 2ijkl
μ= Ý = i=1 j=1 k=1 l=1
n
Para buscar el resultado de la desviación estándar, la fórmula es la siguiente:
σ 2=CMEE
Del resultado de estos dos parámetros se interpreta que el promedio de la

desviación de la” variable de respuesta” se estima en (el resultado de la media)
con una desviación estándar de (el resultado de la desviación estándar).
12.4 EJEMPLOS COCA COLA
La empresa Coca Cola de Panamá está realizando un estudio en la sección de

embotellado de las bebidas gaseosas, ya que se desea obtener alturas de llenado más
uniformes en las botellas que salen de su proceso de manufactura.
En teoría, la máquina llenadora introduce líquido en cada botella hasta la altura objetivo
correcto, pero en la práctica existe variación alrededor de este objetivo, y el fabricante
quisiera comprender mejor las fuentes de esta variabilidad para poder hacer un estudio
que permita reducirla a un mínimo.
298
El ingeniero de proceso puede controlar tres variables durante el proceso de llenado:
porcentaje de carbonatación (A), la presión de operación en la llenadora (B) y el
número de botellas que se llenan por minuto o velocidad de la línea (C).
La presión de operación y la velocidad son fáciles de controlar, pero el porcentaje de

carbonatación (CO2 gaseosa) es más difícil de regular durante la manufactura real
debido a que varía con la temperatura del producto.
Sin embargo, para los fines de un experimento, el ingeniero puede controlar la

carbonatación a tres niveles: 10, 12 y 14%. Elige dos niveles para la presión de
operación: 25 Y 30 lb/plg2, y dos niveles para la velocidad de la línea: 200 y 250
botellas por minuto(bpm).
El ingeniero decide correr dos réplicas de un diseño factorial con estos tres factores,
haciendo las 24 corridas de manera aleatoria. Se mide la desviación de la altura de
llenado objetivo que se observa en una corrida de producción de botellas con cada
conjunto de condiciones.
En el cuadro se muestran los datos de este experimento. Las desviaciones positivas

son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son
alturas de llenado abajo del objetivo.
Porcentaje de Presión de operación (B)

carbonatació 25 psi 30 psi
Velocidad de la línea (C) Velocidad de la línea (C)
n (%). 200 250 200 250
(A)
10 -3 -1 -1 1
-1 0 0 1
12 0 2 2 6
1 1 3 5
14 5 7 7 10
4 6 9 11
299
12.4.1 Desarrollo del problema
 Problema: Determinar si existe diferencias significativas en la
desviación de la altura de llenado promedio para los diferentes
porcentajes de carbonatación (10%, 12% y 14%), utilizando dos
diferentes presiones de operación en la llenadora (25 psi y 30 psi) y
dos diferentes velocidades en la línea (200 bpm y 250 bpm).
 Definición de variables:
VR: Desviación de la altura de llenado.
Factor A: Porcentaje (%) de carbonatación, niveles (1, 2, 3)
Factor B: Presión de operación, niveles (1, 2)
Factor C: Velocidad de la línea, niveles (1, 2)
Interacciones:
AB: Porcentaje de carbonatación con la presión de operación.
BC: La presión de operación con la velocidad de la línea.
AC: Porcentaje de carbonatación con la velocidad de la línea.
ABC: Porcentaje de carbonatación con la presión de operación y la

velocidad de la línea.
i. Modelo estadístico
Yijkl =m +Ai+Bj+Ck+ (AB)ij + (AC)ik + (BC)jk + (ABC)ijk+ e ijkl
(AB)ij: Es el efecto del i-ésimo porcentaje de carbonatación y la j-ésima

presión de operación sobre la VR.
300
(AC)ik: Es el efecto del i-ésimo porcentaje de carbonatación y la k-ésima
rapidez de línea sobre la VR.
(BC)jk: Es el efecto de j-ésima presión de operación y la k-ésima rapidez de
la línea sobre la VR.
(ABC)ijk: Es el efecto del i-ésimo porcentaje de carbonatación, de la j-ésima
presión de operación y la k-ésima rapidez de la línea sobre la VR.
eijkl = error experimemtal
ii. Hipótesis:
Para el factor A Ho: m1= m2 =m3
H1: al menos una de las m de los promedios es diferente.
Para el factor B:Ho: m1 = m2 H1:

al menos una de las m de los promedios es diferente.
Para el factor C: Ho: m1 = m2

Para la interacción (AB)ij: Ho: m11= m12 =m21=m22= m31 =m32

Para la interacción (AC)ik: Ho: m11= m12 =m21=m22= m31 =m32

Para la interacción (BC)jk: Ho: m11= m12 =m21=m22

Para la interacción (ABC)ijk: Ho: m111= m112 =m121…=m322

301
Regla de decisión:
Se descarta Ho si FC ³ Fa , glN,,glD
iii. Aleatorización
Cod. Aleatori. Asignación

1 11 A1B1C1
2 6
3 2 A1B1C2
4 15
5 12 A1B2C1
6 23
7 8 A1B2C2
8 21
9 16 A2B1C1
10 1
11 20 A2B1C2
12 19
13 24 A1B2C2
14 9
15 13 A2B1C1
16 3
17 10 A2B1C2
18 4
19 22 A3B1C2
20 17
21 14 A3B2C1
22 7
23 18 A3B2C2
24 5
iv. Registro de datos
Porcentaje de Presión de operación (B)

carbonatació 25 psi 30 psi
Velocidad de la línea (C) Velocidad de la línea (C)
n (%).
200 250 200 250
(A)
10 -3 -1 -1 1
-1 0 0 1
12 0 2 2 6
302
1 1 3 5
14 5 7 7 10
4 6 9 11
Tabla AxB
B
25 30 TA
10 -5 1 -4
12 4 16 20
14 22 37 59
TB 21 54 75
Tabla BxC
C
200 250 TB
25 6 15 21
30 20 34 54
TC 26 49 75
Tabla AxC
C
200 250 TA
10 -5 1 -4
12 6 14 20
14 25 34 59
TC 26 49 75
303
12.4.6 Supuestos del Modelo
 MINITAB
Recordando los pasos:
1. Estadísticas
2. DOE
3. Factorial
4. Crear diseño factorial
5. Diseño factorial general, 3 factores
Proceso de aleatorización
A B C
3 1 2 7
2 1 2 2
2 1 2 1
3 1 1 5
1 1 1 -3
3 1 1 4
1 1 1 -1
2 2 1 2
1 2 2 1
3 2 2 1
1 1 2 6
2 1 1 11
1 2 1 3
3 1 2 10
3 2 1 5
2 1 1 9
2 2 2 6
3 2 1 7
1 2 2 -1
304
2 2 1 0
2 2 2 1
1 1 2 0
1 2 1 -1
3 2 2 0
Supuestos del modelo
1. Estadísticas
2. DOE
3. Factorial
4. Analizar diseño factorial
Supuesto de probabilidad normal (Gráfica de normalidad)
Los datos presentan una distribución normal ya que se encuentran bastante

aproximados a la línea oblícua.
Supuesto de independencia (Grafica de residuo vs. orden)
305
Se cumple el supuesto de independencia ya que los datos en la gráfica no se
encuentran correlacionados entre sí.
12.4.7 ANDEVA
FV. GL. S.C. C.M. Fc. F

A 2 252.750 126.375 178.41 3.89
B 1 45.375 45.375 64.059 4.75
C 1 22.042 22.043 31.118 4.75
AB 2 5.250 2,625 3.706 3.89
AC 1 1.042 1.042 1.471 4.75
BC 2 0.583 0.292 0.412 3.89
ABC 2 1.083 0.542 0.765 3.89
CN
EE 12 8.500 0.708
To 23 336.625
Coeficiente de determinación y parámetros
306
SCN 328.13
R 2= = =0.9747=97.47 %
SC T o 336.63
El 97.47% de la variabilidad que se da en la desviación de la altura de llenado se debe

al porcentaje de carbonatación, a la presión de la operación y a la velocidad de la línea.
75
μ= Ý = =3.125
24
σ 2=CMEE=0.708
El promedio de la desviación de la altura de llenado se estima en 3.125 mm, con una

desviación estándar de 0.708.
12.4.8 Interpretación (observar ANDEVA):

Se descarta Ho: Para el procentaje de carbonatación debido a que Fc>Fóptima
Se descarta Ho: Para la presión de trabajo a que Fc>Fóptima
Se descarta Ho: Para la rapidez de línea debido a que Fc>Fóptima
No se descarta Ho: Para interacción (AB) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (BC) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (AC) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (ABC) debido a que Fc<Fóptima
12.4.9 Conclusión
Se concluye que existe diferencia significativa entre los promedios de las
desviaciones de las alturas de llenado para los 3 factores: 3 porcentajes de
carbonatación, 2 presiones de operación, 2 velocidades de línea.
Se concluye también que no existen diferencias significativas entre los
promedios de la desviación de alturas promedios de llenado para:
La combinación de factores: AB, AC, BC y ABC.
307
CAPÍTULO 13
13. DISEÑO DE BLOQUES DE 3 FACTORES

13.1 Definición
308
Este es el más simple y quizás el ampliamente usado de los diseños de bloques al azar
que es definido por Hinkelman(1994) así: El material experimental es dividido en
grupos de unidades experimentales (UE) cada uno, donde es el número de
tratamientos, tales que las UE dentro de cada grupo son lo más homogénea posible y
las diferencias entre las UE sea dada por estar en diferentes grupos. Los conjuntos son
llamados bloques. Dentro de cada bloque las UE son asignadas aleatoriamente, cada
tratamiento ocurre exactamente una vez en un bloque.
Si la variación entre las UE dentro de los bloques es apreciablemente pequeña en

comparación con la variación entre bloques, un diseño de bloque completo al azar es
más potente que un diseño completo al azar.
13.2 Generalidades
 Este tipo de experimento comprende tres factores los cuales se denotan A, B y C.

 Factor A tiene a niveles
 Factor B tiene b niveles
 Factor C tiene c niveles
 Hay abc combinaciones de niveles
 Se tienen n bloques y las combinaciones de niveles se asignan aleatoriamente a
cada uno de los bloques
 Existen abcn observaciones en el experimento
13.3 Pasos
1. Definición del problema

2. Definición de las variables
3. Modelo Estadistico
4. Formulación de las hipótesis
5. Regla de decisión
6. Aleatorización
309
7. Tabla de datos
8. Verificación de los supuestos
9. Análisis de varianza ( andeva )
10. Conclusiones
11. Cálculos de parámetros
12. Calculo de intervalos de confianza
Comparar si hay diferencias significativas entre los promedios de los niveles

delos 3 factores de interés (i,j y k).
13.3.2 Modelo Estadístico:
Yijkl = m + Ai + Bi + Ck + (AB)ij + (BC)jk + (AC)ik + (ABC)ijk + Rl+ Eijkl
Yijkl = es la l-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel
del factor B y el k-ésimo nivel del factor C.
μ= promedio total
Ai = efecto del i-ésimo nivel del factor A
Bi = efecto del j-ésimo nivel del factor B
Ck = efecto del k-ésimo nivel del factor C
(AB)ij = efecto de la interacción entre i-ésimo nivel del factor A y el j-ésimo nivel
del factor B.
(BC)jk = efecto de la interacción entre j-ésimo nivel del factor B y el k-ésimo nivel
del factor C.
310
(AC)ik = efecto de la interacción entre i-ésimo nivel del factor A y el k-ésimo
nivel del factor C.
(ABC)ijk = efecto de la interacción entre i-ésimo nivel del factor A , el j-ésimo

nivel del factor B y el k-ésimo nivel del factor C.
Rl= efecto del l-esimo bloque
Eijkl = error experimental.
13.3.3 Planteamiento de las hipótesis:
PARA EL FACTOR A
Ho: m1= m2 ........... = ma
Hi : al menos una de las mediases diferente
PARA EL FACTOR B
Ho: m1= m2 ........... = mb
Hi : al menos una de las medias es diferente
FACTOR C
Ho: m1= m2 ........... = mC
BLOQUES
Ho: m1= m2 ........... = mn
Hi : al menos una de las medias es diferente
INTERACCIÓN AB
Ho: m11= m12 ........... = mab
311
NTERACCIÓN BC
Ho: m 11= m12 ........... = mbc
INTERACCIÓN AC
Ho: m11= m12 ........... = mac
INTERACCIÓN ABC
Ho: m111= m112 ........... = mabc
13.3.4 Regla de decisión
 Factor A
Descartar Ho si Fc > Fα,(a-1),abc(n-1)
 Factor B
Descartar Ho si Fc > Fα,(b-1),abc(n-1)
 Factor C
Descartar Ho si Fc > Fα,(c-1),abc(n-1)
 Interacción AB
Descartar Ho si Fc > Fα,(a-1)(b-1),abc(n-1)
312
 Interacción BC
Descartar Ho si Fc > Fα,(b-1)(c-1),abc(n-1)
 Interacción AC
Descartar Ho si Fc > Fα,(a-1)(c-1),abc(n-1)
 Interacción ABC
Descartar Ho si Fc > Fα,(a-1)(b-1)(c-1),abc(n-1)
13.3.5 Aleatorización
En un proceso de aleatorización para un diseño de bloques de tres factores

debemos: asignar las combinaciones de niveles(ABC) a cada uno de los n bloques.
Bloques
Ejm. A1B1C1 A2B2C2
A =2 A1B1C2 A2B1C2
B =2 A1B2C1 A2B2C1
313
C =2 A1B2C2
n =3 A2B1C1
Asignar 8 combinaciones aleatoriamente a cada casilla de cada bloque
13.3.5.1 Esquemas
DBA:
Se debe confeccionar una tabla para, AB, AC y para BC
Tabla AB.
314
Tabla AC.
Tabla BC.
13.3.7 Verifiación de los supuestos
Normalidad:
El máximo residuo normalizado es dado por:
315
Donde: y es el mayor residual en valor absoluto. Si
este valor excede el valor crítico de tabla, la observación es declarada como un outlier
potencial. Estas deben ser localizadas y examinadas para buscar causas
asignables. La eliminación arbitraria de valores extremos debe evitarse.
Normalidad:
Ho: Los datos poseen una distribución normal

Hi: Los datos no poseen una distribución normal
Homocedasticidad:
Homogeneidad de varianza
La prueba gráfica de igualdad de varianza es graficar los residuales contra los valores
predichos ( si existe algún patrón especial que muestre mayor

dispersión para un lado de la gráfica se puede decir que no hay homogeneidad de
varaianza.
316
Las pruebas analíticas para igualdad de varianza dadas por el DCA no son aplicables a
bloques ya que no se tienen estimadores independientes de las varianzas de los
tratamientos. Existen algunos procedimientos, pero quizá el más simple es el
desarrollado por Han ( . Esta prueba es especialmente para un DBC y asume:
Las poblaciones muestreadas sean normalmente distribuídas
Los errores son igualmente correlacionados dentro de los bloques, pero son
independientes entre bloques.
La prueba estadística es:
Donde el estimado de la varianza para el tratamiento es:
Donde es el número de bloques y los son los residuales en el tratamiento . Note
que la varianza no es calculada directamente de los datos, por ello la no independencia
de las varianzas. Observe que para el calculo de la varianza del tratamiento 1 utiliza a
la medias de los bloques, , y para el tratamiento 2 utiliza tambien a a
la medias de los bloques .
317
Los valores críticos de la prueba estadística son basados sobre puntos de porcentaje
de la distribución rango estudentizado en vez de la distribución Fmax.
Se rechaza la hipótesis de homogeneidad de varianzas
si . Los puntos de porcentaje de han sido tabulados por Harter
(1960) y pueden ser obtenidos en la tabla C-7 de Martin.
Hipótesis:
Ho: µ1 = µ2 = µ3
Hi: al menos un promedio es diferente
Independencia
Se observa si gráficamente los datos presentan alguna tendencia y se concluye

diciendo si no presentan alguna tendencia que los datos son independientes.
13.3.8 Análisís de varianza
318
Luego de haber visto los supuestos estamos en la capacidad de confeccionar la
tabla de ANDEVA. Las formulas y ecuaciones se describen en
Nota: las formulas que se encuentran en el interior de la tabla 13.5 se describen a

parte.
319
13.3.8.1 Formulas:
Tabla 13.6
a
Y....2
Y
1
SCA  2
i ... 
b cn i 1 abcn
b
Y....2
 Y. 2j .. 
1
SCB 
a cn j 1 a b cn
c
Y....2
Y
1
SCC  2
.. k . 
abn k 1 ab cn
a b
Y....2
 Y
1
SCAB  2
ij..   SCA  SCB
cn i 1 j 1 abcn
a c
Y....2
 Y
1
SCAC  2
i .k .   SCA  SCC
bn i 1 k 1 abcn
b c
Y....2
 Y
1
SCBC  2
. jk .   SCB  SCC
an j 1 k 1 abcn
SCABC  SCCN  ( SCA  SCB  SCC  SCAB  SCAC  SCBC )
a b c n
Y....2
SCTo  
i 1 j 1 k 1 l 1
2
Yijkl 
abcn
SCEE  SCTo  ( SCCN  SCB)
320
1 n 2 Y....2
SCBLOQUES   Y... l  abcn
abc l 1
1 n 2 Y....2
SCCN   Yijk. 
n l 1 abcn
13.3.9 Conclusiones
Para un diseño de bloques de tres factores se concluye de la siguiente manera:
Para cada factor, bloque e interacciónFc >Fa, se rechaza Ho
Existe diferencia significativa en lavariable de respuesta debido a factor,
bloque o interacción.
Promedio μ = y..../abcn
Varianza s 2 = CMEE
R2 = (SCABC + SCAB + SCBC + SCAC + SCA + SCB + SCC)/ SCTo
El x% de la variabilidad de la variable derespuesta se explica con el modelo utilizado

elresto se debe a otros factores.
321
BIBLIOGRAFÍA
 Montgomery, D.C. (1991). Diseño y Análisis de Experimentos. Grupo Editorial

Iberoamérica.
 MOODLE.
322

Dba 3 Factores 2019

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Dba 3 Factores 2019

Transféré par

Droits d'auteur :

Formats disponibles

CAPÍTULO 1: Diseño Completamente al Azar

El diseño completamente al azar (un solo factor) es el diseño más sencillo.

Sus principales ventajas:

 Cualquier número de niveles y cualquier número de réplicas pueden ser

En la práctica los experimentos donde se aplican los diseños completamente al

Para aplicar cualquier diseño experimental es necesario hacer una serie de

De acuerdo a experiencias y estudios recientes en el tema se sugieren las

Con base en esta nueva información, los investigadores de I.C.S.A. sugieren

El diseño experimental desarrollado por los mismos para evaluar la hipótesis

A cada conjunto de condiciones de empaque le asignaron al azar 3 cortes del

Cuál es el problema objeto de estudio para esta situación?

Determinar el efecto de diferentes condiciones de empaque en el número de

Como se formula el Modelo Estadístico para un DCA, considerando un

Tal como se ha mencionado, en un DCA se estudia el efecto de una variable

Dependiendo de la estructura que el experimentador le quiera dar al formato

Y ij es la i-ésima medición realizada a la unidad experimental correspondiente

μ es la media total de los valores medidos sobre las unidades experimentales a la

μ es la media total de los valores medidos sobre las unidades experimentales a

τi es el efecto del i-ésimo nivel del factor de interés sobre la variable de

En el diseño presentado en este capítulo, tanto en el diseño balanceado como en

Cuando se plantea una hipótesis para un diseño experimental cualquiera primero

Entonces de acuerdo a dicha clasificación como se formulan la Hipótesis Nula y

Cuando el Factor es Fijo las Hipótesis Nula y Alterna se plantean

Y su respectiva regla de decisión para un nivel de significancia α dado, se plantea

F c≥F α , g ln, gld

Cuando el Factor es Aleatorio las Hipótesis Nula y Alterna se plantean

Y su respectiva regla de decisión para un nivel de significancia α, se plantea a

F c≥F α , g ln, gld

La figura 1 representa la región de rechazo correspondiente a cualquier tipo de

Figura 1: Región de rechazo de la prueba estadística

En el capítulo 1 se mencionó que uno de los principios del diseño experimental es

• Codificar las unidades experimentales desde 1 hasta nk, que representa el

Luego de una minuciosa planificación del experimento se procede a realizar las

Es necesario que en el diseño del formato se coloque espacio para información

En caso de que el modelo se haya escrito en la forma (1) el formato de

Una vez que se ha ejecutado el experimento y se han generado los datos

EL ANDEVA es una de las técnicas estadísticas en el análisis de datos

Es una potente herramienta estadística, de gran provecho :

Cuáles son los supuestos en que se basa el ANDEVA?

NORMALIDAD: Los datos obtenidos para la variable de respuesta en cada

HOMOCEDASTICIDAD: Las varianzas de las observaciones de la variable

INDEPENDENCIA: Cada conjunto de datos debe ser independiente uno del

SUPUESTO Prueba Analitica AplIcable para Grafico

Si se utilizan las pruebas analíticas se deben plantear las hipótesis

En el caso del supuesto de Normalidad se deben plantear las Hipótesis Nula y

Para el supuesto de Homocedasticidad, las hipótesis son planteadas como en la

Para comprobar la Normalidad, utilizando MINITAB se sugiere seleccionar

El MINITAB ofrece tres pruebas analíticas para verificar este supuesto:

 Anderson-Darling (muestras menores a 50)

Una vez seleccionada cualquiera de las pruebas anteriores la hoja de

El PASW ofrece el gráfico de probabilidad normal y dos pruebas analíticas para

 Shapiro Wilk (muestras menores a 50)

Para comprobar el supuesto de homocedasticidad, donde se comparan las

En el MINITAB los pasos son los siguientes:

Para comprobar el supuesto de independencia, se puede utilizar Minitab,

Modelo Factores: Gráficos:

El gráfico obtenido debe presentar un comportamiento aleatorio para que se

Luego que se verifican los supuestos del ANDEVA se procede a comprobar la

Las ecuaciones para el cálculo de la prueba F de Fisher, varían un poco en

Entonces el cálculo de la prueba F se hace a través de las ecuaciones

Para el modelo de la forma (2)

La demostración de las fórmulas ´presentadas en los cuadros (5) y (6) se

Los resultados encontrados con la prueba F permiten en primer lugar comprobar la