Vous êtes sur la page 1sur 322

CAPÍTULO 1: Diseño Completamente al Azar

Unifac

Unifactorial
.

El diseño completamente al azar (un solo factor) es el diseño más sencillo.


Consiste en asignar los niveles de un factor de interés (FI) a unidades
experimentales previamente aleatorizadas. Es necesario que dichas unidades
experimentales sean homogéneas.

Sus principales ventajas:

 Cualquier número de niveles y cualquier número de réplicas pueden ser


usadas, siempre y cuando se tengan suficientes sujetos u objetos
homogéneos.
 Análisis Estadístico simple
 Es muy preciso

Sus Desventajas 
Se puede obtener baja precisión cuando las unidades experimentales no sean
muy homogéneas y así ser ineficiente

En la práctica los experimentos donde se aplican los diseños completamente al


azar pueden ser balanceados o desbalanceados. Un experimento balanceado es
aquel en el que el número de observaciones (n) por cada nivel del factor de
interés es igual, mientras que en el desbalanceado difiere el número de
observaciones de nivel a nivel.

Para aplicar cualquier diseño experimental es necesario hacer una serie de


consideraciones previas. En primer lugar es importante identificar cual es el
problema a estudiar para conocer cuales son las variables involucradas en el
mismo. Para el caso en el que se considera un solo factor el propósito principal
es medir el efecto de una variable independiente, conocida como factor de interés,
sobre una variable de respuesta o variable dependiente.
Además se debe considerar que objetos o sujetos constituyen la unidad
experimental, estimar el tamaño de muestra para cada nivel del FI, y cuál es el
nivel de significancia más adecuado para probar las hipótesis correspondientes.

Cuales son entonces en resumen las consideraciones previas que se deben hacer
al planificar un experimento donde se utilizará un diseño completamente al azar
 Problema
 Variable de Respuesta
 Factor de Interés
 Niveles
 Unidades Experimentales
 Tamaño de Muestra por cada nivel
 Establecer el nivel de significancia

Ejemplo 1:
El supermercado Daly Gourmet está interesado en realizar un estudio sobre la
vida de anaquel de las carnes que venden en sus diferentes locales en la Ciudad
de Panamá. Para esto solicita los servicios de Ingenieros Consultores S.A.
(I.C.S.A)
La vida de anaquel de las carnes almacenadas es el tiempo que un corte
previamente empacado es sano y vendible. Un paquete normal expuesto al aire
ambiental tiene una vida aproximada de 48 horas, después de las cuales la carne
comienza a deteriorarse por contaminación de microbios, degradación del color y
encogimiento. El empaque al vacío es efectivo para suprimir el desarrollo de
microbios, sin embargo, continúan siendo un problema los otros aspectos.

De acuerdo a experiencias y estudios recientes en el tema se sugieren las


atmósferas controladas de gas, como alternativa a los empaques actuales. Los
resultados de los mismos indican que dos atmósferas que prometen combinar la
capacidad de suprimir el desarrollo de microbios con la conservación de las
cualidades de la carne son: dióxido de carbono puro (CO2) y mezcla de monóxido
de carbono (CO), oxígeno (O2) y nitrógeno (N).

Con base en esta nueva información, los investigadores de I.C.S.A. sugieren


plantear una hipótesis para comparar las diferentes atmósferas en cuanto al
número de bacterias sicotrópicas en la carne, de tal manera que a través de los
resultados obtenidos en este experimento se puedan tomar para encontrar un
entorno más efectivo de empaque para el almacenamiento de las carnes.

El diseño experimental desarrollado por los mismos para evaluar la hipótesis


incluyó empaques con:
 Aire del ambiente con un empaque comercial de plástico
 Empaque al vacío
 Una mezcla de gases con 1% CO, 40% O2, y 59% N
 100% CO2.

A cada conjunto de condiciones de empaque le asignaron al azar 3 cortes del


mismo tamaño (75 kg). Cada corte se empacó por separado en las condiciones
asignadas y a cada uno se le midió el número de bacterias sicotrópicas en la
carne (el crecimiento bacterial se expresa como el logaritmo del número de
bacterias por centímetro cuadrado). Las bacterias sicotrópicas se encuentran en
la superficie de la carne y se asocian con la carne deteriorada.

Cuál es el problema objeto de estudio para esta situación?


Determinar si hay diferencias significativas en el número promedio de bacterias
sicotrópicas en la carne para diferentes condiciones de empaque.
De que otra forma se puede redactar el problema objeto de estudio?

Determinar el efecto de diferentes condiciones de empaque en el número de


bacterias sicotrópicas en los cortes de carne.
Que elementos contiene este problema?
Variable de Respuesta
Número de Bacterias Sicotrópicas en cada paquete de carne.
Factor de Interés o Variable Independiente
Condiciones de Empaque
Niveles:
• Aire del ambiente con un empaque comercial de plástico
• Empaque al vacío
• Una mezcla de gases con 1% CO,40% O2, y 59% N
• 100% CO2
Unidad experimental
Son los cortes de carne. Cada corte de carne se le empaca en las diferentes
condiciones, tomando tres cortes de carne para condición.

Ejercicio 1:
Tome un experimento cualquiera y defina lo siguiente
• Defina el problema objeto de estudio
• Identifique la variable de respuesta (VD), unidad experimental
• Identifique el factor de interés (VI) y sus niveles
• Número de observaciones por cada nivel

A. Caso Balanceado

Como se formula el Modelo Estadístico para un DCA, considerando un


experimento balanceado?

Tal como se ha mencionado, en un DCA se estudia el efecto de una variable


independiente denominada Factor de Interés (FI), sobre una variable de respuesta
a la que se le llama Variable Dependiente (VD).

Dependiendo de la estructura que el experimentador le quiera dar al formato


donde se registrarán los datos hay dos formas de escribir el modelo estadístico
para un DCA. El formato es una tabla de una vía donde se colocan en los
márgenes los niveles del FI y a través de la columna o la fila de cada uno se
escriben los valores medidos sobre la unidad experimental a la variable de
respuesta.

Si los niveles del FI se colocan en las columnas, la expresión (1) define el modelo
estadístico

Y ij=μ+τ j +ε ij
(1)
j=1. .. .. . k
i=1. . .. .. n
donde:

Y ij es la i-ésima medición realizada a la unidad experimental correspondiente


utilizando el j-ésimo nivel del factor de interés.

μ  es la media total de los valores medidos sobre las unidades experimentales a la


variable de respuesta
 
τj es el efecto del j-ésimo nivel del factor de interés sobre los valores de la
variable
de respuesta
 
εij es el error experimental.

Si los niveles del FI se colocan en las filas, la expresión (2) define el modelo
estadístico

Y ij=μ+τ i +ε ij (2)

i=1. . .. .. k
j=1. .. .. . n
Y ij es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés

μ es la media total de los valores medidos sobre las unidades experimentales a


la variable de respuesta

τi es el efecto del i-ésimo nivel del factor de interés sobre la variable de


respuesta

ε ij el error experimental

En el diseño presentado en este capítulo, tanto en el diseño balanceado como en


el no balanceado siempre se utilizara k para representar a los niveles del FI y n
para el número de mediciones realizadas a la variable de respuesta para cada
nivel.
Dado que en un experimento donde se aplica un DCA se quiere comprobar si los
promedios de los valores observados por nivel son iguales, se requiere formular
una hipótesis estadística que permita comprobar si hay diferencias significativas
entre dichos promedios.

Cuando se plantea una hipótesis para un diseño experimental cualquiera primero


es necesario definir qué tipo de factor se está estudiando de acuerdo a la forma en
que son seleccionados los niveles del FI. De acuerdo a este criterio los factores
se clasifican en fijos y aleatorios. Para un DCA de un solo factor, este será o fijo o
aleatorio. En el capítulo 1 se explicó el significado de factores fijos y aleatorios.

Entonces de acuerdo a dicha clasificación como se formulan la Hipótesis Nula y


Alterna para un DCA?

Cuando el Factor es Fijo las Hipótesis Nula y Alterna se plantean


respectivamente, como en la expresión (3)
  H o : μ1 =μ2 =. .. .. . .. . μ k
H1 = al menos una de las medias de los niveles del FI es diferente (3)

Y su respectiva regla de decisión para un nivel de significancia α dado, se plantea


a través de la prueba F de Fisher, como en la expresión (4)

F c≥F α , g ln, gld


Descartar Ho si: donde (4)

g ln=k−1
gld=k ( n−1 )
Donde
gln son los grados de libertad correspondientes a los niveles del factor
gld son los grados de libertad correspondientes al error experimental

Cuando el Factor es Aleatorio las Hipótesis Nula y Alterna se plantean


respectivamente, como la expresión (5)

2 2 2
:H 0 :σ 1 =σ 2=.. .. . .. .. σ k
H1 : al menos una de las varianzas de los niveles del FI es diferente (5)

Y su respectiva regla de decisión para un nivel de significancia α, se plantea a


través de la prueba F de Fisher, en la expresión (6)

F c≥F α , g ln, gld


donde
Descartar Ho si: g ln=k−1 (6)
gld=k ( n−1 )
donde
gln son los grados de libertad correspondientes a los niveles del factor
gld son los grados de libertad correspondientes al error experimental

La figura 1 representa la región de rechazo correspondiente a cualquier tipo de


factor (fijo o aleatorio). El área sombreada corresponde a la región de rechazo.

Figura 1: Región de rechazo de la prueba estadística

Si se planteó el modelo estadístico con los niveles en las filas o en las columnas,
las hipótesis se plantean de la misma forma, tanto para un factor fijo como para
uno aleatorio.

En el capítulo 1 se mencionó que uno de los principios del diseño experimental es


la ALEATORIZACION.
Como se realiza el procedimiento de aleatorización de un experimento balanceado
en un DCA unifactorial?
Para un experimento en el que se toman n observaciones para cada uno de los
niveles de un FI, el procedimiento de aleatorización independientemente de cómo
se formule el modelo estadístico, se hace a través de los siguientes pasos:

• Codificar las unidades experimentales desde 1 hasta nk, que representa el


número total de observaciones en el experimento.
• Establecer un orden aleatorio para las pruebas que serán realizadas sobre
las unidades experimentales, utilizando la tabla de números aleatorios o
cualquier herramienta computacional.
• Asignar los niveles del factor de interés a las unidades experimentales
aleatorizadas.
• Considerar los resultados anteriores en el orden de experimentación

Todos los puntos que hasta aquí se han mencionado constituyen la planificación
del experimento. Los pasos son los mismos independientemente de cómo se
haya escrito el modelo.

Luego de una minuciosa planificación del experimento se procede a realizar las


mediciones correspondientes a la variable de respuesta registrando dichas
observaciones en el formato previamente diseñado, lo cual permite hacer un
ordenado registro de los datos obtenidos en el experimento.

Es necesario que en el diseño del formato se coloque espacio para información


general sobre el experimento. (quien hizo las mediciones, la fecha,, motivo, unidad
de medición, factor de interés, nombre de la empresa, etc) que sirven de apoyo
para darle seguimiento al experimento.

En caso de que el modelo se haya escrito en la forma (1) el formato de


de registro de datos debe ser como en el cuadro 2
Y ij=μ+τ j +ε ij
j=1. .. .. . k
i=1. . .. .. n
Cuadro 2: Formato de registro de datos para un DCA
Si el modelo estadístico se escribe en la forma (2), el formato de registro de datos
debe ser como se muestra en el cuadro 3

Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . n
Cuadro 3: Formato de registro de datos para un DCA

Una vez que se ha ejecutado el experimento y se han generado los datos


experimentales es necesario comprobar si los datos recopilados cumplen con los
supuestos del Análisis de Varianza (ANDEVA).

EL ANDEVA es una de las técnicas estadísticas en el análisis de datos


experimentales. Se utiliza para comprobar las hipótesis principales de los diseños
experimentales, que son las que se plantean en base al propósito del experimento.

Es una potente herramienta estadística, de gran provecho :


 Para la Industria
 Para el control y mejora de los procesos
 Para el laboratorio de análisis
 Para el control de métodos analíticos
En el ANDEVA la variabilidad total se descompone en las partes con las que
contribuye cada fuente de variación en el experimento. En el caso de un DCA la
ecuación (7) es la base del ANDEVA, sea el experimento balanceado o no.

(7)

Cuáles son los supuestos en que se basa el ANDEVA?

NORMALIDAD: Los datos obtenidos para la variable de respuesta en cada


nivel deben seguir una distribución normal (figura 2)

HOMOCEDASTICIDAD: Las varianzas de las observaciones de la variable


de respuesta en cada nivel no deben diferir de forma significativa (figura 3)

INDEPENDENCIA: Cada conjunto de datos debe ser independiente uno del


otro.
Figura 2
.

Figura 3
Como se verifican los supuestos mencionados?
Existen diferentes gráficos y pruebas analíticas que permiten comprobar el
cumplimiento de dichos supuestos. El cuadro 4 ofrece un resumen de los mismos

SUPUESTO Prueba Analitica AplIcable para Grafico


Ryan Joyner MUESTRAS MENORES A 50 Probabilidad Normal
NORMALIDAD Shapiro Wilk MUESTRAS MENORES A 50  
Smirnof-kolmorof MUESTRAS MAYORES A 50  
VALORES PREDICHOS Vs
BARLETT  
HOMOCEDASTICIDAD RESIDUOS
LEVIN   NIVELES DE FACTOR VS RESIDUOS
 ORDEN DE RECOLECCION Vs
INDEPENDENCIA  
RESIDUOS
CUADRO 4: RESUMEN DE LAS PRUEBAS ANALITICAS Y GRAFICAS PARA VERIFICAR LOS SUPUESTOS DEL ANDEVA

Si se utilizan las pruebas analíticas se deben plantear las hipótesis


correspondientes, que luego mediante la aplicación de un software estadístico a
los datos experimentales, pueden ser comprobadas.

En el caso del supuesto de Normalidad se deben plantear las Hipótesis Nula y


Alterna de la siguiente manera, expresión (8):
:
Ho: Las mediciones de la variable de respuesta presentan una distribución normal.
Hi: Las mediciones de la variable de respuesta no presentan una distribución
normal. (8)

Para el supuesto de Homocedasticidad, las hipótesis son planteadas como en la


expresión (9)
Ho: Las varianzas de los niveles del FI son iguales.
Hi: Las varianzas de los niveles y de la variable respuesta no son iguales (9)
Verificación de los Supuestos
Para las pruebas analíticas o la elaboración de los gráficos es recomendable
apoyarse en un software estadístico. En este libro se hará referencia al
módulo de Análisis de Datos de Excel, al Minitab o al PASW.

Para comprobar la Normalidad, utilizando MINITAB se sugiere seleccionar


los siguientes comandos en la barra superior:

Colocar
Colocar la
la
Estadísticas Prueba de Seleccionar
Estadísticas
Estadísticas Variable
Variable de
de Aceptar
Aceptar
Básicas
Básicas Normalidad
Normalidad Ryan-Joiner
Ryan-Joiner
Respuesta
Respuesta

El MINITAB ofrece tres pruebas analíticas para verificar este supuesto:

 Anderson-Darling (muestras menores a 50)


 Ryan-Joiner (muestras menores a 50, es equivalente a la prueba de
Shapiro Wilk)
 Smirnof-Kolmorof (muestras mayores de 50)

Una vez seleccionada cualquiera de las pruebas anteriores la hoja de


resultados muestra el grafico de probabilidad normal, así como también los de
la prueba, en base al valor de p-value, el cual se compara con el nivel de
significancia establecido como criterio de rechazo. Si el gráfico de
probabilidad normal es aproximadamente lineal, se concluye que los datos
experimentales obtenidos presentan una distribución normal. Para la prueba
analítica seleccionada si el valor de p-value es mayor que el nivel de
significancia no se descarta la Hipótesis Nula planteada y se conlcuye que los
datos presentan una distribución normal. Si el p-value es menor que el nivel de
significancia se descarta la Hipótesis Nula y por lo tanto se concluye que no
secumple con el supuesto de normalidad.
Otro software estadístico en el que es posible apoyarse para verificar el supuesto
de normalidad es el PASW. En la barra principal seleccionar los comandos a
continuación:
Gráfica con Escoger la
Estadísticos
Analizar Explorar Pruebas de Variable de Aceptar
Descriptivas
Normalidad Respuesta

El PASW ofrece el gráfico de probabilidad normal y dos pruebas analíticas para


verificar este supuesto:

 Shapiro Wilk (muestras menores a 50)


 Smirnof-Kolmorof (muestras mayores de 50)

Los resultados que se obtienen son muy similares al del MINITAB y se interpretan
de la misma forma.

Para comprobar el supuesto de homocedasticidad, donde se comparan las


varianzas por nivel, también se pueden utilizar ambos softwares. En el MINITAB
se encuentra las pruebas de Levene y de Barlett. En el PASW solamente se
puede utilizar la de Levene.

En el MINITAB los pasos son los siguientes:

Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste

En el PASW:

FALTA BLOQUES
Para cualquiera de los software, al obtener los resultados se puede inferir que las
varianzas de los niveles del FI son iguales si el valor de p-value es mayor que el
nivel de significancia establecido.

Para comprobar el supuesto de independencia, se puede utilizar Minitab,


seleccionado el gráfico de residuos vs orden

Modelo Factores: Gráficos:


Variable de
Estadísticas
Estadísticas ANOVA
ANOVA Lineal
Lineal Bloques
Bloques yy Residuos
Residuos vs
vs Aceptar
Aceptar
Respuesta
Respuesta
General
General Niveles
Niveles Orden
Orden

El gráfico obtenido debe presentar un comportamiento aleatorio para que se


verifique el supuesto de independencia. Si este gráfico presentara alguna
tendencia no se cumple con dicho supuesto.

Luego que se verifican los supuestos del ANDEVA se procede a comprobar la


hipótesis principal del experimento, a través de la prueba estadística F de Fisher.
Recuerde que la hipótesis principal compara los promedios de la variable de
respuesta para cada nivel.

Las ecuaciones para el cálculo de la prueba F de Fisher, varían un poco en


relación a la forma en que el modelo estadístico se haya planteado:
Si el modelo se escribe de la forma (1)

Y ij=μ+τ j +ε ij (1)

Entonces el cálculo de la prueba F se hace a través de las ecuaciones


presentadas en el cuadro 5 .
Cuadro 5: Cálculo de la Prueba Estadística de Fisher
Donde las sumas de cuadrados para el total y para los niveles se calculan
respectivamente por (10) y (11)

2 2
n
Y..2
k
Y . j Y ..
SCT0   Y 
k
nk
2
ij SCN =∑ j=1 −
i 1 j 1 n nk
(10) (11)

Para el modelo de la forma (2)

Yij     i   ij
El cálculo de la La prueba F se calcula siguiendo las ecuaciones del cuadro 6 .
Cuadro 6: Cálculo de la Prueba Estadística de Fisher
Donde las sumas de cuadrados para el total y los niveles se calculan
respectivamente por (12) y (13)

k n2
Y Y 2i . Y 2. .
k
SCT 0 =∑ ∑ Y 2ij − . . SCN =∑i=1 −
i=1 j=1 nk n nk
(12) (13)

La demostración de las fórmulas ´presentadas en los cuadros (5) y (6) se


encuentran en el anexo…….

Los resultados encontrados con la prueba F permiten en primer lugar comprobar la


hipótesis principal, si se descarta o no la Hipótesis Nula( Ho), donde se
comparan los promedios de los niveles

Apoyándose en los cuadros 5 o 6, las conclusiones se describen de la siguiente


manera:
 Si Fc es mayor que Fα se descarta Ho, si Fc es menor que Fα, no se
descarta Ho.
En segundo lugar se da respuesta al problema objeto de estudio en base a la
conclusión estadística, es decir, se concluye si existen diferencias significativas o
no en los promedios de variable de respuesta para cada nivel.
Otra manera de llegar a determinar si se descarta o no la Hipótesis Nula es a
través del valor de p-value. El p-value se calcula a través del área que está a la
derecha del valor de Fc y se compara con el valor del nivel de significancia
establecido.

Si el valor de p-value es mayor que el valor del nivel de significancia α no se


descarta la hipótesis nula. Si es menor entonces se descarta Ho.

Los datos experimentales permiten estimar los parámetros del modelo: la media,
la varianza y la desviación estándar.

Los cálculos para los parámetros son los mismos, independientemente del
formato que se haya elegido para el modelo. Se utilizan las ecuaciones (14) ,
(15) y (16) respectivamente, para la media, varianza y desviación estándar

n k
(14)
σ =∑√CMEE
∑ Y ij
(15)
 2  CMEE (16)
i=1 j=1
μ=
nk
Para el cálculo de los Intervalos de Confianza del 100( 1 – α) % para la media de
cada nivel es importante recordar cómo se escribió el modelo estadístico y el
formato que se utilizo para la recolección de los datos experimentales.
Si el modelo se escribió de acuerdo a la forma 1 se utiliza la expresión (17):

(17)
IC μ j = y . j±t α/ 2 ,k (n−1 ) √ CMEE/n
Si el modelo se escribió de acuerdo a la forma (2) se utiliza la expresión (18)
(18)
IC μ i= y i. ±t α /2 ,k (n−1 ) √ CMEE/n
Otro indicador que es
importante calcular e interpretar es el Coeficiente de Determinación, para lo cual

(19) R 2 SCN 0 ≤ R2 ≤ 1

=
SCT o
Esta fórmula es la misma independientemente de la forma en que se haya escrito
el modelo.
Como se interpreta este indicador?

Es la variabilidad en los valores observados en la variable de respuesta, explicada


por el modelo estadístico, en el caso de un DCA de un solo factor, es debido a la
variable independiente.

B. Experimento Desbalanceado
En algunos experimentos, puede ser diferente el número de observaciones que
se hacen dentro de cada tratamiento, es decir no es posible recolectar el mismo
número de observaciones para cada nivel, se dice entonces que este experimento
es desbalanceado.

En este diseño existen ciertas variaciones en las fórmulas para el análisis de


varianza, con respecto al balanceado en este caso en la suma de cuadrados .

Para abordar un experimento desbalanceado se siguen los mismos pasos que


en uno balanceado, con la diferencias que habrá una cantidad desigual en el
número de observaciones para cada nivel.
Si el Modelo Estadístico se escribe utilizando las columnas para colocar los
niveles del factor, se representa por la expresión (20)

Y ij=μ+τ j +ε ij
 (20) j=1. .. .. . k
i=1. . .. .. n k
donde

Y ij es la i-ésima medición realizada a la unidad experimental correspondiente


utilizando el j-ésimo nivel del factor de interés.

μ  es la media total de los valores medidos sobre las unidades experimentales


 
τj es el efecto del j-ésimo nivel del factor de interés sobre los valores de variable
de respuesta
 
εij es el error experimental.

  Se utililiza nk para indicar que es un experimento desbalanceado.

Cuando se utilizan las filas para representar los niveles del factor el Modelo
Estadístico se escribe como la expresión (21)

(21)
Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . nk

donde
Y ij
es la j-ésima medición realizada a la unidad experimental correspondiente
utilizando el i-ésimo nivel del factor de interés

μ es la media total de los valores medidos sobre las unidades experimentales

τi es el efecto del i-ésimo nivel del factor de interés sobre la variable de


respuesta

ε ij el error experimental

Para la formulación de Hipótesis cuando el FI es Fijo se utiliza la misma expresión


que se usó en el caso balanceado (3)

  H o : μ1 =μ2 =. .. .. . .. . μ k
H1 = al menos una de las medias de la variable de respuesta es diferente

La respectiva Regla de Decisión para un nivel de significancia α se escribe por la


expresión (22)
F c≥F α , g ln,gld
Descartar Ho si:
donde
gln=k−1
k
(22) gld=∑ j=1 n j−k

Para la formulación de Hipótesis cuando el FI es aleatorio, se utiliza la misma


expresión que se usó en el modelo balanceado (5)

H 0 :σ 12=σ 22=.. .. . .. .. σ 2k
H1 : al menos una de las varianzas de la variable de respuesta es diferente (5)
La Regla de Decisión para un nivel de significancia dado es la expresión (23 )
Descartar Ho si:
(23) F c≥F α , g ln,gld
donde
g ln=k−1
k
gld=∑ j n j −k

En este punto se hace referencia a la figura 1 donde se muestra gráficamente la


región de rechazo, que es la misma para el caso balanceado. Es la misma
independiente del tipo de factor que se presente en el experimento
Para realizar el procedimiento de aleatorización en el modelo completamente al
azar desbalanceado primero se deben codificar los elementos de la población de 1
hasta N, donde: N= n1 + n2 +…nk , para luego establecer un orden aleatorio, y
asignar los niveles del factor de interés a las unidades experimentales.

Para el registro de los datos experimentales se diseña el formato correspondiente


Si se utilizan las columnas para representar los niveles del FI se utiliza el cuadro
(7).

Cuadro 7 : Formato de registro de datos. Caso desbalanceado

Si se utilizan las filas para representar los niveles del factor se recomienda el
cuadro 8 .
Cuadro 8: Formato de registro de datos para un experimento
desbalanceado

También se deben verificar los supuestos del ANDEVA mencionados en el diseño


balanceado. Se utilizan las mismas técnicas estadísticas y es recomendable
apoyarse en herramientas como Minitab, y PASW.

Si se utilizan las columnas para representar los niveles del factor El ANDEVA se
hace a través de las ecuaciones del cuadro 9.
Fuentes de Grados de Suma de Cuadrado Fc Fα
variación libertad cuadrados Medio
FV Gl SC CM
Entre Niveles k−1 SCN CMN F α,g ln, gld
(N) SCN k−1 CMEE
k SCEE
Error
∑ j=1 nk −k SCT O−SCN k
Experimental ∑ j=1 nk −k
k
Total
∑ j=1 nk −1 SCT O
Cuadro 9 : ANALISIS DE VARIANZA DCA desbalanceado.

Para calcular la suma de cuadrados de los niveles y la suma de cuadrados del


total se deben utilizar las expresiones (24) y (25) respectivamente
2 2
k Y.j Y ..
(24) SCN =∑ j=1 − k
nk
∑ j=1 n k
nk k 2
2 Y ..
(25) SCT o =∑ ∑ Y ij −
N
i=1 j=1

El análisis de Varianza para el modelo completamente al azar desbalanceado


cuando los niveles del FI se colocan en las filas se presentan también en el
cuadro 9.
Sin embargo para calcular la suma de cuadrados de los niveles y los totales se
utilizan las expresiones (26) y (27) respectivamente

(26) Y 2i.
k Y 2. .
SCN =∑ i=1 − k
nk
∑i=1 nk

k nk 2
(27) 2 Y ..
SCT o=∑ ∑ Y ij −
N
i=1 j=1
Las conclusiones se plantean de la misma forma que en el experimento
balanceado

Para el cálculo de los parámetros se utilizan las expresiones (28), (29) y (30)
respectivamente

2
n k σ =CMEE
∑ ∑ Y ij
i=1 j=1 (28)
μ=
N
σ = √CMEE
(29)

(30)

Para el cálculo de los Intervalos de Confianza del 100( 1 – α) % para la media de


cada nivel del FI, es importante recordar cómo se escribió el modelo estadístico y
el formato que se utilizó para la recolección de los datos experimentales.
Si el modelo se escribió de acuerdo a la forma 1 se utiliza la expresión (31)

IC μ = y . j±t α/ 2 , ∑ n −k √CMEE /nk


(31) j k

Si el modelo se escribió de acuerdo a la forma (2) se utiliza la expresión (32)

(32)
IC μ = y i. ±t α /2 ,k (n−1 ) √ CMEE/nk
i

Modelo à Y ij=μ+τ j +ε ij Y ij=μ+τ i +ε ij


Calculo del intervalo
de confianza del Ecuación
100(1-α)% para la IC μj = y . j±t α /2 ,k (n−1) √ CMEE/n
media µj del j-esimo
nivel del factor de
interés

Calculo del intervalo


de confianza del Ecuación
100(1-α)% para la IC μi = y i.±t α /2 , k( n−1) √ CMEE/n
media µi del i-esimo
nivel del factor de
interés

Y el cálculo del Coeficiente de Determinación por la expresión (33)

R 2 SCN 0 ≤ R2 ≤ 1 (33)

=
SCT o
La interpretación es la misma que en el diseño balanceado.

EJEMPLO: FABRICACION DE CALZADO/ CASO BALANCEADO


La Zapatería Ultra Moderna como parte de sus estrategias desea mejorar la
calidad de las suelas de los zapatos que fabrica, los cuales se pueden hacer con
uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.

Para ello, contrata los servicios de I.C.S.A. Los especialistas de esta agencia de
consultoría diseñan un experimento en que se prueban los cueros con una
máquina que hace pasar los zapatos por una superficie abrasiva, la suela de los
zapatos se desgasta al pasarla por dicha superficie. Como criterio de desgaste
se usa la pérdida de peso después de un número fijo de ciclos. Se prueban en
orden aleatorio 24 zapatos, seis de cada tipo de cuero.

Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en
el formato correspondiente.

Como se Define el Problema en este caso?


De acuerdo al propósito del estudio se puede redactar de dos formas diferentes:
 Determinar si hay diferencias significativas en la pérdida de peso promedio
para cuatro tipos de cuero (A,B,C y D) o…
 Determinar el efecto de cuatro tipos de cuero en la pérdida de peso
promedio de la suela de un zapato.
Cuál es la Variable de Respuesta: pérdida de peso promedio

Cuál es el Factor de Interés o variable independiente: tipos de cuero


Cuantos Niveles tiene el FI : 4 Cuales son? Tipos de Cuero A, B, C y D.

Cuál es la Unidad experimental: el zapato (suela de un zapato)

Cuantas observaciones se hacen por cada nivel? 6


Cuantas observaciones se hacen en total en el experimento? 24

El Modelo Estadístico se escribirá utilizando la forma (1)


Y ij=μ+τ i +ε ij
i=1. . .. .. k
j=1. .. .. . n
Donde:

Yij = es la j-ésima pérdida de peso de la suela del zapato para el i-ésimo tipo de
cuero
m = desgaste promedio (pérdida de peso promedio)
t i = es el efecto del i-ésimo tipo de cuero sobre la pérdida de peso de la suela del
zapato
e ij= es el error experimental

Formulación de Hipótesis

Dado que en este experimento no se seleccionan los niveles del factor


aleatoriamente se considera el factor tipo de cuero como fijo. Por lo tando la
hipótesis nula se plantea como:

  H o : μ1 =μ2 =μ3 =μ4


H1 = al menos una de las pérdida promedio es diferente

En términos cualitativos esta hipótesis nula dice que la pérdida de peso promedio
para cada uno de los tipos de cuero es igual.
Para un nivel de significancia del 5% la Regla de Decisión se expresa por (4):

Región de Rechazo

Descartar Ho Si

F c≥F 0.05, 3 ,20


F 0.05,3,,2020
donde
g ln=4−1=3
gld=4(6−1)=20
Procedimiento de Aleatorización

Dado que en total se deben hacer seis observaciones por cada tipo de cuero se
enumeran las corridas del experimento de uno a veinticuatro. Luego se buscan
24 números aleatorios entre uno y veinticuatro. Finalmente se le asignan los
zapatos con cada uno tipos de cuero a cada una de las corridas del experimento.
En el cuadro 10 se resumen cada uno de los pasos expresados.

CODIFICACIO ORDEN ASIGNACIO


N ALEATORIO N
1 3 A
2 10 A
3 14 A
4 8 A
5 15 A
6 1 A
7 11 B
8 18 B
9 23 B
10 7 B
11 22 B
12 12 B
13 2 C
14 24 C
15 4 C
16 6 C
17 13 C
18 5 C
19 17 D
20 16 D
21 19 D
22 9 D
23 20 D
24 21 D
Cuadro 10 : Aleatorización

De acuerdo al resultado de la tabla anterior el experimento se ejecutar de la


manera representada en el cuadro 11.

TC CORRIDAS
A 3 10 14 8 15 1
B 11 18 23 7 22 12
C 2 24 4 6 13 5
D 17 16 19 9 20 21

Luego que se hacen las mediciones de la variable de respuesta pérdida de peso


se obtuvieron los datos del cuadro 12 .
TIPO ORDEN DE LAS PRUEBAS
DE
CUERO
A 3 10 14 8 15 1
B 11 18 23 7 22 12
C 2 24 4 6 13 5
D 17 16 19 9 20 21
Responsable de las
mediciones Publio Medina
Fecha de Medición Primera semana enero 2014
ULTIMA
TURNO D APARATO BALANZA CALIBRACION Nov-13

Comprobación de los Supuestos del ANDEVA

Verificación del supuesto de NORMALIDAD

Gráficamente a partir del Grafico De Probabilidad Normal se obtiene el


diagrama de la figura 4 .
Probability Plot of C1
Normal
99
Mean 229.7
StDev 19.89
95 N 24
AD 1.312
90
P-Value <0.005
80
70
Percent

60
50
40
30
20

10

1
180 200 220 240 260 280
C1

Figura 4
Para que se cumpla el supuesto de normalidad los datos de la perdida de peso
deberán tener aproximadamente una línea recta. Observando el gráfico,
obtenido a través de minitab no se cumple con el supuesto de normalidad.

Si se utiliza la prueba de Ryan Joiner para comprobar la normalidad se debe


plantear la hipótesis de la siguiente manera:

Ho: La pérdida de peso de la suela de los zapatos presentan una distribución


normal
H1: La pérdida de peso de la suela de los zapatos no presenta una distribución
normal
Para un nivel de significancia de 5% la Regla de decisión se redacta como : Si p-
value ≥ 0.05. No se descarta la Hipótesis Nula formulada

Conclusión: Al observar el valor de P- value en el recuadro que está en la parte


superior derecha del gráfico en la figura 5, p value = 0.005 0.005 < 0.05 . Por
lo tanto se descarta Ho, esto significa que los datos no muestran una distribución
normal.
La verificación del supuesto residuos versus orden (figura ), utilizando Minitab.
de independencia se realiza a través del gráfico

Versus Order
(response is C1)

30

20
Residual

10

-10

-20
2 4 6 8 10 12 14 16 18 20 22 24
Observation Order

Figura 6
Al observar está gráfica de Residuo vs Orden se observa que no hay
tendencias marcadas y los datos tienen un comportamiento aleatorio, es decir, las
pérdidas de peso de la suela de zapatos no muestra una tendencia por lo cual
se concluye que son independientes. Gráficamente se concluye que las
observaciones de la perdida promedio de pesos no están correlacionadas ya que
el gráfico no presenta ninguna tendencia.

Para el Supuesto de homocedasticidad, se puede usar Minitab para construir los


intervalos de confianza para la desviación standard. En la figura 7 se aprecian
dichos intervalos de confianza

Test for Equal Variances for C1

Bartlett's Test

1 Test Statistic 8.48


P-Value 0.037
Levene's Test
Test Statistic 0.67
P-Value 0.583
2
C2

0 10 20 30 40 50 60
95% Bonferroni Confidence Intervals for StDevs
Figura 7
Esta grafica indica que los intervalos de confianza para los tipos de cuero
tienen aproximadamente la misma desviación estándar, sin embargo el intervalo
para el tipo de cuero C tiene un ancho mayor.
Analíticamente se puede usar la prueba de Levin, cuyos resultados están en la
parte superior derecha de la figura .En primer lugar es necesario plantea la
siguiente hipótesis:
Ho: σ12 = σ22 = σ32 = σ42
H1: al menos una varianza es diferente
Para un nivel de significancia del 5%. Se establece como regla de decisión No se
descarta la H0 si Pvalue ≥ 0.05
De acuerdo a la Prueba de Levene el Pvalue= 0.583
Conclusión: Dado que Pvalue (0.583) > 0.05, no se descarta Ho, esto significa que
se cumple el supuesto de Homocedasticidad que dice que las varianzas de las
observaciones de las pérdidas de peso de los tipos de cuero son iguales.
Tanto la prueba de Levine como la de Barlett indican que las varianzas de la
perdida promedio de pesos son iguales para los tipos de cuero estudiados

Aún cuando en este experimento no se cumple con el supuesto de normalidad se


presenta a continuación el Análisis de Varianza(ANDEVA).

TIPO
DE
CUERO ORDEN DE LAS PRUEBAS SUMA PROMEDIO
A 264 260 258 241 262 255 1540 256.7
B 208 220 216 200 213 206 1263 210.5
C 220 263 219 225 230 228 1385 230.8
D 217 226 215 224 220 222 1324 220.7
Responsable de las
mediciones Publio Medina 5512 229.68
Fecha de Medición
Primera semana enero 2014
ULTIMA PROMEDIO
TURNO D APARATO BALANZA CALIBRACION 13-Nov TOTAL TOTAL
Cuadro 13 : Pérdida de peso de la suela de los zapatos
Las datos obtenidos para la medición de las pérdidas de peso de las suelas de los
zapatos a través de la prueba realizada se muestran en el cuadro 13.

El Análisis Estadístico se resume en los cuadros (14) y (15) .


TIPOS DE Cuenta Suma Promedi Varianz
CUERO o a
A 6 1540 256.6667 68.6666
7
B 6 1263 210.5 52.7
C 6 1385 230.8333 266.966
7
D 6 1324 220.6667 17.4666
7
Cuadro 14 : Resumen de cálculos estadísticos por nivel

Origen de las Suma de Grados de Cuadrado


Fc P-value F3, 20
variaciones cuadrados libertad Medio

Tipos de 7072.3333 2357.4444 23.237500


3 1.00E-06 3.09839121
cuero 3 4 7

Error
2029 20 101.45      
Experimental

9101.3333
Total 23        
3
Cuadro 15: ANALISIS DE VARIANZA

Las conclusiones se describen de la siguiente manera:


 En el cuadro 15 se observa que Fc es mayor que F0.05, 3, 20, por lo
tanto se descarta Ho

 Se concluye que existen diferencias significativas en la pérdida promedio de


peso(miligramos) de la suela de los zapatos para los tipos de cuero en
estudio
También se puede utilizar el valor de p-value para hacer las conclusiones
comparando versus el nivel de significancia utilizado (5%)

n k
La pérdida de peso promedio total es:
∑ ∑ Y ij
i=1 j=1
μ=Ȳ¯ =5512/24=229. 67 μ=
nk
Del cuadro 15 se obtiene el Cuadrado medio del error experimental, el cual es
igual a la varianza.

2
σ =CMEE =101. 45
2
y la desviación estándar σ =CMEE
σ = √101 . 45

Los Cálculos de los Intervalos de Confianza del 100( 1 – α) % para la Pérdida de


peso promedio de cada tipo de cuero se muestran a continuación

IC μi=y i.±t α/2 ,k(n−1) √ CMEE/n


.5.1.1 Balanceado
Un fabricante supone que existe diferencia en el contenido de calcio en los lotes
de materia prima que le son suministrados por su proveedor. Actualmente hay
una gran cantidad de lotes en la bodega. Cinco de estos son elegidos
aleatoriamente. Un químico realiza cinco pruebas sobre cada lote y obtiene los
siguientes datos:

Tabla n°1.15
Lotes
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38

Observación: Para el problema descrito, identifique las consideraciones previas


(Problema, identificación de la variable respuesta, selección del factor de interés,
selección de los niveles, definición de las unidades experimentales y estime el
tamaño de muestra por cada nivel)

Solución de problema
Primeramente, antes de analizar los datos se procede a definir el problema en
estudio y sus respectivos aspectos:

Problema: Determine si existe diferencia en el contenido de calcio en los lotes de


materia prima, para cinco lotes diferentes de la bodega.

Variable de respuesta: Contenido de calcio en los lotes de materia prima.


Factor de interés: lote de materia prima.

Nivel del factor de interés: lotes (1, 2, 3, 4, 5)

Diseño experimental viable a la situación: Diseño completamente al azar (DCA):


Balanceado.

Además, es necesario definir tamaño de muestra (número de observaciones por


cada nivel) e identificar las unidades experimentales que han ser medidas en el
estudio, que para este caso serian:
Tamaño de muestra: n=5 por cada lote
Unidad experimental: lotes de materia prima.

Una vez definidas las consideraciones previas, se procede a formular el modelo


estadístico y definir cada uno de sus componentes:

Modelo estadístico:
El modelo correspondiente a este experimento es el siguiente:
Y ij=μ+τ j +ε ij
j=1. .. .. . k
i=1. . .. .. n

Y ij : es el i-ésimocontenido de calcio para el j-ésimo lote de materia prima.


μ : Contenido Promedio (Media total)
τj : es el efecto del j-ésimolote de materia prima sobre el contenido de calcio en
lotes de materia prima.

εij : es el error experimental.

Luego, de haber formulado el modelo correspondiente se realiza el contraste de


hipótesis:

Hipótesis:
H0: μ1 = μ2 = μ3= μ4 = μ5
H1: al menos uno de los contenidos de calcio en lotes materia prima es diferente.

Para realizar el análisis de los datos, es importante establecer el nivel de


significancia, el cual sirve para establecer el punto crítico de rechazo y la regla de
decisión, la cual se basa en la Prueba F de Fisher para probar las hipótesis:
Nivel de significancia: α = 0.05

Regla de Decisión:
Descartar Ho si:
F c≥F 0.05 ,4 ,20
Región de Rechazo
donde
gln=k−1=5−1=4
gld=k(n−1)=5(5−1)=20
F0.05, 4, 20=2.87
Luego de haber establecido, todo estos parámetros, es recomendable realizar la
aleatorización (la aleatorización puede hacerse una ves se han recogido los datos)

Procedimiento de aleatorización
Unidad Exp. Orden aleatorio asig de nivel 1
3 1
2 8 1
3 13 1
4 1 1
5 21 1
6 16 2
7 19 2
8 5 2
9 23 2
10 7 2
11 10 3
12 2 3
13 14 3
14 22 3
15 17 3
16 4 4
17 24 4
18 11 4
19 25 4
20 6 4
21 20 5
22 15 5
23 9 5
24 12 5
25 18 5

Después de la aleatorización, se procede a proponer un formato para la


recolección de los datos en base a la aleatorización: se recomienda capturar los
datos en el orden en el que se hallan hecho las mediciones:

Tabla n°1.16: Aleatorización


Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
3 () 16 ( ) 10 ( ) 4 () 20 ( )
8 () 19 ( ) 2 () 24 ( ) 15 ( )
observacione 13 ( ) 5 () 14 ( ) 11 ( ) 9 ()
s 1 () 23 ( ) 22 ( ) 25 ( ) 12 ( )
21 ( ) 7 () 17 ( ) 6 () 18 ( )

Después se recurre a la toma de datos, que en este caso serian:

Tabla n°1.17: Datos post-aleatorización


Lotes
1 2 3 4 5
23.46 23.59 23.51 23.28 23.29
23.48 23.46 23.64 23.40 23.46
Obsevacione 23.56 23.42 23.46 23.37 23.37
s 23.39 23.49 23.52 23.46 23.32
23.40 23.50 23.49 23.39 23.38

Antes de realizar el análisis de varianza de los datos es recomendable verificar los


supuestos del ANDEVA, ya que estos datos deben cumplir con tres supuestos
para hacer el análisis:
Estos supuestos son: normalidad, homocedasticidad e independencia.

Para un mejor entendimiento de los casos, se utilizará tanto el programa minitab


como el PASW, para verificar los supuestos de la siguiente manera:

Verificación de supuestos del ANDEVA

Normalidad
Se refiere a que los datos deben seguir una distribución de normalidad.
Antes de realizar la verificación, es necesario establecer las hipótesis y sus
respectivas reglas de decisión:

Hipótesis:
Ho: Las pérdidas de peso en la suela de los zapatos presentan una distribución
normal.

H1: Las pérdidas de peso en la suela de los zapatos no presentan una distribución
normal.

Regla de decisión: no se descarta Ho si P-value≥α

Resultados, del supuesto de normalidad para el programa MINITAB:


Primeramente captar los datos, en columnas ya sea para los niveles del factor de
interés así como, los datos de las variables respuesta con sus respectivas
definiciones.

Se utiliza como referencia al valor de P-value para concluir y si se cuenta con la


tabla de Ryan-Joiner, también se puede concluir en base a esta.

Se concluye de la siguiente manera:

Grafica n°1.1: supuestos de normalidad


Gráfica de probabilidad de contenidodecalcio
Normal
99
Media 23.44
Desv.Est. 0.08770
95 N 25
RJ 0.992
90
Valor P >0.100
80
70
Porcentaje

60
50
40
30
20

10

1
23.2 23.3 23.4 23.5 23.6 23.7
contenidodecalcio

En este grafico se muestra que los contenidos de calcio en los lotes de materia
prima, presentan una línea recta y también el valor de P-value (P>0.100 ¿ α =0.05
), por lo tanto se concluye que los contenido de calcio en los lotes de materia
prima sí siguen una distribución normal y se acepta la hipótesis Ho.

Resultados, del supuesto de normalidad para el programa PASW:


Primeramente se definen las variables en el apartado vista de variables y luego se
capturan los datos.

Tabla n°1.18: Supuestos de normalidad


Grafica n°1.2: Supuestos de normalidad

En donde igualmente que el anterior se concluye en base al grafico,yel valor de P-


value (sig) (P= 0.847 ¿ α =0.05), y de este modo para este caso, se concluye que
los contenido de calcio en los lotes de materia prima si siguen una distribución
normal y se acepta Ho.

Homocedasticidad
Se refiere a que los datos deben tener varianzas iguales.
Antes de realizar la verificación de este supuesto también, es necesario establecer
las hipótesis y sus respectivas reglas de decisión:

Hipótesis:
Ho: α 21 = α 22 =α 23 =α 24=α 25
H1: al menos una de las varianzas es diferente.
Regla de decisión: no se descarta Ho si P-value≥α.

Resultados, del supuesto de homocedasticidad para el programa MINITAB:


De aquí se despliega el grafico, para observar la igualdad de varianzas.

De esta manera, se concluye en base a este grafico:

Grafica n°1.3: Supuesto de homocedasticidad

Prueba de igualdad de varianzas para contenidodecalcio

Prueba de Bartlett
1 Estadística de prueba 0.04
Valor P 1.000
Prueba de Lev ene
Estadística de prueba 0.03
2
Valor P 0.998
Lotes

0.00 0.05 0.10 0.15 0.20 0.25 0.30


Intervalos de confianza de Bonferroni de 95% para Desv.Est.

De donde podemos concluir, lo siguiente:


Este resultado nos indica que los datos tienen varianzas aproximadamente iguales
y por tanto se acepta Ho, ya que P-value=0.998 ¿ α=0.05. Tanto para la prueba de
Bartlett como la de Levene se puede verificar la igualdad de varianzas.

Resultados, del supuesto de homocedasticidad para el programa PASW:


En este caso también ya tenemos los datos capturados, de modo que se continúa
utilizando los mismos datos para esta prueba.

De donde se obtiene el resultado de la Prueba de Levene:

Tabla n°1.19: Supuestos de homocedasticidad

De modo que este resultado nos indica que los datos tienen varianzas
aproximadamente iguales y por tanto se acepta Ho, ya que P-value=0.998 ¿
α=0.05.

Independencia
Se refiere a que los datos deben ser independientes del resto de los datos.
En este caso, no se establecen hipótesis pero si se requiere establecer la regla de
decisión, que en este caso seria:

Regla de decisión: se descarta Ho si el grafico de independencia muestra una


tendencia.
Resultados, del supuesto de independencia para el programa MINITAB:
Ya que los datos están capados, solo se procede a analizar estos.

Y se obtiene el siguiente resultado, del cual podemos concluir:

Grafica n°1.4: Supuestos de independencia

vs. orden
(la respuesta es contenidodecalcio)

0.10

0.05
Residuo

0.00

-0.05

-0.10

2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación

En este grafico se puede observar que los datos no muestran una tendencia y
presentan un orden aleatorio por tanto no se descarta Ho y se comprueba el
supuesto de independencia.

Análisis estadístico de los datos


Posteriormente, se procede con el análisis estadístico de los datos, obteniéndose
para este caso:
Tabla n°1.20: Análisis de datos
Lote 1 Lote 2 Lote 3 Lote 4 Lote 5
23.46 23.59 23.51 23.28 23.29
Observacione 23.48 23.46 23.64 23.40 23.46
23.56 23.42 23.46 23.37 23.37
s
23.39 23.49 23.52 23.46 23.32

23.40 23.50 23.49 23.39 23.38


Suma 117.29 117.46 117.62 116.9 116.82
Promedios 23.458 23.492 23.524 23.38 23.364

Seguidamente, se procede con el análisis de varianza, el cual nos permite probar


la hipótesis principal:

Este análisis se puede realizar manualmente, utilizando las formulas


proporcionadas y llenando la tabla siguiente, el cual va a depender del modelo
escogido, en este caso, seria:

n k 2
Y 2. j Y 2. .
k 2 Y ..
SCN =∑ j=1 − SCT 0 =∑ ∑ Y ij −
Utilizando las formulas: n nk y i=1 j=1 nk

Tabla n°1.21: Análisis de varianza


Fuente de Grados de Suma de Cuadrado Fc F crítica
variable libertad Cuadrados Medio
FV Gl SC CM
Entre Niveles k-1 = 5-1= SCN = SCN/(k-1)= CMN/CMEE= F
N 4 0.097 0.024
0.05,4,20
5.54
=

2.87

Error K(n-1)= SCEE = SCEE/k(n-1)=


experimental (5)*(4)= 0.088 0.004
EE 20
Total Nk-1= SCTo =
To 24 0.185
En cuanto al ANÁLISIS DE VARIANZA PARA EL PROGRAMA MINITAB, este se
obtiene directamente de la hoja de respuesta que se obtuvo al realizar la
verificación del supuesto de independencia:

El análisis de varianza para MINITAB ES:

Modelo lineal general: contenidodecalcio vs. Lotes


Factor Tipo Niveles Valores
Lotes fijo 5 1, 2, 3, 4, 5

Análisis de varianza para contenidodecalcio, utilizando SC ajustada para pruebas

Fuente GL SC Sec. SC Ajust. CM Ajust. F P


Lotes 4 0.096976 0.096976 0.024244 5.54 0.004
Error 20 0.087600 0.087600 0.004380
Total 24 0.184576

S = 0.0661816 R-cuad. = 52.54% R-cuad.(ajustado) = 43.05%

Para el caso del Programa PASW el Análisis de Varianza se obtiene del resultado
que se obtiene cuando se hace la prueba de homogeneidad de varianzas:

Observación: para el caso del programa PASW, no tiene la


Tabla
opción de realizar la prueba de independencia
n°1.22:
Análisis de
datos
Posteriormente se buscar otros indicadores que se deben calcular, tales como:
Calculo del coeficiente de determinación: el cual hace referencia a la suma de
cuadrados de niveles, el cual se obtiene del ANDEVA o también se puede calcular
manualmente, con la formula: depende del modelo propuesto:

kY 2. j Y 2. .
SCN =∑ j=1 −
1. n nk à Y ij=μ+τ j +ε ij

2 2
Yk Y
SCN =∑i=1 i . − . . Y ij=μ+τ i +ε ij
2. n nk à

R2 SCN 0. 097
=
SCT o = 0. 185 =0. 52=52 %

Interpretación: Existe una variabilidad del 52% en los contenidos de calcio en los
lotes de materia prima.

También se deben hacer los cálculos de parámetros que son:


μ=586 .09/25=23. 44
2
σ =CMEE =0 . 004

σ = √0 . 004= 0. 063
Adicional se deben calcularlos intervalos de confianza, los cuales para este caso
son:

Cálculo del Intervalo de Confianza del 100( 1 – α) % para el contenido promedio


de calcio en lotes de materia prima.
IC μ i= y i. ±t α /2 ,k (n−1 ) √ CMEE/n

IC μ =23 . 46±t 0. 025, 20 √ 0 . 004/5 23.46±(2.086) √0.004/5 μi


1
= = 23.40 < >23.52

IC μ =23. 49±t 0 .025 ,20 √0 . 004 /5 23.49±(2.086)√ 0.004/5 μi


2
= = 23.43< >23.55

IC μ 3 =23. 52±t 0 .025 ,20 √0 . 004 /5 23.52±(2.086) √0.004/5 μi


= = 23.46<

>23.58

IC μ =23. 38±t 0. 025, 20 √ 0 .004 /5 23.38±(2.086) √ 0.004/5 μi


4
= = 23.32<

>23.44

IC μ 5=18 . 36±t0 . 025,20 √ 0 .004 /5 23.36±(2.086) √ 0.004/5 μi


= = 23.30< >23.42

Por ultimo se realizan las Conclusiones finales, las cuales deben contener la
conclusión de la hipótesis principal.

Para este caso podemos concluir de la siguiente manera:


Como Fc es mayor que F α (Fc = 5.535)¿(F 0.05,4,20 = 2.87),por lo tanto se descarta H 0
y se acepta la hipótesis H1.
De este modo se concluye que a un nivel de significancia de 0,05, si hay
diferencia y por tanto, uno de los contenidos promedio de calcio en los lotes de
materia prima es diferente.

EJEMPLO 2: TABLERO DE CONTROL DE UN AEROPLANO/ CASO


DESBALANCEADO

COPA es una aerolínea panameña, la cual mantiene un compromiso de mejora


continua con todas las partes interesadas. Continuamente se realizan
investigaciones para mejorar sus servicios. Conscientes de diferentes situaciones
de emergencia que se pueden presentar en un vuelo, COPA ha contratado los
servicios de I:C:S:A: para realizar un experimento donde se desea estudiar la
mejor disposición de los instrumentos sobre un tablero de control de un aeroplano,
se prueban tres distintos arreglos simulando una situación de emergencia, y
observando el tiempo de reacción requerido para corregir la avería.
Cuál es el propósito principal de este experimento, que persigue la aerolínea
COPA con la realización de este experimento.

Determinar si hay diferencia significativa en los tiempos de reacción promedio


para tres arreglos diferentes de los instrumentos del tablero de control de un
aeroplano.
Variable de Respuesta: Tiempo de reacción de los pilotos
 Factor de interés: Los tres arreglos diferentes: Disposición 1, Disposición 2 y
Disposición 3
 Niveles: D1, D2, D3
Unidades experimentales: los pilotos
Número de observaciones/Niveles: Nivel 1 (8), nivel 2 (12), nivel 3 ( 8)
Modelo Estadístico

Y ij=μ+τ j +ε ij
i=1. . .. .. n k
j=1. .3
Yij = es el i-ésimo tiempo de reacción de un piloto para la j-ésima disposición
  = es el tiempo de reacción promedio
j = es el efecto de la j-ésima disposición sobre el tiempo de reacción de cada
piloto.
ij= es el error experimental
HIPOTESIS
Ho = µ1=µ2=µ3 
H1 = al menos uno de los tiempos de reacción promedio para cada disposición es
diferente
 Regla de Decisión: Descartar Ho si Fc F0.05, 2, 25 = 3.385 glN= k-1 = 3-1 = 2glD= 28
– 3 = 25

Región de Rechazo F=3.385

Procedimiento de Aleatorización

El número total de unidades experimentales en este experimento es de 28. Se


codifican los pilotos dándoles un numero del 1 al 28. Luego se busca el orden
aleatorio. En una tabla de números aleatorios se seleccionan números entre 1 y
28. Después se procede a asignar la disposición a los pilotos que han sido
previamente aleatorizados, de acuerdo al número de observaciones establecidas
para cada disposición (ver cuadro 16)
Unidad Orden
Experimental Aleatorio Asignación
1 10
2 1
3 11
4 20
5 16
D1
6 17
7 2
Las corridas del experimento son como en el cuadro
8 23
9 9
17
10 19
D1 D2 D3
11
10 924 8
121 13
19 27
13
11 244 18
14
20 22
13 14
15
16 415 D2
26
16
17 22
21 28
172 153 7
23
18 216 25
19  312  
20  65  
12
21  8  
5
22  27  
23   18  
24 14
Cuadro 17
25 26
D3
26 28
27 7
28 25

Cuadro 16
Registro de Datos

Los tiempos de reacción observados para cada piloto de acuerdo a la


disposición asignada se pueden ver en el cuadro 18 
Toma de Datos
FI: DISPOSICIONES
Observaciones
Disposición 1 Disposición 2 Disposición 3
1 14 10 11
2 13 12 5
3 9 9 9
4 15 7 10
5 11 11 6
6 13 8 8
7 14 12 8
8 11 9 7
9   10  
10   13  
11   9  
12   10  
TOTALES 100 120 64
CUADRO 18: TIEMPO DE REACCION DE LOS PILOTOS

Luego se procede a verificar los supuestos del ANDEVA USANDO MINITAB

Prueba de normalidad
Por medio de la gráfica de probabilidad normal se verifica el supuesto de la
normalidad, el que se presenta en la figura 8
Probability Plot of C1
Normal
99
Mean 10.18
StDev 2.525
95 N 28
RJ 0.999
90
P-Value >0.100
80
70
Percent 60
50
40
30
20

10

1
5.0 7.5 10.0 12.5 15.0 17.5
C1

Figura 8
Al observar la grafica de la figura 8 se observa que los tiempos de reacción
presentan aproximadamente una línea recta, por lo tanto se puede concluir
que los tiempos de reacción de los pilotos presentan una distribución
normal. Gráficamente se concluye que las observaciones de las reacciones
promedios de los pilotos se distribuyen normalmente, ya que el gráfico presenta
aproximadamente una línea recta.

Aplicando la prueba de Ryan Joiner para validar el resultado gráfico se plantea la


siguiente hipótesis:

Ho: Tiempo de reacción de los pilotos presentan una distribución normal


H1:Tiempo de reacción de los pilotos no presenta una distribución normal
Regla de decisión: No se descarta la H0 si Pvalue ≥ α
Observando el resultado del p-value para la rueba de Ryan Joiner , en la parte
superior derecha de la figura, se concluye lo siguiente:

Pvalue: 0.100≥ 0.05. De acuerdo a la prueba RyanJoiner se observa que el p-


value es mayor que el nivel de significancia por lo tanto no se descarta la Hipótesis
Nula y se concluye que los datos presentan una distribución normal.
Independencia

Al observar la gráfica de Residuo vs Orden, en la figura 9, se verifica el


supuesto de independencia del Tiempo de reacción de los pilotos: estos datos
no muestran ninguna tendencia, tienen un comportamiento bastante aleatorio, por
lo tanto se cumple el supuesto de independencia. Por lo tanto gráficamente se
concluye que las observaciones del tiempo de reacción de los pilotos no están
correlacionadas ya que el gráfico no presenta ninguna tendencia.

Versus Order
(response is C1)

1
Residual

-1

-2

-3

-4
2 4 6 8 10 12 14 16 18 20 22 24 26 28
Observation Order

Para el supuesto de homocedasticidad


Se plantea la hipotesis
Ho: σ12 = σ22 = σ32
H1:al menos una varianza es diferente
Con la Regla de decisión: No se descarta la h 0 si Pvalue ≥ α
De acuerdo a Prueba de Levene el Pvalue= 0.982≥α= 0.05
Observando los valores obtenidos para el p-value, en la parte superior derechad e
la figura 10, en las pruebas de Barlett y Levine se concluye lo siguiente
Pvalue (0.982) > 0.05, no se descarta Ho, esto significa que la varianza del tiempo
de reacción para las tres disposiciones son aproximadamente iguales

Test for Equal Variances for C1

Bartlett's Test
Test Statistic 0.15
1 P-Value 0.926
Lev ene's Test
Test Statistic 0.02
P-Value 0.982

2
C2

1 2 3 4 5
95% Bonferroni Confidence Intervals for StDevs

Figura 10

Continuando con el anaálisis se procede a realizar el ANDEVA. El cuadro 19 hace


un resumen de las estadisticas por disposicion.
ANDEVA- Análisis de Varianza

DISPOSICIONES Cuenta Suma Promedio Varianza


Disposición 1 8 100 12.5 4
Disposición 2 12 120 10 3.090909
Disposición 3 8 64 8 4
Cuadro 19 : Estadísticas por Disposición

El cuadro 20 presenta los resultados del ANDEVA

Suma de Grados
Origen de las Cuadrad P-
cuadrado de Fc F2,25
variaciones o Medio value
s libertad
DISPOSICIONES 81.428571 2 40.71429 11.3095 0.00032 3.38519

ERROR 90 25 3.6      
EXPERIMENTAL
Total 171.42857 27        

Cuadro 20 : resultados de ANDEVA

Conclusiones
Observando el resultando el cuasdro 20, as conclusiones se describen de la
siguiente manera:
Se observa que Fc>F, por lo tanto se rechaza Ho y se concluye que los tiempos de
reacción promedio de los pilotos para las tres disposiciones del tablero de control
de un aeroplano, no son iguales.

Cálculo de Parámetros

284
µ¿ =10.14
28
El segundo parámetro a calcular es la varianza y la misma es igual al cuadrado
medio del error experimental,
2 = 3.60

Y la desvicion estándar

Los Intervalos de Confianza correspondientes a cada disposición son los


siguientes:

IC μ =12 .5±t 0. 025, 25 √ 3 .60 /28


1

IC μ 2 =10±t 0.025,25 √3.60/28


IC μ 3 =8±t 0.025,25 √3.60/28

Cálculo del Coeficiente de Determinación

R2 SCN R2
=
81. 43
== =0.9047
90 .00
SCT o

El 90.45% de la variabilidad de lo tioemposd e reacion permite concluir que el


90.45% de la variabilidad de los tiempos de reacción se debe a las disposiciones.
Hay un 9.6% restante que se debe a otros factores.
1.5.2 Problemas Propuestos
1.5.2.1 Problema 1
En una determinada fábrica de dulces se desea saber si las harinas de sus cuatro
proveedores producen la misma viscosidad en la masa. Para ello, produce durante
un día 16 masas, 4 de cada tipo de harina, y mide su viscosidad. Los resultados
obtenidos son:

Proveedor Proveedor B Proveedor C Proveedor D


A
98 97 99 96
91 90 93 92
96 95 97 95
95 96 99 98

1.5.2.2 Problema 2
Se realizó un experimento para determinar la influencia de dos medicamentos
sobre el tiempo en realizar una tarea por parte de unos estudiantes. Los datos se
presentan a continuación:

Grupo 1 Grupo 2 Grupo 3 Grupo 1


(No medicamento) (Medicamento 1) (Medicamento 2) (Ambos medicamentos)
1 12 12 13
8 10 4 14
9 13 11 14
9 13 7 17
4 12 8 11
0 10 10 14
1 12 13
5 14
CAPÍTULO 2

1. DISEÑO DE BLOQUES AL AZAR- UN FACTOR


2.1 Definición
 Es el diseño experimental más ampliamente utilizado cuando se presenta el
caso de que las unidades experimentales no son homogéneas.

 Las unidades experimentales se dividen en grupos llamados bloques de modo


que las observaciones realizadas en cada bloque se realicen bajo condiciones
experimentales lo más parecidas posibles.
En este diseño, el experimentador agrupa las unidades experimentales en
bloques, y a continuación determina la asignación de los niveles del factor en
cada bloque.

 Requisito: Requiere que cada uno de los niveles del factor de interés se
prueben por lo menos una vez en cada uno de los bloques.
- Aquí, todos los posibles niveles del factor de interés son asignados en
forma aleatoria. Una variable bloque no presenta interacción con el factor
en estudio.

2.2 Generalidades

En muchos problemas de investigación es necesario diseñar experimentos en


los que pueda controlarse sistemáticamente la variabilidad producida por diversas
fuentes extrañas.
A estas variables se les denomina variables bloque, y se caracterizan porque:
• No son el motivo del estudio sino que aparecen de forma natural y obligada
en el mismo.
• Se asume que no tienen interacción con el factor en estudio.
• El experimentador no está interesado en investigar las posibles diferencias
de la respuesta entre los niveles de los factores bloque.
La ventaja de bloquear un factor que se supone que tiene una clara influencia en
la respuesta, pero en el que no se está interesado, convierte la variabilidad
sistemática no planificada en variabilidad sistemática planificada.

Consideraciones Previas
 Definición del Problema
 Identificación de la Variable de Respuesta
 Selección del Factor de Interés
 Selección de los Niveles
 Definición de las Unidades Experimentales
 Estimar el Tamaño de Muestra por cada nivel.

2.3 Pasos para la Resolución de Problemas en un DCA de 1 factor.

PROBLEMA A EXPLICAR

TEMA: Necesidades Energéticas del Individuo


Se quieren determinar las necesidades energéticas de una persona cuando anda,
come o hace deporte.
Supongamos que se tienen 10 personas para realizar el experimento y se
considera como variable respuesta o cuantitativa, el número de calorías
consumidas por segundo.

Los resultados varían según el individuo considerado. Aquí, el factor es la


actividad realizada, con 3 posibles niveles: andar, comer o hacer gimnasia
Si a cada una de las personas se le asigna una actividad distinta puede ser que la
variabilidad observada entre las distintas actividades sea debida a las diferencias
entre los propios individuos.
Una posible solución es que cada uno de los individuos realice las tres
actividades. De este modo, la variable bloque es el tipo de persona y cada uno de
los bloques es cada persona.

A cada bloque (persona) se le aplican los 3 niveles del factor por orden aleatorio:

BLOQUES ASIGNACION

Persona 1 C A G
Persona 2 A C G
Persona 3 G A C
Persona 4 C G A
Persona 5 . . .
Persona 6 . . .
Persona 7 . . .
Persona 8 . . .
Persona 9 . . .
Persona 10 . . .

Esto quiere decir que cada persona realiza cada una de las actividades y se mide
la variable de respuesta.

2.3.1 Definición del Problema

Primero que nada se debe comparar si existen diferencias significativas entre los
promedios de los niveles del factor de interés. De igual manera, se debe
determinar el efecto del factor de interés sobre la variable de respuesta.
Determinar la variable de respuesta, factor de interés, bloques y niveles.

2.3.2 Modelo Estadístico

Existen dos formas de representar el modelo estadístico y son las siguientes:


Colocando los bloques en las filas y los niveles del factor en las
columnas

Modelo Estadístico
Yij =  +  i + j + ij
i =1.….n
j= 1.….k

Donde:
Yij = es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés

 = es la media total

j = es el efecto del j-ésimo nivel del factor de interés

i= es el efecto del i-ésimo bloque.

ij = es el error experimental

Colocando los niveles del factor en las filas y los bloques en las
columnas

Modelo Estadístico

Yij =  +  j + i + ij
i =1.….k y j= 1.….n

Donde:
Yij= es la medición de la variable de respuesta en el i-ésimo bloque para el j-
ésimo nivel del factor de interés.
 = es la media total

i = es el efecto del i-ésimo nivel del factor de interés

j = es el efecto del j-ésimo bloque.

ij = es el error experimental.

2.3.3 Formulación de las Hipótesis


Para la formulación de las Hipótesis, hay que considerar que tipos de factores se
están estudiando en el experimento, ya que pueden ser de dos tipos: fijos y
aleatorios.
Para factores fijos y aleatorios se formula lo siguiente:
Hipótesis

Factor de Efectos Fijos

 Para los bloques


Ho: 1 = 2 =. . . = n
H1: al menos una de las medias de los bloques es diferente

Regla de Decisión: Se descarta Ho si Fc ≥ F,gln,gld


 gln = ( n – 1)
gld = ( k – 1) (n – 1)
 

 Para el factor de interés


Ho : 1 = 2 = . . . = k
H1 : al menos una de las medias de los niveles del factor de interés es diferente
  Regla de Decisión: Se descarta Ho si Fc ≥ F,gln,gld
gln = ( k – 1)
gld = ( k – 1) (n – 1)

 Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.

En este caso, las hipótesis de los bloques serían solo para confirmar que hay
diferencias entre éstos. Si se ha considerado un diseño por bloques es porque
éstos influyen en el experimento.
Como se dijo al inicio de esta sección, las hipótesis que se han planteado
anteriormente para el Diseño de Bloques al Azar (DBA), sirven tanto para factores
fijos como para factores aleatorios.

Hipótesis

Factor Efectos aleatorios

Cabe destacar que las hipótesis del factor de interés, en el caso que sean
Factores Aleatorios, se pueden escribir en términos de la varianza, por lo que
quedarían de la siguiente manera:

 Para el factor de interés


Ho: 1² = 2² =......... k²
H1: al menos una de las varianzas de los niveles del factor de interés es diferente
  Regla de Decisión: Se descarta Ho si Fc ≥ F,gln,gld
 gln = ( k – 1)
gld = ( k – 1) (n – 1)

 Estas hipótesis se pueden utilizar para cualquiera de los dos formatos del
Modelo Estadístico de DBA.
IMPORTANTE: Los factores de bloque no se incluyen en el experimento porque
no nos interesa su efecto, sino que es un medio de estudiar de manera más
adecuada el factor de interés.
Tiene un grado de importancia secundaria en relación al factor de interés.
Pueden existir otros factores que deben controlarse durante el experimento, pero
no se tiene que caer en el extremo de controlar todo. Se pueden controlar
entonces aquellos factores que por conocimiento del proceso o experiencia previa
se sabe que pueden afectar en forma sensible el resultado de las comparaciones.

2.3.4 Procedimiento de Aleatorización


El procedimiento de aleatorización se puede definir de la siguiente forma:

Para el Modelo Yij =  +  i + j + ij


Se debe asignar aleatoriamente cada uno de los k niveles del factor de interés
a cada uno de los n bloques considerados en el experimento.

B1 B2 .………… Bn
1 1 1
2 2 2
. . .
. . .
K k k

Para el Modelo Yij =  +  j + i + ij


Se debe asignar aleatoriamente cada uno de los n niveles del factor de interés
a cada uno de los k bloques considerados en el experimento.

B1: 1 2 3 4 ........k ( en forma aleatoria)


B2: 1 2 3 4 .........k ( en forma aleatoria)
Bn: 1 2 3 4 ..........k ( en forma aleatoria)

Por ejemplo:
3 Niveles: A,B,C para el factor de interés y 3 Bloques: 1,2,3

Una posible configuración de la asignación aleatoria de los niveles podría ser la


siguiente:
Bloque 1 C( ) A( ) B( )
Bloque 2 A( ) C( ) B( )
Bloque 3 C( ) B( ) A( )

2.3.5. Registro De Datos

Una vez identificados los niveles, los bloques, la variable de respuesta y el modelo
estadístico con el que se realizará todo el experimento. Se debe proceder a de
realizar el registro de datos donde primeramente se debe señalar quien es el
responsable de la realización del reporte, la fecha en que se está efectuando e
identificar para qué empresa se realiza la investigación. También es necesario
señalar el motivo de realización de dicho experimento, el factor de interés y la
unidad de medida, para que toda la información que se plasme en el reporte, se
realice de forma clara, consistente y veraz.
Luego se procede a elegir el formato de registro de datos a utilizar para el
experimento, en el cual para el Diseño de Bloques al Azar, existen dos formas
dependiendo del modelo estadístico previamente seleccionado.
Para el Modelo: Y ij =μ+ β i +τ j+ ε ij

NINIVELES

Totales/
BLOQUES

1 2 … k
Bloque
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Nivel

Para este formato, los datos ya aleatorizados correspondientes a los bloques se


ubican en las filas y llevan el orden (Y11, Y12,…Y1k); los datos aleatorizados de los
niveles se ubican en las columnas y llevan el orden (Y21, Y22,…Y2k). Luego de esto
se procede a sumar todos los datos de cada fila y columna para obtener así los
totales por bloque (Y1.) y nivel (Y.1). Por último se suman los totales de los bloques
y de los niveles, los cuales deben coincidir para obtener el gran total (Y..).

Para el Modelo: Y ij =μ+ β j + τ i+ ε ij

BLOQUES
Totales/
NIVELES

1 2 … K
Nivel
1 Y11 Y12 … Y1k Y1.
2 Y21 Y22 … Y2k Y2.
… …
N Yn1 Yn2 … Ynk Yn.
Totales/
Y.1 Y.2 … Y.k Y..
Bloque
Para este formato, los datos ya aleatorizados correspondientes a los niveles se
ubican en las filas y llevan el orden (Y11, Y12,…Y1k); los datos aleatorizados de los
niveles se ubican en las columnas y llevan el orden (Y21, Y22,…Y2k). Luego de esto
se procede a sumar todos los datos de cada fila y columna para obtener así los
totales por nivel (Y1.) y bloque (Y.1). Por último se suman los totales de los niveles y
de los bloques, los cuales deben coincidir para obtener el gran total (Y..)

2.3.6 Supuestos Del Modelo

Los supuestos que se tienen en consideración para la realización del experimento


del diseño bloques al azar son:

NORMALIDAD: Este supuesto indica que los resultados obtenidos para la


variable de respuesta en cada nivel deben seguir una distribución normal.

HOMOCEDASTICIDAD: Este supuesto indica que as varianzas de las


observaciones de la variable de respuesta en cada nivel no deben diferir
de forma significativa

INDEPENDENCIA: Este supuesto indica que cada conjunto de datos debe


ser independiente del resto, esto se comprueba cuando los datos en el
gráfico de independencia se muestran de forma aleatoria, sin ninguna
tendencia.

Para estos supuestos se plantean las siguientes hipótesis, que luego mediante
software estadísticos se van a aceptar o rechazar.

Hipótesis para la Normalidad:


Ho: Los datos del experimento presentan una distribución normal.
Hi: Los datos del experimento no presentan una distribución normal.
Hipótesis para la Homocedasticidad:

Para los niveles:


Ho: Las varianzas de los niveles y de la variable respuesta son iguales.
Hi: Las varianzas de los niveles y de la variable respuesta no son iguales.
Para los bloques:
Ho: Las varianzas de los bloques y de la variable respuesta son iguales.
Hi: Las varianzas de los bloques y de la variable respuesta no son iguales.

Hipótesis para la Independencia:


Ho: Los datos se muestran de forman independiente.
Hi: Los datos no se muestran de forman independiente.

Verificación de los Supuestos

Para comprobar los supuestos de normalidad, utilizaremos el software estadístico


Minitab. Los pasos son los siguientes:

Colocar la
Estadísticas Prueba de Seleccionar
Estadísticas Variable de Aceptar
Básicas Normalidad Ryan-Joiner
Respuesta

Otro software estadístico es el PASW, en donde se puede comprobar también es


supuesto de normalidad. Los pasos son los siguientes:
Gráfica con Colocar la
Estadísticos
Analizar Explorar Pruebas de Variable de Aceptar
Descriptivas
Normalidad Respuesta

Para comprobar la hipótesis nula de acuerdo a la prueba de Ryan Joiner se


debe observar que el p-value es mayor que el nivel de significancia por lo
tanto se acepta la hipótesis nula y se concluye que los datos presentan una
distribución normal.
Para comprobar los supuestos de homocedasticidad, utilizaremos el software
estadístico Minitab. Los pasos son los siguientes:
Para Comparar las varianzas de Variable de Respuesta vs Niveles

Seleccionar
Prueba de Colocar la
Comparar Gráfica de
Estadísticas ANOVA Varianzas Variable de Aceptar
con el Nivel Residuo vs
Iguales Respuesta
Ajuste

Para Comparar las varianzas de Variable de Respuesta vs Bloques

Seleccionar
Prueba de Colocar la Comparar
Gráfica de
Estadísticas ANOVA Varianzas Variable de con el Aceptar
Residuo vs
Iguales Respuesta Bloque
Ajuste

Otro software estadístico es el PASW, en donde se puede comprobar también es


supuesto de homocedasticidad. Los pasos son los siguientes:

Para Comparar las varianzas de Variable de Respuesta vs Niveles

Gráfica con Colocar la


Comparar ANOVA de un Comparar con
Analizar Pruebas de Variable de Aceptar
Medias factor el Nivel
Normalidad Respuesta

Para Comparar las varianzas de Variable de Respuesta vs Bloques

Gráfica con Colocar la


Comparar ANOVA de un Comparar con
Analizar Pruebas de Variable de Aceptar
Medias factor el Bloque
Normalidad Respuesta

Al obtener los resultados se puede inferir que las varianzas de los factores
son iguales si el valor de p>0.05.

Para comprobar el supuesto de independecia, solamente se utiliza el software


Minitab, ya que el PASW no tiene la función disponible para comprobar este
supuesto.

Modelo Factores: Gráficos:


Variable de
Estadísticas
Estadísticas ANOVA
ANOVA Lineal
Lineal Bloques
Bloques yy Residuos
Residuos vs
vs Aceptar
Aceptar
Respuesta
Respuesta
General
General Niveles
Niveles Orden
Orden
2.3.7 Análisis De Varianza
El análisis de varianza se realiza con el propósito de comprobar si la hipótesis de
los niveles y de los bloques planteados se comprueba o se rechaza.
Existen dos formatos y modos de calcular el análisis de varianza dependiendo del
modelo estadístico elegido.

Para el modelo: Y ij =μ+ β i +τ j+ ε ij


Grados Suma de Cuadrado
Fuente de
de Cuadrados Medio Fc Fa
Variable
Libertad SC CM
Niveles CMN/CME
k-1 SCN SCN/k-1 Fa, gln,gld
N E
Bloques CMB/CME
n-1 SCB SCB/n-1 Fa, gln,gld
B E
Error SCEE/(n-1)(k-
(n-1)(k-1) SCEE
EE 1)
Total
nk-1 SCTo
T0

Al tener el formato para el cálculo del Análisis de Varianza (ANDEVA), donde ya


se han colocado en las columnas la fuente de variable, los grados de libertad, la
suma de cuadrado, el cuadrado medio, la F calculada y la F crítica, se procede a
colocar en la filas los cálculos correspondientes a los niveles, bloques, error
experimental y los totales para cada columna.

En la columna de grados de libertad se calculan los grados de libertad


correspondiente a:

Niveles: gln= k-1 Error Experimental: glee=(n-1)(k-1)


Bloques: glb= n-1 Total: nk-1
Para la columna de Suma de Cuadrados se realizan los siguientes cálculos:
2 Error Ex.:
k Y ..
SCN = 1n ∑ 2
Y −
j=1 . j nk
Niveles: SCEE=SCT 0 −(SCN +SCB )
2
2 Y ..
n n k 2
SCB= 1k ∑ Y − 2 Y ..
Bloques: i=1 i. nk SCT 0 =∑ ∑ Y ij − nk
Totales: i=1 j=1

En la columna de Cuadrado Medios se realizan los siguientes cálculos:

Niveles: CMN=SCN/k-1 Bloques: CMB=SCB/n-1


Error Experimental: CMEE=SCEE/=(n-1)(k-1)

En la columna de F calculada, la misma se calcula para los niveles y los


bloques.

Niveles: Fc=CMN/CMEE Bloques: Fc=CMB/CMEE

Para la columna de F crítica, los datos que se deben establecer son el nivel de
significancia con que se realizará la medición y búsqueda del valor de Fisher en la
tabla correspondiente; lo más recomendado es realizar el cálculo con un nivel de
significancia del 95% o del 99%, siendo a=0.05 y a=0.01, respectivamente.
Luego se procede a calcular para los niveles y bloques la gl n y gld correspondiente.

Niveles: gln= (k-1) gld=(k-1)(n-1) Bloques: gln= (k-1) gld=(k-1)(n-1)


Para el Modelo: Y ij =μ+ β j + τ i+ ε ij

Grados Suma de Cuadrado


Fuente de
de Cuadrados Medio Fc Fa
Variable
Libertad SC CM
Niveles CMN/CME
k-1 SCN SCN/k-1 Fa, gln,gld
N E
Bloques CMB/CME
n-1 SCB SCB/n-1 Fa, gln,gld
B E
Error SCEE/(n-1)(k-
(n-1)(k-1) SCEE
EE 1)
Total
nk-1 SCTo
T0

De igual manera el formato para este modelo es igual, pero la variante es la forma
de calcular y las fórmulas de los elementos que componen el ANDEVA.

Los grados de de libertad se calculan de la misma forma para el modelo


anterior:

Niveles: gln= k-1 Error Experimental: glee=(n-1)(k-1)


Bloques: glb= n-1 Total: nk-1

Para la columna de Suma de Cuadrados se realizan los siguientes cálculos:

2 Error Ex.:
k 2 Y ..
SCN = 1n ∑ Y −
i=1 i. nk
Niveles: SCEE=SCT 0 −(SCN +SCB )
2
2 Y ..
n n k 2
SCB= 1k ∑ Y − 2 Y ..
Bloques: j=1 . j nk SCT 0 =∑ ∑ Y ij − nk
Totales: i=1 j=1

En la columna de Cuadrado Medios se realizan los siguientes cálculos:


Niveles: CMN=SCN/k-1 Bloques: CMB=SCB/n-1
Error Experimental: CMEE=SCEE/=(n-1)(k-1)

En la columna de F calculada, la misma se calcula para los niveles y los


bloques.

Niveles: Fc=CMN/CMEE
Bloques: Fc=CMB/CMEE

Para la columna de F crítica, se realiza el mismo procedimiento para calcular el


punto crítico de rechazo, utilizando el nivel de significancia seleccionado y de igual
forma se procede a calcular para los niveles y bloques la gl n y gld correspondiente.

Niveles: gln= (k-1) gld=(k-1)(n-1)

Bloques: gln= (k-1) gld=(k-1)(n-1)

2.3.8 Conclusión

Luego de finalizar el cálculo de todos los elementos del ANDEVA, se comparan los
valores obtenidos para la F calculada con el punto crítico de rechazo establecido
en la Regla de Decisión, tanto para los niveles del factor como para los bloques.

La manera de comprobar si la hipótesis de los niveles y de los bloques se acepta,


es observar si la F calculada (F c) es menor a la F crítica (Fa), de lo contrario se
rechaza la hipótesis correspondiente porque habría diferencia significativa en las
medias de las variables de estudio.
2.3.9 Cálculo De Parámetros

Los parámetros del modelo estadístico para el diseño de bloques al azar son:

Varianza s² = CMEE

El cual indica la variabilidad que tiene la variable de respuesta del experimento al


realizar los cálculos correspondientes para cada bloque y nivel.

n k
Media de los datos:
∑ ∑ Y ij
μ= i=1 j=1
nk
El cual indica la cantidad total de la variable distribuida a partes iguales entre cada
observación.

2.3.10 Intervalos De Confianza

Se  llama intervalo de confianza a un par de números entre los cuales se estima que


estará cierto valor desconocido con una determinada probabilidad de acierto, en el
caso del Diseño de Bloque Al Azar realizamos pruebas de intervalos de confianza para
cada una de las medias del experimento, tanto del factor de interés como de los
bloques, para la realización de los cálculos es importante poseer la tabla de valores
observada anteriormente (registro de datos) y utilizar la tabla de T de Student.

La siguiente formula es la utilizada para calcular dichos intervalos de confianza:

PARA LAS MEDIAS DE LOS NIVELES

CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n

Donde:
ý . j = promedio de cada valor de los niveles.

t ∝/2 ,(k−1)(n−1) = Valor de la tabla T de Student de ∝/2 para el grado (k −1)(n−1).

CMEE
√ n
= Raíz cuadrada del Cuadrado medio del error entre n niveles.

PARA LAS MEDIAS DE LOS BLOQUES

CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k

Donde:

ý .i = promedio de cada valor de los niveles.

t ∝/2 ,(k−1)(n−1) = Valor de la tabla T de Student de ∝/2 para el grado (k −1)(n−1).

CMEE
√ k
= Raíz cuadrada del Cuadrado medio del error entre k niveles.

Estimadores

Estimación de Media de Niveles:


τ i .=Y i. −Y . .
i= 1........k

Estimación de Media de Bloques:


β . j =Y . j −Y . . j= 1........n

Cálculo del Coeficiente de Determinación


R² = (SCN + SCB) / SCTotal

El coeficiente de determinación indica el porcentaje de la variabilidad en la variable de


respuesta debido a los bloques y niveles del factor de interés.

2.4 Ejemplo
2.4.1 EJEMPLO: ALEACIÓN DE ALUMINIO

Un fabricante de aleación de aluminio produce refinadores de textura en forma de


lingotes. La compañía manufactura el producto en cuatro hornos. Se sabe que cada
horno tiene sus propias características de operación, de modo que los hornos se
considerarán una variable problemática en cualquier corrida experimental en la
fundición que implique más de un horno.

Los ingenieros de proceso sospechan que la velocidad de agitación influye en el


tamaño de grano del producto. Cada horno puede operarse a cuatro velocidades de
agitación distintas.

Se ejecuta un diseño de bloques aleatorizados para un refinado en particular, y se


mide el tamaño de grano.

2.4.1.1 Definición del Problema.

Determinar si existe diferencia significativa en el tamaño de grano promedio para las


distintas velocidades de agitación utilizando cuatro diferentes hornos.

Variable de Respuesta: Tamaño del grano.

Factores de Interés: velocidades de agitación

Bloques : hornos

Niveles=4 Bloques= 4
2.4.1.2 Modelo Estadístico

Existen dos formas de representar el modelo estadístico y son las siguientes:

Utilizando los bloques en las filas y los niveles del factor en las
columnas.

Modelo Estadístico

Yij = m + b i + tj + eij í i =1, ...,4 y j= 1,..., 4

Donde:

Yij = es el tamaño del grano para la j-esima velocidad de agitación en el i-esimo horno

μ= tamaño de grano promedio.

b i = es el efecto del i-esimo horno sobre el tamaño de grano.

tj = es el efecto de la j-esima velocidad de agitación sobre el tamaño de grano

eij = es el error experimental.

Se puede colocar también utilizando las columnas para representar los niveles
del factor.

2.4.1.3 Formulación de Hipótesis


Niveles (Velocidad de Agitación)

Ho : m1 = m2 = m3 = m4

H1 : al menos uno de los tamaños promedio de grano es diferente.

  Regla de Decisión: Se descarta Ho si la Fc ≥ F0.05,gln,gld


 gln = ( k – 1) = 4 – 1=3

gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9

Bloques (Hornos)

Ho: m1 = m2 = m3 = m4

H1: al menos uno de los tamaños promedio de grano es diferente.

  Regla de Decisión: Se descarta Ho si la Fc ≥ F0.05,gln,gld

 gln = ( n – 1) = 4 – 1=3

gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9

2.4.1.4 Procedimiento de Aleatorización

VELOCIDADES DE AGITACIÓN
H 4() 2() 1() 3()
O
R 2() 1() 3() 4()
N
4() 3() 1() 2()
O
S 3() 4() 2() 1 ()

2.4.1.5 Registro de Datos

Velocidades de Agitación
Hornos 5 10 15 20 Totales/horno

1 8 14 14 17 53
2 4 5 6 9 24
3 5 6 9 3 23
4 6 9 2 6 23
Totales/veloci 23 34 31 35 123
dad de
agitación.

2.4.1.6 ANOVA- Análisis de Varianza

ANÁLISIS DE VARIANZA

Fuente de Grados de Suma de Suma de Fc F∝


variable libertad Cuadrados cuadrados
medios
Velocidad de 3 22.19 7.40 0.85 3.86
agitación
Hornos 3 165.19 55.06 6.35 3.86
Bloques
Error 9 78.06 8.67
Experimental
Total 15 265.44

2.4.1.7 Conclusiones
Para las Velocidades de Agitación:

Fc es menor que F 0.05,3,9 , por lo tanto no se descarta Ho . Se concluye que no


existe diferencia significativa en el tamaño de grano promedio para las distintas
velocidades de agitación.
Para los Hornos:

Fc es mayor que F 0.05,3,9 , por lo tanto se descarta Ho. Se concluye que existe
diferencia significativa en el tamaño promedio del grano para los cuatro hornos. Por lo
tanto se confirma que los hornos tienen características de operación propias.

2.4.1.8 Cálculo de Parámetros

Varianza: CMEE = 8.67

123
μ= =7.69
16

2.4.1.9 Intervalos de Confianza


Para las medias de los Bloques

CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k

8.67
IC μ =53 /4 ± t 0.025 , 9
j
√ 4
=

53 8.67
IC μ =
j
4
±(2.262)
4
=
√ 9.92 y 16.58

Y así para el valor promedio de cada fila de bloques…

Para las medias de los niveles

CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n

8.67
IC μ =23 /4 ± t 0.025 , 9
j
√ 4
=
23 8.67
IC μ =
j
4 √
±(2.262)
4
= 2.41 y 9.08

Así para el valor promedio de cada columna de los niveles…

Estimadores:

Para los Bloques:

τ =13.25−7.69=5.56
τ =6−7.69=−1.69
τ =7.67−7.69=−0.02
τ =7.67−7.69=−0.02
Para los Niveles:

τ =7.67−7.69=−0.02
τ =8.5−7.69=0.81
τ =7.75−7.69=0.06
τ =8.75−7.69=1.06

Coeficiente de Determinación:

R² = (SCN + SCB) / SCTotal

  R²= (22.19 + 165.19) / 265.44 = 0.71

Interpretación:

El modelo explica en un 71% la variabilidad en los tamaños de grano o el 71% de la


variabilidad en el tamaño del grano se debe a la velocidad de agitación.
2.4.2 EJEMPLO: SISTEMA DE COMPUTACIÓN

Una empresa de contabilidad grande trata de seleccionar un sistema de computación


integrado a la oficina entre los 3 modelos que están actualmente en estudio. La
selección final dependerá de la productividad del sistema. Se seleccionan
aleatoriamente 5 operadores para manejar cada sistema.

Es importante tener en cuenta que el nivel de experiencia que tienen los empleados en
el manejo de computadora puede afectar el resultado de la prueba por lo tanto existe la
necesidad de justificar el impacto de la experiencia y determinar los méritos relativos de
los sistemas de comunicación.

Los niveles resultantes de producción medidos en unidades por hora aparecen en la


siguiente tabla.

Operadores Sistemas

1 2 3

1 27 21 25

2 31 33 35

3 42 39 39

4 38 41 37

5 45 46 45

2.4.2.1 Definición del Problema

Determinar si existe diferencia significativa en la productividad promedio, de 3 tipos de


sistemas de computación manejado por cinco operarios con diferente grado de
experiencia.
Variable de Respuesta:

Es la productividad del j-esimo sistema de computación manejado por el i-esimo


operario.

Factor de Interés: Tipo de Sistema de computación

Bloques: operadores

2.4.2.2 Modelo Estadístico

Existen dos formas de representar el modelo estadístico y son las siguientes:

Colocando los bloques en las filas y los niveles del factor en las columnas

Yij = µ + Bi + Tj + Eij

i = l,.....5 j = l,...3

Yij = es la productividad del i-esimo tipo de sistema de computación manejado por el


j-esimo operario.

µ = Productividad media Total.

Bi = Es el efecto del i-esimo operario sobre la productividad.

Tj = Es el efecto del j-esimo tipo de sistema de computadora sobre productividad.

Eij = Error experimental.

2.4.2.3 Formulación de la Hipótesis


Para Bloques ( operadores )

Ho: µ1 = µ2 =... = µ5
Hi: al menos un promedio es diferente

Para niveles ( sistemas )

Ho: µ1 = µ2 = µ3

H1: al menos un promedio es diferente.

Selección del nivel de significancia y regla de decisión

œ = 0.05%

Para los operadores: Descartar Ho Si Fc> F0.05, 4, 8

Para los tipos de sistemas: Descartar Ho si Fc> F0.05, 2, 8

2.4.2.4 Procedimiento de Aleatorización

5 bloques (operadores) = 1, 2, 3,4,5

3 niveles (tipos de sistemas) = 1, 2, 3, 4, 5

Operarios Sistemas

1 A(27) C(25) B(21)

2 A(31) B(33) C(35)

3 B(39) C(39) A(42)

4 B(41) A(38) C(37)


4 C(45) B(46) A(45)

2.4.2.5 Registro de Datos

TIPOS DE SISTEMAS
OPERARIOS A B C
1 27 21 25 73
2 31 33 35 99
3 42 39 39 120
4 38 41 37 116
5 45 46 45 136
Totales 183 180 181 544

2.4.2.6 ANDEVA

FUENTE DE GL SC CM Fc Fcrítica
VARIACIÓN
TIPOS DE SISTEMAS 2 0.933 0.4665 0.09 4.46

OPERARIOS 4 764.93 191.23 37.28 3.84

E.E 8 41.07 15.13    

Totales 14 806.93      

2.4.2.7 Conclusión

Para el factor de interés se observa que Fc = 0.09 < F0.05,2, 8 = 4.46, por lo tanto no
se descarta Ho. Se concluye que no existe diferencia significativa en la productividad
promedio para los 3 tipos de sistemas.
Para los operadores se observa que Fc = 37.28 > F0.05, 4, 8 = 3.84, por lo tanto se
descarta Ho. Se concluye que existe diferencia significativa en la productividad
promedio de los operadores.

2.4.2.8 Cálculo de Parámetros

Varianza:

CMME = 15.13

544
μ= =36.27
15

2.4.2.9 Intervalos de Confianza


Para las medias de los Bloques

CMEE
IC μ = ý . i ± t ∝ /2 ,(k−1)(n−1)
j
√ k

15.13
IC μ =73 /3 ± t 0.025, 8
j
√ 3
=

73 15.13
IC μ =
j
3
±(2.306)
3 √
= 19.15 y 29.51

Y así para el valor promedio de cada fila de bloques…

Para las medias de los niveles

CMEE
IC μ = ý . j ±t ∝/ 2,(k−1)(n−1 )
j
√ n

15.13
IC μ =183 /5 ± t 0.025 , 8
j
√ 5
=
183 15.13
IC μ =
j
5 √
±(2.306)
5
= 32.59 y 40.61

Así para el valor promedio de cada columna de nivel.

Estimadores

Para los Bloques:


τ =24.33−36.27=−11.94
τ =33−36.27=−3.27
τ =40−36.27=3.73
τ =38.67−36.27=2.40
τ =45.33−36.27=9.06
Para los Niveles:
τ =36.6−36.27=0.33
τ =36−36.27=−0.27
τ =36.2−36.27=−0.07

Coeficiente de Determinación:

R² = (SCN + SCB) / SCTotal

  R²= (0.933 + 764.93) / 806.93 = 0.94

Interpretación:

El modelo explica en un 94% la variabilidad en la productividad o el 94% de la


variabilidad en la productividad se debe al tipo de sistema de computación.

2.4.3 EJEMPLO: SOLUCIONES DE LAVADO

Se están comparando tres soluciones de lavado diferentes a fin de estudiar su


efectividad para retardar el crecimiento de bacterias en contenedores de leche de cinco
galones. El análisis se hace en un laboratorio y sólo pueden realizarse tres ensayos en
un día. Puesto que los días podrían representar una fuente potencial de variabilidad, el
experimentador decide usar un diseño de bloques aleatorizados. Se hacen
observaciones en cuatro días, cuyos datos se muestran enseguida. Analizar los datos
de este experimento (utilizar α = 0.05) y sacar las conclusiones apropiadas.

Solución 1 2 3 4

1 13 22 18 39

2 16 24 17 44

3 5 4 1 22

Crecimiento de las bacterias en la leche

2.4.3.1 Definición del Problema

Determinar el efecto de las 3 soluciones de lavado en cada contenedor de leche,


sobre la efectividad para retardar el crecimiento de bacterias durante los 4 días de
observación.

V R: Efectividad para retardar el crecimiento de bacterias.


F I: Tres soluciones de Lavado
Bloques: 4 Días
Diseño apropiado: Diseño de Bloque al Azar

2.4.3.2 Modelo Estadístico

Yij = m + bj + ti + eij
i =1.….3 y j= 1.….4eij

Donde:

Yi j= es la medición de La efectividad para retardar crecimiento de bacterias en el i-


esimo día para la j-esima solución de lavado
m= es la efectividad promedio para retardar el crecimiento de bacterias
ti= es el efecto del i-esimo solución de lavado sobre la efectividad de retraso de
crecimiento de bacterias
bj= es el efecto del j-esimo día sobre la efectividad del crecimiento de bacterias
eij = es el error experimental.

2.4.3.3 Formulación de la Hipótesis


Hipótesis para los bloques
Ho: m1 = m2 = m3=m4
H1: al menos una de las medias de los 4 días es diferente

  Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 2,6=5.14
 gln= ( 4– 1) =3gld = ( 3– 1) (4 – 1)=6

Hipótesis para los niveles


Ho: m1 = m2 =m3
H1: Al menos uno de las efectividades para retardar el crecimiento de las
bacterias promedio es diferente.

Regla de Decisión:
Se descarta Ho si Fc ≥ F5%, 3,6= 4.76
gln= ( k – 1) : (3-1)= 2gld = ( k – 1) (n – 1)= (3-1)(4-1)= (2)(3)= 6

2.4.3.4 Procedimiento de Aleatorización


Se le asigna al azar cada uno de los niveles del factor a cada uno de los bloques.
3 Días: 1,2,3,4. (B); 3 Soluciones: 1,2,3. (N)
S. Lavado Días (B)
(N)
1 A ( 13) D(39) C(18) B(22)
2 B(24) C(17) D(44) A(16)
3 B(4) A(5) D(22) C(1)

2.4.3.5 Registro de Datos

  Días (B)
Solución A B C D TOTALE
(N) S
1 13 22 18 39 92
2 16 24 17 44 101
3 5 4 1 22 32
TOTALE 34 50 36 105 225
S

2.4.3.6 SUPUESTOS DEL ANOVA


Normalidad

Por medio de esta gráfica verificamos el supuesto de la normalidad:


Ho: Efectividad de retardar el crecimiento de bacterias presentan una distribución normal
H1: Efectividad de retardar el crecimiento de bacterias no presentan una distribución
normal
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
Conclusión: Pvalue: 0.100≥ 0.05 no se descarta ho, esto significa que los datos
muestran una distribución normal.
Los datos muestran una distribución normal, debido a que los puntos muestran una
secuencia.

Homosedasticidad

H0: Las varianzas son iguales

H1: Al menos una


varianza es diferente

El factor de interés presenta varianzas similares.


Los bloques presentan varianzas similares debido a la distribución de los puntos.

Observando está gráfica de Residuo vs Ajustes de la Solución de lavado podemos verificar


Independencia
que el factor de interés presentan varianzas similares.

Al observar está gráfica de Residuo vs Orden verificamos la independencias de las


soluciones de lavado y los días de estudio y vemos que lo datos no muestran una
tendencia por lo cual concluimos son independientes.

Homocedasticidad
Niveles

Observando está Lasgráfica


varianzas de lasvssoluciones
Residuo de lado son
Ajustes; verificamos la iguales o similares. de las
Homocedasticidad
soluciones de Lavado
Ho: σ12 = σ22 = σ32 = σ42
H1: al menos una varianza es diferente
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
De acuerdo a Prueba de Levene nuestro Pvalue= 0.870 ≥ α= 0.05
Conclusión: Como Pvalue (0.870) > 0.05, no se descarta Ho, esto significa que los datos
cumplen con el supuesto de Homocedasticidad que dice que las varianzas de las soluciones
de lado son iguales o similares.

Bloques

Las varianzas de los días


de observaciones son
iguales.
Observando está gráfica Residuo vs Ajustes; verificamos la Homocedasticidad de días
de observación del estudio
Ho: σ12 = σ22 = σ32 = σ42
H1: al menos una varianza es diferente
Regla de decisión:
No se descarta la h0 si Pvalue ≥ α
De acuerdo a Prueba de Levene nuestro Pvalue= 0.950 ≥ α= 0.05
Conclusión: Como Pvalue (0.950) > 0.05, no se descarta Ho, esto significa que los datos
cumplen con el supuesto de Homocedasticidad que dice que las varianzas de los días
de observaciones son iguales o similares.

2.4.3.7 ANOVA- Análisis de Varianza

Análisis de varianza de dos factores con una sola muestra por grupo

RESUMEN ANÁLISIS DE
Cuenta VARIANZA Promedio
Suma Varianza
Origen de las Suma
Fila 1 de Grados4 de Promedio
92 de los 23 F Probabilida
127.33 Valor
variaciones cuadrados
Fila 2 libertad
4 cuadrados 25.25
101 d168.917 crítico para
Fila 3 4 32 8 90 F
Filas 703.5 2 351.75 40.7 0.000323 5.14
2
Columna 1 3 34 11.33 32.33
Columnas 1106.92 3 368.97 42.7 0.000192 4.76
Columna 2 3 50 16.67 121.33
1
Columna 3 3 36 12 91
Error 51.83 6 8.64      
Columna 4 3 105 35 133
             
Total 1862.25 11        
2.4.3.8 Conclusión

Como Fc (40.72) ≤ F0.05,2,6 (5.14) por lo tanto se descarte Ho y al menos una de las
soluciones de lavado es diferente.

Como Fc (42.71) ≤ F0.05,3,6 (4.76) por lo tanto se descarte Ho y al menos una de los
días de observaciones es diferente.

Para el factor de interés se observa que Fc (40.72) ≥ F0.05,2,6 (5.14) por lo tanto se
descarte Ho . Se concluye que existe diferencia significativa en le efectividad para
reducir el crecimiento de las bacterias en un contenedor de cinco galones promedio
para las tres soluciones de lavado .

Para los días de estudio se observa que Fc (42.71) ≥ F0.05,3,6 (4.76) por lo tanto
se descarte Ho . Por lo cual concluimos que existen diferencia significativas en la
efectividad promedio de bacterias en los cuatros días pertinente a dicha
investigación
2.4.3.9 Cálculo de Parámetros

n k

∑ ∑ Y ij 225
μ= i=1 j=1
= =18.75
nk 12

σ 2=CMEE=8.64

σ =√ 8.64=2.94

2.4.3.10 Intervalo de Confianza


CMEE
IC μ =Y´i . ± t ∝
i
2
∑ nk −k √ n

8.64
IC μ =23± 2.1788
1
4
8.64

(19.80 ≤❑1 ≤ 26.20)

IC μ =25.25± 2.1788
2

8.64
4 √
(20.05 ≤❑2 ≤ 26.45)

IC μ =8 ±2.1788
3
4 √
(4.80 ≤❑3 ≤ 11.20)

CMEE
IC μ =Y´ j . ± t ∝
i
2
∑ nk−k √ k

8.64
IC μ =11.33 ±2.1788
1
3
8.64

(7.63 ≤❑1 ≤15.03)

IC μ =16.67± 2.1788
2
3 √
( 12.97≤❑2 ≤20.37)
8.64
IC μ =12± 2.1788
3
√ 3
(8.30 ≤❑3 ≤15.69)

8.64
IC μ =35 ±2.1788
4
√ 3
(31.30 ≤❑4 ≤ 39.70)

Estimadores

 media de niveles
 Media de los Bloques
τ i =Y´ i .−Y´ ..
τ1 = 23 – 18.75 = 4.25
τ2 = 25.25 – 18.75 = 6.5 β j=Y´ j .−Y´ ..
τ3 = 8 – 18.75= -10.75 β1 = 11.33 – 18.75 = -7.24
Coeficiente de determinación
β2 = 16.67 – 18.75 = -2.08
β3 = 12 – 18.75 = -6.75
 Calculo del coeficiente de determinación
β4 = 35– 18.35 = 16.65
e interpretación
R² = (SCN + SCB) / SCTo0= 1810.41 / 1862.25 = 97.22% 0 ≤ R2 ≤ 1

Esto indica que la variabilidad en la efectividad del retraso de crecimiento en las


bacterias dependen un 97.22% de las soluciones de lavado en los 4 días de
estudio.

2.4.4 DISTANCIA DE ENFOQUE DEL OJO

Un ingeniero industrial está realizando un experimento sobre el tiempo de enfoque del


ojo. Se interesa en el efecto de la distancia del objeto al ojo sobre el tiempo de
enfoque. Cuatro distancias diferentes son de interés. Cuenta con cinco sujetos para el
experimento. Debido a que puede haber diferencias entre los individuos, el ingeniero
decide realizar el experimento en un diseño de bloques aleatorizados. Los datos
obtenidos se presentan a continuación. Analizar los datos de este experimento (utilizar
α = 0.05) y sacar las conclusiones apropiadas.

Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3

2.4.4.1 Definición del Problema

Determinar el efecto de la distancia del objeto al ojo del individuo sobre el tiempo de
enfoque.

Variable de Respuesta: Tiempo del enfoque del ojo

Factores de interés: Sujetos o Individuos

Bloques: Distancias

Bloques: 4 y Niveles: 5

2.4.4.2 Modelo Estadístico

Yij =  +  i + j + ij

 i =1, ...,4 y j= 1,..., 5

Donde:

Yij = es el tiempo del enfoque del ojo del j-ésimo


Sujeto (individuo) a la i-ésima distancia

 = tiempo promedio del enfoque del ojo

 i = es el efecto de la i-ésima distancia sobre el tiempo de enfoque del ojo

j = es el efecto del j-ésimo sujeto o individuo sobre el tiempo de enfoque del ojo

ij = es el error experimental.

2.4.4.3 Formulación de la Hipótesis

Hipótesis:

Niveles (Sujetos o Individuos)

Ho : 1 = 2 = 3 = 4 = 5

H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente

  Regla de Decisión: Se descarta Ho si la Fc ≥ F0.05,gln,gld

 gln = ( k – 1) = 5 – 1= 4

gld = ( k – 1) (n – 1)= (5-1)(4-1)= 12

Bloques (Distancias):

Ho : 1 = 2 = 3 = 4

H1 : al menos uno de los tiempos promedios del enfoque del ojo es diferente

  Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld

 gln = ( n – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (5-1)(4-1)= 12

2.4.4.4 Procedimiento de Aleatorización

SUJETOS O INDIVIDUOS
D
I 4 5 2 1 3
S
T 2 1 5 3 4
A 5 4 3 2 1
N
C 1 5 3 4 2
I
A
S
2.4.4.5 Registro de Datos

Su
jeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6
6 7 6 6 1 6
8 5 3 3 2 5
10 6 4 4 2 3

S Total Promedio
ujeto
Distancia 1 2 3 4 5
(pies)
4 10 6 6 6 6 34 6.8
6 7 6 6 1 6 26 5.2
8 5 3 3 2 5 18 3.6
10 6 4 4 2 3 19 3.8
totales 28 19 19 11 20 97
Promedios 7 4.75 4.75 2.75 5

2.4.4.6 SUPUESTOS DEL ANOVA


PRUEBA DE NORMALIDAD

Ho: Los valores del tiempo de enfoque del ojo presentan una distribución
normal.
H1: Los valores del tiempo de enfoque del ojo no presentan una distribución
normal.

Tests of Normality
Kolmogorov-Smirnova Shapiro-Wilk
Statistic Df Sig. Statistic df Sig.
TIEMP .207 20 .024 .921 20 .104
O
a. Lilliefors Significance Correction

Se acepta Ho ya que el valor de Sig. de Shapiro-Wilk es 0.104 , y es mayor a 0.05, [


Pvalue (0.104) > 0.05] ; inferimos que los valores presentan una distribución normal.
2.4.4.7 ANOVA- Análisis de Varianza

Tests of Between-Subjects Effects


Dependent Variable:TIEMPO
Source Type III Sum of df Mean Square F Sig.
Squares
Corrected Model 42.490a 2 21.245 8.587 .003

Intercept 140.300 1 140.300 56.707 .000


DISTANCIAS 28.090 1 28.090 11.354 .004
SUJETOS 14.400 1 14.400 5.820 .027
Error 42.060 17 2.474
Total 555.000 20
Corrected Total 84.550 19

a. R Squared = .503 (Adjusted R Squared = .444)

2.4.4.8 Conclusión

Para los Sujetos:


La Fc es menor que F 8.74, por tanto no descartamos H0. Concluimos que no hay
diferencia significativa en el promedio del tiempo que tarde el ojo en enfocar el objeto.

Para los Distancia:


La Fc es mayor que F 5.71, por tanto se descarta
Ho. Podemos concluir que existe una diferencia significativa en las distancias sobre el
tiempo que tarda el ojo en enfocar el objeto. Por lo tanto se puede corroborar que las
distancias si afectan el tiempo en que tarda el ojo en enfocar objeto.

2.4.4.9 Cálculo de Parámetros

 = 97 / 20 = 4.85

² = CMEE = 1.2750

2.4.4.10 Intervalo de Confianza

Para los bloques:

IC μ = y . j±t α/ 2 ,(k−1 )(n−1 ) √CMEE /n


j =6.8±2.179√1.2750/5 5.69≤µ1≤7.90
Y así para cada Valor de y´i .

Para los niveles:

IC μ = y . j±t α/ 2 ,(k−1 )(n−1 ) √CMEE /n


j =2.15±2.179√1.2750/4 0.919≤µ1≤ 3.38
Y así para cada Valor de y´. j

Estimadores

Para los Bloques

β j=Y´ j .−Y´ ..
β1 =6.8– 4.85 = 1.95
β2 = 5.2 - 4.85= 0.35
β3 = 3.6 – 4.85 = -1.25
β4 = 3.8– 4.85 = -1.05

Para los Niveles

τ i =Y´ i .−Y´ ..
τ1 = 7- 4.85= 2.15
τ1 = 4.75- 4.85= -0.1
τ1 = 4.75- 4.85= -0.1
τ1 = 2.75- 4.85= -2.1
τ1 = 5- 4.85= 0.15

Coeficiente de determinación

R² = (SCN + SCB) / SCTotal

  R²= (32.95 + 36.30) /84.55 = 0.82

Interpretación:

El modelo tiene una variabilidad del 82% que existe en enfocar el objeto.
CAPÍTULO 3

2. DISEÑO CUADRADO LATINO


3.1 Definición
El diseño cuadrado latino se define como una modalidad de diseño factorial fraccionado
que tiene la misma cantidad de factores y de niveles, y en que las interacciones se
consideran nulas (Arnau,1986). Es un diseño de bloques con un factor experimental y
dos variables de bloqueo. Este tipo de diseño estratifica la muestra de sujetos en
función de dos variables de clasificación y, posteriormente se aplican los distintos
tratamientos dentro de cada bloque.

Esto resulta en la combinación de tres dimensiones de variación, la de que se debe a


los tratamientos y las dos variables de bloqueo, las cuales concuerdan con las filas y
con las columnas de una matriz cuadrada.

3.2 Generalidades
El objetivo de este diseño es reducir el error de los residuos de un experimento. Por
esta razón se utiliza para eliminar la variación de dos variables problemáticas, por lo
cual los reglones y columnas son restricciones de aleatorización.

La manera en que se arregla el diseño procede de las letras del alfabeto latino
dispuestas en una matriz cuadrada, donde cada letra aparece una vez en cada fila y
una vez en cada columna de la matriz. Es decir el diseño cuadrado latino es un
cuadrado con t filas y t columnas. Donde cada una de las t² celdas contiene una de la t
letras latinas que corresponden a las observaciones.

Para poder garantizar la correcta aplicación del diseño cuadrado latino se debe cumplir
los siguientes requisitos:
 Cada valor de la variable de respuesta debe aparecer una sola vez en cada fila y en
cada columna de la matriz.
 El diseño debe ser equilibrado.
 Las variables de bloque deben guardar estrecha relación con la variable dependiente.
Ya que la efectividad del diseño depende del grado de relación entre las variables de
bloque y la variable de respuesta.
 El tamaño más adecuado para experimentos con este tipo de diseño es de 5 a 7
niveles.

3.3 Pasos para la Resolución de Problemas en un DCL.

Los pasos para la resolución de problemas de un diseño cuadrado latino se


muestran a continuación.

3.3.1 Definición del Problema

La definición del problema consiste en determinar si existen diferencias significativas en


la variable de respuesta con respecto a los efectos que le producen las dos variables
de bloqueo.
Variable de respuesta: es la característica o propiedad del producto cuyo valor interesa
medir para mejorar el desempeño de un proceso.

Factor de interés: son las variables independiente o de bloqueo, cuyo efecto sobre la
variable de respuesta es de particular interés para el experimentador.
En este arreglo de diseño las variables de bloqueo son las que están colocadas en las
filas y columnas.
3.3.2 Modelo Estadístico

El modelo estadístico para este experimento es el siguiente:

Y ijk =μ +α i + β j + τ k +¿ε ijk ¿i=1....t


j=1....t
Yijk = es la observación correspondiente al k-ésimo nivel del factor de interés
k=1.... t
(representado por las letras latinas) para la i-ésima fila y la j-ésima columna.

= es la media general

I = es el efecto de la i-ésima fila sobre la Variable de Respuesta

j = es el efecto de la j-ésima columna sobre la Variable de Respuesta

k = es el efecto del k-ésimo nivel del factor de interés (letra latina) sobre la
variable de respuesta

εijk= error experimental

3.3.3 Formulación de las Hipótesis

Para este experimento como tenemos tres fuentes de variación debemos formular un
juego de hipótesis para cada una, entonces serían tres juegos de hipótesis de la
siguiente manera:

 Para las filas


H0 = 1 = 2 = ... t

H1 = al menos una de las medias de las filas es diferente...

 Para las columnas

H0 = 1 = 2 = ... t

H1 = al menos una de las medias de las columnas es diferente...

 Para las letras latinas

H0 = 1 = 2 = ... t

H1 = al menos una de las medias de los niveles es diferente...

La regla de decisión es la siguiente para los tres juegos de hipótesis:

Descartar H0 si Fc  F, gln, gld

3.3.4 Procedimiento de Aleatorización


El procedimiento de aleatorización se puede definir de la siguiente forma:

Para aleatorizar los datos, se selecciona al azar uno de los cuadrados estándar, de tal
forma que a cada fila y a cada columna se le asignan aleatoriamente cada uno de los
niveles del Factor de Interés (representados por las letras latinas). Por ejemplo:
3.3.5 Registro de Datos

Diseñadores de experimento, S.A.

Hoja de Registro de datos

Nombre del Operador:__________________

Fecha de toma de datos:_________________

Última calibración del equipo:____________


3.3.6 ANDEVA- Análisis de Varianza

El ANDEVA parte de los supuestos que han de cumplirse:

 Independencia de las observaciones.

 La distribución de los residuales debe ser normal.

 Homocedasticidad: homogeneidad de las varianzas.

Al cumplirse estos supuestos procedemos a armar la tabla del ANDEVA.


F.V GL S.C C.M Fc Fα,gln,gld

FILAS (F) T-1 SCF SCF/(T-1) CMF/CMEE Fα,(T-1),(T-1)(T-2)

COLUMNAS T-1 SCC SCC/(T-1) CMC/CMEE Fα,(T-1),(T-1)(T-2)


(C)
LETRAS T-1 SCLL SCLL/(T-1) CMLL/CME Fα,(T-1),(T-1)(T-2)
LATINAS (LL) E
E.E (T-2)(T- SCEE SCEE/(T-1)    
1) (T-2)
TOTAL (To) T2-1 SCTo      

Formulas para calcular la suma de cuadrados:

t 2
1 Y 1 Yt 2
SCF= ∑ Y 2i. .− 2.. . SCLL= ∑ Y 2. . k − .2. .
t i=1 t t k =1 t

2
1
t
Y 2.. . t t t
Y . ..
SCC= ∑ Y 2. j.− SCT 0 =∑ ∑ ∑ Y 2ijk−
t2
3.3.7 t j=1
Conclusión t2 i=1 j=1 k=1

Al completar la tabla de ANDEVA, se procede hacer las conclusiones del problema de


interés, tomando en cuenta las hipótesis principales planteadas y basándose en la
regla de decisión.

3.3.8 Cálculo de Parámetros


Para el cálculo de los parámetros, los resultados los obtenemos con las siguientes
formulas:

 Para los parámetros del modelo

t t t
∑ ∑ ∑ Y ijk
i=1 j=1 k=1
μ= 2
t
3.3.9 Intervalos de Confianza

Para obtener los intervalos de confianza, seguimos la siguiente formulas

 Para la media de los niveles del factor de interés

IC μk = y ..k ±t α /2,(t−1)( t−2 ) √CMEE /t

 Para las medias de las columnas

IC μj = y . j.±t α /2, (t−1)( t−2) √CMEE /t


 Para las medias de las filas

IC μi = y i..±t α /2,(t−1)(t−2) √ CMEE/t


Estimadores

 Estimación de la media de los niveles

τ . . k =Y . . k −Y . .. k= 1........t

 Estimación de la media de las columnas

β . j.=Y . j .−Y ..
j= 1........t

 Estimación de la media para las filas.

α i. .=Y i .. −Y .. .
i= 1........t

3.4 Ejemplo
3.4.1 EJEMPLO: METODOS DE ENSAMBLAJE

Un ingeniero industrial está investigando el efecto que tienen cuatro métodos de


ensamblaje (A, B, C y D) sobre el tiempo de ensamblaje de un componente para
televisores a color. Se seleccionan cuatro operadores para realizar este estudio. Por
otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo
que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el
primero, independientemente del método. En otras palabras, se produce un patrón
en el tiempo de ensamblaje. Para controlar esta posible fuente de variabilidad, el
ingeniero utiliza el diseño de cuadrados latinos que aparece a continuación. Analice
y haga conclusiones apropiadas.

Orden de Operador 1 Operador 2 Operador 3 Operador 4


Montaje
1 C=10 D=14 A=7 B=8
2 B=7 C=18 D=11 A=8
3 A=5 B=10 C=11 D=9
4 D=10 A=10 B=12 C=14

.Se ejecuta un diseño de bloques aleatorizados para un refinado en particular, y se


mide el tamaño de grano.

3.4.1.1 Definición del Problema.

Determinar si hay diferencias significativas en el tiempo de ensamblaje promedio


de un componente de televisor para cuatro métodos de ensamblaje diferentes
realizado por cuatro operarios distintos en diferentes ordenes.

Al 5% de confiabilidad.

Variable de respuesta: tiempo de ensamblaje.

Filas: orden de montaje.

Columnas: operadores.

Factor de interés: efecto de cuatro métodos de ensamblaje.

3.4.1.2 Modelo Estadístico

El diseño experimental a utilizar será el cuadrado latino.


Modelo estadístico:

Y ijk =μ+α i+ βj + τ k +ℇ ijk

j=1 … … 4

i=1 … … 4

k =1 … … 4

Y ijk = es el tiempo de ensamblaje observado para el componente de televisor realizado


con el k-esimo método, con el i-esimo orden de montaje, por el j-esimo operador.

μ = es el tiempo de ensamblaje promedio.

α i=¿es el efecto del i-esimo orden de montaje.

τ k = es el efecto del k-ésimo método de ensamblaje (letra latina).

β k = es el efecto del k-ésimo operador.

ℇ ijk = es el error experimental.

3.4.1.3 Formulación de Hipótesis

Hipótesis

 Orden de montaje.

Ho = μ1=μ 2=μ3=μ 4

H1 = al menos una de los tiempos de montaje promedio es diferente para los


órdenes de montaje.

 Operadores.

Ho = μ1=μ 2=μ3=μ 4
H1 = al menos una de los tiempos de montaje promedio es diferente para los
operadores.

 Método de ensamblaje.

Ho = μ1=μ 2=μ3=μ 4

H1 = al menos una de los tiempos de montaje promedio es diferente para los


método de ensamblaje.

Regla de decisión:

Descarta Ho si:

F c ≥ F 0.05,3,6

F 0.05,3,6=4.76

3.4.1.4 Procedimiento de Aleatorización

Orden de Operador Operador Operador Operador


Montaje 1 2 3 4

1 C D A B
2 B C D A
3 A B C D
4 D A B C

3.4.1.5 Registro de Datos


Orden de Operador 1 Operador 2 Operador 3 Operador 4
montaje

1 C=10 D=14 A=7 B=8

2 B=7 C=18 D=11 A=8

3 A=5 B=10 C=11 D=9

4 D=10 A=10 B=12 C=14

3.4.1.6 Supuestos del ANDEVA


Observando el grafico podemos concluir que los datos no tienen una distribución
normal, debido a que un dato esta fuera de la línea de tendencia.

Prueba matemática.

P value = 0.475

Ho = los datos tienen un distribución normal.

H1 = los datos no tienen una distribución normal.

P-value > 0.05 con lo cual se acepta H0.

Se acepta la hipótesis nula porque el P value es mayor que el nivel de


significancia.
Orden de ensamblaje.

Ho = σ 1 =σ 2=σ 3

H1 =σ 1 ≠ σ 2 ≠ σ 3

P value = .489

La varianzas son iguales para el orden de ensamblaje.

P-value > 0.05 con lo cual se acepta H0.

Operador.

Ho = σ 1 =σ 2=σ 3

H1 =σ 1 ≠ σ 2 ≠ σ 3

P value = .528

P-value > 0.05 con lo cual se acepta H0.

Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
operadores.
Métodos de ensamblaje.

Ho = σ 1 =σ 2=σ 3

H1 =σ 1 ≠ σ 2 ≠ σ 3

P value = .493

P-value > 0.05 con lo cual se acepta H0.

Se acepta la hipótesis nula, es decir que las varianzas son iguales para los
métodos de ensamblaje.

3.4.1.7 ANOVA- Análisis de Varianza

Fuente de Grados Suma de Cuadrado medio Fc Fα


Variable de cuadrados CM
libertad SC
Filas (Orden 3 18.500 6.617 3.524 4.76
de ensamble)
Columnas 3 51.500 17.167 9.810 4.76
(Operadores)
Letras 3 72.500 24.167 13.810 4.76
latinas
(métodos de
ensamble)
Error EE 6 10.500 1.750
Total 15 0.222

Regla de decisión:
Descarta Ho si:

F c ≥ F 0.05,3,6

F 0.05,3,6=4.76

3.4.1.8 Conclusión
Orden de montaje.

Fc = 3.524. Se acepta Ho, es decir los tiempos de montaje promedio son iguales
para los órdenes.

Operadores.

Fc = 9.810. Se acepta la hipótesis nula, concluyendo que al menos una de los


tiempos de montaje promedio es diferente para los operadores.

Método de ensamblaje.

Fc = 13.810. Se acepta la hipótesis nula, concluyendo que al menos una de los


tiempos de montaje promedio es diferente para los métodos de ensamblaje.

3.4.1.9 Cálculo de Par Cálculo de Parámetros

Media Total

μ=10.25

El tiempo promedio es = 10.25

σ 2=1.75

σ =1.332

La muestra tiene una desviación estándar de 1.322


R2=93.14 %

3.4.1.10 Intervalos De Confianza


Métodos de ensamblaje

1.75
IC μ A =7.5 ±t 0.025 ,6
√ 4
=7.5 ± 1.618

1.75
IC μ B=9.25 ± t 0.025 , 6
√ 4
=9.25 ±1.618

1.75
IC μ C =13.25± t 0.025, 6
√ 4
=13.25± 1.618

1.75
IC μ D=11± t 0.025, 6
√ 4
=11 ±1.618

Operadores

1.75
IC μ 1=8± t 0.025 ,6
√ 4
=8 ± ±1.618

1.75
IC μ 2=13 ± t 0.025, 6
√ 4
=13± 1.618

1.75
IC μ 3=10.25± t 0.025, 6
√ 4
=10.25± 1.618

1.75
IC μ 4 =9.75 ± t 0.025 ,6
√ 4
=9.75± 1.618

Orden de ensamblaje

1.75
IC μ 1=9.75± t 0.025, 6
√ 4
=9.75 ±± 1.618
1.75
IC μ 2=11± t 0.025, 6
√ 4
=11 ±1.618

1.75
IC μ 3=8.75± t 0.025 ,6
√ 4
=8.75 ±1.618

1.75
IC μ 4 =11.5± t 0.025 , 6
√ 4
=11.5 ±1.618

Estimadores

Metodos de ensamblaje

τ .. A =7.5−10.25=−2.75

τ .. B=9.25−10.25=−1

τ .. C =13.25−10.25=3

τ .. D=11−10.25=0.75

Operadores

β .1. =8−10.25=−2.25

β .2. =13−10.25=2.75

β .3. =10.25−10.25=0

β .4. =9.75−10.25=−0.50

Orden de ensamblaje
α 1.. =9.75−10.25=−0.50

α 2.. =11−10.25=0.75

α 3.. =8.75−10.25=−1.50

α 4.. =11.5−10.25=1.25

Coeficiente de determinación

El coeficiente de determinación establece que los datos tienen una variabilidad


de 93.14%

3.1.1 EJEMPLO: METODOS DE ENSAMBLAJE

Se encuentra bajo estudio el efecto que tienen cinco reactivos distintos (A, B,C,D y E)
sobre el tiempo de reacción de un proceso químico.

Cada lote de material nuevo es lo suficientemente grande para permitir que sólo se
realicen 5 ensayos. Más aún, cada ensayo tarda, aproximadamente, una hora y media,
por lo que sólo pueden realizarse cinco ensayos por día.

La investigadora decide efectuar el experimento usando un diseño de cuadrado latino,


con el fin de controlar sistemáticamente las variables lote de material y día. Ella
recolecta los siguientes datos. Analice y obtenga las conclusiones.

3.1.1.1 Definición del Problema.

Determinar el efecto de cinco reactivos distintos (A, B,C,D y E) sobre el tiempo


de reacción de un proceso químico realizando cinco ensayos por día.

Determinar si hay diferencias significativas en el tiempo de reacción promedio


para cinco reactivos distintos realizado cinco ensayos por día.

Variable de Respuesta: tiempo de reacción de un proceso químico


Niveles: días (5 ensayos por día)

Bloques: lotes de material nuevo

Factor de Interés: distintos reactivos (A, B,C,D y E)

3.1.1.2 Modelo Estadístico

Yijk = m + ai + bj + tk + εijk

i = 1...5 j = 1...5 k = 1...5

Yijk = es el tiempo de reacción sobre un proceso químico realizando los k´-esimo


reactivos con el i-ésimo lote de material nuevo, por el j-ésimo de los ensayos.

m = tiempo de reacción promedio sobre un proceso químico.

ai = es el efecto del i-ésimo lote de material nuevo

bj = es el efecto de los j-ésimos días

tk = es el efecto del k-ésimo reactivo (letra latina)

εijk = es el error experimental.

3.1.1.3 Formulación de Hipótesis


Lotes de material nuevo

H0 = m1 = m2 = m3 =m4 =m5

H1 = al menos una de los tiempo de reacción promedio es diferente

Días- ensayos

H0 = m1 = m2 = m3 =m4 =m5
H1 = menos una de los tiempo de reacción promedio es diferente

Reactivos

H0 = m1 = m2 = m3 =m4 =m5

H1 = menos una de los tiempo de reacción promedio es diferente

Regla de decisión (igual para todas las hipótesis)

Descartar H0 si Fc ³ Fa, gln, gld gln= t -1, gld= (t -1)(t -2)

Descartar H0 si Fc ³ F0.05, 4, 12.


3.1.1.4 Procedimiento de Aleatorización

Día
Lote 1 2 3 4 5
1 A B D C E
2 C E A D B
3 B A C E D
4 D C E B A
5 E D B A C

3.1.1.5 Registro de Datos

Día
Lote 1 2 3 4 5

1 A=8 B=7 D=1 C=7 E=3

2 C=11 E=2 A=7 D=3 B=8

3 B=4 A=9 C=10 E=1 D=5

4 D=6 C=8 E=6 B=6 A=10

5 E=4 D=2 B=3 A=8 C=8

Letras latinas
Día
Lote 1 2 3 4 5 Total por
lotes
1 A=8 B=7 D=1 C=7 E=3 26
2 C=11 E=2 A=7 D=3 B=8 31
3 B=4 A=9 C=10 E=1 D=5 29
4 D=6 C=8 E=6 B=6 A=10 36
5 E=4 D=2 B=3 A=8 C=8 25
Total por 33 28 27 25 34 147
día

Totales por fórmula

A B C D E

42 28 44 17 16

3.1.1.6 Supuestos del ANDEVA

Normalidad

Para lograr esto entramos al menu estadísticas > estadística básica > prueba de
normalidad. Seleccionamos los datos sin ponerle los factores porque queremos
ver la normalidad de todos los datos.
Prueba gráfica:

Como los datos se acercan mucho a la línea de referencia descartando los


valores extremos, podemos concluir que los datos siguen una distribución
normal.

Prueba analítica Ryan Joiner:

Ho: los datos siguen una distribución normal (Pvalue > α)

H1: los datos no siguen una distribución normal (Pvalue < α)

Como Pvalue > 0.05 se acepta H0

Homocedasticidad

Para comprobar este supuesto, vamos al menú estadísticas > anova > prueba
de varianzas iguales. Seleccionamos la variable, pero con un solo factor para
analizar la homocedasticidad para cada factor de variación. Hacemos esto para
las tres fuentes de variación

 Lotes de materia prima

Ho: σ12 = σ22 = σ32 = σ42 =σ52

H1: al menos una varianza es diferente

Regla de decisión:

No se descarta la h0 si Pvalue ≥ α

De acuerdo a Prueba de Levene nuestro Pvalue= 0.760 ≥ α= 0.05


Conclusión: Como Pvalue (0.760) > 0.05, no se descarta Ho, por lo cual las
varianzas de los lotes son iguales

 Días de ensayo

Ho: σ12 = σ22 = σ32 = σ42 =σ52

H1: al menos una varianza es diferente

Regla de decisión:

No se descarta la h0 si Pvalue ≥ α
De acuerdo a Prueba de Levene nuestro Pvalue= 0.986 ≥ α= 0.05

Conclusión: Como Pvalue (0.986) > 0.05, no se descarta Ho, por lo cual las varianzas
de los días de ensayo son iguales.

 Los Reactivos (Letras Latinas)

Ho: σ12 = σ22 = σ32 = σ42 =σ52

H1: al menos una varianza es diferente

Regla de decisión: No se descarta la h0 si Pvalue ≥ α

De acuerdo a Prueba de Levene nuestro Pvalue= 0.775 ≥ α= 0

Conclusión: Como Pvalue (0.775) > 0.05, no se descarta Ho, por lo cual las varianzas
de los reactivos son iguales
 Independencia

Para comprobar este supuesto, cuando hacemos el análisis de varianza


(estadísticas > ANOVA > Modelo Lineal General), de lso gráficos que nos puede
generar solo seleccionamos el gráfico orden vs residuos.

Observando la grafica vemos que son independientes ya que no muestran un patrón


conocido

3.1.1.7 ANOVA- Análisis de Varianza

Análisis de varianza para Tiempo, utilizando SC ajustada para pruebas MINITAB

Fuente GL SC Sec. SC Ajust. CM Ajust. F P

Lotes 4 15.440 15.440 3.860 1.23 0.348

Día 4 12.240 12.240 3.060 0.98 0.455

Reactivos 4 141.440 141.440 35.360 11.31 0.000

Error 12 37.520 37.520 3.127

Total 24 206.640
3.1.1.8 Conclusión

Observando los resultados del Análisis de Varianza se puede concluir lo siguiente:

El tiempo de reacción promedio es de 5.88 con una variabilidad de 3.126

El coeficiente de determinación es 81.8%, lo cual indica que el 81.8% de la variabilidad


en el tiempo de reacción se debe a los factores estudiados.

 Para las fórmulas:

Fc ³ Fa, gln, gld, por lo tanto se rechaza H0

Se concluye que existe diferencia significativa en la fuerza de explosión promedio


para las cinco fórmulas

 Para los días y los lotes:

Fc < Fa, gln, gld, por lo tanto se acepta H0

Se concluye que no existe diferencia significativa en la fuerza de explosión promedio


para los distintos lotes de materia prima o días.

3.1.1.9 Cálculo de Parámetros

s² = CMEE= 3.126
t t t
∑ ∑ ∑ Y ijk
147 i=1 j=1 k=1
μ= μ==5 . 88
25 2
t

S = 1.76824 R-cuad. = 81.84% R-cuad.(ajustado) = 63.69%


3.4.2.10 Intervalos de Confianza
Estimación de las medias de los reactivos

IC μk = y . . k ±t α / 2, (t −1)( t −2 ) √ CMEE /t

IC μk =8. 4 ±1 . 72

IC μk =5 . 6 ±1 . 72

IC μk =8. 8 ± 1. 72

IC μk =3 . 4 ±1 .72

IC μk =3 . 2 ±1 .72

Estimación de las medias de los días- ensayos

IC μj = y . j.±t α /2,(t−1)( t−2) √CMEE /t


IC μj =6 .6 ± 1. 72

IC μj =5 . 6 ± 1. 72

IC μj =5 . 4 ±1 .72
IC μj =5 ± 1. 72

IC μj =6 .8 ± 1. 7

Estimación de las medias de los lotes

IC μi = y i..±t α /2, (t−1)( t−2) √ CMEE/t


IC μi 5. 2 ±1 . 72

IC μi =6 . 2 ±1 . 72

IC μi =5 . 8 ±1 . 72

IC μi =7 . 2 ±1 . 72

IC μi =5 ± 1. 7

Estimadores

Estimación de las medias de los reactivos

τ . . k =Y . . k −Y . ..
k= 1........t

42
τ1= −5 .88=2 .52
5
28
τ1= −5 . 88=−0 . 28
5

44
τ1= −5 . 88=2. 92
5

17
τ1= −5. 88=−2 . 48
5

16
τ1= −5. 88=−2 .68
5

Estimación de las medias de los días- ensayos

β . j.=Y . j .−Y ..

j= 1........t

33
β 1= −5 .88=0 . 72
5

28
β 2= −5 . 88=−0 . 28
5

27
β 3= −5 . 88=−0 . 48
5

25
β4= −5 . 88=−0 . 88
5

34
β 5= −5 . 88=1. 15
5
Estimación de las medias de los lotes

α i . .=Y i .. −Y .. .

i= 1........t

26
α 1= −5 . 88=−0 . 68
5

31
α 2= −5. 88=0 .32
5

29
α 3= −5 .88=−0 . 08
5

36
α 4= −5 . 88=1. 32
5

25
α 5= −5 . 88=−0 . 88
5

Coeficiente de determinación

R² = (SCF + SCC + SCLL) / SCT=(15.44+12.24+141.44) / (206.64)= 0.818

Existe un 81.8% en cuanto a la variabilidad de los datos.


CAPÍTULO 4

4. DISEÑO CUADRADO GRECO LATINO

4.1Definición

El diseño cuadrado Greco latino (DCGL) podría decirse que es una extensión
del cuadrado latino en el que se incluye una tercera variable de control (letras griegas).
Es por tanto una fracción del diseño completo en bloques aleatorizados con un factor
principal y 3 factores secundarios.

4.2 Generalidades
Se dice que los dos cuadrados son ortogonales si al sobreponerse poseen la
propiedad de que cada letra griega aparece sólo una vez con cada letra latina.
Puede utilizarse para controlar sistemáticamente tres fuentes extrañas de variabilidad,
en otras palabras, se usa para hacer un análisis por bloques en tres direcciones.
Permite analizar cuatro factores (renglón, columna, letra latina y letra griega).

1.3 Pasos para la Resolución de Problemas en un DCGL.

Observaremos cuáles son los pasos necesarios para resolver un problema en el diseño
cuadrado greco-latino
4.3.1 Definición del Problema a Resolver

El problema se puede definir de dos maneras:

 Determinar el efecto de las letras latinas, las filas, las columnas y las letras
griegas sobre la variable de respuesta.

 Determinar si existen diferencias significativas en la variable de respuesta


promedio para las letras latinas, las filas, las columnas y las letras griegas.

Se procede a la identificación del factor de interés, bloques y variable de


respuesta.

4.3.2 Modelo Estadístico

Se define cual es el modelo estadístico en este caso y que representan cada una de las
variables.

Yijkl = Yijkl = μ + αi + tj + d k + l + eijkl


i=1.....t
j=1.....t
k=1....t
l=1.....t

Yijkl = es la observación de la i-ésima fila y la j-ésima columna con la k-ésima letra latina
y la l-ésima letra griega.

μ = media total

αi = es el efecto de la i-ésima fila sobre la variable de respuesta.

tj = es el efecto de la j-ésima columna sobre la variable de respuesta


dk = es el efecto de la k-ésima letra latina sobre la variable de respuesta.

l = es el efecto de la l-ésima letra griega sobre la variable de respuesta.

eijkl = error experimental

4.3.3 Formulación de la Hipótesis

Formulamos las respectivas hipótesis por filas, columnas, letras latinas y letras griegas.

Las filas, columnas, letras latinas y letras griegas formarían 4 pares de hipótesis, una
para cada factor. Todas se definen de la misma manera:

Ho : μ1 = μ2 =...... ... μt

HI : al menos una μ es diferente

Regla de decisión: Se descarta Ho si Fc ³ Fa , glN, glD

glN = t-1 glD = ( t-3) (t-1)

Esta regla de decisión es igual para las filas, las columnas, letras latinas y letras
griegas ya que todas tienen el mismo número de variables.

4.3.4 Procedimiento de Aleatorización

En el procedimiento de aleatorizacion a cada fila y columna se le asignan cada una de


las letras latinas y cada una de las letras griegas.

Esta sería una posible configuración para un DCGL 5x5

Lotes Operarios
1 Aα Bγ Cε Dβ Eδ
2 Bβ Cδ Dα Eγ Aε
3 Cγ Dε Eβ Aδ Bα
4 Dδ Eα Aγ Bε Cβ
5 Eε Aβ Bδ Cα Dγ
4.3.5 Registro de Datos

Se va a llenar un reporte el cual es la prueba de lo que se va a realizar con el


siguiente formato:

Nombre de la empresa: ________________ Motivo de análisis: ______________

Elaborado por: ____________________ Unidad de medición: ____________

Fecha: __________________ Factor de interés: _______________

Se procede al llenado de datos medidos en los siguientes formatos:

Observaciones 1 2 … t Totales por


fila
1 Y11(LG) Y12(LG) … Y1t(LG) Y1…
2 Y21(LG) Y22(LG) … Y2t(LG) Y2…
… … … … … …
… … … … … …
… … … … … …
t Yt1(LG) Yt2(LG) … Ytt(LG) Yt…
Totales por Y.1.. Y.2.. … Y.t.. Y….
columna

Una vez tomados los datos medidos se procede a la suma de las columnas Y. t.. y de
las filas Yt… seguido por el Gran Total Y…

Luego, se elaboran otras dos tablas para calcular los totales de las letras latinas y de
las letras griegas.

Letras Latinas … … … …
1 2 … t … … … …
Y11 Y11 … Y11 YttL Ytt … YttL
L. L. L. . L. .
Y22 Y22 … Y22 Y..1 Y..2 … Y..L
L. L. L. . . .
… … … …
Letras Griegas … … … …
1 2 … t … … … …
Y11. Y11. … Y11. Ytt. Ytt. … Ytt.
G G G G G G
Y22. Y22. … Y22. Y… Y...2 … Y…
G G G 1 G
… … … …

Una vez completado esto se procede a la suma de las letras latinas cuyo total se
representa por Y..t. y a la suma de las letras griegas cuyo total se representa por Y…t
4.3.6 Supuesto del Modelo
Antes de continuar con el siguiente paso, que consiste en el análisis de varianza, se
deben probar los supuestos del modelo. Hay tres supuestos: normalidad,
homocedasticidad u homogeneidad de varianzas e independencia.

Para probar los supuestos, se utilizan los mismos métodos mencionados en los
capítulos anteriores, ya sea gráfica o analíticamente, con la ayuda de programas como
Excel, MINITAB o PASW.

Al probar la normalidad con la gráfica de probabilidad normal, los puntos deben formar
una línea recta.
Se puede probar analíticamente con las pruebas Ryan-Joiner, Shapiro-Wilks y
Smirnov-Kolmogorov, dependiendo de la cantidad de observaciones totales del
experimento.

Al probar la homocedasticidad con el gráfico de residuos vs orden, el espaciado de los


puntos debe ser aproximadamente igual para todos los factores.

Se puede probar analíticamente con la prueba de Barlett, donde se compara pvalue


con el nivel de significancia α. Si pvalue > α, las varianzas son iguales.
Al probar la independencia con el gráfico de residuos vs orden, no debe haber patrón
aparente en la distribución.
4.3.7 ANDEVA- Análisis de Varianza

Luego de verificar que se cumplen los tres supuestos del modelo, se prosigue con el
análisis de varianzas. Para el mismo lo más conveniente es elaborar una tabla como se
muestra a continuación. Cada componente será explicado posteriormente.

Fuente de Grados de Suma de Cuadrado Fc Fα


Variación Libertad Cuadrados Medio
Fila (t-1) SCF CMF CMF / CMEE

Columna (t-1) SCC CMC CMC / CMEE

Letras Latinas (t-1) SCLL CMLL CMLL /

SE CALCULA
Fα (t-1),(t-3)(t-1)
CMEE
Letras (t-1) SCLG CMLG CMLG /
Griegas CMEE
Error (t-3)(t-1) SCEE CMEE
Experimental
Total (t2-1) SCT

4.3.7.1 Grados de Libertad


Primeramente cabe resaltar que para elaborar un DCGL se requiere el mismo número
de niveles (t) para cada factor. Los grados de libertad se calculan a partir del número
de niveles en cada experimento.

4.3.7.2 Suma de Cuadrados


SCF suma de cuadrados debida al efecto fila
2
t 2 y
1

t i=1 y − . .. .
2
t
i . ..

donde:
t = niveles
yi… = sumatoria por filas
y…. = sumatoria total
SCC suma de cuadrados debida al efecto columna
2
t 2 y
1

t j=1 y − . .. .
2
t
. j ..

donde:
t = niveles
y.j.. = sumatoria por columnas
y…. = sumatoria total

SCLL suma de cuadrados debida a las letras latinas


2
t
y
y −
1 2 ....

t k=1 2
t
.. k .

donde:
t = niveles
y..k. = sumatoria por letras latinas
y…. = sumatoria total

SCLG suma de cuadrados debida a las letras griegas


2
t
y
y −
1 2 . . ..

t l=1 2
t
.. . l

donde:
t = niveles
y...l = sumatoria por letras griegas
y…. = sumatoria total
SCEE suma de cuadrados del error

Se obtiene por diferencia SCEE = SCT – (SCF + SCC + SCLL + SCGL)

SCT suma total de cuadrados


2
t t t
∑ ∑ ∑ ∑ y ijkl−
t 2 y .. . .
2
i=1 j=1 k=1 l=1
t
donde:
t = niveles
yijkl = cada observación de la tabla de registro
y…. = sumatoria total

4.3.7.3 Cuadrado Medio

Se calcula el cuadrado medio de cada factor basándonos en las sumas de cuadrados


anteriores y sus respectivos grados de libertad. Los valores esperados de los
cuadrados medios correspondientes a las filas, columnas, letras latinas, letras griegas y
error experimental, son, respectivamente:

Cuadrado Medio de las Filas

SCF
t−1
Cuadrado Medio de las Columnas

SCC
t−1
Cuadrado Medio de las Letras Latinas

SCLL
t−1

Cuadrado Medio de las Letras Griegas

SCLG
t−1

Luego de calcular los grados de libertad, la suma de cuadrados y los cuadrados


medios, se proceden a calcular las Fc de Fisher para cada factor del experimento. La
misma se calcula dividiendo el cuadrado medio de cada factor entre el cuadrado medio
del error experimental.

La Fα se calcula a partir del nivel de significancia “α” y los grados de libertad de los
factores “(t-1)” y del error experimental “(t-3)(t-1)”. Este valor es el mismo para
comparar todas las Fc por la particularidad del diseño de que todos los factores deben
tener el mismo número de niveles.

4.3.8 Conclusiones

Una vez completada la tabla de ANDEVA, se prosigue con las conclusiones respectivas
para las hipótesis, planteadas al inicio del experimento.

Recordando la regla de decisión, Se descarta H0, si Fc ³ Fa , glN, glD .

Esto quiere decir que para cada hipótesis planteada se debe analizar la regla de
decisión.

Filas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia significativa


entre las filas. Si FC < Fa, no se descarta H0 y se concluye que no existe
diferencia significativa entre las filas.
Columnas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia
significativa entre las columnas. Si F C < Fa, no se descarta H0 y se concluye que
no existe diferencia significativa entre las columnas.

Letras Latinas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia


significativa entre las letras latinas. Si F C < Fa, no se descarta H0 y se concluye
que no existe diferencia significativa entre las letras latinas.

Letras Griegas: Si FC > Fa,. se descarta H0 y se concluye que existe diferencia


significativa entre las letras griegas. Si F C < Fa, no se descarta H0 y se concluye
que no existe diferencia significativa entre las letras griegas.

4.3.9 Cálculo de los Parámetros

El gran promedio “μ” se calcula con la siguiente fórmula:

t t t t

∑∑∑∑ y
i=1 j=1 k=1 l=1
ijkl

μ= 2
t
4.3.10 Intervalos de Confianza

Para calcular los intervalos de confianza es necesario tener conocimientos básicos


acerca de la tabla T de Student, ya que es necesaria su utilización.

Para las filas:

IC μi = y i. . .±t α /2,( t−1)( t−3 ) √CMEE /t

Para las columnas:

IC μj = y . j. .±tα /2 ,(t−1)(t−3 ) √CMEE/t


Para las letras latinas (factor de interés)

IC μk = y ..k.±tα /2 ,(t−1)(t−3 ) √CMEE/t

Para las letras griegas

IC μl = y ...l ±t α /2, (t−1)( t−3) √ CMEE/t

Para todos los casos se debe buscar el valor de t en la tabla T de Student para el nivel
de significancia “α” asignado al experimento.

Estimación de las medias de las filas, columnas, letras latinas y letras griegas
respectivamente:

α i . . .=Y i . . .−Y . .. . β ..k .=Y .. k .−Y ... .

donde i = 1…t donde k = 1…t

Ψ . . .l =Y .. . l−Y .. . .
τ . j . . =Y . . j.−Y .. . .
donde l = 1…t
donde j = 1…t

La variabilidad en unidades cuadradas está representada por el valor del cuadrado


medio del error experimental, es decir:

σ2 = CMEE

El coeficiente de determinación R2 se calcula a partir de las sumas de cuadrados:

R2 = SCF + SCC + SCLL + SCLG

SCTo
Este valor representa el porcentaje en el que el modelo explica la variabilidad de la
variable de respuesta

4.4 Ejemplos

4.4.1 TIPO DE ENSAMBLAJE DE UN COMPONENTE

Un ingeniero industrial está investigando el efecto que tienen cuatro métodos de


ensamblaje (A,B,C y D) sobre el tiempo de ensamblaje de un componente para
televisores a color. Se seleccionan cuatro operadores para realizar este estudio. Por
otra parte, el ingeniero sabe que cada método de ensamblaje produce fatiga, por lo
que el tiempo que se tarda en el último ensamblaje puede ser mayor que en el primero,
independientemente del método. En otras palabras, se produce un patrón en el tiempo
de ensamblaje. Para controlar esta posible fuente de variabilidad, el ingeniero utiliza el
diseño de cuadrados latinos que aparece a continuación.

Analice y haga conclusiones apropiadas. Suponga que en el problema el ingeniero


sospecha que el lugar de trabajo usado por los cuatro operadores puede representar
una fuente adicional de variabilidad. Es posible introducir el lugar de trabajo ( ,, y )
como un cuarto factor. Se produce el cuadrado greco-latino que se muestra a
continuación. Analice los datos y obtenga las conclusiones.

Orden de Operador Operador Operado Operador


Montaje 1 2 r3 4
1 C=11 B=10 D=14 A=8
2 B=8 C=12 A=10 D=12
3 A=9 D=11 B=7 C=15
4 D=9 A=8 C=18 B=6

4.4.1.1 Definición del Problema


Determinar el efecto que tienen cuatro métodos de ensamblaje (A,B,C y D) con los
distintos ordenes de montaje, en los diferentes lugares de trabajo (,, y ) y con los
diferentes operarios sobre el tiempo de ensamblaje de un componente para televisores
a color.

Variable de respuesta: tiempo de ensamble componente para televisor a color.


Fila: orden de montaje, Columna: operadores, Letra latina: métodos de ensamblaje,
Letra griega: lugar de trabajo.

4.4.1.2 Modelo Estadístico

Se define el modelo estadístico con la definición de cada una de ellas.

Yijkl = m + ai + tj + dk + Y l + eijkl

i = 1...4 j = 1...4 k = 1...4 l=1…4

Yijkl = es la tiempo de ensamble de componente de televisor para el k-ésimo método de


ensamble con el i-ésimo orden de montaje, por el j-ésimo operador en el l-ésimo lugar
de trabajo.

m = tiempo de ensamble promedio para el componente del televisor.

ai = es el efecto del i-ésimo orden de montaje sobre el tiempo de ensamble.

tj = es el efecto del j-ésimo operador sobre el tiempo de ensamble.

dk = es el efecto del k-ésimo método de ensamble sobre el tiempo de ensamble.

Y l = es el efecto del l-ésimo lugar de trabajo sobre el tiempo de ensamble.

eijkl = error experimemtal


4.4.1.3 Formulación de Hipótesis

Se plantea cuatro pares de hipótesis para: filas, columnas, letras latinas y letras
griegas.

Orden de métodos

H0 = m1 = m2 = ... m4

H1 = al menos uno tiempos promedio de ensamblaje es diferente...

Operadores

H0 = m1 = m2 = ... m4

H1 = al menos uno de los tiempos promedio de ensamblaje es diferente...

Factor de Interés (método de ensamble letra latina)

H0 = m1 = m2 = ... m4

H1 = al menos uno de los tiempos promedio de ensamble es diferente...

Lugar de trabajo (letras griegas)

H0 = m1 = m2 = ... m4

H1 = al menos uno de los tiempos promedio de ensamble es diferente...

Regla de decisión

Se define una regla de decisión igual para los 4 pares de hipótesis.

Descartar H0 si Fc ³ F0.05, 3, 3=9.28


4.4.1.4 ALEATORIZACIÓN

En el procedimiento de aleatorizacion a cada fila y columna se le asignan cada una de


las letras latinas y cada una de las letras griegas.

Orden de Operador Operador Operador Operador


Montaje 1 2 3 4
1 C B D A
2 B C A D
3 A D B C
4 D A C B

4.4.1.5 REGISTRO DE DATOS

Se va a llenar un reporte el cual es la prueba de lo que se va a realizar con el


siguiente formato:

Nombre de la empresa: Aplitec Panamá Motivo de análisis: Análisis de métodos

Elaborado por: Cristela Vega Unidad de medición: tiempo (min)

Fecha: 2 de Febrero de 2012 Factor de interés: lugar de trabajo.

Orden de Operador Operador Operador Operador Totales


Montaje 1 2 3 4 filas
1 C=11 B=10 D=14 A=8 Y1…=43
2 B=8 C=12 A=10 D=12 Y2…=42
3 A=9 D=11 B=7 C=15 Y3…=42
4 D=9 A=8 C=18 B=6 Y4…=41
Totales Y.1..=37 Y.2..=41 Y.3..=49 Y.4..=41 Y.…=168
columna
En este caso se procede a la suma de las columnas (operadores) y filas (orden de
montaje). También a la suma de las letras latinas que son los métodos de ensamble y
letras griegas lugar de trabajo.

Totales por método de ensamble

A Y..1.=35

B Y..2.=31

C Y..3.=56

D Y..4.=46

Totales Lugar de trabajo

 Y…1=45

 Y…2=38

 Y…3=44

 Y…4=41

4.4.1.6 Supuestos del ANDEVA


Para la comprobación de los supuestos de este experimento se utilizó el programa
Minitab.
Grafica de Normalidad.

Gráfica de probabilidad de Tiempo de Ensamble


Normal
99
Media 10.5
Desv.Est. 3.162
95 N 16
RJ 0.974
90
Valor P >0.100
80
70
Porcentaje

60
50
40
30
20

10

1
5 10 15 20
Tiempo de Ensamble
Prueba gráfica:

Ho: los datos siguen una distribución normal porque los puntos se acercan a la línea de
referencia

H1: los datos no siguen una distribución normal ya que los puntos no se acercan a la
línea de referencia.

Como los datos se acercan mucho a la línea de referencia descartando los valores
extremos, se acepta H0 para la prueba gráfica.

Prueba analítica Ryan Joiner:

Ho: los datos siguen una distribución normal (Pvalue > α)

H1: los datos no siguen una distribución normal (Pvalue < α)

Como Pvalue > 0.05 se acepta H0

Homocedasticidad:

Para los lugares de trabajo (letra griega):

Prueba de igualdad de varianzas para Tiempo de Ensamble

Prueba de Bartlett

1 Estadística de prueba 1.48


Valor P 0.686
Prueba de Levene
Estadística de prueba 0.47
Lugar de trabajo

Valor P 0.708
2

0 5 10 15 20 25 30
Intervalos de confianza de Bonferroni de 95% para Desv.Est.
Prueba gráfica Intervalos de confianza de Bonferroni al 95%:

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual

Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett.

Prueba Analítica Barlett:

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
(Pvalue > α)

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
(Pvalue < α)

Como 0.686 > 0.05, podemos concluir que los tiempos de ensamble para los métodos
de ensamble tienen varianzas iguales.

Prueba gráfica usando el gráfico Residuo vs Valor ajustado:

vs. ajustes para Lugar de Trabajo


(la respuesta es Tiempo de Ensamble)
7.5

5.0

2.5
Residuo

0.0

-2.5

-5.0
9.5 10.0 10.5 11.0 11.5
Valor ajustado

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual

Como las distancias entre los puntos es aproximadamente igual, aceptamos H 0


Para los métodos de ensamble (letra latina):

Prueba de igualdad de varianzas para Tiempo de Ensamble

Prueba de Bartlett

1 Estadística de prueba 3.43


Valor P 0.330
Prueba de Levene
Estadística de prueba 1.93
Metodo de ensamble

Valor P 0.179
2

0 5 10 15 20
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Prueba gráfica Intervalos de confianza de Bonferroni al 95%:

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual

Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett.

Prueba Analítica Barlett:

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual
(Pvalue > α)

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual
(Pvalue < α)

Como 0.330 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.

Prueba gráfica usando el gráfico Residuo vs Valor ajustado:


vs. ajustes para Metodo de Ensamble
(la respuesta es Tiempo de Ensamble)

1
Residuo

-1

-2

-3

7 8 9 10 11 12 13 14
Valor ajustado

Ho: los tiempos de ensamble para los métodos de ensamble tienen varianza igual

H1: los tiempos de ensamble para los métodos de ensamble no tienen varianza igual

Como las distancias entre los puntos es aproximadamente igual, aceptamos H 0


Para las órdenes de montaje:

Prueba de igualdad de varianzas para Tiempo de Ensamble

Prueba de Bartlett

1 Estadística de prueba 3.06


Valor P 0.383
Prueba de Lev ene
Estadística de prueba 0.40
Orden de Montaje

Valor P 0.757
2

0 5 10 15 20 25 30 35
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Prueba gráfica Intervalos de confianza de Bonferroni al 95%:


Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual

H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual

Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett

Prueba Analítica Barlett:

Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual
(Pvalue > α)

H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual
(Pvalue < α)

Como 0.383 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.

Prueba gráfica usando el gráfico Residuo vs Valor ajustado:

Ho: los tiempos de ensamble para las órdenes de montaje tienen varianza igual

H1: los tiempos de ensamble para las órdenes de montaje no tienen varianza igual

vs. ajustes para Orden de Montaje


(la respuesta es Tiempo de Ensamble)

7.5

5.0

2.5
Residuo

0.0

-2.5

-5.0
Como las distancias
10.2
entre10.3
los puntos
10.4
es 10.5
aproximadamente
Valor ajustado
10.6 10.7
igual,
10.8
aceptamos H 0
Como un resultado grafico fallo, aceptamos el resultado analítico ya que es mas
preciso.

Para los operadores

Prueba de igualdad de varianzas para Tiempo de Ensamble

Prueba de Bartlett

1 Estadística de prueba 5.56


Valor P 0.135
Prueba de Lev ene
Estadística de prueba 4.16
Valor P 0.031
2
Operador

0 5 10 15 20 25 30
Intervalos de confianza de Bonferroni de 95% para Desv.Est.

Prueba gráfica Intervalos de confianza de Bonferroni al 95%:

Ho: los tiempos de ensamble para los operadores tienen varianza igual

H1: los tiempos de ensamble para los operadores no tienen varianza igual

Vemos que tres de los intervalos de confianza no se parecen por lo tanto aceptamos
H1, esperando el resultado de la prueba analítica de Barlett

Prueba Analítica Barlett:

Ho: los tiempos de ensamble para los operadores tienen varianza igual (Pvalue > α)

H1: los tiempos de ensamble para los operadores no tienen varianza igual (Pvalue < α)

Como 0.135 > 0.05, podemos concluir que los tiempos de ensamble para los
métodos de ensamble tienen varianzas iguales.

Prueba gráfica usando el gráfico Residuo vs Valor ajustado:

Ho: los tiempos de ensamble para los operadores tienen varianza igual

H1: los tiempos de ensamble para los operadores no tienen varianza igual
vs. ajustes para Operadores
(la respuesta es Tiempo de Ensamble)

5.0

2.5
Residuo

0.0

-2.5

-5.0

9.0 9.5 10.0 10.5 11.0 11.5 12.0 12.5


Valor ajustado

4.4.1.7 ANDEVA (Análisis de varianza)

FUENTE DE GL SUMA DE CUADRADO Fcalculada Fcritica


VARIACION CUADRADOS MEDIO

Orden de montaje(F) 3 0.5 0.17 0.05 9.28

Operadores(C) 3 19 6.33 1.81 9.28

Método de ensamble(LL) 3 95.5 31.83 9.09 9.28

Lugar de trabajo(LG) 3 7.5 2.5 0.71 9.28

ERROR 3 10.5 3.5


EXPERIMENTAL
TOTAL 15 133

En el formato anterior es el análisis de varianza a continuación se presenta como se


realizan los cálculos respectivos.

Suma de cuadrados
SC Orden de montaje = 1/4 [(43)2 +(42)2 +(42)2 + (41)2 ] - [(168)2/16] = 0.5

SCOperadores = 1/4 [(37)2+ (41)2 +(49)2 +(41)2] - [(168)2/16] = 19

SCMensamble(LL) = 1/4 [(35)2+ (31)2 +(56)2 +(46)2] - [(168)2/16] = 95.5

SC Ltrabajo(LG) = 1/4 [(45)2+ (38)2 +(44)2 +(41)2] - [(168)2/16] = 7.5

4.4.1.8 Cálculo de los Parámetros

² = CMEE= 3.5

t t t
∑ ∑ ∑ Y ijk
μ= i=1
j=1 k=1
2
t = 168/16 = 10.5

4.4.1.9 Conclusiones

Ordenes de montaje: FC < Fa,. No se descarta Ho, se concluye que no existe


diferencia significativa en los tiempos de ensamble para los órdenes de montaje.
Operadores :FC < Fa,. No se descarta Ho, se concluye que no existe diferencia
significativa en los tiempos de ensamble con los operadores.

Método de ensamble: FC < Fa,. No se descarta Ho, se concluye que no existe


diferencia significativa en los tiempos de ensamble entre los cuatro métodos de
ensamble.

Lugar de trabajo: FC < Fa . Se descarta HO y se concluye que no existe


diferencia significativa en la fuerza de explosión promedio para las cinco líneas
de montaje

El tiempo de ensamble promedio es de 10.5 con una variabilidad de 3.5, en la regla de


decisión no se descarta Ho.
El coeficiente de determinación es 73%, lo cual indica que el 73% de la variabilidad en
el tiempo de ensamble se debe a los factores estudiados.

4.4.1.10 Intervalos de Confianza

Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y
letras griegas.

Intervalos de confianza para las órdenes de montaje:

1. 10.75±1.9432 √3.5/4
2. 10.50±1.9432 √3.5/4
3. 10.50±1.9432 √3.5/4
4. 10.25±1.9432 √3.55/4

Intervalos de confianza para los operadores:

1. 9.25±1.9432 √ 3.5/ 4
2. 10.25±1.9432 √3.5/4
3. 12.25±1.9432 √3.5/4
4. 10.25±1.9432 √3.5/4

Intervalos de confianza para el método de ensamble:

1. 8.75±1.9432 √ 3.5/ 4
2. 7.75±1.9432 √ 3.5/4
3. 14±1.9432 √3.5/4
4. 11±1.9432 √3.5/4
Intervalos de confianza para el lugar de trabajo:

1.
11.25±1.9432 √ 3.5/ 4

2. 9.50±1.9432 √ 3.5/ 4

3.
11±1.9432 √3.5/4

4.
10.25±1.9432 √3.5/4

Estimadores
Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.

Estimadores de medias para las órdenes de montaje.

α i. . .=Y i . . . −Y . .. .

α1… =10.75-10.50=0.25

α2… =10.50-10.50=0

α3… =10.50-10.50=0

α4… =10.25-10.50=-0.25

Estimadores de medias para las Operadores.

τ . j .. =Y .. j.−Y ....
Τ.1.. = 9.25-10.50=-1.25

Τ.2.. = 10.25-10.50=-0.25

Τ.3.. = 12.25-10.50=1.75
Τ.4.. = 10.25-10.50=-0.25

Estimadores de medias para el método de ensamble.

β ..k .=Y .. k .−Y ....

Β..1. = 8.75-10.50 = -1.75

Β..2. = 7.75-10.50 = -2.75

Β..3. = 14-10.50 = 3.50

Β..4. = 11.50-10.50 = 1

Estimadores de medias para el lugar de trabajo.

Ψ ...l =Y ...l−Y ....

=11.25-10.50=0.75

=9.50-10.50=-1

=11=10.50=0.50

=10.25-10.50=-0.25

Coeficiente de Determinación
2
R = (0.5+19+95.5+7.5)/168 = 0.73 Indica que el modelo explica en 73% de las mediciones de
la variable de respuesta.

4.4.2 MEZCLA DE DINAMITA


Supongamos que un experimentador está estudiando el efecto de cinco fórmulas
diferentes de la mezcla de dinamita sobre la fuerza explosiva observada. Cada fórmula
se prepara usando un lote de materia prima lo suficientemente grande para que sólo se
hagan cinco mezclas. Se supone que tanto los lotes de materia prima como los
operadores representan restricciones en la aleatorización. Considérese que existen
cinco líneas de montaje representadas por las letras griegas a , b, g, d y e.

4.4.2.1 Definición
Determinar si existen diferencias significativas en la fuerza explosión promedio de la
dinamita para las cinco fórmulas preparadas con cinco lotes de materia prima distintas,
en cinco diferentes líneas de montaje, manejadas por cinco diferentes operarios.
Variable de respuesta: fuerza de explosión de la dinamita

Fila: Lotes

Columna: Operarios

Letras latinas: tipo de fórmula

Letras griegas: línea de montaje

4.4.2.2 Modelo Estadístico

Yijkl = μ + αi + j + k + l + eijkl
i= 1,2,3,4,5
j = 1,2,3,4,5
k= 1,2,3,4,5

Yijkl = es la fuerza explosiva para la k-ésima fórmula preparada por el j-ésimo operario
con el i-ésimo lote de materia prima en la l-ésima línea de montaje de prueba.
μ = fuerza explosiva promedio.
αi = es el efecto del i-ésimo lote de materia prima sobre la fuerza explosiva.
j = es el efecto del j-ésimo operario sobre la fuerza explosiva.
dk = es el efecto de la k-ésima fórmula sobre la fuerza explosiva.
l = es el efecto de la l-ésima línea de montaje de prueba sobre la fuerza explosiva.
eijkl = error experimental

4.4.2.3 Formulación de la Hipótesis

Lote de materia prima


Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una μ es diferente
Operario
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una m es diferente
Fórmula
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una μ es diferente
Línea de montaje
Ho : μ 1= μ 2 = μ 3= μ 4 = μ 5
H1 : al menos una μ es diferente

Regla de decisión
Se descarta Ho si FC ³ Fα , glN, glD
donde:
glN = ( t -1) glD= (5-1) (5-3) = 8
glN= ( 5-1) = 4
glD= (t-1) (t-3)

F0.05, 4, 8 = 3.84
Esta regla de decisión es igual para los lotes de materia prima, los operarios, las
fórmulas y para las líneas de montaje dado que todos los factores tienen el mismo
número de niveles.

1.4.2.1 Aleatorización

Al realizar la aleatorización se debe asegurar que cada operador prepare cada fórmula
con cada tipo de lote de materia prima en cada línea de montaje.
Esta sería una posible configuración para un DCGL 5x5

Lotes Operarios

1 Aα Bγ Cε Dβ Eδ

2 Bβ Cδ Dα Eγ Aε

3 Cγ Dε Eβ Aδ Bα

4 Dδ Eα Aγ Bε Cβ

5 Eε Aβ Bδ Cα Dγ
1.4.2.2 Registro de Datos

Los datos se registran respectivamente para cada lote, operario, fórmula y línea de
montaje en la siguiente tabla:

Nombre de la empresa: ________________ Motivo de análisis: ______________

Elaborado por: ____________________ Unidad de medición: ____________

Fecha: __________________ Factor de interés: _______________

Operarios  
Lotes 1 2 3 4 5 Totales
1 Aα =24 Bγ =20 Cε =19 Dβ =24 Eδ =24 Y1...=111
2 Bβ =17 Cδ =24 Dα =30 Eγ =27 Aε =36 Y2...=134
3 Cγ = 18 Dε =38 Eβ =26 Aδ =27 Bα =21 Y3...=130
4 Dδ =26 Eα =31 Aγ =26 Bε =23 Cβ =22 Y4...=128
5 Eε =22 Aβ =30 Bδ =20 Cα = 29 Dγ =31 Y5...=132
Totales Y.1..=107 Y.2..=143 Y.3..=121 Y.4..=130 Y.5..=134 Y....=635

Como podemos ver en la misma tabla se calculan los totales por fila y por columna, sin
embargo, los totales por letra latina y por letra griega deben calcularse por separado.

Letras latinas
Totales por fórmula
A B C D E
24 17 18 26 22
36 20 24 38 31
27 20 19 30 26
26 23 29 24 27
30 21 22 31 24
Y..1.=143 Y..2.=101 Y..3.=112 Y..4.=149 Y..5.=130

Letras griegas
Totales por línea de montaje
α β Γ  Ε
24 17 26 18 22
31 30 24 20 38
30 26 20 26 19
29 24 24 27 23
21 22 27 31 36
Y…1=135 Y…2=119 Y…3=121 Y…4=122 Y…5=138

1.4.2.3 Supuestos del ANDEVA


Para la comprobación de los supuestos de este experimento se utilizó el programa
Minitab.

Normalidad:
Gráfica de probabilidad normal

Gráficamente se concluye que las observaciones de la Fuerza de Explosión se


distribuyen normalmente, ya que el gráfico presenta aproximadamente una línea recta.

Homogeneidad de Varianzas
Para el caso de DCGL en Minitab, la igualdad de varianzas se debe calcular para cada
uno de los factores por separado.

Se formula la hipótesis para los operarios:

178
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
H1 = al menos una varianza es diferente

Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre los operarios ya que p >α.

Se formula la hipótesis para los lotes:


2 2 2 2 2
H o =σ 1 =σ 2=σ 3 =σ 4 =σ 5
H1 = al menos una varianza es diferente

Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre los lotes ya que p >α.

179
Se formula la hipótesis para las fórmulas:
H o =σ 12=σ 22=σ 23 =σ 24 =σ 25
H1 = al menos una varianza es diferente

Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre las fórmulas ya que p >α.

Se formula la hipótesis para las líneas de montaje:


2 2 2 2 2
H o =σ 1 =σ 2=σ 3 =σ 4 =σ 5
H1 = al menos una varianza es diferente

Tanto la prueba de Levine como la de Barlett indican que las varianzas de la fuerza de
explosión son iguales entre las líneas de montaje ya que p >α.

180
Independencia

No hay ningun patrón aparente en el recorrido de los puntos.

1.4.2.4 ANOVA- Análisis de Varianza

Al verificar que se cumplen todos los supuestos del modelo, proseguimos con la
elaboración de la tabla ANDEVA.
Fuente de GL Suma de Cuadrado F F crítica
Variación Cuadrados Medio calculad
a
Lotes 4 68 17 2.06 3.84
Operarios 4 150 37.5 4.54 3.84
Fórmulas 4 330 82.5 10 3.84
Línea de 4 62 15.5 1.9 3.84
Montaje
Error 8 66 8.25    
Experimenta
l
Total 24 676      

181
Los cálculos realizados para la misma son los siguientes:
SCLOTES = 1/5 [(111)2 +(134)2 +(130)2 + (128)2 + (132)2 ] - [(635)2/25] = 6
SCOPERADORES = 1/5 [(107)2 + (143)2 +(130)2 +(134)2] - [(635)2/25] = 150
SCFORM= 1/5 [(143)2+ (101)2 +(112)2 + (149)2 + (130)2 ] - [(635)2/25] = 330
SCLINMONT = 1/5 [( 135)2 +(119)2 + (122)2+ (121)2 +(138)2] -[(635)2/25] = 62

1.4.2.5 Conclusión

LOTE DE MATERIA PRIMA: FC < Fa,. no se descarta H0, se concluye que no


existe diferencia significativa en la fuerza de explosión promedio entre los lotes.

OPERADOR: porque FC >Fa, se descarta H0 y se concluye que existe diferencia


significativa en la habilidad del operario al preparar la fórmula.

FÓRMULA: FC >Fa se descarta H0, y se concluye que existe diferencia


significativa en las distintas fórmulas promedio para las cinco fórmulas
preparadas por los cinco operarios en las cinco líneas de montaje.

LÍNEAS DE MONTAJE: FC < Fa . no se descarta H0 y se concluye que no existe


diferencia significativa en la fuerza de explosión promedio para las cinco líneas
de montaje.

1.4.2.6 Cálculo de Parámetros

Variabilidad: s2 = CMEE = 66
Promedio: m = Y..../ t2 = 635 / 25 =25.4

1.4.2.7 Intervalos de Confianza

182
Lo mismo para los intervalos de confianza para las filas, columnas, letras latinas y letras
griegas.

 Intervalos de confianza para los lotes de materia prima

1. 22. 2±2 . 306 √8 . 25/5

2. 26.8±2 .306 √8.25/5

3. 26.0±2 .306 √8 .25/5

4. 25.6±2.306 √ 8.25/5

5. 26. 4±2.306 √ 8.25/5

 Intervalos de confianza para los operarios

1. 21.4±2.306 √8.25/5

2. 28.6±2.306 √ 8.25/5

3. 24.2±2.306 √ 8.25/5

4. 26.0±2 .306 √8 .25/5

5. 26.8±2 .306 √8 .25/5

 Intervalos de confianza para las fórmulas

1. 28.6±2.306 √ 8.25/5

2. 20.2±2.306 √ 8.25/5

3. 22.4±2.306 √8.25/5

4. 29.8±2.306 √ 8 .25/5

5. 26.0±2 .306 √8 .25/5

 Intervalos de confianza para las líneas de montaje

1. 27.0±2 .306 √8 .25/5

183
2. 23.8±2.306 √ 8.25/5

3. 24.2±2.306 √ 8.25/5

4. 24.4±2.306 √ 8. 25/5

5. 27.6±2 .306 √8.25/5

Estimadores

Se realiza el cálculo de los estimadores para las filas, columnas, letras latinas y letras
griegas.

 Estimadores de medias para los lotes de materia prima

α i . . .=Y i . . .−Y . .. .
α1… =22.2-25.4= -3.2

α2… =26.8-25.4= 1.4

α3… =26.0-25.4= 0.6

α4… =25.6-25.4= 0.2

α5… =26.4-25.4= 1.0

 Estimadores de medias para las operarios

τ . j .. =Y .. j.−Y ....
Τ.1.. = 21.4-25.4= -4.0

Τ.2.. = 28.6-25.4= 3.2

184
Τ.3.. = 24.2-25.4= -1.2

Τ.4.. = 26.0-25.4= 0.6

Τ.5.. = 26.8-25.4= 1.4

 Estimadores de medias para las fórmulas

β ..k .=Y .. k .−Y ....


Β..1. = 28.6-25.4= 2.2

Β..2. = 20.2-25.4= -5.2

Β..3. = 22.4-25.4= -3.0

Β..4. = 29.8-25.4= 4.4

Β..5. = 26.0-25.4= 0.6

 Estimadores de medias para las líneas de montaje

Ψ ...l =Y ...l−Y ....


…1 = 27.0-25.4= 1.6

…2 = 23.8-25.4= -1.6

…3 = 24.2-25.4= -1.2

…4 = 24.4-25.4= -1.0

…5 = 27.6-25.4= 2.2

185
Coeficiente de Determinación

R2 = [68+150+330+62] / 676 = 90%


EL 90 % de la variabilidad de la fuerza de explosión de la dinamita es explicada por el
modelo.

CAPÍTULO 5

2. DISEÑO MINIMO SIGNIFICATIVO


5.1 Definición y Generalidades

Es un prueba para comparar dos medias y posiblemente el mas utilizado, debido a


que es bastante sencillo de aplicar. Se utiliza usualmente para comparar una pareja
de medias de tratamientos, pero también puede ser utilizado para comparaciones
de mas de dos medias. Fisher la denominó Prueba protectora de Fisher LSD, en
la cual recomendó que para que la tasa de error juiciosa por comparación sea
aproximadamente igual a α se deben realizar dos etapas.

186
Etapa I: Es probar la Ho : μ1 = μ2 =…..μi por la prueba de F de tamaño α, si el valor
F no es significante se termina el análisis. Si el valor de F es significante, entonces
sigue la etapa II.

Etapa II: Se prueba cada comparación simple de Ho : μ1 = μ2 por una prueba τ al


nivel de significancia de α y con grados de libertad (gl) de CMee (en un DCA g.l=
k(n-1) , en un bloque g.l= (n-1)(k-1).

Esta prueba determina el valor mínimo necesario para considerar diferentes dos
muestras y lo utiliza para comparar los diferentes pares de medias que se deseen
evaluar.

5.2 Pasos para la Resolución de Problemas

5.2.1 Verificar si el resultado de el ANDEVA es significativo para el factor de


interés
5.2.2 Calcular y ordenar las medias de cada nivel por magnitud ( Orden
ascendente o descendente)
5.2.3 Plantear las hipótesis correspondientes con sus respectivas
reglas de decisión.

HIPOTESIS:
H 0=μ i=μ j
H 1=μi ≠ μ j

REGLA DE DECISION:
Descartar H 0 si |Ý i−Ý j|≥ DMS i ≠ j

5.2.4 Calculo del comparador DSM

187
Para un Diseño Completamente al azar (DCA)
2 CMEE
DSM =t α /2 , glee
√ n

Donde:
N: Numero de observaciones por cada nivel del factor de interés.

 Para un Diseño completamente al azar (desbalanceado)

1 1

DSM =t α /2 , ∑ nk −k CMEE ¿ +
nj [ ]
Donde:
N: Numero de observaciones por cada nivel del factor de interés.

 Para un Diseño de bloques al azar (DBA – Niveles)

2 CMEE
DSM =t α /2 ,(k −1)(n−1)
√ n

 Para un Diseño de bloques al azar (DBA –Bloques)


2 CMEE
DSM =t α /2 ,(k −1)(n−1)
√ k

 Para un Diseño Cuadrado Latino (DCL)


2 CMEE
DSM =t α /2 ,(t−1)(t−2)
√ t

Donde:
T: Numero de letras latinas o # de files o # de columnas

 Para un Diseño Cuadrado Greco-Latino


188
2CMEE
DSM =t α /2 ,(t−1)(t−3)
√ t

Donde:
T: Numero de letras latinas o griegas o # de filas o #de columnas.

5.2.5 Comparar las diferencias de las medias con el valor calculado


para DSM

Para cada una de las hipótesis |Y i −Y j|vs DSM

5.2.6 Concluir para cada una de las hipótesis

5.2.3 EJEMPLO: MAXIMIZAR LA RESISTENCIA A LA TENSIÓN


Un ingeniero de desarrollo de productos está interesado en maximizar la resistencia a
la tensión de una nueva fibra sintética que se empleará en la manufactura de tela para
camisas de hombre. El ingeniero sabe por experiencia que la resistencia es influida por
el porcentaje de algodón presente en la fibra. Además, él sospecha que elevar el
contenido de algodón incrementará la resistencia, al menos inicialmente. También sabe
que el contenido de algodón debe variar aproximadamente entre 10 y 40 % para que la
tela resultante tenga otras características de calidad que se desean (como capacidad
de recibir un tratamiento de planchado permanente). El ingeniero decide probar
muestras a cinco niveles de porcentaje de algodón: 15, 20, 25, 30 y 35 %. Así mismo,
decide ensayar cinco muestras a cada nivel del contenido de algodón.los datos
aparecen en la tabla.

5.2.3.1 Verificar si es Significativo


Los resultados del ANDEVA fueron los siguientes:

189
Glee = 20 CMEE = 8.06 Fc = 14.76 Fα = 2.87 Dado que el resultado fue
significativo se puede seguir adelante con otras comparaciones.

5.2.3.2 Calcular y ordenar las medias


Se procede a calcular y ordenar las medias de cada nivel en orden ascendente o
descendente.
NIVELES OBSERVACIONES TOTALES MEDIAS
% ALGODÓN 1 2 3 4 5
15 7 7 15 11 9 49 9.8
20 12 17 12 18 18 77 15.4
25 14 18 18 19 19 88 17.6
30 19 25 22 19 23 108 21.6
35 7 10 11 15 11 54 10.8

Los cinco promedios de tratamientos son: Y 1= 9.8; Y2= 15.4; Y3= 17.6; Y4= 21.6; Y5=
10.8 denotemos por µ1, µ2, µ3, µ4 y µ5 respectivamente a los medios de los tratamientos
con porcentaje 15, 20, 25, 30 y 35.

MEDIAS
ORDENADAS
Ῡ1 = 9.8
Ῡ5 = 10.8
Ῡ2 = 15.4
Ῡ3 = 17.6
Ῡ4 = 21.6

5.2.3.3 Plantear Hipótesis

H 0 :μ 1=μ5 |Ý 1−Ý 5|=|9.8−10.8|=1


H 1: μ1≠ μ5 descartar H 0 si|Ý 1−Ý 5|≥ DSM

190
H 0 :μ 5=μ2 |Ý 5 −Ý 2|=|10.8−15.4|=4.6
H 1 : μ 5 ≠ μ2 descartar H 0 si|Ý 5−Ý 2|≥ DSM

H 0 :μ 2=μ3 |Ý 2− Ý 3|=|15.4−17.6|=2.2


H 1 : μ 2 ≠ μ3 descartar H 0 si|Ý 2−Ý 3|≥ DSM

H 0 :μ 3=μ4 |Ý 3 −Ý 4|=|17.6−21.6|=4


H 1 : μ 3 ≠ μ4 descartar H 0 si|Ý 3−Ý 4|≥ DSM

5.2.3.4 Calcular DSM

2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05

2× 8.06
DSM =t 0.025 , 20
√ 5
DSM =3.75

5.2.3.5 calcular el comparador DSM con la diferencias de medias

H 0 :μ 1=μ5 |Ý 1−Ý 5|=|9.8−10.8|=1


H 1: μ1≠ μ5

1 vs 3.75 es No significativa ya que el valor de las diferencias de medias es menor que


el valor de DSM.

H 0 :μ 5=μ2 |Ý 5 −Ý 2|=|10.8−15.4|=4.6


H 1 : μ 5 ≠ μ2

191
4.6 vs 3.75 es significativa ya que el valor de las diferencias de medias es
mayor que el valor de DSM.

H 0 :μ 2=μ3 |Ý 2− Ý 3|=|15.4−17.6|=2.2


H 1 : μ 2 ≠ μ3

2.2 vs 3.75 es No significativa ya que el valor de las diferencias de medias es


menor que el valor de DSM.

H 0 :μ 3=μ4 |Ý 3 −Ý 4|=|17.6−21.6|=4


H 1 : μ 3 ≠ μ4

4 vs 3.75 es significativa ya que el valor de las diferencias de medias es


mayor que el valor de DSM.

5.2.3.6 Conclusión
Existe diferencia significativa en la resistencia promedio a la tensión de la nueva fibra
sintética para los pares
μ5 y μ2 Para 35% y 20% de algodón
μ3 y μ4 Para 25% y 30% de algodón
Sin embargo, para los siguientes pares la resistencia a la tensión no varía
significativamente:
μ1 y μ5 Para 15% y 35 % de algodón
μ2 y μ3 Para 20% y 25% de algodón

5.2.4 EJEMPLO. MEJORAR LA CALIDAD DE LAS SUELAS

Un fabricante de calzado desea mejorar la calidad de las suelas, las cuales se pueden
hacer con uno de los cuatro tipos de cuero A, B, C y D disponibles en el mercado.

192
Para ello, prueba los cueros con una máquina que hace pasar los zapatos por una
superficie abrasiva, la suela de los zapatos se desgasta al pasarla por dicha superficie.
Como criterio de desgaste se usa la pérdida de peso después de un número fijo de
ciclos. Se prueban en orden aleatorio 24 zapatos, seis de cada tipo de cuero.
Al hacer las pruebas en orden completamente al azar se evitan sesgos y las
mediciones en un tipo de cuero resultan independientes de las demás.
Los datos (en miligramos) sobre el desgaste de cada tipo de cuero se anotan en la
hoja de verificación previamente diseñada

Tipo de OBSERVCIONES (miligramos)


Cuero
A 264 260 258 241 262 255
B 208 220 216 200 213 206
C 220 263 219 225 230 228
D 217 226 215 224 220 222

TC OBSERVACIONES SUM PROMEDI


A O
A 26 26 25 24 26 25 1540 256.7
4 0 8 1 2 5
B 20 22 21 20 21 20 1263 210.5
8 0 6 0 3 6
C 22 26 21 22 23 22 1385 230.8
Los 0 3 9 5 0 8 resultados
D 21 22 21 22 22 22 1324 220.7
del ANDEVA
7 6 5 4 0 2
fueron los siguientes:

FV SC GL CM Fc Fα
TIPOS 7072.3 3 2357.44 23.24 3.098
DE 3

193
CUERO
EE 2029 20 101.45    
TOTAL 9101.3 23      
3

5.2.4.1 Verificar si es Significativo


Dado que el resultado fue significativo se puede seguir adelante con otras
comparaciones.

5.2.4.2 Calculamos y ordenamos las medias de cada nivel en orden


descendente o ascendente.
MEDIAS
ORDENADA
S
Ῡa = 256.7
Ῡc = 230.8
Ῡd = 220.7
Ῡb = 210.5

5.2.4.3 Plantear Hipótesis

H 0 :μ a=μ c |Ý a −Ý c|=|256.7−230.8|=25.8


H 1 : μ a ≠ μc descartar H 0 si|Ý a−Ý c|≥ DSM

H 0 :μ c =μd |Ý c −Ý d|=|230.8−220.7|=10.1


H 1: μc ≠ μd descartar H 0 si|Ý c −Ý d|≥ DSM

H 0 :μ d =μ b |Ý d −Ý b|=|220.7−210.5|=10.2


H 1: μd ≠ μb descartar H 0 si|Ý d −Ý b|≥ DSM

5.2.4.4. Calcular DSM

194
2 CMEE
DSM =t α /2 , glee
√ n
α = 0.05

2× 101.45
DSM =t 0.025 , 20
√ 4
DSM =14.857

5.2.4.5 Calcular el comparador DSM con las diferencias de medias


H 0 :μ a=μ c |Ý a −Ý c|=|256.7−230.8|=25.8
H 1 : μ a ≠ μc

25.8 vs 14.857 es significativa ya que el valor de las diferencias de medias es


Mayor que el valor de DSM.

H 0 :μ c =μd |Ý c −Ý d|=|230.8−220.7|=10.1


H 1: μc ≠ μd

10.1 vs 14.857 no es significativa ya que el valor de las diferencias de medias es menor


que el valor de DSM.

H 0 :μ d =μ b |Ý d −Ý b|=|220.7−210.5|=10.2


H 1: μd ≠ μb descartar H 0 si|Ý d −Ý b|≥ DSM

10.2 vs 14.857 no es significativa ya que el valor de las diferencias de medias es menor


que el valor de DSM.

5.2.4.6 Conclusión

195
Existe diferencia significativa en el desgaste promedio de suela de cada tipo de cuero
para μa y μc .
Sin embargo, para los siguientes tipos de cuero el desgaste promedio no varía
significativamente: μc y μd, μd y μb.

CAPÍTULO 6

6. DUNCAN
6.1 Definición

La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia
entre pares de medias después que se ha rechazado la hipótesis nula en el análisis de
varianza.

196
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios
"rangos" (Duncan los llama rangos significativos mínimos) dados por la fórmula:

Dónde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de la


tabla T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.

6.2 Generalidades

 Este procedimiento es utilizado para realizar comparaciones múltiples de medias


 Es recomendable efectuar esta prueba después que la prueba F haya resultado
significativa.

6.3 Pasos para la Resolución de Problemas.

6.3.1 Verificar que sea aplicable al caso de estudio

Solamente es aplicable si el resultado del ANDEVA es significativo para el factor de interés

6.3.2 Cálculo de Medias


Se procede a calcular las medias de cada nivel.

6.3.3 Ordenar Medias


Se Ordenan las medias de cada nivel por magnitud.

6.3.4 Cuadro de Rangos Múltiples

197
Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.

Por ejemplo el cuadro de rangos múltiples para:

 Para un factor de interés con 5 niveles y que el orden por magnitud sea
A,B,C,D Y E

A B C D E
Posibles Comparaciones

E E-A E-B E-C E-D - E Vs A


E Vs B
D D-A D-B D-C - E Vs C
E Vs D
D Vs A
C C-A C-B
D Vs B
D Vs C
B B-A - C Vs A
C Vs B
A - B Vs A

 Para un factor de interés


con 4 niveles y que el orden por magnitud sea A, B, C y D

A B C D
Posibles Comparaciones
D D-A D-B D-C - D Vs A
D Vs B
C C-A C-B - D Vs C
C Vs A
B B-A - C Vs B
B Vs A
A -

 Para un factor de interés con 3 niveles y que el orden por magnitud sea
A,B y C

198
A B C Posibles Comparaciones
C Vs A
C C-A C-B -
C Vs B
B B-A - B Vs A

A -

6.3.5 Hipótesis

Plantear las hipótesis correspondientes con sus reglas de decisión:

Descartar Ho si |Ý i −Ý j|≥C . D.

6.3.6 Cálculo de Comparador de Duncan para DCA


CD = (Dα, Nodemedias, glee) Sy

CMEE
S ȳ = √ n
DCA un solo factor

Ejemplo para 3 niveles

# de Medias (p) 2 3
D α, glee D2 D3
Sy Sy Sy
CD D2 S y D3 S y

En los demás diseños, lo que varía es el cálculo de S ý

199
CMEE
DBA S ý =
√ n
Para los niveles

CMEE
S ý =
√ k
Para los bloques

CMEE
DCL S ý =
√ t
En donde t es el número de las L.L o filas o columnas.

CMEE
DCGL S ý =
√ k
t el número de las L.L o L.G.

6.3.7 Comparación de Medias


Comparar las diferencias de medias de los niveles del factor con su respectivo
Comparador Duncan.

6.3.8 Conclusión
Se pueden realizar de forma general, o especificando el efecto de cada factor.

6.4 Ejemplos
6.4.1 Problema a Resolver

200
Se están comparando tres soluciones de lavado diferentes a fin de estudiar su
efectividad para retardar el crecimiento de bacterias en contenedores de leche de
cinco galones. El análisis se hace en un laboratorio y sólo pueden realizarse tres
ensayos en un día. Puesto que los días podrían representar una fuente potencial
de variabilidad, el experimentador decide usar un diseño de bloques
aleatorizados. Se hacen observaciones en cuatro días, cuyos datos se muestran
enseguida. Analizar los datos de este experimento (utilizar α = 0.05) y sacar las
conclusiones apropiadas.

Días
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22

6.4.1.1 Verificar si es aplicable.

Sí es aplicable.

6.4.1.2 Cálculos de las Medias de todos los tratamientos

92
x́ solu .1 = =23
4
101
x́ solu .2 = =25.25
4
32
x́ solu .3 = =8
4

6.4.1.3 Ordenamiento de las Medias

x́ solu .2 =25.25

x́ solu .1 =23

201
x́ solu .3 =8

6.4.1.4 Cuadro de Rangos Múltiples

x́ solu .3 =8 x́ solu .1 =23 x́ solu .2 =25.25


x́ solu .2 =25.25 17.25 2.25 -
x́ solu .1 =23 15 -
x́ solu .3 =8 -

6.4.1.5 Hipótesis

H0: m solu.2 = m solu.3 H1: m solu.2 ¹ m solu.3


Si |25.25-8| C.D. se descarta H0

H0: m solu.2 = m solu.1 H1: m solu.2 ¹ m solu.1


Si |25.25-23| C.D. se descarta H0

H0: m solu.1 = m solu.3 H1: m solu.1 ¹ m solu.3


Si |23-8| C.D. se descarta H0

6.4.1.6 Cálculo de los Comparadores DUNCAN (C.D)

No. de 2 3

202
medias
Duncan al 3.113 3.256
5%
S ý S ý S ý
C.D. 3.113* S ý 3.256* S ý

Para cada No. de medias se busca al 0.05. Para la media de 2 en la tabla de


Duncan sale 3.113 y para el de 3 medias nos da 3.256.
g.l.ee: nk-1 = (4*3)-1 = 11

Para ambos no. de medias es el mismo S ý tanto para la media 2 y la media 3.


CMEE
S ý =
√ n

Comparación de las medias

Para los niveles

|17.25| 18.491 se acepta H0


|2.25| 17.679 se acepta H0
|15| 17.679 se acepta H0

Conclusión

Podemos concluir que los pares de medias no tienen diferencias significativas entre sí
en cuanto a su efectividad para retardar el crecimiento de bacterias en contenedores de
leche de cinco galones.

6.4.2 EJEMPLO: DONAS

Se realizó un experimento para determinar la cantidad (en gramos) de grasa absorbida


por 48 donas (donuts) usando ocho tipos diferentes de grasas (aceites y mantecas).
Las medias para los ocho tratamientos se muestran a continuación:

203
Se usaron seis "donas" en cada tipo de grasa y se obtuvo un cuadrado medio del error
de 141.6, los grados de libertad del error son 48 - 8 =40.

6.4.2.1 Verificar que sea aplicable al caso de estudio

Sí es aplicable.

6.4.2.2 Cálculos de las Medias de todos los tratamientos

El problema las indica. Y por otro lado se calculan los rangos

Se calculan los rangos:

Seleccionando a = 0.05 para este ejemplo, los rangos de Duncan son:

Los valores 3.300, 3.266,..., 2.858 se obtuvieron de la tabla de Duncan (T-9) para a =
0.05, 2 £ p £ 8 y 40 grados de libertad.

6.4.2.3 Ordenamiento de las Medias

El siguiente paso es ordenar las medias en orden creciente para establecer los
"rangos".

204
El rango entre las medias máxima y mínima se compara con D8, esto es,

entonces existe diferencia significativa entre las grasas 4 y 7.

6.4.2.4 Cuadro de rangos múltiples

161 162 165 172 176 178 182 185

185 24 23 20 13 9 7 3 -

182 21 20 17 10 6 4 - -

178 17 16 13 6 2 - - -

176 15 14 11 4 - - - -

172 11 10 7 - - - - -

165 4 3 - - - - - -

162 1 - - - - - - -

161 - - - - - - - -

6.4.2.5 Hipótesis
Y i−Y j

Descartar Ho si │ │≥ C.D.

205
6.4.2.6 Cálculo de Comparador de DUNCAN para un DCA

CD=( Dα ,Nodemedias , glee )S ȳ CMEE


S ȳ = √ n
En este caso, no tenemos los resultados del andeva.

6.4.2.7 Comparación de Medias

El próximo paso es comparar subconjuntos de siete medias con el rango D7.

, entonces

, entonces

Como los dos exceden el rango D7 se subdividen estos dos subconjuntos en conjuntos
de seis medias.

, entonces

, entonces

, entonces

Nuevamente éstos exceden D6, entonces éstos se subdividen en subconjuntos de cinco


medias

, entonces

, entonces

, entonces

206
, entonces

Como las medias para las grasas 3, 2, 6 y 1 están incluidos en el conjunto 43261 que
fue no significativo, los rangos de las medias en el subconjunto 3261 no se comparan
con D4; solamente los rangos de las medias en el subconjunto 2615 se comparan con
D4; por lo tanto,

, entonces

Los otros subconjuntos de cuatro medias (3,2,6,1) y (6,1,5,3) no se comparan con D4


porque ya fueron declarados no significativos en los conjuntos de cinco medias. Por lo
tanto, el proceso termina.

Los resultados se muestran gráficamente en la siguiente figura, donde las medias que
están debajo de una línea no son significativamente diferentes.

6.4.2.8 Conclusión

El investigador puede concluir que las cantidades absorbidas usando las grasas 4 y 3
son significativamente mayores que las 5, 8 y 7, y que la 2 es significativamente mayor
que las 8 y 7 y las demás grasas no son significativamente diferentes en relación con la
cantidad absorbida.

6.4.3 EJEMPLO: RIEGO EN EL CULTIVO DE PLÁTANO

En un experimento bajo el diseño de bloques al azar se compararon 4 normas de riego


en el cultivo del plátano fruta clón “Cavendish gigante” en el ciclo de fomento.

207
Los tratamientos evaluados fueron:

T1- Regar cuando la humedad en el suelo llegue a 0,40 bar (40 centibar).

T2- Regar cuando la humedad en el suelo llegue a 0,45 bar (45 centibar).

T3- Regar cuando la humedad en el suelo llegue a 0,5 bar (50 centibar).

T4- No regar.

Para evaluar los tratamientos se utilizó como variable principal:

Rendimiento expresado en toneladas por hectárea, los datos son los siguientes.

Réplicas
Tratamiento 1 2 3 4 5 Totales
s
1 47.99 48 47.98 48.78 47.2 239.95
2 44.22 44.01 44.45 44.13 44.31 221.12
3 42.58 42.3 42.86 42.11 43.06 212.91
4 37.66 37.3 38.02 37.25 37 187.23
∑ 172.45 171.61 173.31 172.27 171.57 861.21

6.4.3.1 Verificar que sea aplicable al caso de Estudio


Sí es aplicable.

6.4.3.2 Cálculos de las medias de todos los tratamientos

239.95
x́ trat .1 = =47.99
5

221.12
x́ trat .2 = =44.224
5

208
212.91
x́ trat .3 = =42.582
5

187.23
x́ trat .4 = =37.446
5

6.4.3.3 Ordenamiento de las medias

x́ trat .1 =47.990

x́ trat .2 =44.224

x́ trat .3 =42.582

x́ trat .4 =37.446

6.4.3.4 Cuadro de Rangos Múltiples

x́ trat .4 =37.446 x́ trat .3 =42.582 x́ trat .2 =44.224 x́ trat .1 =47.990


x́ trat .1 =47.990 10.544 5.408 3.766 -
x́ trat .2 =44.224 6.778 1.642 -
x́ trat .3 =42.582 5.136 -
x́ trat .4 =37.446 -

6.4.3.5 Hipótesis

H0: m trat.1 = m trat.4 H1: m trat.1 ¹ m trat.4

Si |47.990-37.446| C.D. se descarta H0

H0: m trat.1 = m trat.3 H1: m trat.1 ¹ m trat.3

Si |47.990-42.582| C.D. se descarta H0

H0: m trat.1 = m trat.2 H1: m trat.1 ¹ m trat.2

Si |47.990-44.224| C.D. se descarta H0

209
H0: m trat.2 = m trat.4 H1: m trat.2 ¹ m trat.4

Si |44.224-37.446| C.D. se descarta H0

H0: m trat.2 = m trat.3 H1: m trat.2 ¹ m trat.3

Si |44.224-42.582| C.D. se descarta H0

H0: m trat.3 = m trat.4 H1: m trat.3 ¹ m trat.4

Si |42.582-37.446| C.D. se descarta H0

6.4.3.6 Cálculo de los Comparadores DUNCAN (C.D)


Para los niveles

No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý nivel S ý nivel S ý nivel
C.D. 3.082∗S ý nivel 3.225∗S ý nivel 3.313∗S ý nivel

.gl.ee: (n-1)(k-1) = (5-1)(4-1) = 12

Para Duncan al 5%, la media de 2 es 3.082, la media de 3 es de 3.225 y la media de 4


es de 3.313.

CMEE
S ý nivel=
√ n

Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.

Para los bloques

No. de medias 2 3 4
Duncan al 5% 3.082 3.225 3.313
S ý S ý bloques S ý bloques S ý bloques
C.D. 3.082∗S ý bloques 3.225∗S ý bloques 3.313∗S ý bloques

210
g.l.ee: (n-1)(k-1) = (5-1)(4-1) = 12

Para Duncan al 5%, la media de 2 es 3.082, la media de 3 es de 3.225 y la media de 4


es de 3.313.

CMEE
S ý bloques=
√ k

Para ambos no. de medias es el mismo S ý tanto para la media 2, la media 3 y la media
4.

211
CAPÍTULO 7

7. TUKEY
7.1 Definición

La prueba Tukey se usa en experimentos que implican un número elevado de


comparaciones o se desea usar una prueba más rigurosa que la de Duncan.

Es de fácil cálculo puesto que se define un solo comparador, resultante del producto
del error estándar de la media por el valor tabular en la tabla de Tukey usando como
numerador el número de tratamientos y como denominador los grados de libertad del
error.

7.2 Generalidades
 Este procedimiento es llamado también «Diferencia Significativa Honesta»
 Se utiliza para realizar comparaciones múltiples de medias
 Esta prueba es similar a la prueba de Duncan en cuanto a su procedimiento y
además es más exigente.
 Esta prueba es un procedimiento de comparación múltiple que también está
basado en los intervalos.
 Su procedimiento requiere el uso de qµ (k,glee) para determinar el valor crítico
de todas las comparaciones por pares, independientes de cuantas medias estén
en el grupo.
 Esta prueba declara dos medias significativas diferentes si el valor absoluto de
sus diferencias muéstrales excede al comparador
 La prueba de Tukey es una prueba de comparación múltiple, al igual que otras
como Duncan, diferencia significativa mínima, entre otras. son utilizadas para la
comparación de promedios.
 Es utilizada una vez hayamos realizado el análisis de varianza y hayamos
concluido con éste, que el factor de interés es significativo (Fc ≥ Fα).

212
 Para la aplicación de la prueba de Tukey es necesario el uso de qµ (k,glEE) los
puntos porcentuales del estadístico del rango studentizador.
 Se utiliza qµ (k,glEE) para determinar el valor crítico de todas las comparaciones
por pares,
 Esta prueba declara dos medias significativas diferentes, si el valor absoluto de
sus diferencias muéstrales excede al comparador T µ = q µ (k,glEE) Syi.
 A la versión de este método que trabaja con números de muestras desiguales o
desbalanceado se le llama Procedimiento Tukey-Kramer.

7.3 Pasos para la Resolución de Problemas..


7.3.1 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)
7.3.2 Ordenar en forma ascendente o descendente las medias de los
niveles, obtener las diferencias de las medias (cuadro de rangos
múltiples)

Para un factor de interés con 5 niveles y que el orden por magnitud sea A,B,C,D Y E.

213
7.3.3 Plantear Hipótesis y sus Reglas de Decisión

7.3.4 Calcular los comparadores Tukey – puntos críticos de rechazo.

214
7.3.5 Comparar la diferencia de medias con el comparador Tukey
7.3.6 Hacer Conclusiones

7.4 Ejemplos

7.4.1 Problema a Resolver

Se sospecha que la temperatura ambiente en la cual se activan las bacterias, afecta su


tiempo de activado. Se probaron treinta bacterias homogéneas, 6 a cada una de las 5
temperaturas y se obtuvieron los datos mostrados a continuación. Analice e intérprete
los datos.

Tabla de Datos Obtenidos:

215
7.4.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)

Análisis de Varianza

Conclusiones para el análisis de varianza:

216
Se concluye que las cinco temperaturas ambientes determinadas afectan
significativamente el tiempo de activado de las baterías probadas.

7.4.3 Ordenar en forma ascendente o descendente las medias de los


niveles, obtener las diferencias de las medias (cuadro de rangos
múltiples)

7.4.4 Plantear Hipótesis y sus Reglas de Decisión

217
7.4.5 Calcular los comparadores Tukey – puntos críticos de rechazo.

7.4.6 Comparar la diferencia de medias con el comparador Tukey

7.4.7 Hacer Conclusiones

218
 Se acepta la hipótesis nula para la pareja de medias (3,4) y se rechaza para
todas las demás parejas. Se concluye lo siguiente:

u3 = u4 ; u1 ¹ u2 ; u1 ¹ u3; u1 ¹ u4 ; u1 ¹ u5 ; u2 ¹ u4 ; u2 ¹ u5 ; u3 ¹ u5 ; u4 ¹ u5

 Existe diferencia significativa entre todas las parejas de medias a excepción de


la pareja (3,4).

 El tiempo de activado promedio de las baterías que se probaron a T = 50 ºC y de


las que se probaron a T =75ºC no difieren significativamente. Mientras que para
el resto de las comparaciones de las medias de temperatura sí difiere
significativamente.

7.4.2 Ejemplos
7.4.2.1 Problema a Resolver

Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes. Los resultados del experimento aparecen en la siguiente
tabla.

219
7.4.2.2 Verificar si el factor de interés es significativo (en la tabla de
ANDEVA)

El análisis de varianza:

Puesto que Fcalc > Fteor se rechaza H0, y se concluye que hay diferencia significativa
(al 5%) entre las cantidades medias de contaminantes para las diferentes plantas.

Los valores absolutos de las diferencias entre   del ejemplo se


muestran en la siguiente tabla.

220
7.4.2.3 Ordenar en forma ascendente o descendente las medias de los
niveles, obtener las diferencias de las medias (cuadro de rangos
múltiples)
7.4.2.4 Plantear Hipótesis y sus Reglas de Decisión
H0= µ1=µ2 H1= µ1≠µ2
H0= µ1=µ3 H1= µ1≠µ3
H0= µ1=µ4 H1= µ1≠µ4
H0= µ2=µ3 H1= µ2≠µ3
H0= µ2=µ4 H1= µ2≠µ4
H0= µ3=µ4 H1= µ3≠µ4

7.4.3 Calcular los comparadores Tukey – puntos críticos de rechazo.


Para los datos obtenidos y un α = 0.05,

Como se puede observar, las diferencias de tukey que exceden (DSH) están entre las

medias ,y , por lo tanto, sólo difieren las medias u 4 de u 1 y de u 3.

7.4.4 Comparar la diferencia de medias con el comparador Tukey

221
0.348 vs 0.3127 (1,4)
0.204 vs 0.3127 (1,2)
0.022 vs 0.3127 (1,3)

0.226 vs 0.3127 (2,3)


0.144 vs 0.3127 (2,4)
0.370 vs 0.3127 (3,4)

7.4.5 Hacer Conclusiones


Como se puede observar, las diferencias de tukey que exceden (DSH) están entre las

medias ,y , por lo tanto, sólo difieren las medias u 4 de u 1 y de u 3.


Existen diferencias significativas para las parejas (1,4) y (3,4)

222
CAPÍTULO 8

8. NEWMAN KEULS
8.1 Definición
Es un procedimiento de comparaciones múltiples que ordena las medias de los grupos
de menor a mayor y establece el rango a utilizar para comprobar la hipótesis de que no
hay diferencias significativas entre las medias, en función del nº de pasos que hay
entre 2 medias a contrastar.

8.2 Generalidades
 Esta prueba se basa en la separación de un par específico de medias que se
prueban del conjunto completo de medias ordenadas.
 Fue desarrollada por Newman (1939) y Keuls (1952) en donde utilizaron
intervalos múltiples entre medias como criterio de conclusión.

8.3 Pasos

 Verificar si el análisis de varianza es significativo mediante el ANDEVA


 Calcular y Ordenar en forma ascendente o descendente las medias.
 Elaborar el cuadro de Rangos Múltiples
 Plantear las Hipótesis y las reglas de decisión respectivas
 Calcular el error estándar
 Calcular los comparadores Newman-Keuls
 Comparar los valores obtenidos en la diferencia de medias según su posición,
con los correspondientes valores obtenidos para los comparadores Newman-Keuls
 Establecer que par de valores son significativos (mediante un asterisco) y
cuales no son significativos (mediante las letras n.s.)
 Concluir

8.3.1 Verificar si el análisis de varianza es significativo mediante el andeva.

223
Fc>Fα

8.3.2 Calcular y ordenar en forma ascendente o descendente las medias

8.3.3 Elaborar el cuadro de rangos múltiples

Se hace una matriz donde se colocan las medias de cada nivel en forma ascendente
en la parte superior y en el margen izquierdo se colocan las medias de cada nivel en
forma descendente, o viceversa. En el interior de la matriz se calculan las diferencias
de medias para cada posible comparación.

8.3.4 Plantear las


hipótesis y las reglas de decisión respectivas
Ho: u1= u4 Ho: u5=u4 Ho: u2=u4 Ho: u3=u4 Ho:u1=u3
H1: u1=u4 H1: u5=u4 H1: u2=u4 H1:u3=u4 H1:u1=u3

Ho: u5=u3 Ho: u2=u3 Ho: u1=u2 Ho: u5=u2 Ho: u1=u5
H1: u5=u3 H1: u2=u3 H1: u1=u2 H1: u5=u2 H1: u1=u5

Regla de decisión

Descartar ho, si l l ≥nk (respectivo)

224
8.3.5 Calcular el error estándar

Para un D. C. A (balanceado) s y =√ CMEE


n

DBA sy  CMEE
n
sy  CMEE
k

DCL
sy  CMEE
t

DCGL
sy  CMEE
t

Para un D. C. A (desbalanceado)

1 1 1 1
n n n n
   ...
i 1 2 k

8.3.6 Calcular los comparadores newman-keuls

Donde: p= número de medias (p= 2,3…k)

glee= grados de libertad del error

q = valor de la tabla correspondiente

225
8.3.7 Comparar los valores obtenidos en la diferencia de medias según su
posición, con los correspondientes valores obtenidos para los comparadores
newman-keuls.

8.3.8 Establecer que par de valores son significativos (mediante un asterisco)


y cuales no son significativos (mediante las letras n.s.)

8.3.9 Concluir

8.4 EJEMPLO. RESISTENCIA A LA TENSIÓN DEL CEMENTO

Se está estudiando la resistencia a la tensión de cemento Pórtland. Cuatro técnicas de


mezclado pueden ser usadas económicamente. Se han recolectado los siguientes
datos:

Para la solución de este problema debemos seguir los pasos antes descritos.

8.4.1 Se procede con la verificación de la significancia del ANDEVA, es decir


cuando Fc>Fα.

En este caso obtuvimos la siguiente tabla del Análisis de Varianza:

226
De aquí podemos observar que F calculada es mayor que la F crítica, por ende se dice
que si es significativo el ANDEVA.

8.4.2 Calcular y Ordenar en forma ascendente o descendente las medias.

Y 1 =2971 Y 4 =2666 . 25
Y 2 =3156 .25 Ordenadas Ascendente Y 3 =2933 .75
Y 3 =2933 . 75 Y 1 =2971
Y 4 =2666 . 25 Y 2 =3156 .25

8.4.3 Elaborar el cuadro de Rangos Múltiples, de la forma descrita al principio


de este capítulo.

Para este ejemplo queda de la siguiente forma:

Luego de esto se debe plantear las Hipótesis. En este caso de la siguiente forma:

Ho: μ2 =μ 4 H 1 : μ2 ≠μ 4
Ho: μ2 =μ3 H 1 : μ2 ≠μ 3
Ho: μ2 =μ1 H 1 : μ2 ≠μ 1
Ho: μ1 =μ4 H 1 : μ1 ≠μ 4
Ho: μ1 =μ3 H 1 : μ1 ≠μ 3
Ho: μ3 =μ 4 H 1 : μ3 ≠μ4

8.4.4 Plantar la regla de decisión, para este caso:

|Y i −Y j|≥NK 227
Descartar Ho si:

|3156 .25−2666.25|≥NK 4 |2971−2666.25|≥NK 3


|3156 .25−2933.75|≥NK 3 |2971−2933.75|≥NK 2
|3156 .25−2971|≥NK 2 |2933 .75−2666 .25|≥NK 2

8.4.5 Calcular el error estándar

12825 .68
s y =√ CMEE
n
S ȳ = √ 4
= 56.62

8.4.6 Se deben calcular los comparadores Newman-Keuls

NK=q α , p , glee S ȳ
i

Donde: p= número de medias ( p= 2,3…k)

glee= grados de libertad del error

q = valor de la tabla VIII (Montgomery)

Del cuadro del ANDEVA el CMEE = 12825.68, gl del error = 12

228
Se debe calcular el comparador:

Comparar este cuadro con el de la diferencia de medias

8.4.7 De esta comparación obtenemos lo siguiente:

|490|≥NK 4
490 vs237 .804
|222 .5|≥NK 3
222.5vs 13.4574
|185 .25|≥NK 2 185 .25 vs174.3896
|304 . 75|≥NK 3 304 .75vs213.4574
|37 . 25|≥NK 2 37 .25 vs174.3896
|267 . 5|≥NK 2 267 .5 vs174.3896

8.4.8 Establecer que par de valores son significativos (mediante un


asterisco) y cuales no son significativos (mediante las letras n.s.)

229
n.s.

8.4.9 Concluimos para este ejemplo lo siguiente:

230
CAPÍTULO 9

9. DUNNETT
9.1 Definición

En muchos experimentos uno de los tratamientos es el control, y el investigador está


interesado en comparar cada una de las otras a - 1 medias de los tratamientos contra
el control, por lo tanto, existen a - 1 comparaciones. Un procedimiento para realizar
estas comparaciones es la prueba de Dunnett (desarrollada en 1964 por Charles W.
Dunnett). Si se supone que el control es el tratamiento a, entonces se desea probar las
hipótesis.

H0 = µi = µa

H1 = µi = µa

Esta prueba es útil cuando el experimentador está interesado en determinar que


tratamiento es diferente de un testigo, control o tratamiento estándar.

9.2 Generalidades

Una vez que el análisis de varianza de un experimento ha mostrado que un valor de F


es significativo (rechazo de la hipótesis nula), se puede aplicar una prueba como la
Dunnett, entre otras pruebas como Duncan, Newman-Keuls, Tuckey o la prueba de
Diferencia Significativa.

Todos los procedimientos involucran el cálculo de un valor que es comparado con la


diferencia entre promedios. Si este valor es más pequeño que las diferencias quieren
decir que éstas son significativamente diferentes. Normalmente las comparaciones
múltiples se realizan al mismo nivel de significancia que la ANDEVA.

231
Por ejemplo, para un ANDEVA significativa a un nivel de 5% (α= 0,05), se realizan
comparaciones múltiples al 5%. Sin embargo, algunos investigadores realizan
comparaciones a niveles diferentes lo cual, desde el punto de vista estadístico también
es posible realizar. Lo que no puede hacerse, sin embargo, es realizar comparaciones
múltiples al nivel de 1% (α = 0,01) cuando el ANDEVA sólo muestra diferencias al 5%.

Como habíamos indicado, existen muchos métodos para llevar a cabo estas
comparaciones, que emplean tablas como la t de Student o tablas elaboradas
especialmente para este efecto, como las de Dunnett o las de Tuckey.

9.3 Pasos

La prueba de Dunnett para las comparaciones de medias se puede realizar ya a partir


de un diseño completamente al azar DCA, diseño de bloques al azar DBA o un diseño
cuadrado latino DCL, la prueba se realiza en seis pasos.

En esta prueba se establece previamente un patrón o testigo para compararlo con los
otros niveles del factor de interés.

9.3.1 Verificar si el ANDEVA es significativo

Luego de realizado el experimento y los cálculos del análisis de varianza, se


comprueba a través de la hipótesis principal (factor de interés), si existen diferencias
significativas entre la variable respuesta sobre el efecto del factor de interés.

Se descarta Ho si Fc ≥ Fa,gln,gld

9.3.2 Calcular las medias de cada uno de los niveles

Se calculan cada una de las medias de los niveles del factor de interés de acuerdo al
modelo utilizado para realizar el experimento.

Y se colocan en orden ya ascendente o descendente.

Ӯi. = ∑Ӯi.
n

232
9.3.3 Formular las hipótesis y la regla de decisión

Calculadas las medias de los niveles del factor de interés, se formula la hipótesis de
interés y la regla de decisión de la diferencia entre las medias y medir la diferencia
significativa entre estas.
∫ yi− yk ∫ ¿ CDU
Descartar Ho si:

9.3.4 Calcular el comparador Dunnett

Para calcular el comparador de Dunnett existe una fórmula específica para cada diseño
experimental, veamos.

Para un DCA:
2 CMEE
 Balanceado: DU =d ¿ (k−1, glee )
√ n

1 1
 No Balanceado: DU =d ¿ (k −1, glee ) CMEE∗ n + n
i j √ ( )
glee = grados de libertad del error

n= número de observaciones por nivel

Para un DBA:
2 CMEE
DU =d ¿ (k−1, glee )
√ n
n= número de bloques

Para un DCL y DCGL:


2 CMEE
DU =d ¿ (k−1, glee )
√ t

233
t= número de letra latina o letras griegas.

Donde la constante se encuentra en la tabla de distribución de Dunnett para la


comparación de medias, (tabla en el apéndice).

9.3.5 Calcular la diferencia de las medias y compararlas con el


comparador de Dunnett

Luego de calcular el comparador de Dunnett y teniendo el valor de las medias, se


calcula la diferencia de las medias y se compara con el comparador.

9.3.6 Conclusión

Al final el resultado demuestra que si la diferencia entre las medias es mayor que el
comparador de Dunnett existen diferencias en la variable respuesta sobre el efecto de
los noveles del factor de interés.

9.4 EJEMPLO. RESISTENCIA AL CEMENTO

Se está estudiando la resistencia a la tensión de cemento Portland. Cuatro técnicas de


mezclado pueden ser usadas económicamente. Se han recolectado los siguientes
datos:

Técnica Resistencia a la tensión (lb/plg 2) Total Promedio


de
mezclado
1 3129 3000 2865 2890 11884 2971
2 3200 3300 2975 3150 12625 3156,25
3 2800 2900 2985 3050 11735 2933,75
4 2600 2700 2600 2765 10665 2666,25

Luego de haber realizado el experimento y el desarrollo de los procesos del diseño


experimental, incluyendo el análisis de varianza y este ha demostrado que Fc posee un
valor significativo se puede aplicar la Prueba de Dunnett.

9.4.1.1 Verificar si el ANDEVA es significativo.

234
Comparando el cálculo de la Fc con F crítico para rechazar o aceptar la hipótesis
principal.

Se descarta Ho si Fc ≥ Fa,gln,gld

Cálculo de la ANDEVA

Origen SC GL CM Fc F crítico
Técnicas de 489740.188 3 163246.7 12.7281075 3.49029482
mezclado 29
EE 153908.25 12 12825.68
75
Total 643648.438 15

Conclusión del experimento: Fc>F crítica, concluimos entonces que existen


diferencias significativas en la resistencia a la tensión del cemento Portland debido a
las técnicas de mezclado.

Al verificar el cálculo de la ANDEVA notamos que si existen diferencias significativas,


por lo que el experimento permite realizar la prueba de Dunnett.

9.4.1.2 cálculo de las medias de los niveles del factor de interés.

Y colocarlas de manera descendente.

Y 4 =2666 . 25
Y 3 =2933 .75
Y 1 =2971
H o : u2 =u 4
Y 2 =3156 .25
H 1 : u2 ≠u4
9.4.1.3 Formular la hipótesis y la regla de decisión

H o : u1 =u 4
H 1 : u1 ≠u4
235
H o : u3 =u 4
H 1 : u3 ≠u4
Descarta Ho si ∫ yi− yk ∫ ¿ CDU

9.4.1.4 calcular el comparador de Dunnett

2 CMEE
CDunnet =d ¿ (k−1 ,f )
n √2(12825.68)
CDunnet =d 0 .05,(3,12)
4 √
CDunnet=2.14

9.4.1.5 calcular las diferencias entre las medias y compararlas con el


comparador de Dunnett

¿ Ȳ 2−Ȳ 4 /¿ 490≻214 . 61
¿ Ȳ 1−Ȳ 4 /¿304 . 75≻214 .61
¿ Ȳ 3−Ȳ 4 /¿ 267 .5≻214 .61

9.4.1.6 Conclusión

236
En base a los resultados obtenidos podemos concluir que existen diferencias
significativas en la resistencia a la tensión del cemento Portland, al comparar las
técnicas de mezclado (1, 2, 3) con la técnica de mezclado 4 (patrón).

9.4.2 EJEMPLO. PLANTAS

Una empresa tiene cuatro plantas y sabe que la planta A satisface los requerimientos
impuestos por el gobierno para el control de desechos de fabricación, pero quisiera
determinar cuál es la situación de las otras tres. Para el efecto se toman cinco
muestras de los líquidos residuales de cada una de las plantas y se determina la
cantidad de contaminantes.

Los resultados de los experimentes se presentan en la siguiente tabla.

Plantas Contaminantes Total Promedi


o
A 1,65 1,72 1,50 1,35 1,60 7,82 1,56
B 1,70 1,85 1,46 2,05 1,80 8,86 1,77
C 1,40 1,75 1,38 1,65 1,55 7,73 1,55
D 2,10 1,95 1,65 1,88 2,00 9,58 1,92

9.4.2.1 Verificar si el ANDEVA es significativo.

Cálculo de la ANDEVA

Origen SC GL CM Fc F crítico
Plantas 0,470255 3 0,1567 5.1708 3.2040
EE 0,48504 16 0,0303
Total 0,955295 19

Conclusión del experimento: Fc>F crítica, concluimos entonces que existen


diferencias significativas en el nivel de contaminación de las diferentes plantas.

Al verificar el cálculo de la ANDEVA notamos que si existen diferencias significativas,


por lo que el experimento permite realizar la prueba de Dunnett.

237
9.4.2.2 Cálculo de las medias de los niveles del factor de interés.

Y colocarlas de manera descendente.


Y C =1 .55
Y A =1. 56
Y B =1. 77
Y D=1 .92

9.4.2.3 Formular la hipótesis y la regla de decisión

H o : u D = uC
H 1 : u D≠uC
Descarta Ho si ∫ yi− yk ∫ ¿ CDU
H o : u B =uC
H 1 : uB ≠uC

H o : u A =uC
H 1 : u A ≠uC

9.4.2.4 Calcular el comparador de Dunnett

1 1

CDunnet=d ¿ (k −1, glee) CMEE∗
( )+
ni n j

1 1

CDunnet=d 0 . 05( 3 ,16 ) 0 . 0303∗ +

CDunnet = 0.30068
( )
5 4

238
9.4.2.5 calcular las diferencias entre las medias y compararlas con el
comparador de Dunnett.

¿ Ȳ D−Ȳ A /¿ 0 .36≻0 .30068


¿ Ȳ B−Ȳ A /¿ 0. 21≻0 . 30068
¿ Ȳ C−Ȳ A /¿ 0 . 01≻0 . 30068

9.4.2.6 Conclusión

En base a los resultados obtenidos podemos concluir que existen diferencias


significativas en la planta D debido a los niveles de contaminación y en las plantas C,B
no hay diferencia significativa, todos estos comparados con el patrón que es la fabrica
A que cumple con los requerimientos establecidos.

239
CAPÍTULO 10

10. DISEÑO COMPLETAMENTE AL AZAR DE 2 FACTORES


10.1 Definición

.En los capitulo anteriores pudimos observar paso a paso como se utiliza el Diseño
Completamente al Azar para realizar diseño de experimentos para una sola variable.

En este capítulo veremos cómo se puede realizar un Diseño Completamente al Azar


pero para dos factores. En general, el procedimiento utilizado en un experimento DCA
de dos factores es muy similar al utilizado en un DCA de un factor.

El tipo más simple de experimento factorial comprende solamente dos factores, los
cuales serán denotados por A y B.

En este modelo los datos de muestra son clasificados en función de dos variables
aleatorias independientes (factores).

10.2 Generalidades

En general, el procedimiento utilizado en un experimento DCA de dos factores es muy


similar al utilizado en un DCA de un factor.

Es de importancia considerar si el experimento comprende un modelo de efectos fijos,


aleatorios o mixtos. Los cuadrados medios deben examinarse a fin de determinar las
estadísticas de pruebas adecuadas.

10.3 Pasos

A continuación explicaremos paso a paso como se debe realizar un Diseño


Completamente al Azar de dos factores correctamente.

10.3.1. Definición del Problema

Este es el primer paso, del diseño y consiste en los siguientes puntos:

 Definición del Problema: Consiste en determinar si hay diferencias


significativas en la variable de respuesta de acuerdo a los factores A y B.

 Variable de Respuesta: Es la característica, variable o salida o propiedad, cuyo


valor interesa medir para mejorar el desempeño de un proceso.

240
 Factor A: Variable experimental independiente. Cuyo efecto sobre la variable
de respuesta es de particular interés para el experimentador.

 Factor B: Variable experimental independiente. Cuyo efecto sobre la variable


de respuesta es de particular interés para el experimentador.

 Niveles: Es la intensidad asignada a un factor. Es decir los tipos o grados


específicos del factor que tendrán en cuenta en la realización del experimento.

 Unidad Experimental: Es el objeto o sujeto sobre el cual se medirá la


variable de respuesta.

10.3.2 Modelo Estadístico

Yijk = es la k-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel del
factor B.

μ = promedio total

Ai = efecto del i-ésimo nivel del factor A.

Bj = efecto del j-ésimo nivel del factor B.

(AB)ij = efecto de la interacción entre los factores Ai y Bj.

εijk = error experimental

10.3.3 Formulación de la hipótesis


241
Para formular la hipótesis de un DCA de dos factores se deben tomar en cuenta un
aspecto muy importante, y es si los factores del experimento del problema son fijos,
aleatorios o mixto.

Si ambos factores son fijos

Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.

 En el caso del factor A

H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente

La regla de decisión para esta hipótesis del factor A:

Se descarta H0, si Fc > F , a-1, ab(n-1)

 Igualmente se hace con el factor B

H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente

La regla de decisión para esta hipótesis del Factor B:

Se descarta H0, si FC > F , b-1, ab(n-1)

 Y finalmente la hipótesis para la interacción de AB

H o : μ11 =μ12=... .. . .. . μ ab
H1: al menos una es diferente

La regla de decisión para la Interaccion AB:

Se descarta H0 si, Fc  F, (a-1) (b-1), ab(n-1)

Si ambos factores son aleatorios:

Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.

242
 En el caso del factor A

H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a
H1: al menos una es diferente

La regla de decisión para esta hipótesis del factor A:

Se descarta H0, si Fc > F , a-1, (a-1)(b-1)

 Igualmente se hace con el factor B

H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a

H1: al menos una es diferente

La regla de decisión para esta hipótesis del Factor B:

Se descarta H0, si FC > F , b-1, (a-1)(b-1)

 Y finalmente la hipótesis para la interacción de AB

H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 2ab


H1: al menos una es diferente

La regla de decisión para la Interacción AB:

Se descarta H0 si, Fc  F, (a-1) (b-1), ab(n-1)

Si un factor es aleatorio y el otro fijo, es decir mixto:

Se deben hacer tres hipótesis, uno para cada factor y la interacción de los 2 factores.

 En el caso del factor A (fijo)

243
H o : μ1 =μ2 =. .. .. . .. . μ a
H1: al menos una es diferente

La regla de decisión para esta hipótesis del factor A:

Se descarta H0, si Fc > F , a-1, (a-1)(b-1)

 Igualmente se hace con el factor B (aleatorio)

H 0 :σ 12=σ 22 .. . .. .. .. .=σ 2a

H1: al menos una es diferente

La regla de decisión para esta hipótesis del Factor B:

Se descarta H0, si FC > F , b-1, ab(n-1)

 Y finalmente la hipótesis para la interacción de AB

H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 2ab


H1: al menos una es diferente

La regla de decisión para la Interacción AB:

Se descarta H0 si, Fc  F, (a-1) (b-1), ab(n-1)

Para las reglas de decisión los valores de F deben ser calculados con las tablas de
Fisher y los grados de libertad calculados dependiendo del caso.

10.3.4 procedimiento de aleatorizacion

Se utiliza para validar la estimación de la variancia del error experimental. Consiste en


aplicar en forma aleatoria los tratamientos a las unidades experimentales. La

244
aleatorización tiende a promediar entre los tratamientos cualquier efecto sistemático
presente de forma que las comparaciones entre tratamientos midan sólo los efectos de
los tratamientos mismos.

• Codificar las unidades experimentales.

• En este diseño existirán abn observaciones, por lo tanto se buscan esta totalidad
de números aleatorios y las pruebas o unidades experimentales se enumeran en
orden aleatorio.

• En este diseño existe ab combinaciones de niveles, por lo tanto estas


combinaciones son asignadas a las pruebas o unidades experimentales
previamente aleatorizadas

• Luego se procede a realizar las mediciones de acuerdo a esta planificación

10.3.5. Registro de datos

En un Diseño Completamente al Azar de dos factores, ya sea Y ijk la respuesta


observada cuando el factor A tiene el nivel i-ésimo (i=1,2,3…..,a) y el factor B tiene el
nivel j-ésimo (j=1,2,3….,b). En general, el experimento factorial de dos factores
aparece en la tabla 10.1. El orden en que se hacen las abn observaciones se
seleccionar al azar.

245
Tabla 10.1 Arreglo General de un diseño completamente al azar de dos factores.

Tabla 10.2 Resumen de Registro de Datos

Observamos la distribución de el factor A con el i-ésimo nivel y el Factor B con el j-


ésimo nivel y ambos forman el conjunto Y ij el cual nos da la combinación toral d e
los factores que influyen en el proceso de el experimento. De esa manera el factor
A representa las filas las cuales se suman horizontalmente y nos da el total de las

246
Yi , mientras que el factor B representa las columnas, por ellos se suman
verticalmente los datos dándonos el total de los Y j. Así tenemos el resumen de
nuestros datos de manera ordenada y entendible para realizar nuestro experimento
como se ve en la Tabla 10.2.

10.3.6 ANDEVA

Para calcular el Fc y poder comparar el resultado con el F utilizamos el análisis de


varianzas. De esta manera a través de la regla decisión se puede concluir si las
hipótesis de descartan o no.

Para el análisis de varianza (ANDEVA) de un Diseño completamente al azar de dos


factores, se utiliza el siguiente cuadro:

Fuente de gl Suma de Cuadrado medio


Variacion cuadrados

Factor A a-1 SCA SCA/(a-1)

Factor B b-1 SCB SCB/(b-1)

Interaccion AB (a-1)(b-1) SCAB SCAE/(a-1)(b-1)

Entre ab-1 SCComb SCCokmb/(ab-1)


combinaciones
de niveles
(COMB)

Error ab(n-1) SCEE SCE/ab(n-1)


Experimental
(EE)

Total (To) abn-1 SCTo

Donde las formulas para calcular la suma de cuadrado es:


a
1 2 2
SCA = bn ∑ Y i . . −Y . .. ¿ abn
i=1

a
1
SCB = an ∑ Y 2. j.−Y 2. . . ¿ abn
i=1

a b 247

SCComb=1 n ∑ ∑ Y 2ij. −Y 2. .. ¿ abn


i=1 j=1
SCAB=SCComb−(SCA+SCB)

SCEE=SCTo−SCcom
a b n
SCT 0 =∑ ∑ ∑ Y 2ijk−Y 2. . . ¿ abn
i=1 j=1 k=1

Finalmente para calcular la Fc, dependiendo si el diceno es de factores fijos, aleatorios


o mixtos, se utilizan las siguientes formulas:

Fuente de Fcalculada para Fcalculada para Fcalculada para


Variación Factores Fijos factores factores mixtos
aleatorios

Factor A CMA/CME CMA/CMAB CMA/CMAB

Factor B CMB/CME CMB/CMAB CMB/CME

Interacción AB CMAB/CME CMAB/CME CMAB/CME

De esta manera si, al obtener el Fcalculada se debe comparar con la F y así llegar a
concluir a través de las reglas de decisiones si las hipótesis se cumplen o no, y si los
factores tienen efectos significativos sobre la variable de respuesta.

10.3.7. Conclusiones

Se recomienda:

Decidir que medidas implementar para generalizar el resultado del estudio y garantizar
que los mejores se mantengan.

Por lo tanto para un Diseño Completamente al Azar de dos factores se debe tener en
cuenta cada factor con su interacción como se ve descrita en la formulación de
hipótesis con su respectiva regla de decisión.

248
Para Factor A, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor A son
significativos sobre la variable de respuesta

Para Factor A, Fc < Fa se acepta Ho. Se concluye que los efectos del factor A no
son significativos sobre la variable de respuesta.

Para Factor B, Fc > Fa Se rechaza H0. Se concluye que los efectos del factor B son
significativos sobre la variable de respuesta

Para Factor B, Fc < Fa se acepta Ho. Se concluye que los efectos del factor B no
son significativos sobre la variable de respuesta.

Para la interacción, Fc < Fa se acepta Ho. Se concluye que los efectos de la


interacción no son significativos sobre la variable de respuesta.

Para la interacción, Fc > Fa Se rechaza H0. Se concluye que los efectos de la


interacción son significativos sobre la variable de respuesta.

10.3.8 Cálculo de Parámetros

s² = CMEE

Variabilidad es como decir varianza. La varianza es, pues, una medida de la


diseminación o dispersión de las puntuaciones, que expresa el grado en que las
puntuaciones de los sujetos de un grupo difieren entre sí.

10.3.9. Intervalos De Confianza

Cálculo del Intervalo de Confianza del 100( 1 – α) % para la Media μi del i-ésimo nivel
del factor A, Media μj del j-ésimo nivel del factor B de un Diseño Completamente al
Azar de dos factores.

Factor A------------ IC μi = y i.±t α /2 ,k( n−1) √ CMEE/n

Factor B-----------
IC μj = y j.±t α /2 ,k (n−1) √ CMEE/n
249
10.3.10 Comparaciones Múltiples

Cuando las medias de los renglones o columnas difieren, por lo general es de interés
hacer comparaciones entre las medias individuales de los renglones o columnas para
descubrir diferencias específicas.

El procedimiento es el mismo que el desarrollado para un solo factor.

Cuando la interacción es significativa, las comparaciones entre las medias de uno de


los factores pueden ser AB.

Una forma de manejar esta situación es fijar un nivel de B y aplicar la prueba a las
medias del factor A con ese nivel.

Las pruebas que se pueden realizar para esto son: Prueba de Duncan, prueba Tukey y
la Newman Keuls, que a continuación explicaremos como realizar en las DCA de dos
factores.

Prueba Duncan

Anteriormente pudimos observar cómo utilizar el método de Duncan, a continuación


volveremos a mencionar brevemente los pasos para realizar la prueba Duncan para
DCA de dos factores.

• Verificar que el análisis de varianza en la interacción sea


significativo.

• Fijar al azar un nivel de cualquiera de los 2 factores y aplicar la


prueba a las medias del nivel del otro factor

• Calcular las medias.

• Elaborar el cuadro de rangos múltiples

• Plantear las hipótesis y las regla de decisión respectiva

• Se descarta Ho si │yi-yj│≥ Comparador Duncan

• Cálculo de los Comparadores Duncan (CD).

CD=Dα ,numdemedias, glee S ȳ


250
CMEE
S ȳ =
√ n

• Comparar las diferencias de medias con el valor del CD


respectivo.

• Conclusión

Para las pruebas Tukey y Newwman Keuls se siguen los mismos criterios que en la
prueba Duncan.

10.4 EJEMPLOS. DISEÑO DE UNA BATERÍA

Considere el caso en que un ingeniero diseña una batería para su uso en un dispositivo
que será sometido a ciertas variaciones extremas de temperatura. El único parámetro
de diseño que él puede seleccionar en este punto es el material de la cubierta de la
batería y tiene tres alternativas.

Cuando el dispositivo se manufactura y se envía al campo, el ingeniero no tiene control


sobre los extremos de temperatura a que será expuesto el dispositivo, y sabe por
experiencia que es probable que la temperatura influya en la duración efectiva de la
batería. Sin embargo, es posible controlar la temperatura en el laboratorio de
desarrollo de productos para los fines de ensayo.

Decide probar los tres materiales de la cubierta a tres niveles de temperatura (15, 70 y
125 F) consistentes en el entorno de uso final del producto. Se prueban cuatro baterías
a cada combinación de material de la cubierta y temperatura, y las 36 pruebas se
ejecutan al azar.

El ingeniero decide probar los tres materiales de la cubierta a tres niveles de


temperatura (15, 70 y 125 F) consistentes en el entorno de uso final del producto. Se
prueban cuatro baterías a cada combinación de material de la cubierta y temperatura, y
las 36 pruebas se ejecutan al azar.

Factor A. Tipo de Material

251
Factor B: Temperatura

Variable de Respuesta: Duración (en horas)

1. Qué efecto tienen el tipo de material y la temperatura sobre la duración de las


baterías

2. Existe una elección del material que de por resultado una duración uniformente
larga sin importar la temperatura?

10.4.1.1 Definición del Problema

Determinar el efecto que tiene el tipo de material y la temperatura sobre la duración


efectiva de las baterías.

O también,

Determinar el efecto de los tres materiales de la cubierta de las baterías y la aplicación


de tres niveles de temperatura (15, 70 y 125 F) sobre la duración efectiva de las
baterías.

10.4.1.2 Modelo Estadístico


Y ijk =μ +Α i +Β j +( AB)ij +ε ijk
i=1. . .. .3
j=1. .. .. 3
k =1. .. . . 4
Yijk = es la k-ésima duración efectiva de las baterías para el i-ésimo tipo de material y la
j-ésima temperaura

μ = promedio de la duración efectiva de las baterías

Ai = es el efecto del i-ésimo tipo de material

Bj = es el efecto de la j-ésima temperatura

(AB)ij = es el efecto de la interacción entre el tipo de material (A i) y la temperatura (Bj)

252
εijk= error experimental

10.4.1.3 Hipótesis

 Factor A (Tipo de Material)

H0: u1= u2 = u3

H1: al menos una es diferente

RD: se descarta H0 si Fc ³ F0.05, 2, 27 = 3.35

gln = a-1 = 3-1 = 2

gld = ab(n-1) = 3*3(4-1)= 27

 Factor B (Temperatura)

H0: u1= u2 = u3

H1: al menos una es diferente

RD: se descarta H0 si Fc ³ F0.05, 2, 27 = 3.35

gln = b-1 = 3-1 = 2

gld = ab(n-1) = 3*3(4-1)= 27

 Interacción AB

H0: u11= u12 =...= u33

H1: al menos una es diferente

RD: se descarta H0 si Fc ³ F0.05, 4, 27 = 2.73

gln = (a-1)(b-1) = (3-1)(3-1) = 4

gld = ab(n-1) = 3*3(4-1)= 27

253
Unidad Orden Asignación
Experimental Aleatorio

1 10 a1b1
2 1
3 11
4 20
10.4.1.4 Aleatorización
5 16 a1b2
6 14
7 19
8 25
9 22 a1b3
10 36
11 30
12 27
13 34 a2b1
14 2
15 26
16 24
17 4 a2b2
18 6
19 7
20 5
21 35 a2b3
22 13
23 18
24 21
25 31 a3b1

10.4.1.5 26 9 Registros de
Datos 27 28
28 33
29 23 a3b2
30 8 254

31 15
32 17
Datos de duración (en horas) para el ejemplo de diseño de una batería

FACTORES Temperatura
15 70 125
Tipo 1 130 34 20
74 80 70
155 40 82
180 75 58
de 2 150 126 25
159 122 70
188 106 58
126 115 45
Material 3 138 174 96
168 150 104
110 120 82
160 139 60

Tabulamos los datos, sumando las observaciones en cada uno de los factores y
calculando los totales por filas y columnas (factor A y factor B).

TIPO DE Temperatura TOTALES


MATERIAL
15 70 125
1 539 229 230 998
2 623 469 198 1290
3 576 583 342 1501
TOTALES 1738 1281 770 3789

Igualmente con los promedios de los factores.

TIPO DE MATERIAL TEMPERATURAS DURACION


PROMEDIOS/TIPO
15 70 125 DE MATERIAL
1 134.75 57.25 57.5 83.17
2 155.75 117.25 49.5 107.5
3 144 145.75 85.5 125.08
DURACION 144.83 106.75 64.17 105.25
PROMEDIO

255
/TEMPERATURA

Podemos resumir todos estos cálculos en un solo cuadro que nos facilitará el
cálculo del ANDEVA.

FACTORES Temperatura TOTALES/TIPO DE


MATERIAL
15 70 125 998
Tipo 1 130 34 20
  74 80 70
  155 40 82
  180 75 58
  suma 539 229 230
  medias 134.75 57.25 57.5 83.16666667
de 2 150 126 25 1290
  159 122 70
  188 106 58
  126 115 45
  suma 623 469 198
  medias 155.75 117.25 49.5 107.5
Materi 3 138 174 96 1501
al
  168 150 104
  110 120 82
  160 139 60
  suma 576 583 342
medias 144 145.75 85.5 125.0833333
TOTALES/TEMP 1738 1281 770 3789
ERATURA

10.4.1.6 Verificación de los supuestos del modelo

256
Descriptivos
Estadístico Error típ.
Duracion Media 105.2500 7.82420
Intervalo de confianza para la media al 95% Límite inferior
89.3660
Límite superior 121.1340
Media recortada al 5% 105.4630
Mediana 108.0000
Varianza 2203.850
Desv. típ. 46.94518
Mínimo 20.00
Máximo 188.00
Rango 168.00
Amplitud intercuartil 77.25
Asimetría -.056 .393
Curtosis -1.026 .768

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-
Wilk
Estadístico gl Sig.
Estadístico gl Sig.
Duracion .106 36 .200* .969 36
.396
a. Corrección de la significación de
Lilliefors
*. Este es un límite inferior de la
significación verdadera.

10.4.1.7 ANDEVA

Fuente de SC gl CM Fc Pvalue Fcritico


Variación
Tipo de 10633 2 5317 7.983 0.0019 3.354

257
Material(A)
Temperatura( 39083 2 19542 29.34 2E-07 3.354
B)
Interacción(A 9437.7 4 2359 3.543 0.019 2.728
xB)
EE 17981 27 666  
Totales(To) 77135 35  
Se realiza el análisis de varianza con las formulas anteriormente mencionadas y con
ayuda de los datos calculados al momento del registro de datos.

10.4.1.8 Conclusiones

 Para tipo de material, Fc=7.91 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos del tipo material son significativos sobre la duración promedio de las
baterías.

 Para temperatura, Fc=28.97 > Fa=3.35 \ Se rechaza H0. Se concluye que los
efectos de la temperatura son significativos sobre la duración promedio de las
baterías.

 Para la interacción, Fc=3.56 > Fa=2.73 \ Se rechaza H0. Se concluye que los
efectos de la interacción entre el tipo de material y la temperatura son
significativos sobre la duración promedio de las baterías.

10.4.1.9 Calculo de los parámetros

μ=3799 /36=105 .33

10.4.1.10 Coeficiente de Determinación

R2 = (SCAB + SCA + SCB)/SCTO

R2 = 59416.22/77646.97=0.765= 77%

El 77% de la variabilidad en la duración efectiva de las baterías se explica por la


temperatura, tipo de material y por la interacción entre el tipo de material y la
temperatura.

258
10.4.2 EJEMPLO. QUALITY CONTROL 2 = CMEE= 675.21
En un artículo publicado en Industrial Quality Control (1956, pp 5-8) se describe un
experimento para investigar el efecto del tipo de vidrio y el tipo de fósforo sobre la
brillantez de un cinescopio de televisor. La variable de respuesta es la corriente
necesaria (en microamperes) para obtener un nivel de brillantez especificado. Los
datos son como sigue:

Tipo de Vidrio Tipo de Fósforo


1 2 3
1 280 300 290
290 310 285
285 295 290
2 230 260 220
235 240 225
240 235 230

Factor A: Tipo de Vidrio

Factor B: Tipos de Fósforo(aleatorio)

Variable de Respuesta: Corriente necesaria para obtener un nivel de brillantez


específico.

1. Definición del Problema

Determinar el efecto que tiene el tipo de vidrio y fósforo sobre la corriente necesaria
para obtener un nivel de brillantez específico.

10.4.2.2 Modelo Estadístico

Y ijk =μ +Α i +Β j +( AB)ij +ε ijk


i=1. . .. .3
j=1. .. .. 2
k =1. .. 3
Yijk = es la k-ésima corriente necesaria para obtener un nivel de brillantez específico
para el i-ésimo tipo de vidrio y el j-ésimo tipo de fósforo

μ = promedio de la corriente necesaria para obtener un nivel de brillantez


específico.

259
Ai = es el efecto del i-ésimo tipo de vidrio

Bj = es el efecto del j-ésimo tipo de fósforo

(AB)ij = es el efecto de la interacción entre el tipo de vidrio (A i) y tipo de fósforo (Bj)

εijk= error experimental

10.4.2.3 Hipótesis
Vidrio (A)

H o : μ1 =μ2 =. μ 3

H1: al menos una es diferente

RD: se descarta H0 si FC > F0.05,3.89

gln: a-1 = 3-1 = 2

gld: ab(n-1) = 3*2(3-1) = 12

Operador (B)

H 0 : σ 12=σ 22

H1: al menos una es diferente

RD: se descarta H0 si FC > F0.05,4.75

gln: b-1 = 2-1 = 1

gld: ab(n-1) = 3*2(3-1) = 12

Interacción (AB)

H 0 :σ 112 =σ 212 .. . .. .. . ..=σ 243

260
H1: al menos una es diferente

RD: se descarta H0 si FC > F0.05,3.89

gln: (a-1)(b-1) = 2*1 = 2

gld: ab(n-1) = 3*2(3-1) = 12

10.4.2.5 Registro de Datos

Tipo de Vidrio Tipo de Fósforo


1 2 3
1 280 300 290
290 310 285
285 295 290
2 230 260 220
235 240 225
240 235 230

  Tipos de Fósforo Totales


Tipos de Vidrio 1 2 3  
1 855 905 865 2625
2 705 735 675 2115
Totales 1560 1640 1540 4740

10.4.2.6 Verificación de Supuestos

Normalidad

Ho: Los datos se distribuyen normalmente

H1: Los datos no se distribuyen normalmente

Pruebas de normalidad
Kolmogorov-Smirnova Shapiro-Wilk

261
Estadístic gl Sig. Estadístic gl Sig.
o o
Corriente .263 18 .002 .837 18 .005

De acuerdo a la Prueba de Shapiro-Wilk se observa que el p-value es menor a 0.05


que el nivel de significancia, por lo tanto se acepta la hipótesis nula y se concluye que
los datos no presentan una distribución normal.

Gráficamente se concluye que las observaciones de las corrientes necesarias para


obtener un nivel de brillantez específico no se distribuyen normalmente, ya que el
gráfico presenta aproximadamente una curva.

Independencia

Gráficamente se concluye que las


observaciones de las corrientes
necesarias para obtener un nivel de
brillantez específico están
correlacionadas ya que el gráfico no
presenta ninguna tendencia.

Homocedasticidad

262
H o =σ 12=σ 22=σ 23 =σ 24 . .. .. σ 218
H1: Al menos una varianza es diferente.

Tanto la prueba de Levene como


la de Barlett indican que la
varianza de los tipos de vidrios y
los tipos de fósforos son iguales
con respecto a la corriente para
obtener un nivel de color
específico.

10.4.2.7 Análisis de Varianza

Análisis de varianza para Corriente, utilizando SC ajustada para pruebas

Fuente GL SC sec. SC ajust. MC ajust. F P

A 2 1911.1 1911.1 955.6 1.10 0.363

B 1 800.0 800.0 800.0 0.92 0.355

A*B 2 700.0 700.0 350.0 0.40 0.676

Error 12 10383. 10383.3 865.3

Total 17 13794.4

S = 29.4156 R-cuad. = 24.73% R-cuad.(ajustado) = 0.00%

10.4.2.8 Conclusiones

263
Para los tipos de vidrio: dado que F C = 1.19 > Fcrítica = 0.363, se Rechaza Ho y se
concluye que hay efecto significativo en la corriente necesaria para obtener un nivel de
brillantez específico de acuerdo al tipo de vidrio.

Para los operarios: dado que F C = 0.92 > Fcrítica = 0.355, se rechaza Ho y se concluye que
hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido al tipo de fósforo.

Para la interacción: dado que F C = 0.40 < Fcrítica = 0.675 , se acepta Ho y se concluye que
no hay efecto significativo en la corriente necesaria para obtener un nivel de brillantez
específico debido a la interacción entre los vidrios y los fósforos.

10.5 USO DE PROGRAMAS ESTADISTICOS

10.5.1 EXCEL

• Activar la aplicación de Excel en Windows

• Ingresar los datos obtenidos en el experimento en una hoja de Excel.

• Hacer click sobre la opción “Herramientas” de la barra principal (ver barra


superior).

• Hacer click sobre la opción “Análisis de Datos...”, la cual generalmente es la


última opción de la caja desplegada.

• En la nueva ventana, seleccionar “Análisis de varianza de dos factores con


varias muestras por grupo” y hacer click sobre “Aceptar”

• La siguiente ventana abierta será completada con la información de los datos


previamente ingresados en la hoja de Excel.

• En la primera opción, “Rango de Entrada”, debemos definir el rango (celdas) en


las cuales fueron escritas las observaciones. Una forma sencilla de hacerlo es
sombrear el área de las observaciones arrastrando el mouse sobre ellas.

• En la segunda opción, “Fila por muestra”, se debe especificar el número de filas


que cada muestra posee.

264
• La tercera opción, “Alfa”, aparecerá predeterminada como 0.05, de ser
necesario un alfa diferente entonces hacemos el cambio escribiendo el nuevo
alfa en la casilla dada.

• En la parte inferior de la ventana están desplegadas las “Opciones de Salida”.


Aparecerá predeterminada la opción “En una hoja nueva”, lo que significa que
el ANDEVA será presentado en una hoja diferente a la hoja que contiene las
observaciones.

• Finalmente, hacer click en en botón de “Aceptar” y el análisis será presentado en


la nueva hoja.

265
266
10.5.2 MINITAB

• Activar la aplicación de Minitab en Windows


• Hacer click sobre la opción “Estadística” de la barra principal (ver barra superior).
• Hacer click sobre la opción DOEFACTORIALCREAR DISEÑO FACTORIAL

 En la primera opción, “Diseño Factorial completo General”, debemos definir el


número de factores como es de 2 factores serían dos.
267
• En la segunda opción, “Diseño”, se debe especificar el número de niveles que
posee ambos factores tanto el A como el B.
• La tercera opción, “Número de Réplicas”, será el total de interacciones
correspondientes en el factor A y B.
• Finalmente, hacer click en en botón de “Aceptar”.

268
PARA LOS SUPUESTOS Y ANÁLISIS DE VARIANZA

• Estadística  DOEFACTORIAL Analizar Diseño Factorial Gráficas-


Normalidad, Residuo vs Orden, Residuo vs Ajustes- Aceptar.
• Al hacer Click en Aceptar se despliegan todas las tablas y gráficos necesarios al
análisis de Varianza de Dos Factores.

269
270
10.5.3 PASW

Al abrir PASW, lo primero que se debe hacer es definir las variables.

271
 En PASW las variables no se aleatorizan como en MINITAB, es por eso que al
insertar los datos se debe insertar cada uno de los valores de las variables,
aunque se repitan, especialmente en los casos en los que son 2 muestras o más
por factor.
 Para calcular el ANDEVA, una vez se han insertado los datos en el programa,
los pasos que se deben seguir son:
 Menú ANALIZAR, Modelo lineal general, Univariante

 En el cuadro que aparece, colocamos la variable de respuesta en el cuadro de


las variables dependientes. Y seleccionamos los otros dos factores y los
colocamos en el cuadro de variables aleatorias. (si son fijos se colocan en
variables fijas).
 Del lado derecho del cuadro, seleccionamos la opción: MODELO ->
PERSONALIZAR.
 En el cuadro derecho podremos observar las diferentes variables que
anteriormente identificamos, pasamos el factor A y el factor B al cuadro de la
derecha.
 Seleccionamos la opción, Interacción. Y luego seleccionamos el factor A y B al
mismo tiempo y los colocamos en el cuadro derecho. Aceptar.

Para verificar el supuesto de normalidad, los pasos son:

 ANALIZAR -> ESTADISTICOS ESTADÍSTICOS -> EXPLORAR


 Seleccionamos la variable de respuesta como variable dependiente.
 Seleccionamos la opción AMBOS (para obtener resultado gráfico y analítico)

272
 Aceptar.Para el resto de los supuestos, se recomienda utilizar otros
programas como MINITAB.

CAPÍTULO 11

11. DISEÑO DE BLOQUES AL AZAR DE 2 FACTORES


11.1 Definición

.Algunas veces no es posible hacer la aleatorización completa de todas las corridas de


un diseño factorial. La presencia de un factor perturbador puede hacer necesario que el
experimento se realice en bloques.

Ya se han analizado los conceptos para la formación de bloques con un solo factor. En
este capítulo se presenta como realizar la formación de bloques en un diseño factorial.

11.2 Generalidades

273
El experimento tiene dos factores que se denominarán A y B , los cuales tendrán a y b
niveles respectivamente. Por lo tanto existirán ab combinaciones de niveles
Los factores podrán ser todos fijos o todos aleatorios o la combinación de ambos
Se consideran n bloques
Cada una de las combinaciones de niveles de los factores se asigna a cada uno de los
bloques. Por lo tanto existirán a*b*n observaciones en total en el experimento.

11.3 Pasos
11.3.1 Definición del problema
Determinar si existe diferencia altamente significativa en la variable de respuesta
promedio en un experimento usando el factor de interés A y B para el número de
bloques diferentes.

11.3.2 Modelo estadístico

Y ijk =μ +A i +B j +( AB)ij +δ k +ε ijk


i=1,2,....,a
j=1,2,.....,b
k=1,2,.....,n
Yijk es la observación del k-ésimo bloque para el i-ésimo nivel del factor A y el j-
ésimo nivel del factor B
Ai es el efecto del i-ésimo nivel del factor A
Bj es el efecto del j-ésima nivel del factor B
(AB)ij es el efecto de la interacción entre el factor A y el factor B
dk es el efecto del k-ésimo bloque

274
eijk error experimental.

11.3.3 Formulación de Hipótesis para el modelo

PARA EL FACTOR A:
Ho: m1= m2 ........... = ma
Hi : al menos una de las mi es distinta a 0

PARA EL FACTOR B:
Ho: m1= m2 ........... = mb
Hi : al menos una de las mj es distinta a 0

INTERACCIÓN AxB:
Ho: m11= m21 ........... = mab
Hi : al menos una de las mijes distinta a 0

BLOQUES:
Ho: m1= m2 ........... = mn
Hi : al menos una de las mk es distinta a 0

Regla de decisión
SE RECHAZA Ho SI FC > Fa,gln,gld
gln grados de libertad del numerador
gld = grados de libertad del denominador

 Para ambos factores fijos


Grados de Libertad del Numerador
Factor A a-1
Factor B b-1

275
Interacción AxB( a - 1 ) ( b - 1 )
Bloques (n-1)

11.3.4 Proceso de Aleatorización

A cada uno de los bloques se le debe asignar cada una de las combinaciones de los
factores en forma aleatoria.

Combinaciones: A1B1 A1B2 A2B1…AaBb


bloques
1 A1B1 A1B2 A2B1 A2B2 AaBb
2 A1B2 A2B1 A2B2 AaBb A1B1
n A2B1 A2B2 AaBb A1B1 A1B2

11.3.5 Registro de datos

276
Y ijk Y ..k

277
Es importante tomar en cuenta a la hora de registrar los datos que el formato debe
contener quien hizo el reporte, la fecha de confección, el motivo, la unidad de medición
y el nombre de la empresa.

11.3.6 Hipótesis de los supuestos

11.3.6.1 Supuesto de Normalidad

H0: los datos presentan una distribución normal

H1: los datos no presentan una distribución normal

11.3.6.2 Supuesto de Homosedasticidad

2 2 2

H0: σ 11 = σ 12 = σ ab

H1: al menos una es diferente

11.3.6.3 Supuesto de independencia

En este supuesto sólo se analiza la gráfica del mismo.

Nota: los supuestos deben verificarse en los programas minitab y pasw. En la sección
de ejemplos del capítulo se presentan.

11.3.7 Análisis de varianza: ANDEVA

F.V. GL SC CM FC Fα,gln,gld
A a-1 1
a
SCA CMA F ∝´ (a-1)(ab-1)(n-1)
∑ Y 2 ..−Y 2…/abn
bn i=1 i a−1 CMEE

B b-1 1
b
SCB CMB F ∝´ (b-1)(ab-1)(n-1)
∑ Y 2 .. j −Y 2…/abn b−1 CMEE
an j=1

AB (a-1)(b-1) SCCN –(SCA+SCB) SC ( AB) CM ( AB) F ∝´ (a-1)(b-1)(ab-1)


( a−1 )( b−1) CMEE
(n-1)

278
Entre ab -1 1
a b
SCcomb . CMcomb F ∝´ (ab-1)(ab-1)(n-1)
∑ ∑ Y 2ij−Y 2…/abn CMEE
comb. n i=1 j=1 ( ab−1)

Entre n-1 1
n
SCBloq CMbloq F ∝´ (n-1)(ab-1)(n-1)
∑ Y 2..k −Y 2…/abn n−1 CMEE
bloque ab k=1

s
Error (ab-1)(n-1) SCTo-(SCComb. + SCEE
SCBloq) ( ab−1 )( n−1)

a b n
Total (abn-1)
∑ ∑ ∑ Y 2ijk−Y 2…/abn
i j k

11.3.8 Conclusiones

Con la evaluación de FC>Fα,gln,gld en el análisis de varianza podemos descartar o


aceptar H0 y concluir si existe diferencia significativa en las medias.

11.3.9 Cálculo de los Parámetros

Y…
μ=
abn

σ 2=C . M . E . E .

11.3.10 Coeficiente de Determinación

S .C .Comb .+ S . C . Bloques
R 2=
S . C . Totales

Mide o explica el % de la variabilidad de la Variable de Respuesta.

279
11.4 EJEMPLO. CAPACIDAD DE DETECTAR OBJETOS

Una Ingeniera Electrónica está estudiando diferentes métodos para mejorar la


capacidad de detectar objetos sobre la pantalla de un radar. Ella considera que los dos
factores más importantes son cantidad de ruido de fondo sobre la misma y el tipo de
filtro que se pone sobre la pantalla. Se diseña un experimento usando tres niveles de
ruido de fondo y dos tipos de filtro. El experimento se lleva a cabo eligiendo
aleatoriamente una combinación de tratamientos (nivel de ruido y tipo de filtro) e
introduciendo una señal que representa al objetivo en la pantalla del radar. La
intensidad del objetivo se incrementa hasta que el operador lo detecta. El nivel de
intensidad del objetivo se mide como la variable de respuesta. A causa de la
disponibilidad de los operadores, es conveniente seleccionarlo y mantenerlo en el lugar
del experimento hasta haber realizado todas las mediciones. Por otra parte, existen
diferencias en la capacidad y experiencia de los operadores. En consecuencia, resulta
lógico considerar a los operarios como bloques. Se eligieron cuatro operadores al azar.
Una vez que se elige al operador, el orden en el que se efectúan las combinaciones de
tratamientos es aleatorio.

tabla 11.4 nivel de intensidad en la detección de objetivos


operarios 1 2 3   4
tipo de filtro 1 2 1 2 1 2 1 2
nivel de ruido  
bajo 90 86 96 84 100 92 92 81
mediano 102 87 106 90 105 97 96 80
alto 114 93 112 91 108 95 98 83

11.4.1 Definición del Problema

Determinar si existe diferencia significativa en el promedio de la intensidad de objetivo


utilizando tres niveles de ruido de fondo y dos tipos de filtrode acuerdo a cada una de
las condiciones del operario.

280
11.4.2 Modelo Estadístico

Y ijk =μ + A i + B j +( AB )ij + δ k +ε ijk

i=1,2,3

j=1,2

k=1,2,3,4

Yijk= es el nivel de intensidad en la detección de objetivos para el i-ésimo nivel de ruido


con el j-ésimo tipo de filtro para el k-ésimo operario.

ti = es el efecto del i-ésimo nivel de ruido

bj = es el efecto del j-ésimo tipo de filtro

dk = es el efecto del k-ésimo operario

(tb)ij= es el efecto de la interacción entre el tipo de filtro (ti) y el nivel de ruido (bj)

eijk = error experimental.

11.4.3 Hipótesis

Para los operarios

Ho: 1= 2 = 3= 4

Hi : al menos una de las k es distinta a 0

Regla de decisión: Se rechaza HO si FC > F0.01,3,15 = 5.42

281
Para el nivel de ruido

Ho: 1= 2 = 3

Hi : al menos una de las i es distinta a 0

Regla de decisión: Se rechaza HO si FC >F0.01,2,15 = 6.36

Para el tipo de filtro

Ho: 1= 2

Hi : al menos una de las j es distinta a 0

Regla de decisión: Se rechaza HO si FC >F0.01,1,15 = 8.68

InteracciónAxB:

Ho: 11= 21= ……….32

Hi : al menos una de las ijes distinta a 0

Regla de decisión: Se rechaza HO siFC > F0.01, 2, 15 = 6.36

11.4.5 Registro de Datos

  Combinacion de tratamientos (AxB)  


operadore A₁B₁ A₁B₂ A₂B₁ A₂B₂ A₃B₁ A₃B₂ Totales de
s operadore
s
1 90 86 102 87 114 93 Y..₁=572
2 96 84 106 90 112 91 Y..₂=579
3 100 92 105 97 108 95 Y..₃=597
4 92 81 96 80 98 83 Y..₄=530

282
  Tipo De Filtro  
nivel del 1 2 Yi..
Ruido
bajo 378 343 Y₁..=721
mediano 409 354 Y₂..=763
alto 432 362 Y₃..=794
Y.j. Y.₁.=1219 Y.₂.=1059 Y…=2278

11.4.6 Supuestos del modelo

Supuesto de Normalidad

H0: los datos presentan una distribución normal

H1: los datos no presentan una distribución normal

Gráfica de probabilidad de C7
Normal
99
Media 94.92
Desv .Est. 9.436
95 N 24
RJ 0.990
90
Valor P >0.100
80
70
Porcentaje

60
50
40
30
20

10

1
70 80 90 100 110 120
C7

De acuerdo a la gráfica los datos presentan una distribución normal.

Supuesto de Homosedasticidad

283
2 2 2

H0: σ 11 = σ 12 = σ ab

H1: al menos una es diferente

Supuesto de independencia

vs. orden
(la respuesta es C7)

5.0

2.5
Residuo

0.0

-2.5

-5.0
2 4 6 8 10 12 14 16 18 20 22 24
Orden de observación

11.4.7 Análisis de varianza

Fuente GL SC Sec. SC Ajust. CM Ajust. F P


Bloques 3 402.17 402.17 134.06 12.09 0.000
A 2 335.58 335.58 167.79 15.13 0.000
B 1 1066.67 1066.67 1066.67 96.19 0.000
A*B 2 77.08 77.08 38.54 3.48 0.058
Error 15 166.33 166.33 11.09
Total 23 2047.83
S = 3.33000 R-cuad. = 91.88% R-cuad.(ajustado) = 87.55%

284
Analisis de varianza (Andeva) por calculadora

Factor de gl SC CM Fc Fα
variacion
nivel de Ruido 2 335.583 167.7815 15.13 6.36(**)
(factor A)
Tipo de filtro 1 1066.667 1066.667 96.19 8.68(**)
(factor B)

InteraccionAxB 2 77.083 38.5415 3.48 6.38

Entre 5 1479.333 295.867    


combinaciones
de los niveles
operadores 3 402.167 134.056 12.09 5.42(**)
(bloques)
Error 15 166.333 11.089    
Experimental

Totales 23 2047.333 **= son altamente significativas

11.4.8 Conclusiones

Para los factores

Se rechaza HO y se acepta H1; y se concluye que existe diferencia altamente


significativa en el nivel de intensidad promedio en la detección de objetivos en la
pantalla de un radar, para el nivel de ruido y para el tipo de filtro.

Para los operadores

285
Se rechaza HO y se acepta H1; y se concluye que existe diferencia altamente
significativa en el nivel de intensidad promedio en la detección de objetivos en la
pantalla de un radar, debido a la habilidad de los operadores.

INTERACCIÓN axb

Se rechaza H1y se acepta Ho; y se concluye que la interacción entre los niveles
de ruido y el tipo de filtro, no son altamente significativos en el nivel de
intensidad promedio en la detección en la pantalla de un radar.

11.4.9 Calculo de Parámetros

2278
µ¿ 24 = 94.917

σ 2= 11.089

Coeficiente de Determinación

1279.333+166.333
R 2= =80.4 %
2047.333

El 80.4 % de la variabilidad nivel de intensidad promedio en la detección en la pantalla


de un radar es explicada por el modelo.

286
CAPÍTULO 12

12. DISEÑO COMPLETAMENTE AL AZAR DE 3 FACTORES


12.1 Definición

Los diseños completamente al azar de tres factores, al igual que los DCA de dos
factores, son un conjunto de puntos experimentales que pueden formarse
considerando todas las posibles combinaciones de los niveles de los factores en cada
ensayo completo o réplica del experimento.

12.2 Generalidades

Algunas características de este modelo son:

 Flexibilidad: Cualquier número de tratamientos y cualquier número de


réplicas pueden ser usadas, siempre y cuando se tengan suficientes UE
homogéneas.
 Análisis Estadístico simple: el análisis estadístico es simple ya sea
cuando todos los tratamientos tengan igual número de réplicas
(balanceado), diferente número de réplicas (desbalanceado) o pérdida de
datos, caso en el cual se trata como un análisis desbalanceado.
 Se pueden estudiar los efectos de diversos factores en el mismo
experimento, por lo tanto son más eficientes, al igual que se puede
estudiar el efecto de cada factor en todos los niveles de los otros factores
y descubrir si determinado efecto, cambia o no al cambiar el otro.
También se puede estudiar las interacciones, que es el efecto conjunto de
dos o más factores combinados.
 Son necesarios cuando alguna interacción puede estar presente con el
propósito de evitar hacer conclusiones engañosas.

287
 Permiten estimar los efectos de un factor en diversos niveles de los otros
factores produciendo conclusiones que son válidas sobre toda la
extensión de las condiciones experimentales

12.3 Pasos

Consisten en una serie de puntos que se deben ir cumpliendo o realizando en un


respectivo orden, al igual que en los capítulos anteriores, a la hora de desarrollar un
problema de diseño completamente al azar de tres factores. Los mismos son
mencionados y explicados a continuación

12.3.1 Definición del problema


El objetivo fundamental de esta etapa es delimitar el problema de investigación, con
lo cual se logra tener claridad desde un comienzo de las dimensiones del estudio y
realizar una eficiente planeación de las etapas posteriores. En esta etapa se selecciona
la(s) variable(s) respuesta(s) o variable (s) dependiente(s). El experimentador debe
estar seguro que la respuesta que se va a medir realmente provee información útil
acerca de la investigación.
Paradefinir un problema de un DCA de tres factoresse debe identificar tres factores
que se denominarán A, B y C, los cuales tendrán a, b y c niveles respectivamente. Por
lo tanto existirán “abc” combinaciones de niveles.Los factores podrán ser todos fijos o
todos aleatorios o la combinación de ambos. Por cada combinación de niveles de los
factores se tomarán “n” observaciones. Por lo tanto existirán “abcn” observaciones en
total en el experimento.

12.3.2 Modelo estadístico

Y ijkl=μ+ A i +B j +C k +( AB)ij +( AC )ik +(BC ) jk +( ABC )ijk +ε ijkl

288
i=1..........a
j=1.........b
k=1.........c
l=1..........n
Definición de los componentes del modelo:

Yijkl= es la l-ésima observación del k-ésimo nivel de factor C, el j-ésimonivel de


factor B y el i-ésimo nivel de factor A.

m = media total

Ai= efecto del i-ésimo nivel del factor A.

Bj = efecto del j-ésimo nivel del factor B.

Ck = efecto del k-ésimo nivel del factor C.

(AB)ij= efecto de la interación del i-ésimo nivel del factor A y el j-ésimo nivel del
factor B.

(BC)jk = efecto de la interación del j-ésimo nivel del factor B y el k-ésimo nivel del
factor.

(AC)ik = efecto de la interación del i-ésimo nivel del factor A y el k-ésimo nivel
del factor C.

(ABC)ijk = efecto de la interación del i-ésimo nivel del factor A, el j-ésimo nivel del
factor B y el k-ésimo nivel de C.

εijkl= error experimental

289
12.3.3 Formulación de la hipótesis
Realizamos la formulación de las hipótesis, de la misma forma que se lleva a
cabo en los Diseños anteriormente visualizados, pero debemos completarla para
cada uno de los factores de interés que estamos estudiando:
 Para el factor A
Ho: m1 = m2 =. . . = ma
HI: al menos un promedio es diferente

 Para el factor B
Ho: m1 = m2 = . . . = mb
HI: al menos un promedio es diferente

 Para el factor C
Ho: m1 = m2 = . . . = mc
HI: al menos un promedio es diferente

Para cualquiera de la hipótesis de los efectos principales la regla de decisión se


plantea como: Descartar Ho, si Fc³Fa,gln,glEE

INTERACCIONES:

La Regla de Decisión será (R:D)

 Para la interacción (AB)ij


Ho: m11 = m12 = . . . = mab
HI: al menos un promedio es diferente
Descartar Ho, si Fc³Fa,gl(AB)ij,glEE

 Para la interacción (BC)jk


Ho: m11 = m12= . . . = mbc
HI: al menos un promedio es diferente
Descartar Ho, si Fc³Fa,gl(BC)ij,glEE

290
 Para la interacción (AC)ik
Ho: m11 = m12= . . . = mac
HI: al menos un promedio es diferente
Descartar Ho, si Fc³Fa,gl(AC)ij,glEE

 Para la interacción (ABC)ijk


Ho: m111 = m121 = . . . = mabc
HI: al menos un promedio es diferente
Descartar Ho, si Fc³Fa,gl(ABC)ij,glEE

12.3.4 Procedimiento de aleatorizacion


Debemos llevar a cabo la Asignación al azar de tratamiento a las unidades
experimentales. Para realizar el procedimiento de aleatorización de un DCA de 3
factores es necesario tener en cuenta los siguientes aspectos:
 Codificar cada unidad experimental.
 Aleatorizar las pruebas o unidades experimentales.
 Asignar cada una de las combinaciones de niveles a cada grupo de n
pruebas o unidades experimentales.

De esta forma obtenemos la tabla:

Cod. Orden aleatorio Asignación


1 11 A1B1C1
2 3
3 2 A1B1C2
: : :
: : :
: : :
abcn AaBbCc

12.3.5 Registro de datos

291
En el formulario de recolección de información, se deben registrar los siguientes
datos, además de los obtenidos:
 Nombre de la persona que hizo el reporte
 Fecha en que se ejecutó el experimento
 Mes
 Motivo
 Unidad de medición
 Factores de Interés
 Nombre de la Empresa
 Suministrar toda la información adicional que se considere necesaria para
facilitar la comprensión de los datos.

FORMATO DE REGISTRO DE DATOS

A1B1C1 A1B1C2 A1B1C3 ............. AaBbCc

Y1111 Y1121 Y1131 ............ Yabc1

Y1112 Y1122 Y1132 ............ Yabc2

Y1113 Y1123 Y1133 ............ Yabc3

: : : : :

: :
Y ijkl: : :

Y111n Y112n Y113n ............ Yabcn

Y111. Y112. Y113. ............ Yabc.

Y ijk.
Para una mejor comprensión de los cálculos se elaboran 3 tablas de dos
factores incluyendo los niveles de cada uno:
 Tabla AxB
 Tabla AxC
 Tabla BxC
292
TABLA A X B:

Realizamos la sumatoria de los componentes de cada cuadrante Y ij .. y


posteriormente totalizamos las cifras de las columnas y las filas, como
corresponde:

1 .... b TA

1 Y11.. .... Y1b.. Y1...

: :
Y i...
A : : Y ij.. :

a Ya1.. .... Yab.. Ya...

TB Y.1.. .... Y.b.. Y....

Y . j ..

TABLA DE B X C:

Realizamos la sumatoria de los componentes de cada cuadrante Y . jk . y


posteriormente totalizamos las cifras de las columnas y las filas, como
corresponde:

293
C

1 .... c TB

Y.1..
1 Y.11. .... Y.1c.

B : : : :
:
Y . j ..

....
b Y.b1. Y . jk . Y.bc. Y.b..

TC Y..1. .... Y..c. Y....

Y ..k.
TABLA A X C

Llevamos a cabo la sumatoria de los componentes de cada cuadrante Y .ik . y


posteriormente totalizamos las cifras de las columnas y las filas, como
corresponde:

294
1 .... c TA

1 Y1.1. .... Y1.c. Y1...

A : :
:
:
:
Y i...
Y i.k .
a Ya.1. .... Ya.c. Ya...

TC Y..1. .... Y..c. Y....

Y ..k.

12.3.6 SUPUESTOS DEL MODELO


Los supuestos que se deben verificar para este modelo, DCA de 3 factores, son:
 Independencia: Indica que cada conjunto de datos debe ser
independiente del resto.
 Normalidad: La cual indica que los resultados obtenidos para la variable
de respuesta en cada factor debe seguir una distribución normal.
 Homocedasticidad: Este indica que las varianzas de las observaciones de
la variable de respuesta en cada factor no deben diferir de forma
significativa.

12.3.7 ANDEVA

El Análisis de varianza se realiza siguiendo el cuadro descrito a continuación:

FV. GL. S.C. C.M. Fc. F

295
A a-1 SCA SCA/(a-1) CMA/CMEE F,a-
1,abc(n-
1)
B b-1 SCB SCB/(b-1) CMB/CMEE F,b-
1,abc(n-
1)
C c-1 SCC SCC/(c-1) CMC/CMEE F,c-
1,abc(n-
1)
AB (a-1)(b-1) SC(AB) SC(AB)/ CM(AB)/CMEE F,(a-1)
(a-1)(b-1) (b-
1),abc(n-
1)
AC (a-1)(c-1) SC(AC) SC(AC)/ CM(AC)/CMEE F,(a-1)
(a-1)(c-1) (c-
1),abc(n-
1)
BC (b-1)(c-1) SC(BC) SC(BC)/ CM(BC)/CMEE F,(b-1)
(b-1)(c-1) (c-
1),abc(n-
1)
ABC (a-1)(b-1) SC(ABC) SC(ABC)/ CM(ABC)/CMEE F,(a-1)
(c-1) (a-1)(b-1)(c-1) (b-1)(c-
1),abc(n-
1)
CN abc-1 SCCN SCN/(abc-1)
EE abc(n-1) SCEE SCEE/(abc(n-1))
To abcn-1 SCTo

Para completar el cuadro de ANDEVA es necesario conocer las fórmulas para la


Suma de Cuadrados (SC), por tanto las describimos a continuación:

1
a
2 Y 2… .
SCA= ∑Y −
bcn i=1 i … abcn

296
1
b
2 Y 2… .
SCB= ∑Y −
acn j=1 . j .. abcn

1
c
2 Y 2… .
SCC= ∑ Y −
abn k=1 .. k. abcn

1
a b
2 Y 2….
SCAB= ∑ ∑ Y ij ..− −SCA−SCB
cn i=1 j=1 abcn

1
a c
2 Y 2… .
SCAC= ∑∑ Y − −SCA−SCC
bc i=1 k=1 … . abcn

1
b c
2 Y 2….
SCBC= ∑ ∑ Y . jk . − −SCB−SCC
an j=1 k =1 abcn

SCABC=SCCN −¿

1
a b c
2 Y 2… .
SCCN= ∑ ∑ ∑ Y ijk . −
n i=1 j=1 k=1 abcn

SCEE=SC T o −SCCN

a b c n
2 Y 2… .
SC T o=∑ ∑ ∑ ∑ Y ijkl−
i=1 j=1 k=1 l =1 abcn

Cálculo del coeficiente de Determinación:

SCN SCA + SCB+ SCC + SCAB+ SCAC +SCBC + SCAB


R 2= =
SC T o SC T o

Este coeficiente de determinación indicará que el porcentaje de variabilidad que se


da en la “variable de respuesta” debido al porcentaje de los Factores A, B y C
utilizados.

297
12.3.8 Conclusiones
En cuanto se conozca si se acepta o se rechazan las hipótesis podremos
concluir si existe, o no, diferencias significativas entre los promedios de la
“variable de respuesta” para los 3 factores (A, B y C).
Se concluye también, si existe o no, diferencias significativas entre los
promedios de la “variable de respuesta” para los factores combinados (AB, AC,
BC y ABC).

12.3.9 Cálculo de los parámetros


Para buscar el resultado de la media, la fórmula es la siguiente:

a b c n

∑ ∑ ∑ ∑ Y 2ijkl
μ= Ý = i=1 j=1 k=1 l=1
n

Para buscar el resultado de la desviación estándar, la fórmula es la siguiente:

σ 2=CMEE

Del resultado de estos dos parámetros se interpreta que el promedio de la


desviación de la” variable de respuesta” se estima en (el resultado de la media)
con una desviación estándar de (el resultado de la desviación estándar).

12.4 EJEMPLOS COCA COLA

La empresa Coca Cola de Panamá está realizando un estudio en la sección de


embotellado de las bebidas gaseosas, ya que se desea obtener alturas de llenado más
uniformes en las botellas que salen de su proceso de manufactura.

En teoría, la máquina llenadora introduce líquido en cada botella hasta la altura objetivo
correcto, pero en la práctica existe variación alrededor de este objetivo, y el fabricante
quisiera comprender mejor las fuentes de esta variabilidad para poder hacer un estudio
que permita reducirla a un mínimo.

298
El ingeniero de proceso puede controlar tres variables durante el proceso de llenado:
porcentaje de carbonatación (A), la presión de operación en la llenadora (B) y el
número de botellas que se llenan por minuto o velocidad de la línea (C).

La presión de operación y la velocidad son fáciles de controlar, pero el porcentaje de


carbonatación (CO2 gaseosa) es más difícil de regular durante la manufactura real
debido a que varía con la temperatura del producto.

Sin embargo, para los fines de un experimento, el ingeniero puede controlar la


carbonatación a tres niveles: 10, 12 y 14%. Elige dos niveles para la presión de
operación: 25 Y 30 lb/plg2, y dos niveles para la velocidad de la línea: 200 y 250
botellas por minuto(bpm).

El ingeniero decide correr dos réplicas de un diseño factorial con estos tres factores,
haciendo las 24 corridas de manera aleatoria. Se mide la desviación de la altura de
llenado objetivo que se observa en una corrida de producción de botellas con cada
conjunto de condiciones.

En el cuadro se muestran los datos de este experimento. Las desviaciones positivas


son alturas de llenado arriba del objetivo, mientras que las desviaciones negativas son
alturas de llenado abajo del objetivo.

Porcentaje de Presión de operación (B)


carbonatació 25 psi 30 psi
Velocidad de la línea (C) Velocidad de la línea (C)
n (%). 200 250 200 250
(A)
10 -3 -1 -1 1
-1 0 0 1
12 0 2 2 6
1 1 3 5
14 5 7 7 10
4 6 9 11

299
12.4.1 Desarrollo del problema
 Problema: Determinar si existe diferencias significativas en la
desviación de la altura de llenado promedio para los diferentes
porcentajes de carbonatación (10%, 12% y 14%), utilizando dos
diferentes presiones de operación en la llenadora (25 psi y 30 psi) y
dos diferentes velocidades en la línea (200 bpm y 250 bpm).

 Definición de variables:

VR: Desviación de la altura de llenado.

Factor A: Porcentaje (%) de carbonatación, niveles (1, 2, 3)

Factor B: Presión de operación, niveles (1, 2)

Factor C: Velocidad de la línea, niveles (1, 2)

Interacciones:

AB: Porcentaje de carbonatación con la presión de operación.

BC: La presión de operación con la velocidad de la línea.

AC: Porcentaje de carbonatación con la velocidad de la línea.

ABC: Porcentaje de carbonatación con la presión de operación y la


velocidad de la línea.

i. Modelo estadístico

Yijkl =m +Ai+Bj+Ck+ (AB)ij + (AC)ik + (BC)jk + (ABC)ijk+ e ijkl

(AB)ij: Es el efecto del i-ésimo porcentaje de carbonatación y la j-ésima


presión de operación sobre la VR.

300
(AC)ik: Es el efecto del i-ésimo porcentaje de carbonatación y la k-ésima
rapidez de línea sobre la VR.
(BC)jk: Es el efecto de j-ésima presión de operación y la k-ésima rapidez de
la línea sobre la VR.
(ABC)ijk: Es el efecto del i-ésimo porcentaje de carbonatación, de la j-ésima
presión de operación y la k-ésima rapidez de la línea sobre la VR.
eijkl = error experimemtal

ii. Hipótesis:
Para el factor A Ho: m1= m2 =m3
H1: al menos una de las m de los promedios es diferente.

Para el factor B:Ho: m1 = m2 H1:


al menos una de las m de los promedios es diferente.

Para el factor C: Ho: m1 = m2


H1: al menos una de las m de los promedios es diferente.

Para la interacción (AB)ij: Ho: m11= m12 =m21=m22= m31 =m32


H1: al menos una de las m de los promedios es diferente.

Para la interacción (AC)ik: Ho: m11= m12 =m21=m22= m31 =m32


H1: al menos una de las m de los promedios es diferente.

Para la interacción (BC)jk: Ho: m11= m12 =m21=m22


H1: al menos una de las m de los promedios es diferente.

Para la interacción (ABC)ijk: Ho: m111= m112 =m121…=m322


H1: al menos una de las m de los promedios es diferente.

301
Regla de decisión:
Se descarta Ho si FC ³ Fa , glN,,glD

iii. Aleatorización

Cod. Aleatori. Asignación


1 11 A1B1C1
2 6
3 2 A1B1C2
4 15
5 12 A1B2C1
6 23
7 8 A1B2C2
8 21
9 16 A2B1C1
10 1
11 20 A2B1C2
12 19
13 24 A1B2C2
14 9
15 13 A2B1C1
16 3
17 10 A2B1C2
18 4
19 22 A3B1C2
20 17
21 14 A3B2C1
22 7
23 18 A3B2C2
24 5

iv. Registro de datos

Porcentaje de Presión de operación (B)


carbonatació 25 psi 30 psi
Velocidad de la línea (C) Velocidad de la línea (C)
n (%).
200 250 200 250
(A)
10 -3 -1 -1 1
-1 0 0 1
12 0 2 2 6

302
1 1 3 5
14 5 7 7 10
4 6 9 11

Tabla AxB

B
25 30 TA
10 -5 1 -4
12 4 16 20
14 22 37 59
TB 21 54 75

Tabla BxC

C
200 250 TB
25 6 15 21
30 20 34 54
TC 26 49 75

Tabla AxC

C
200 250 TA
10 -5 1 -4
12 6 14 20
14 25 34 59
TC 26 49 75

303
12.4.6 Supuestos del Modelo

 MINITAB
Recordando los pasos:
1. Estadísticas
2. DOE
3. Factorial
4. Crear diseño factorial
5. Diseño factorial general, 3 factores

Proceso de aleatorización

A B C
3 1 2 7
2 1 2 2
2 1 2 1
3 1 1 5
1 1 1 -3
3 1 1 4
1 1 1 -1
2 2 1 2
1 2 2 1
3 2 2 1
1 1 2 6
2 1 1 11
1 2 1 3
3 1 2 10
3 2 1 5
2 1 1 9
2 2 2 6
3 2 1 7
1 2 2 -1

304
2 2 1 0
2 2 2 1
1 1 2 0
1 2 1 -1
3 2 2 0

Supuestos del modelo

1. Estadísticas
2. DOE
3. Factorial
4. Analizar diseño factorial

Supuesto de probabilidad normal (Gráfica de normalidad)

Los datos presentan una distribución normal ya que se encuentran bastante


aproximados a la línea oblícua.

Supuesto de independencia (Grafica de residuo vs. orden)

305
Se cumple el supuesto de independencia ya que los datos en la gráfica no se
encuentran correlacionados entre sí.

12.4.7 ANDEVA

FV. GL. S.C. C.M. Fc. F


A 2 252.750 126.375 178.41 3.89
B 1 45.375 45.375 64.059 4.75
C 1 22.042 22.043 31.118 4.75
AB 2 5.250 2,625 3.706 3.89
AC 1 1.042 1.042 1.471 4.75
BC 2 0.583 0.292 0.412 3.89
ABC 2 1.083 0.542 0.765 3.89
CN
EE 12 8.500 0.708
To 23 336.625

Coeficiente de determinación y parámetros

306
SCN 328.13
R 2= = =0.9747=97.47 %
SC T o 336.63

El 97.47% de la variabilidad que se da en la desviación de la altura de llenado se debe


al porcentaje de carbonatación, a la presión de la operación y a la velocidad de la línea.

75
μ= Ý = =3.125
24
σ 2=CMEE=0.708

El promedio de la desviación de la altura de llenado se estima en 3.125 mm, con una


desviación estándar de 0.708.

12.4.8 Interpretación (observar ANDEVA):


Se descarta Ho: Para el procentaje de carbonatación debido a que Fc>Fóptima
Se descarta Ho: Para la presión de trabajo a que Fc>Fóptima
Se descarta Ho: Para la rapidez de línea debido a que Fc>Fóptima
No se descarta Ho: Para interacción (AB) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (BC) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (AC) debido a que Fc<Fóptima
No se descarta Ho: Para interacción (ABC) debido a que Fc<Fóptima

12.4.9 Conclusión
Se concluye que existe diferencia significativa entre los promedios de las
desviaciones de las alturas de llenado para los 3 factores: 3 porcentajes de
carbonatación, 2 presiones de operación, 2 velocidades de línea.
Se concluye también que no existen diferencias significativas entre los
promedios de la desviación de alturas promedios de llenado para:
La combinación de factores: AB, AC, BC y ABC.

307
CAPÍTULO 13

13. DISEÑO DE BLOQUES DE 3 FACTORES


13.1 Definición

308
Este es el más simple y quizás el ampliamente usado de los diseños de bloques al azar
que es definido por Hinkelman(1994) así: El material experimental es dividido en
grupos de unidades experimentales (UE) cada uno, donde es el número de
tratamientos, tales que las UE dentro de cada grupo son lo más homogénea posible y
las diferencias entre las UE sea dada por estar en diferentes grupos. Los conjuntos son
llamados bloques. Dentro de cada bloque las UE son asignadas aleatoriamente, cada
tratamiento ocurre exactamente una vez en un bloque.

Si la variación entre las UE dentro de los bloques es apreciablemente pequeña en


comparación con la variación entre bloques, un diseño de bloque completo al azar es
más potente que un diseño completo al azar.

13.2 Generalidades

 Este tipo de experimento comprende tres factores los cuales se denotan A, B y C.


 Factor A tiene a niveles
 Factor B tiene b niveles
 Factor C tiene c niveles
 Hay abc combinaciones de niveles
 Se tienen n bloques y las combinaciones de niveles se asignan aleatoriamente a
cada uno de los bloques
 Existen abcn observaciones en el experimento

13.3 Pasos

1. Definición del problema


2. Definición de las variables
3. Modelo Estadistico
4. Formulación de las hipótesis
5. Regla de decisión
6. Aleatorización

309
7. Tabla de datos
8. Verificación de los supuestos
9. Análisis de varianza ( andeva )
10. Conclusiones
11. Cálculos de parámetros
12. Calculo de intervalos de confianza

13.3.1 Definición del Problema

Comparar si hay diferencias significativas entre los promedios de los niveles


delos 3 factores de interés (i,j y k).

13.3.2 Modelo Estadístico:

Yijkl = m + Ai + Bi + Ck + (AB)ij + (BC)jk + (AC)ik + (ABC)ijk + Rl+ Eijkl

Yijkl = es la l-ésima observación del i-ésimo nivel del factor A y del j-ésimo nivel
del factor B y el k-ésimo nivel del factor C.

μ= promedio total

Ai = efecto del i-ésimo nivel del factor A

Bi = efecto del j-ésimo nivel del factor B

Ck = efecto del k-ésimo nivel del factor C

(AB)ij = efecto de la interacción entre i-ésimo nivel del factor A y el j-ésimo nivel
del factor B.

(BC)jk = efecto de la interacción entre j-ésimo nivel del factor B y el k-ésimo nivel
del factor C.

310
(AC)ik = efecto de la interacción entre i-ésimo nivel del factor A y el k-ésimo
nivel del factor C.

(ABC)ijk = efecto de la interacción entre i-ésimo nivel del factor A , el j-ésimo


nivel del factor B y el k-ésimo nivel del factor C.

Rl= efecto del l-esimo bloque

Eijkl = error experimental.

13.3.3 Planteamiento de las hipótesis:

PARA EL FACTOR A

Ho: m1= m2 ........... = ma

Hi : al menos una de las mediases diferente

PARA EL FACTOR B

Ho: m1= m2 ........... = mb

Hi : al menos una de las medias es diferente

FACTOR C

Ho: m1= m2 ........... = mC

Hi : al menos una de las mediases diferente

BLOQUES

Ho: m1= m2 ........... = mn

Hi : al menos una de las medias es diferente

INTERACCIÓN AB

Ho: m11= m12 ........... = mab

311
Hi : al menos una de las mediases diferente

NTERACCIÓN BC

Ho: m 11= m12 ........... = mbc

Hi : al menos una de las mediases diferente

INTERACCIÓN AC

Ho: m11= m12 ........... = mac

Hi : al menos una de las mediases diferente

INTERACCIÓN ABC

Ho: m111= m112 ........... = mabc

Hi : al menos una de las mediases diferente

13.3.4 Regla de decisión

 Factor A

Descartar Ho si Fc > Fα,(a-1),abc(n-1)

 Factor B

Descartar Ho si Fc > Fα,(b-1),abc(n-1)

 Factor C

Descartar Ho si Fc > Fα,(c-1),abc(n-1)

 Interacción AB

Descartar Ho si Fc > Fα,(a-1)(b-1),abc(n-1)

312
 Interacción BC

Descartar Ho si Fc > Fα,(b-1)(c-1),abc(n-1)

 Interacción AC

Descartar Ho si Fc > Fα,(a-1)(c-1),abc(n-1)

 Interacción ABC

Descartar Ho si Fc > Fα,(a-1)(b-1)(c-1),abc(n-1)

13.3.5 Aleatorización

En un proceso de aleatorización para un diseño de bloques de tres factores


debemos: asignar las combinaciones de niveles(ABC) a cada uno de los n bloques.

Bloques

Ejm. A1B1C1 A2B2C2

A =2 A1B1C2 A2B1C2

B =2 A1B2C1 A2B2C1

313
C =2 A1B2C2

n =3 A2B1C1

Asignar 8 combinaciones aleatoriamente a cada casilla de cada bloque

13.3.5.1 Esquemas

DBA:

13.3.6 Registro de datos

Se debe confeccionar una tabla para, AB, AC y para BC

Tabla AB.

314
Tabla AC.

Tabla BC.

13.3.7 Verifiación de los supuestos

Normalidad:

El máximo residuo normalizado es dado por:

315
Donde:    y   es el mayor residual en valor absoluto. Si
este valor excede el valor crítico de tabla, la observación es declarada como un outlier
potencial. Estas deben ser localizadas y examinadas para buscar causas
asignables. La eliminación arbitraria de valores extremos debe evitarse.

Normalidad:

Ho: Los datos poseen una distribución normal


Hi: Los datos no poseen una distribución normal

Homocedasticidad:

Homogeneidad de varianza

La prueba gráfica de igualdad de varianza es graficar los residuales contra los valores

predichos (     si existe algún patrón especial que muestre mayor


dispersión para un lado de la gráfica se puede decir que no hay homogeneidad de
varaianza.

316
Las pruebas analíticas para igualdad de varianza dadas por el DCA no son aplicables a
bloques ya que no se tienen estimadores independientes de las varianzas de los
tratamientos. Existen algunos procedimientos, pero quizá el más simple es el

desarrollado por Han ( . Esta prueba es especialmente para un DBC y asume:

 Las poblaciones muestreadas sean normalmente distribuídas

 Los errores son igualmente correlacionados dentro de los bloques, pero son
independientes entre bloques.

La prueba estadística es:

Donde el estimado de la varianza para el tratamiento   es:

Donde   es el número de bloques y los   son los residuales en el tratamiento  . Note
que la varianza no es calculada directamente de los datos, por ello la no independencia
de las varianzas. Observe que para el calculo de la varianza del tratamiento 1 utiliza a

la medias de los bloques,  , y para el tratamiento 2 utiliza tambien a a

la medias de los bloques  .

317
Los valores críticos de la prueba estadística son basados sobre puntos de porcentaje

de la distribución rango estudentizado   en vez de la distribución Fmax.

Se rechaza la hipótesis de homogeneidad de varianzas   

si  . Los puntos de porcentaje de   han sido tabulados por Harter
(1960) y pueden ser obtenidos en la tabla C-7 de Martin.

Hipótesis:

Ho: µ1 = µ2 = µ3

Hi: al menos un promedio es diferente

Independencia

Se observa si gráficamente los datos presentan alguna tendencia y se concluye


diciendo si no presentan alguna tendencia que los datos son independientes.

13.3.8 Análisís de varianza

318
Luego de haber visto los supuestos estamos en la capacidad de confeccionar la
tabla de ANDEVA. Las formulas y ecuaciones se describen en

Nota: las formulas que se encuentran en el interior de la tabla 13.5 se describen a


parte.

319
13.3.8.1 Formulas:

Tabla 13.6

a
Y....2
Y
1
SCA  2
i ... 
b cn i 1 abcn

b
Y....2
 Y. 2j .. 
1
SCB 
a cn j 1 a b cn

c
Y....2
Y
1
SCC  2
.. k . 
abn k 1 ab cn

a b
Y....2
 Y
1
SCAB  2
ij..   SCA  SCB
cn i 1 j 1 abcn

a c
Y....2
 Y
1
SCAC  2
i .k .   SCA  SCC
bn i 1 k 1 abcn

b c
Y....2
 Y
1
SCBC  2
. jk .   SCB  SCC
an j 1 k 1 abcn

SCABC  SCCN  ( SCA  SCB  SCC  SCAB  SCAC  SCBC )

a b c n
Y....2
SCTo  
i 1 j 1 k 1 l 1
2
Yijkl 
abcn

SCEE  SCTo  ( SCCN  SCB)

320
1 n 2 Y....2
SCBLOQUES   Y... l  abcn
abc l 1

1 n 2 Y....2
SCCN   Yijk. 
n l 1 abcn

13.3.9 Conclusiones

Para un diseño de bloques de tres factores se concluye de la siguiente manera:

Para cada factor, bloque e interacciónFc >Fa, se rechaza Ho

Existe diferencia significativa en lavariable de respuesta debido a factor,

bloque o interacción.

13.3.10 Cálculo de Parámetros

Promedio μ = y..../abcn

Varianza s 2 = CMEE

R2 = (SCABC + SCAB + SCBC + SCAC + SCA + SCB + SCC)/ SCTo

El x% de la variabilidad de la variable derespuesta se explica con el modelo utilizado


elresto se debe a otros factores.

321
BIBLIOGRAFÍA

 Montgomery, D.C. (1991). Diseño y Análisis de Experimentos. Grupo Editorial


Iberoamérica.

 MOODLE.

322

Vous aimerez peut-être aussi