Vous êtes sur la page 1sur 250

Experimentos Industriales

y sus procedimientos en

David R. González Barreto


Rol del diseño experimental en la búsqueda del
conocimiento – Un ciclo que se repite (ANDREWS)

Verdad

slide 2
La búsqueda científica del conocimiento como un
ciclo

Desarrollo de Planificar Prueba para Conducir Analizar Datos


Ideas Hipótesis la idea. Experimento Del Experimento
Diseño experimental

slide 3
Definiciones y principios básicos

 Experimento es una prueba o serie de


pruebas en la(s) cual(es) ciertas variables de
entrada de un proceso son alteradas
sistemáticamente con el propósito de identificar
su efecto en la(s) variable(s) de salida.

 Los experimentos diseñados estadísticamente


permiten diseñar pruebas que son eficientes y
económicas, el uso de métodos estadísticos a la hora
de examinar los datos obtenidos de estas pruebas
resultan en conclusiones válidas y objetivas desde la
perspectiva científica.
 Todos los experimentos se diseñan, algunos se
diseñan de forma incorrecta resultando en
conclusiones no válidas y/o un mal uso de recursos.

slide 4
Definiciones y principios básicos

 Factor es cualquier variable cuyo impacto en la


respuesta queremos estudiar y que podemos controlar.
 Nivel es el número de alternativas o ajustes para cada
factor.
 Tratamiento o condición experimental es una
combinación de factores para obtener una respuesta.

slide 5
Definiciones y principios básicos

 Repetición se refiere al número de ocasiones que una


misma condición experimental se efectúa durante la
prueba.
Temperatura

X
Presión X

 En este ejemplo, tendríamos cuatro (4) condiciones


experimentales. Si cada una de las condiciones
experimentales se repite el mismo número de veces, en
este caso sería dos (2) veces como se presenta en la
casilla superior izquierda, entonces decimos que el
experimento es balanceado. De lo contrario, el
experimento es considerado como desbalanceado con
ciertas repercusiones que estudiaremos.

slide 6
Experimentación

• Variables de Entrada • Variables de Salida


• Variables Controlables Proceso o Sistema • Variables de Respuesta
• Factores

X y
Recursos
• Personal
• Equipo de Medidas
• Otros

slide 7
Experimentación

Aspiramos a obtener un modelo


matemático de la forma:

y= f(X)+ 

slide 8
Definiciones y principios básicos
 Aleatoriedad se refiere al orden en que se
ejecutan las condiciones experimentales
durante el experimento. El objetivo de la
aleatoriedad es el de ‘neutralizar’ los efectos de
variables ajenas al experimento que puedan
intervenir o estar presentes en el mismo.

 Bloque es la técnica utilizada con el fin de


aumentar la precisión en un experimento. Un
bloque es una porción del material
experimental que debe ser más homogénea
que el conjunto completo del material.

slide 9
Pasos a seguir en el diseño y análisis de
experimentos

1. Reconocimiento y establecimiento del problema


2. Selección de factores y los niveles de estos
3. Selección de la variable respuesta
4. Determinar el diseño experimental a llevarse a cabo
5. Llevar a cabo el experimento
6. Analizar los datos
7. Conclusiones y recomendaciones
8. Estudio de confirmación

slide 10
Clasificación de variables controlables (Factores)
Variables Controlables

Cualitativas Cuantitativas
(e.g Tipo de Material, (e.g Temperatura,
Sujeto) Presión)

Variable de Respuesta

Cualitativas Cuantitativas
(e.g producto aceptable (e.g Viscosidad,
o defectuoso) Tiempo)

slide 11
Modelos según las variables analizadas

X
Cuantitativa Cualitativa
Cuantitativa Diagramas de Análisis de
Dispersión, Varianza
Regresión
Y
Cualitativa Regresión Tablas de
Logística contingencia

slide 12
Efectos fijos vs. Efectos aleatorios

 Efectos fijos - el experimentador puede seleccionar los a


tratamientos. En esta situación nos interesa probar la hipótesis sobre
si los promedios para estos tratamientos seleccionados pueden
considerarse iguales. Las conclusiones en este experimento no
pueden extenderse a tratamientos que no fueron considerados en el
mismo.

 Efectos Aleatorios - los a tratamientos pueden ser una muestra


aleatoria de una población mas amplia de tratamientos. En estas
circunstancias nos gustaría poder extender las conclusiones a todos
los tratamientos, sin importar si todos estuvieron explícitamente
considerados en el experimento. Los efectos i son considerados
variables aleatorias y conocer sobre los efectos particulares tiene
poca importancia. Lo que nos importa es qué % de la variabilidad
total se debe a este efecto.

slide 13
Pruebas de hipótesis estadísticas

 Las Hipótesis Estadísticas son supuestos o conjeturas acerca de


cierto parámetro ( ó ) de una o más poblaciones de interés. La
herramienta estadística para verificar dicho reclamo sobre el
parámetro de la población se conoce como Pruebas de Hipótesis.
La estructura de las Pruebas de Hipótesis está dada por la
formulación de dos términos:

H0: Hipótesis nula que establece el valor exacto del parámetro que
queremos probar.

H1: Hipótesis alterna la cual establece la posibilidad de que el valor del


parámetro se encuentre entre una serie de valores distintos al
establecido en H0.

slide 14
Pruebas de hipótesis estadísticas
 El aceptar la hipótesis nula (H0) solo implica que la
muestra analizada no da suficiente evidencia para
refutarla. Sin embargo, rechazar la hipótesis nula implica
que la muestra analizada da evidencia para rechazarla.
Este rechazo da paso a la aceptación de la hipótesis
alterna (H1).

slide 15
Pruebas de hipótesis estadísticas
 Para llevar a cabo una prueba de hipótesis debemos asegurarnos de
que establecemos y conocemos lo siguiente:

 Estadística de prueba - función de la muestra aleatoria que se utiliza


para tomar una decisión en la prueba de hipótesis.
 Valor crítico - número que marca el límite entre aceptación y rechazo de
la H0.
 Región de aceptación - rango marcado por el valor o valores críticos que
de contener el valor de la H0 daría paso a la aceptación de la misma.
 Región de rechazo - rango marcado por el valor o valores críticos que
de contener el valor de la H0 daría paso al rechazo de la misma.

slide 16
Pruebas de hipótesis estadísticas

 Pruebas de hipótesis estadísticas

H0 es cierto H0 es falso

decisión
acepto H0 error tipo II
correcta
decisión
rechazo H0 error tipo I
correcta

 Error tipo I - rechazar H0 cuando se debió aceptar.


 Error tipo II - aceptar la H0 cuando se debió rechazar.
  - probabilidad de cometer error tipo I.
 ß - probabilidad de cometer error tipo II.

slide 17
Pruebas de hipótesis estadísticas

 Potencial de la prueba (1-ß) - probabilidad de rechazar


la H0 cuando se debió rechazar.
 Valor p - nivel mínimo al cual el valor observado de la
estadística de prueba es estadísticamente significativo.
 El procedimiento para llevar a cabo pruebas de
hipótesis es el siguiente:
1) Establezca H0.
2) Escoja la H1 apropiada.
3) Establezca .
4) Seleccione la estadística de prueba.
5) Establezca la región crítica.
6) Calcule el valor de la estadística de prueba para la
muestra analizada.
7) Compare la estadística de prueba con la región crítica
y decida si acepta o rechaza H0.

slide 18
Concepto del Valor P (“P Value”)
 El valor p se define como el nivel mínimo de significancia al cual la
hipótesis nula Ho sería rechazada. En el caso de la distribución F
que usamos en nuestro ANOVA si:
Fcalculada > Fcrítica
entonces uno rechaza la hipótesis nula Ho en favor de la hipótesis
alterna H1. Este concepto se ilustra en la siguiente Figura.

valor p 

F F
Calculada Crítica

slide 19
Concepto del Valor P (“P Value”)
 Como puede notarse en este caso la hipótesis nula Ho no puede ser
rechazada ya que la Fcalculada < Fcrítica, de igual manera el valor p
nos daría la misma decisión bajo la condición:
valor p > 
 Por lo tanto, el valor p puede ser interpretado como la posibilidad de
que la hipótesis nula no sea rechazada. Magnitudes altas del valor p
estarán asociadas con no poder rechazar la hipótesis nula mientras
que magnitudes bajas del valor p estarán asociadas con el rechazo
de la hipótesis nula. Regularmente el valor p es comparado con el
nivel a establecido para la prueba.

slide 20
Concepto del Valor P (“P Value”)
 Usando el valor p como criterio de aceptación o rechazo
de una hipótesis es como comúnmente los programas de
análisis estadístico le permiten al usuario tomar una
decisión.
 Así que, en general, si el valor p es menor que el 
establecido rechazamos la hipótesis nula de lo contrario
no podemos rechazar.

slide 21
Pruebas de hipótesis estadísticas
Ejemplo 1
 La especificación para el grueso de una tableta es 0.03
mm. Se sabe que el grosor de las tabletas sigue una
distribución normal con  = 0.001. Se toma una muestra
aleatoria de 32 tabletas del proceso y se le mide el
grosor.
 ¿Sería correcto decir que el grueso promedio de las
tabletas en el lote es 0.03 mm?

slide 22
Pruebas de hipótesis estadísticas
Ejemplo 1

Observación Grosor (cm) Observación Grosor


(cm)
1 0.031 17 0.0283
2 0.0285 18 0.0291
3 0.029 19 0.0287
4 0.0279 20 0.0291
5 0.0286 21 0.0309
6 0.028 22 0.0298
7 0.0305 23 0.0313
8 0.0279 24 0.03
9 0.0286 25 0.0289
10 0.0299 26 0.0299
11 0.03 27 0.0279
12 0.0295 28 0.0311
13 0.031 29 0.0293
14 0.0316 30 0.032
15 0.0283 31 0.0278
16 0.0294 32 0.0319

slide 23
Pruebas de hipótesis estadísticas
Ejemplo 1

Para contestar la pregunta se llevará a cabo una prueba de


hipótesis donde la conjetura a probar es si el grueso promedio de
las tabletas que se están produciendo es 0.03 cm. Siguiendo los
pasos antes discutidos comenzaremos por establecer la hipótesis
nula, la alterna y el nivel  que estaremos usando. Cuando la
hipótesis alterna lleva el signo de no es igual () se dice que la
prueba es de dos colas. En este tipo de prueba el rango de
aceptación estará dado por dos valores críticos o sus respectivos
valores p. Como en este caso la distribución de los datos es normal
y conocemos la desviación estándar de la población usaremos la
estadística de prueba Z.

H0:  = 0.03
H1:   0.03
 = 0.05

slide 24
Pruebas de hipótesis estadísticas
Ejemplo 1

 Luego de entrar los datos en Minitab y llevar a cabo los


pasos apropiados para pruebas de hipótesis del promedio de
una población obtendremos el siguiente análisis:
Z-Test
Test of mu = 0.030000 vs mu not = 0.030000
The assumed sigma = 0.00100
Variable N Mean StDev SE Mean Z P
grosor 32 0.029553 0.001276 0.000177 -2.53 0.012

Dotplot of grosor
(with Ho and 95% Z-confidence interval for the mean, using sigma = 0.0010000)

[ _ ]
X Ho

0.028 0.029 0.030 0.031 0.032

grosor

slide 25
Pruebas de hipótesis estadísticas
Ejemplo 1
 Luego de verificar que el valor hipotetizado y la
desviación estándar utilizada son los que entramos
revisamos la estadística de prueba y su probabilidad.
Como el valor p es menor que  = 0.05 rechazamos H0 y
concluimos que el grueso promedio de las tabletas
producidas no es igual a 0.03 cm.

slide 26
Pruebas de hipótesis estadísticas
Ejemplo 2
 El proceso de llenado de frascos con medicina líquida
fue recientemente ajustado. Se quiere saber si la
cantidad dispensada en los frascos no es menor de las
12 onzas requeridas. Se sabe que las cantidades
dispensadas siguen una distribución normal. El
supervisor de la línea decide tomar una muestra de 10
frascos y conducir una prueba de hipótesis para
determinar si la cantidad promedio dispensada no es
menor de 12 onzas.

slide 27
Pruebas de hipótesis estadísticas
Ejemplo 2

Observación Cantidad Dispensada (oz) Observación Cantidad Dispensada (oz)

1 11.52 6 12.54

2 12.3 7 12.01

3 11.1 8 10.47

4 10.8 9 11.02

5 11.64 10 12.41

A diferencia del ejemplo anterior en este caso no conocemos la desviación


estándar de la población por lo tanto usaremos la estadística de prueba t.
También es importante observar que lo que se quiere probar es si la cantidad
promedio dispensada es menor de 12 onzas. Este tipo de prueba se conoce
como de una cola donde la región de aceptación está marcada por un solo
valor crítico.
H0:  = 12
H1:  < 12
 = 0.05

slide 28
Pruebas de hipótesis estadísticas
Ejemplo 2

 Luego de entrar los datos en Minitab y llevar a cabo los pasos


apropiados para pruebas de hipótesis del promedio de una
población obtendremos el siguiente análisis:

T-Test of the Mean

Test of mu = 12.000 vs mu < 12.000


Variable N Mean StDev SE Mean T P
onzas 10 11.581 0.723 0.229 -1.83 0.050

 En este caso la prueba de hipótesis es de una cola. Como el


valor p =  tenemos duda sobre qué concluir.

slide 29
Pruebas de hipótesis estadísticas
Ejemplo 3

 En el proceso de sellado existen sospechas de que hay diferencias


significativas entre las bolsas que se sellan en la máquina #1 y las que
se sellan en la máquina #2. Ambas máquinas son idénticas y fueron
puestas en operación al mismo tiempo.
 Determine si no existe diferencia significativa en el sellado de ambas
máquinas.
Maquina Esfuerzo Maquina Esfuerzo
1 5.6 2 5.7
1 5.7 2 6.3
1 6.1 2 5.1
1 5.9 2 4.5
1 4.9 2 6.2
1 5.2 2 5.6
1 6.3 2 5.5
1 5.8 2 5.5
1 4.7 2 6.6
1 5.1 2 4.9
1 5 2 5.2
2 5.3
2 5.2

slide 30
Pruebas de hipótesis estadísticas
Ejemplo 3
 En este caso no sabemos las desviaciones estándar de las dos
poblaciones pero asumimos que son iguales ya que las dos
máquinas de sellado son idénticas y fueron puestas en producción al
mismo tiempo. Como lo que nos interesa es si el trabajo producido
por ambas máquinas es igual conduciremos una prueba de dos
colas para promedios de dos poblaciones.

H0: 1 - 2 = 0
H1: 1 - 2  0
 = 0.05

slide 31
Pruebas de hipótesis estadísticas
Ejemplo 3
 Luego de entrar los datos en Minitab y llevar a cabo los pasos
apropiados para pruebas de hipótesis de promedios de dos
poblaciones obtendremos el siguiente análisis:

Two Sample T-Test and Confidence Interval

Two sample T for esfuerzo


maquina N Mean StDev SE Mean
1 11 5.482 0.529 0.16
2 13 5.508 0.587 0.16
95% CI for mu (1) - mu (2): ( -0.50, 0.45)
T-Test mu (1) = mu (2) (vs not =): T = -0.11 P = 0.91 DF = 21

slide 32
Pruebas de hipótesis estadísticas
Ejemplo 3

Two Sample T-Test and Confidence Interval

Two sample T for esfuerzo


maquina N Mean StDev SE Mean
1 11 5.482 0.529 0.16
2 13 5.508 0.587 0.16
95% CI for mu (1) - mu (2): ( -0.50, 0.45)
T-Test mu (1) = mu (2) (vs not =): T = -0.11 P = 0.91 DF = 22
Both use Pooled StDev = 0.561

 Como el valor p es mayor que  concluimos que no existe suficiente


evidencia para rechazar H0. Por lo tanto es razonable decir que no
existe diferencia significativa en el sellado de ambas máquinas.
 Este análisis se pudo haber llevado a cabo mediante una ANOVA
obteniendo los mismos resultados. Esta herramienta será discutida
luego en detalle. Es interesante señalar que la estadística de prueba
de la ANOVA (F-Ratio) es igual al cuadrado de la estadística de prueba
t usada en la prueba de hipótesis.

slide 33
Pruebas de hipótesis estadísticas
Ejemplo 4

 Se desea determinar si el utilizar azúcar marca B en


el proceso de compactación de tabletas causará una
dureza de tableta que en promedio exceda por 2
unidades la dureza obtenida cuando se utiliza azúcar
marca A. La dureza de las tabletas sigue una
distribución normal.

slide 34
Pruebas de hipótesis estadísticas
Ejemplo 4

Azúcar A Azúcar B
7.1 9.6
6.9 9.4
7.3 8.9
7.5 10.1
7.2 9.7
6.8 10.6
7.3 8.8
7.1 9.5
7.4 9.9
7.8 9.3
7.3 9.1
6.9 10.9
7.4 8.9
6.8 9.6
7.2 10.2

slide 35
Pruebas de hipótesis estadísticas
Ejemplo 4
 Al igual que en el ejemplo anterior no sabemos las desviaciones
estándar de las dos poblaciones. Pero a diferencia de ese caso
asumimos que no son iguales ya que las dos marcas de azúcar son
distintas. Para revisar si en realidad la diferencia en la dureza
promedio es mayor de 2 conduciremos una prueba de una cola para
promedios de dos poblaciones.

H0: A - B = -2
H1: A - B > -2
 = 0.05

slide 36
Pruebas de hipótesis estadísticas
Ejemplo 4

 Luego de entrar los datos en Minitab y llevar a cabo los pasos


apropiados para pruebas de hipótesis de promedios de dos
poblaciones obtendremos el siguiente análisis:

Two Sample T-Test and Confidence Interval


Two sample T for Dureza
azucar N Mean StDev SE Mean
A 15 7.200 0.278 0.072
B 15 9.633 0.621 0.16
95% CI for mu (A) - mu (B): ( -2.801, -2.07)
T-Test mu (A) = mu (B) (vs >): T = -13.86 P = 1.0 DF = 19

 Como el valor p es mayor que  para una diferencia de


promedios estimada de -2.43 no podemos rechazar H0.

slide 37
Pruebas de hipótesis estadísticas
Ejemplo 5
 Se desea determinar si un programa de adiestramiento en seguridad
ocupacional contribuyó a disminuir el número de accidentes
reportados en 10 celdas de manufacturas.

Celda de Mfg. Antes Después


1 45 36
2 73 60
3 46 44
4 124 119
5 33 35
6 57 51
7 83 77
8 34 29
9 26 24
10 17 11

slide 38
Pruebas de hipótesis estadísticas
Ejemplo 5
 Dado que las dos muestras no son independientes si no que son
medidas de lo mismo en dos tiempos distintos se debe llevar a cabo
la "paired t-Test" para determinar si el adiestramiento ha sido
efectivo en reducir la cantidad de accidentes.

H0: D = 0
H1: D > 0
 = 0.05

slide 39
Pruebas de hipótesis estadísticas
Ejemplo 5
 Luego de entrar los datos en Minitab y llevar a cabo los pasos
apropiados para la "paired t-Test" obtendremos el siguiente análisis:

Paired T-Test and Confidence Interval

Paired T for Antes - Despues


N Mean StDev SE Mean
Antes 10 53.8 32.1 10.1
Despues 10 48.6 31.0 9.8
Difference 10 5.20 4.08 1.29
95% CI for mean difference: (2.28, 8.12)
T-Test of mean difference = 0 (vs > 0): T-Value = 4.03 P-Value = 0.001

slide 40
Pruebas de hipótesis estadísticas
Ejemplo 5

T-Test of the Mean

Test of mu = 0.00 vs mu > 0.00


Variable N Mean StDev SE Mean T P
Diferenc 10 5.20 4.08 1.29 4.03 0.0015

 Dado que el valor p es menor que  se rechaza H0 y concluimos que


el programa ha sido efectivo. La cantidad promedio de accidentes
era mayor antes que después del adiestramiento.

slide 41
Modelos según las variables analizadas

 Modelo de ANOVA para un factor:

yij =  + i + eij

 Modelo de regresión de un factor:

yij = bo + b1 X + eij

slide 42
Ejemplo de ensamblajes

 Objetivo de la Prueba: ensamblar tres carritos similares,


cuya diferencia estriba en el número de piezas que cada
uno contiene. Los carritos son de 24, 28 y 32 piezas
respectivamente. Tres personas son reclutadas para
efectuar el ensamblaje y los nombraremos X, Y, Z . La
variable respuesta a medirse es el tiempo de ensamblaje
y lo que se quiere determinar es si existe diferencia en
este tiempo como función del número de piezas del
carrito.

slide 43
Ejemplo de ensamblaje

 Algunas configuraciones posibles para efectuar la


prueba :
A. Efectos Fundidos (Configuración 1)
X Y Z
24 28 32
24 28 32
24 28 32
 En esta configuración no es posible separar el
efecto del número de piezas del carrito de la
persona que lo ensambla. En la jerga experimental
diríamos que el efecto número de piezas se
encuentra completamente fundido con la persona y
no puede separarse.

slide 44
Ejemplo de ensamblaje

B. Completamente Aleatorio (Configuración 2)


X Y Z
24 28 24
28 32 32
24 28 32
 En esta configuración note que el efecto del número
de piezas y la persona se encuentran parcialmente
fundidos. Si el/la ensamblador/a Z fuese muy
diestro/a entonces tal vez se beneficiaría el carrito
con el mayor número de piezas.

slide 45
Ejemplo de ensamblaje

C. Restricción en aleatoriedad (Configuración 3)

X Y Z
24 24 24
28 28 28
32 32 32

 En esta configuración se rompe la relación entre el


número de piezas y quien ensambla ya que todos los
ensambladores trabajan con todos lo carritos. La
preocupación en este esquema resulta de la posibilidad
de que exista un efecto de fatiga o por el contrario de
aprendizaje que perjudicaría o beneficiaría el carrito de
32 piezas según fuese el caso.

slide 46
Ejemplo de ensamblaje

D. Bloque Completamente Aleatorio (Bloqueado Sujeto)


(Configuración 4)

X Y Z
28 24 28
24 28 24
32 32 32

 En esta configuración, establecida de asignar los tratamientos


aleatoriamente a los ensambladores, asegurando que cada
ensamblador ve cada carrito, entramos en el mismo conflicto que
en la configuración II, en donde puede existir por causas fortuitas
efectos parcialmente fundidos. Un posible ejemplo de esto se
muestra en esta configuración IV. Lo mismo sucedería si
estableciéramos que en vez de asignar aleatoriamente los
carritos por ensamblador, los asignáramos aleatoriamente por
orden de ensamblaje esto se presenta en la configuración V.

slide 47
Ejemplo de ensamblaje

E. Bloque Completamente Aleatorio (Bloqueado el orden)


(Configuración 5)
X Y Z
24 28 32
28 32 24
24 28 32
 Note que en esta configuración los ensambladores podrían ver más de
una vez uno de los carritos y no trabajar con alguno de ellos.

F. Cuadrado Latino (Configuración 6)


X Y Z
24 28 32
28 32 24
32 24 28
 En esta configuración notamos como todos los ensambladores trabajan
con todos los carritos y a la misma vez todos los carritos son
ensamblados en distinto orden.

slide 48
Análisis de varianza (ANOVA)
 Las pruebas de hipótesis estudiadas son métodos que comparan
dos tratamientos. Sin embargo, muchos experimentos requieren
comparaciones de más de dos tratamientos simultáneamente.
Tome como ejemplo un factor con 5 niveles o tratamientos, si usted
realiza pruebas por parejas, entonces tendrá 10 pruebas que
realizar.
 Considere ahora que usted estableció .05 como su error Tipo I,
entonces la probabilidad de aceptar su hipótesis nula correctamente
en cada prueba individual es 1 - .05 = 0.95. Si decimos que las
pruebas son independientes, la probabilidad de aceptar la hipótesis
nula correctamente en las 10 pruebas será de (0.95)10 = 0.60.
 El procedimiento apropiado para probar la igualdad de varias medias
o promedios se conoce como análisis de varianza o ANOVA.

slide 49
Análisis de varianza (ANOVA)

 ANOVA - este nombre proviene del inglés ‘Analysis of Variance’ y el


objetivo fundamental es el de descomponer la variabilidad total en sus
distintos componentes.
 Considere la siguiente Tabla para un experimento de un solo factor con
n repeticiones en cada uno de los a tratamientos :

Tratamientos
1 2 …. a
Observaciones y11 y21 ya1
y12 y22 ya2
. .
y1n y2n yan
totales y1. y2. …. ya.
promedios
y1. y 2. y a.

slide 50
Análisis de varianza (ANOVA)

SST     y  y   SS
a n 2

ij .. TRATAMIENTOS
 SS ERROR
i 1 j 1

SST     y  y    y  y 
a n 2

i. .. ij i.
i 1 j 1

SST  n  y  y      y  y 
a 2 a n 2

i. .. ij i.
i 1 i 1 j 1

slide 51
Análisis de varianza (ANOVA)

 Al igual que la suma de cuadrados los grados de libertad


se descomponen de forma aditiva como presenta la
siguiente relación:
glTOTAL = glTratamientos + glError
an – 1 = (a – 1) + (an – a)
N – 1 = (a – 1) + (N – a)
 De la descomposición presentada en la página anterior
podemos construir lo que conocemos como la Tabla de
Anova. Para esto debemos primero recordar que
podemos estimar los componentes de la varianza
usando la siguiente relación:
Suma de Cuadrados
Estimado deVarianza 
grados de libertad

slide 52
Analisis de varianza (ANOVA)

Suma de Grados de Promedio de Estadística


Fuente
Cuadrados Libertad Cuadrados F

Tratamientos SSTrat. MSTrat.


SSTratamientos a-1 MSTrat.  FC
(entre)
a 1 MSError

Error SS Error
SSError N-a MS Error 
(dentro) N a

Total SSTotal N-1

slide 53
Análisis de varianza (ANOVA)
 La prueba de hipótesis bajo estas condiciones puede formularse:
Ho: 1 = 2 = 3 = …. = a = 0
H1: 1  0 para al menos una i
i = 1, 2, 3, …, a
 Una forma alterna para formular la hipótesis sería:
Ho : 1 = 2 = 3 = …. = a
H1 : i  j para al menos una
combinación (i, j)
 Dado que las presunciones de Anova se cumplen,
 Rechazamos Ho si FC > F .

slide 54
Presunciones de ANOVA
 Para efectuar la prueba de hipótesis que acabamos de
describir establecemos las siguientes presunciones:

 Los errores son variables aleatorias independientes y están


normalmente distribuidos promedio cero y varianza constante 2.
 La varianza 2 se presume constante para todos los niveles del
factor.

slide 55
Métodos gráficos para cotejar la idoneidad del
modelo
 Definimos el residual de la observación j dentro del tratamiento i : eij
= yij - donde este último término corresponde al estimado del
modelo para la observación correspondiente.
 Trazo de Probabilidad Normal (Normal Probability Plot) Cotejamos la
normalidad de los residuales
 Trazo de Residuales en Secuencia de Tiempo – nos ayuda en
detectar alguna correlación existente entre los residuales, por lo
tanto, trabaja con la presunción de independencia de los residuales.
En ocasiones, este gráfico podrá mostrarnos cuando una variable no
considerada en el experimento intervino en el mismo.

slide 56
Métodos gráficos para cotejar la idoneidad del
modelo
 Trazo de Residuales vs. Factores – nos ayuda en
detectar de forma clara en muchas ocasiones
desviaciones a la presunción de varianza constante.
 Trazo de Residuales vs. Valores Estimados – este trazo
no debe mostrar ninguna estructura para reconocer que
tenemos un modelo adecuado y que las presunciones
del mismo se cumplen. Ayuda a detectar valores
influyentes (“outliers”).

slide 57
Análisis de varianza (ANOVA) Ejemplo

 El efecto de la geometría de un transportador de tabletas


(“sinker”) en el tiempo de disolución de las tabletas es
estudiado. Las tabletas son sumergidas en un baño en un
medio específico luego de ser colocadas en los “sinkers” y el
tiempo de disolución es capturado.

“Sinker Geometry”

G1 G2 G3 G4 G5

98 95 91 101 94

99 94 84 98 100

100 89 88 100 98

99 96 83 98 103

95 94 75 98 101

slide 58
Análisis de varianza (ANOVA) Ejemplo

One-way ANOVA: % Diss versus Sinker

Source DF SS MS F P
Sinker 4 811.8 202.9 16.53 0.000
Error 20 245.6 12.3
Total 24 1057.4

S = 3.504 R-Sq = 76.77% R-Sq(adj) = 72.13%

slide 59
Análisis de varianza (ANOVA) Ejemplo

Boxplot of % Diss by Sinker


105

100

95
% Diss

90

85

80

75

G1 G2 G3 G4 G5
Sinker

slide 60
Análisis de residuales

 Usando métodos gráficos para el análisis de residuales podemos cotejar la idoneidad


del modelo.

Trazo de Probabilidad Normal (Normal Probability Plot)

Normal Probability Plot of the Residuals


(response is % Diss)
99

95
90

80
70
Percent

60
50
40
30
20

10

1
-10 -5 0 5
Residual

Una inspección visual de este gráfico no revela ninguna desviación


significativa de la presunción de normalidad para los residuales.

slide 61
Análisis de residuales

Trazo de Residuales vs. Orden de Experimentación

Residuals Versus the Order of the Data


(response is % Diss)

0
Residual

-5

-10
2 4 6 8 10 12 14 16 18 20 22 24
Observation Order

Ningún patrón aparente se muestra en el mismo.

slide 62
Pruebas después de ANOVA

 Diferencia Mínima Significativa (Least Significant Difference)


 Después que Anova rechaza la Hipótesis nula entonces queremos
hacer pruebas con la siguiente formulación:
Ho: i = j para toda i  j
 Esto puede realizarse empleando la estadística t

yi .  y j .
t
1 1
MSE  
 ni n j 

slide 63
Pruebas después de ANOVA

 Si presumimos una prueba en dos direcciones (dos colas),


declararemos que una pareja de promedios i, j será
signifcativamente diferente si:

1 1
y i .  y j .  t / 2 , N  a MSE  
 ni n j 
 A la expresión de la derecha es a lo que conocemos como la diferencia
mínima significativa (LSD).
 En resumen decimos que una pareja de promedios i, j difieren si:

yi .  y j .  LSD

slide 64
Pruebas después de ANOVA

Fisher 95% Individual Confidence Intervals


All Pairwise Comparisons among Levels of Sinker

Simultaneous confidence level = 73.57%

Sinker = G1 subtracted from:

Sinker Lower Center Upper +---------+---------+---------+---------


G2 -9.223 -4.600 0.023 (---*----)
G3 -18.623 -14.000 -9.377 (----*----)
G4 -3.823 0.800 5.423 (----*---)
G5 -3.623 1.000 5.623 (----*----)
+---------+---------+---------+---------
-20 -10 0 10

Sinker = G2 subtracted from:

Sinker Lower Center Upper +---------+---------+---------+---------


G3 -14.023 -9.400 -4.777 (----*---)
G4 0.777 5.400 10.023 (---*----)
G5 0.977 5.600 10.223 (----*---)
+---------+---------+---------+---------
-20 -10 0 10

Sinker = G3 subtracted from:

Sinker Lower Center Upper +---------+---------+---------+---------


G4 10.177 14.800 19.423 (----*---)
G5 10.377 15.000 19.623 (----*----)
+---------+---------+---------+---------
-20 -10 0 10

Sinker = G4 subtracted from:

Sinker Lower Center Upper +---------+---------+---------+---------


G5 -4.423 0.200 4.823 (---*----)
+---------+---------+---------+---------
-20 -10 0 10

slide 65
Bloque completamente aleatorio

 En muchos problemas experimentales, es necesario diseñar de forma tal que la


variabilidad causada por fuentes ajenas a nuestro interés pueden ser
sistemáticamente controladas. Cuando existe una sola fuente extraña (ajena) a
nuestro interés, decimos que esa fuente o ese factor debe ser “bloqueado” con el fin
de alejar su variabilidad del error experimental y así poder reducir el mismo.
Experimentos de este tipo se conocen como Bloque Completamente Aleatorio.

yij =  + i + j + ij

 = promedio general

i = efecto del bloque

j = efecto del tratamiento j

ij = error o residual

slide 66
Bloque completamente aleatorio Ejemplo

 Suponga que en el ejemplo de los “sinkers” existen cinco baños (“vessels”) en


dende se sumerjen los mismos. Los datos obtenidos se presentan en la
siguiente tabla:

“Sinker Geometry”

Vessel G1 G2 G3 G4 G5

1 98 95 91 101 94

2 99 94 84 98 100

3 100 89 88 100 98

4 99 96 83 98 103

5 95 94 75 98 101

slide 67
Bloque completamente aleatorio Ejemplo

 Considerando tanto la “sinkers” como los baños en ANOVA, obtenemos la siguiente


gráfica:

Analysis of Variance for %DISSOLUTION, using


Adjusted SS for Tests

Source DF Seq SS Adj SS Adj MS F P


Vessel 4 34.56 34.56 8.64 0.66 0.632
Sinker 4 811.76 811.76 202.94 15.39 0.000
Error 16 211.04 211.04 13.19
Total 24 1057.36

S = 3.63180 R-Sq = 80.04% R-Sq(adj) = 70.06%

slide 68
Cuadrado Latino

 Diseño utilizado cuando existen dos fuentes de variación


ajenas o extrañas a nuestro interés y se quiere controlar las
mismas de forma sistemática para así poder disminuir el error
experimental. Decimos entonces que si “bloqueamos” dos
fuentes de variabilidad podemos tener un diseño cuadrado
latino.
Yijk =  + i + j + k + ijk
 = promedio general
i = efecto del bloque columna
j = efecto del bloque fila
k = efecto del tratamiento K
ijk = error o residual

slide 69
Cuadrado Latino - Ejemplo

 Un ingeniero investiga el efecto de cuatro métodos de ensamblaje (A,


B, C, D) en el tiempo necesario para ensamblar un componente
utilizado en televisores. Cuatro operadores son seleccionados para el
estudio. Cada ensamblaje puede producir algo de fatiga por lo que el
orden en que los operadores usen los distintos métodos puede afectar
el tiempo. Los datos recopilados se presentan a continuación.

Operador

Orden 1 2 3 4
1 C = 10 D = 14 A=7 B=8
2 B=7 C = 18 D = 11 A=8
3 A=5 B = 10 C = 11 D=9
4 D = 10 A = 10 B = 12 C = 14

slide 70
Cuadrado Latino - Ejemplo

 Considerando sólo el método como fuente de variación,


obtenemos el siguiente resultado.

One-way Analysis of Variance

Analysis of Variance for Tiempo


Source DF SS MS F P
Metodo 3 72.50 24.17 3.60 0.046
Error 12 80.50 6.71
Total 15 153.00
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev -------+---------+---------+--------
-
A 4 7.500 2.082 (-------*-------)
B 4 9.250 2.217 (-------*-------)
C 4 13.250 3.594 (-------*-------)
D 4 11.000 2.160 (-------*-------)
-------+---------+---------+--------
-
Pooled StDev = 2.590 7.0 10.5 14.0

slide 71
Cuadrado Latino - Ejemplo
 Considerando operador, orden y métodos como fuentes de
variación, obtenemos el siguiente resultado.

General Linear Model

Factor Type Levels Values


Metodo fixed 4 A B C D
Operador fixed 4 1 2 3 4
Orden fixed 4 1 2 3 4
Analysis of Variance for Tiempo, using Adjusted SS for Tests
Source DF Seq SS Adj SS Adj MS F P
Metodo 3 72.500 72.500 24.167 13.81 0.004
Operador 3 51.500 51.500 17.167 9.81 0.010
Orden 3 18.500 18.500 6.167 3.52 0.089
Error 6 10.500 10.500 1.750
Total 15 153.000

slide 72
Experimentos Factoriales

 Muchos experimentos envuelven el estudio de los efectos de


dos o más factores. Puede demostrarse que, en general, los
diseños factoriales son los más eficientes para este tipo de
experimentos.
 Definimos un Experimento Factorial como uno en donde
existen dos o más factores, en donde todas las condiciones
experimentales son llevadas a cabo de forma completamente
aleatoria.

slide 73
Experimentos Factoriales

 Características de los experimentos factoriales:

 Dos o más factores son considerados.


 Todas las posibles combinaciones de los niveles de los factores son
investigadas.
 Son más eficientes que variar un factor a la vez (lo veremos).
 Son necesarios cuando las interacciones están presentes (lo veremos).
 Las unidades son sometidas a los distintos tratamientos de forma
completamente aleatoria.
 Nos permite estimar los efectos de un factor a través de distintos niveles
de otros factores, logrando conclusiones válidas en un rango de
condiciones experimentales.

slide 74
Experimentos Factoriales

4x3 2 x 2 - 22 2 x 2 x 2 - 23

2 x 2 x 2 x 2- 24 2 x 2 x 2 x 2 x 2 - 25

slide 75
Experimentos Factoriales

Factorial
No se observa

Variando un factor a la vez

2 x 2 - 22
Factorial
No se observan

Variando un factor a la vez

2 x 2 x 2 - 23

slide 76
Experimentos Factoriales
Interacción – No Presente Interacción – Presente

B- B-

B+
Respuesta

B+

A- A+ A- A+
A A

slide 77
Conceptos fundamentales del modelo lineal de
regresión
y = 0 + 1 X1 + 2 X2 + 3 X1 X2 + 

Vector Observaciones Matriz de Diseño Vector Coeficientes Vector Errores


 y1  1 x11 x12 .. x1k   0   1 
y  1 x x22 .. x2 k     
 2  21   1  2
y: X  : : : .. :  :  :
       
: : : : .. :  : :
 yn  1 xn1 xn 2 .. xnk  k  n 

y = X + 

L
L         y  X  y  X   2 X ' y  2 X ' Xb  0
n '
2 '

i 1
i  b
Típicamente Matriz
L  y y   X y  y X   X X
' ' ' ' ' '
X Xb  X y
' '
Diagonal

= y y  2  X y   X X
b   X 'X  X 'y
' ' ' ' '
1

Estimado de Coeficientes

slide 78
Introducción a los experimentos factoriales -
Ejemplo
 El efecto de un factor se define como el cambio
promedio en la respuesta, cuando cambiamos los niveles
del mismo.
 De forma similar definimos el contraste de un factor
como el cambio total en la respuesta cuando los niveles
de éste son cambiados.

slide 79
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial
 Considere la siguiente tabla que muestra el experimento factorial
más pequeño posible, dos factores cada uno a dos niveles. En el
mismo, cuatro repeticiones fueron tomadas en cada condición
experimental

Factor B

Factor A 1 2
145, 148, 147, 135, 138, 141,
1 140 139
total = 580 total = 553
158, 152, 155, 150, 152, 146,
2 152 149
total = 617 total = 597

slide 80
Introducción a los experimentos factoriales -
Ejemplo 1 Factorial

 Definimos los efectos y contrastes de la siguiente manera:

EFECTOA = [(617 + 597) - (580 + 553)] / 8 = 10.125

CONTRASTEA = [(617 + 597) - (580 + 553)] = 81

EFECTOB = [(553 + 597) - (580 + 617)] / 8 = -5.875

CONTRASTEB = [(553 + 597) - (580 + 617)] = 47

slide 81
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial

 En algunos experimentos existe la posibilidad de


encontrar que la diferencia en la respuesta entre los
niveles de un factor no es la misma a todos los niveles
de los otros factores. Cuando esto ocurre decimos que la
interacción entre los factores considerados está
presente.

EFECTOAB = [(597 + 580) - (617 + 653)] / 8 = .875

CONTRASTEAB = [(597 + 580) - (617 + 653)] = 7

slide 82
Introducción a los experimentos factoriales
– Ejemplo 1 Factorial

 El efecto de A es positivo esto implica que cambiar este factor de su


nivel 1 al 2 aumenta la respuesta. El factor B en cambio, al ser
negativo disminuye la respuesta cuando cambiamos de su nivel 1 al 2.
El efecto de la interacción entre los dos factores podríamos decir que
es despreciable cuando se comparan con los factores principales.
Cuando K factores son considerados a dos niveles en un experimento
factorial, a este tipo de experimento le llamamos experimentos
factoriales 2K. Para estos experimentos podemos obtener la suma de
cuadrados para cada una de las fuentes de variación usando la
siguiente relación:

SS FUENTE 

ContrasteFUENTE
2

n  2K
 donde n es el número de repeticiones en cada condición experimental
y K es el número de factores considerados en el experimento.

slide 83
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial
 A continuación se presenta la tabla de ANOVA para el experimento
descrito provista por MINITAB.
Source DF Seq SS Adj SS Adj MS F P
A 1 410.06 410.06 410.06 49.08 0.000
B 1 138.06 138.06 138.06 16.53 0.002
A*B 1 3.06 3.06 3.06 0.37 0.556
Error 12 100.25 100.25 8.35
Total 15 651.44

 Note que la misma suma de cuadrados para el factor A se hubiese


obtenido usando:

 81 2
SS A   410.0625
4  22

slide 84
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial

 De la tabla ANOVA podemos concluir que la interacción en


este caso no resulta relevante, el ‘valor p’ que se obtuvo para el
término de la interacción es .556. Gráficamente esto se
muestra en la siguiente Figura. Como puede observarse
independientemente del nivel de A, la respuesta disminuye
cuando el factor B es ajustado a su nivel 2. Mientras más
paralelas estas líneas menos presente estará la interacción de
los factores. Interaction Plot - Means for respuest

A
155 -1
1
-1
150 1
Mean

145

140

-1 1

slide 85
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial
 En la próxima Figura se muestra el comportamiento de los factores
principales a través de sus pendientes. Note la pendiente positiva para el
factor A, así como la pendiente negativa para el factor B. También se
observa una pendiente más inclinada para el factor A que para el B como
muy bien indicaban los efectos para estos factores (10.125, para A y -5.875
para B).

Main Effects Plot - Means for respuest

152.0

149.5
respuest

147.0
 y = Efecto de A
144.5

142.0
x=2

A B

slide 86
Introducción a los experimentos factoriales –
Ejemplo 1 Factorial

 Resulta muy sencillo convertir los estimados de


los efectos de un diseño factorial 2K en un
modelo de regresión que puede ser utilizado
para predecir la respuesta en cualquier punto
del espacio contenido dentro de la región
experimental.
 Como podemos notar en la figura anterior, la
pendiente o coeficiente se obtendría de dividir
efecto (y) / 2.

slide 87
Conceptos fundamentales del modelo lineal de
regresión

 Considere la siguiente figura para el próximo ejemplo , en esta


situación observamos como el factor Temperatura tiene una influencia
mayor sobre la variable respuesta (Dureza) si se compara con el otro
factor del experimento, el factor Presión. Decimos esto por que la
variable Temperatura tiene una pendiente mucho más inclinada que la
presentada por el factor Presión. Nos resulta entonces relevante
determinar las pendientes de los factores de interés en el experimento
como un método para comparar su importancia a la hora de explicar la
variable respuesta.

34
32
30
28
Dureza 26
24
22
20
-1
-1
0
Temperatura 0
Presion
1 1

slide 88
Conceptos fundamentales del modelo lineal de
regresión

 Un método para determinar estas pendientes y establecer un


modelo matemático es lo que conocemos como el modelo de
regresión. Para la situación presentada, si se considera un
modelo lineal, el modelo de regresión sería:

y = 0 + 1 X1 2 X2 + 
 donde X1 y X2 representan los factores del experimento, las ´s
representan los coeficientes del modelo de regresión y 
representa el error o residuo del modelo.En formato de matrices
el modelo de regresión puede ser representado así:

y = X + 

donde

slide 89
Conceptos fundamentales del modelo lineal de
regresión

 y1  1 x11 x12 .. x1k   0   1 


y  1 x x22 .. x2 k     
 2  21   1  2
y: X  : : : .. :  :  :
       
: : : : .. :  : :
 yn  1 xn1 xn 2 .. xnk  k  n 

En general y es un vector (n x 1) de las observaciones del


experimento, X es la matriz de diseño (n x p) de los niveles de las
variables independientes o factores del experimento,  es un
vector (p x 1) de los coeficientes del modelo de regresión y  es un
vector (n x 1) de errores o residuales.

slide 90
Conceptos fundamentales del modelo lineal de
regresión
 Nuestro objetivo al construir un modelo de regresión lineal es el de
estimar los coeficientes  basándonos en algún criterio. El criterio
más utilizado es el de minimizar la suma del cuadrado de los
errores. En otras palabras, queremos encontrar aquellos
estimadores de los coeficientes que minimicen

 pero L puede ser expresada


L         y  X  y  X 
n '
2 '
i
i 1

L  y y   X y  y X   X X
' ' ' ' ' '

= y y  2  X y   X X
' ' ' ' '

slide 91
Conceptos fundamentales del modelo lineal de
regresión

 el término es un escalar así como su transpuesta, por esta


razón podemos agrupar el segundo término de esta manera.
La derivada de L con respecto a  resulta en:

L
 2 X ' y  2 X ' Xb  0
 b

 lo que simplifica a

X Xb  X y
' '

 entonces los estimadores para los coeficientes que minimizan la


suma del cuadrado de los errores se obtienen

b   X 'X  X 'y
1

slide 92
Conceptos fundamentales del modelo lineal de
regresión

 Las propiedades de la varianza de b se expresan mediante la


matriz de varianza-covarianza. Esta es una matriz simétrica de
tamaño (p x p) cuyos elemento jj de la diagonal es la varianza
de bj y cuyo elemento (i, j) representa la covarianza entre los
elementos bi y bj. La matriz de covarianza del vector b esta
dada por

Cov(b) =  2
X X
' 1

slide 93
Conceptos fundamentales del modelo lineal de
regresión

 Con regularidad será necesario estimar 2. Para desarrollar un


estimador de este parámetro considere la suma de cuadrados
del residual que está dada por

 
n 2 n
SS E   y  yi   ei2  e'e
i 1 i 1

=  y  Xb  y  Xb
'

= y ' y  2b' X 'b  b' X ' Xb


 y ' y  b' X ' y

slide 94
Conceptos fundamentales del modelo lineal
de regresión
 Se puede demostrar que E(SSE) = 2 (n - p), por lo que
un estimador no sesgado para = 2 está dado por

SSE
 
2
n p

slide 95
Conceptos fundamentales del modelo lineal de
regresión

 Suponga que se realiza


el siguiente Presión
experimento para el
ejemplo donde se mide 40 (35) (22)
la dureza como función
30
de temperatura y
presión en un proceso. 20 (25) (20)
Note que se tomó una
observación en cada
una de cuatro
condiciones 100 150 200

experimentales (la Temperatura

respuesta obtenida se
muestra en paréntesis).

slide 96
Conceptos fundamentales del modelo lineal de
regresión
 El siguiente es el modelo lineal de regresión obtenido de MINITAB al
ejecutar los comandos <<Stat>> y <<Regresión>>:

Dureza = 30.0 - 0.0900 Temperatura + 0.300 Presión

 cuando los datos fueron entrados en las siguientes tres columnas

Temperatura Presion Dureza


100 20 25
100 40 35
200 20 20
200 40 22

slide 97
Conceptos fundamentales del modelo lineal de
regresión
 Resulta de interés responder las siguientes dos
preguntas con respecto al modelo lineal presentado.
 ¿ Qué interpretación física le podemos dar a la constante (ó
intercepto como comúnmente llamamos) en el modelo?
 De examinar el modelo, ¿podría usted concluir que factor tiene
mayor impacto en la dureza, Temperatura o Presión?

slide 98
Conceptos fundamentales del modelo lineal de
regresión

 En el caso de la primera pregunta, la interpretación que


comúnmente damos a un intercepto no es aplicable en este
caso porque ninguno de los rangos de experimentación para
los factores incluyen el cero que es lo usamos de referencia
para interpretar el intercepto.
 Las escalas de los niveles de los factores no se espera que
coincidan porque miden distintas características por lo que los
coeficientes de los factores no son comparables. Este es el
caso, en este modelo aunque el plano de la figura que inicia
esta sección muestra que la Temperatura es más influyente
que la Presión, eso no parece verse reflejado en el modelo
cuando notamos que el coeficiente para Presión es .30
mientras que el coeficiente de Temperatura es -.09. Esto es
una consecuencia de las escalas.

slide 99
Conceptos fundamentales del modelo lineal de
regresión

 Por las dos razones expuestas y por otras que iremos


descubriendo más adelante en el curso en los modelos lineales
preferimos usar variables codificadas. La relación entre las
variables naturales (medidas en su escala original) y las
variables codificadas está dada por :

Xi 
   
i
rango
2
 donde es la variable codificada,  i es la variable natural
y 
Xes
i
el promedio de los niveles de la variable a ser
codificada. Cuando las variables naturales tienen sólo dos
niveles cómo es el caso de los experimentos 2K, la codificación
va a producir niveles + 1 para las variables codificadas. Para
ilustrar este procedimiento en nuestro ejemplo, note que
 Temp.150
Xi 
100 / 2

slide 100
Conceptos fundamentales del modelo lineal de
regresión
 lo que resultaría en una nivel + 1 para el nivel alto de la variable
codificada y un nivel -1 para el nivel bajo de la variable codificada.
La siguiente tabla muestra las columnas entradas con las variable
codificadas y la respuesta en MINITAB para el ejemplo de la dureza
para las variable codificadas.

Temperatura Presion Dureza


-1 -1 25
-1 1 35
1 -1 20
1 1 22

slide 101
Conceptos fundamentales del modelo lineal de
regresión

 Estas columnas corresponden al mismo diseño en la región de las variables


codificadas como se presenta en la siguiente Figura.
Presión

+1 (35) (22)

-1 (25) (20)

-1 0 +1

Temperatura

 Usando las variables codificadas el siguiente es el modelo lineal de regresión


obtenido de MINITAB al ejecutar los comandos <<Stat>> y <<Regresión>> :
Dureza = 25.5 - 4.50 Temperatura + 3.00 Presion

slide 102
Conceptos fundamentales del modelo lineal de
regresión
 Los problemas que observamos con el modelo basado en las
variables naturales han sido corregidos con el uso de variables
codificadas. La constante 25.5, es ahora el valor de dureza esperado
cuando ambas variables se encuentran en el valor nominal o el nivel
medio de cada variable.
 Por otro lado ahora los coeficientes son comparables pues se
encuentran en la misma escala. Note como el factor Temperatura
tiene una pendiente negativa pero con magnitud mayor a la del
factor Presión como lo confirma la gráfica original del plano del
modelo lineal para este ejemplo.

slide 103
Conceptos fundamentales del modelo lineal de
regresión

 Suponga ahora que intentamos un modelo que no incluya la


variable Presión por no considerarla significativa. La siguiente
tabla muestra cuatro modelos, dos con variables naturales y
dos con variables codificadas y en cada una de estas
clasificaciones, modelos con el factor Temperatura solamente,
con el factor Presión solamente y modelos con ambos factores:
Temperatura y Presión.
Tipo de Coeficientes
Variable Constante Temperatura Presion
Natural 30 -.09 .30
Natural 39 -.09
Natural 16.50 .30
Codificada 25.5 -4.5 3.0
Codificada 25.5 -4.5
Codificada 25.5 3.0

slide 104
Conceptos fundamentales del modelo lineal de
regresión
 Otra de las ventajas de la codificación de los datos puede observarse de los
modelos en la tabla. Note como los coeficientes del modelo codificado no
cambian independientemente del modelo considerado. Lo mismo no puede
decirse del modelo con las variables naturales, note como la constante
cambia según cambiamos el modelo lineal de regresión.
 Frecuentemente nos interesa probar las hipótesis para distinguir qué
coeficientes dentro del modelo de regresión son significativos. La hipótesis
para probar la significación de cualquier coeficiente j, estaría dado por

H0: j = 0

H1: j  0

slide 105
Conceptos fundamentales del modelo lineal de
regresión

 Si esta hipótesis no es rechazada, esto indicaría que la variable


j, asociada con este coeficiente puede ser eliminada del
modelo. La estadística de prueba para efectuar dicha prueba
está dada por
bj
t0 
 2 Cjj

 donde Cjj es el elemento de la diagonal de la matriz de


varianza-covarianza (X’X)-1 correspondiente al coeficiente bj. La
hipótesis nula H0: j = 0 se rechaza si |t0| > t/2, n- k -1.

slide 106
Conceptos fundamentales del modelo lineal de
regresión

 El siguiente es el producto de MINITAB para nuestro Ejemplo


Factorial 1.
Fractional Factorial Fit

Estimated Effects and Coefficients for respuest

Term Effect Coef StDev Coef T P


Constant 146.688 0.7226 203.00 0.000
A 10.125 5.063 0.7226 7.01 0.000
B -5.875 -2.938 0.7226 -4.07 0.002
A*B 0.875 0.437 0.7226 0.61 0.556

 Note a través de los valores p, que este resultado coincide con


la ANOVA del Ejemplo Factorial 1. Existe esta correspondencia
entre análisis por medio de regresión y el análisis por ANOVA.

slide 107
Algunos conceptos relevantes en la
experimentación
 CONCEPTO DE EFECTOS FUNDIDOS
Considere la siguiente situación:
 Una prueba se conduce para determinar el efecto que pueda
tener la Temperatura y la Presión en la dureza de un material,
esta descripción es consistente con el segundo ejemplo factorial.
Las respuestas para los tratamientos aparecen en paréntesis
junto al círculo que indica la condición experimental efectuada.
Suponga que el experimento consiste de los siguientes dos
tratamientos.

slide 108
Algunos conceptos relevantes en la
experimentación

Presión

40 (35)

30

20 (25)

100 150 200


Temperatura

slide 109
Algunos conceptos relevantes en la
experimentación
 Pregunta :
 ¿ Porqué la dureza del material aumenta ?
 Respuesta :
 No sabemos, los efectos Presión y Temperatura están fundidos o lo
que es igual, no pueden ser separados en este experimento. En la
figura que sigue se muestra uno de todos los posibles planos que
pueden describir las respuestas obtenidas. Matemáticamente esto
puede notarse de la matriz de diseño X para este experimento. Primero
estamos tratando de resolver 3 desconocidas, intercepto y dos
coeficientes, con sólo dos ecuaciones y eso no es posible. Por otro lado,
note que la columna 3 es cinco veces la columna 2, por lo que la matriz
X’X no tendría inversa, el sistema no brindaría una solución única.

slide 110
Algunos conceptos relevantes en la
experimentación

1 100 20
X  
1 200 40

 La matriz de diseño de las variables codificadas XC , muestra la


dependencia lineal de forma más clara. Puede notarse como las columnas 2 y 3
son idénticas. 1  1  1
XC  
1 1 1 

Presión

40 (35)
Cualquier plano
30
que pase entre estos puntos
es una solución a este sistema
20 (25)

100 150 200


Temperatura

slide 111
Algunos conceptos relevantes en la
experimentación

 Para resolver el primero de los dos problemas


mencionados suponga que añadimos un tercer punto a lo
largo de la línea entrecortada como se muestra en la
siguiente figura:
Presión

40 (35)
(37)
Cualquier plano
30
que pase entre estos puntos
es una solución a este sistema
20 (25)

100 150 200


Temperatura

slide 112
Algunos conceptos relevantes en la
experimentación

 Este tercer punto no resolvería nada del segundo


problema que estamos tratando, todavía muchos planos
pasarían por estos tres puntos. Decimos pues, que aún
ambos factores: Temperatura y Presión completamente
fundidos. Al examinar la matriz X para este diseño nos
percatamos que las columnas son linealmente
dependientes. Esto es la columna 3 otra vez es cinco
veces la columna 2 cuando consideramos las variables
naturales mientras que la columna 2 y la 3 vuelven a ser
idénticas cuando se trabaja con variables codificadas.
1 100 20 1  1  1
   
X  1 150 30 X C  1 0 0
1 200 40 1 1 1 

slide 113
Algunos conceptos relevantes en la
experimentación

 Como podemos notar esto sucede porque los tratamientos


considerados en la experimentación están alineados. Una
alternativa que podemos considerar es la de mover un punto
fuera de la línea entrecortada. El diseño de la siguiente figura
muestra el punto del medio movido fuera de la línea.
Presión

40 (35)
(37)
30

20 (25)

100 150 200

Temperatura

slide 114
Algunos conceptos relevantes en la
experimentación
 Este plano está definido de forma única, así que las pendientes o efectos de ambos
factores podrán ser determinadas. No obstante, este plano no es muy estable y
pequeñas variaciones en la variable respuesta harán que el plano potencialmente
cambie de forma drástica. Se puede señalar que para esta situación los efectos están
parcialmente fundidos pero no completamente fundidos como resultaban en el caso 1
y caso 2.
 Este concepto puede observarse de la matriz (X’X)-1 cuyos elementos en la diagonal
representan el estimado de varianza para el coeficiente b correspondiente mientras
que los elementos fuera de la diagonal en esta matriz representan las covarianzas
entre los correspondientes coeficientes. Por lo tanto, una condición deseable para la
matriz (X’X)-1 es que la misma sea una matriz diagonal. Más adelante los
experimentos factoriales 2K balanceados cumplen con esta condición.

slide 115
Algunos conceptos relevantes en la
experimentación
 Regresando al caso 3 de la Figura 9, la siguiente es la matriz de diseño X.
1 100 20
X  1 150 33
 
1 200 40
 De esta matriz obtenemos la matriz (X’X)-1. Los elementos fueran de la
diagonal muestran que existe una relación parcial entre los coeficientes.

 5.00 0.00333  016667


. 
 
(X’X)-1 =  0.00333 0.00687  0.03333
 016667
.  0.03333 016667
. 

slide 116
Algunos conceptos relevantes en la
experimentación
 Este concepto también pudo haber sido observado con las variables
codificadas. Para este caso la matriz de diseño Xc sería
1  1  1
 
X C  1 0 0.3
1 1 1 

 Lo que resultaría en una matriz (XC’XC)-1. Donde nuevamente


pueden observarse que los elementos de la diagonal no todos
exhiben cero.
 0.5000 1.6667  1.6667 
 
X '
C XC 
1
  1.6667 171667
.  16.6667
 1.6667  16.6667 16.6667 

slide 117
Algunos conceptos relevantes en la
experimentación

 El impacto de que los coeficientes estén parcialmente fundidos puede


observarse de tratar varios modelos incluyendo todas las variables y modelos
que incluyen algunas de ellas. Cuando la relación entre las variables es alta
notaremos como los coeficientes pueden cambiar drásticamente no sólo en
magnitud si no también en dirección. Para el caso 3 los siguientes son tres
modelos cuando consideramos las variables codificadas:

respuesta = 30.0 - 18.3 Temperatura + 23.3 Presion

respuesta = 32.3 + 5.00 Temperatura

respuesta = 31.8 + 5.53 Presion

 La interpretación de estos modelos ahora es compleja, ¿cuál es el modelo


razonable?, el factor Temperatura ¿tendrá realmente un efecto positivo o
negativo sobre la respuesta?. Ante la dificultad de responder a estas preguntas
señalamos que la estrategia que seguimos de separar un punto, como lo
hicimos en el caso 3, no fue tan buena estrategia.

slide 118
Algunos conceptos relevantes en la
experimentación

 La figura que sigue muestra un nuevo diseño para la misma


situación incluyendo cuatro puntos. Los puntos se han colocado
en los extremos de la región experimental, obteniendo así un
diseño muy estable. Este diseño corresponde a un experimento
factorial 2k, como ya habíamos visto en la sección anterior.
Presión

40 (35)
(37)

30

20 (25) (22)

100 150 200

Temperatura

slide 119
Algunos conceptos relevantes en la
experimentación
 En variables codificadas, la siguiente es la matriz de diseño XC,
1  1  1
1  1 1 
XC   
1 1  1
 
1 1 1

 Lo que resultaría en una matriz (XC’XC)-1

1 / 4 0 0 
 
X '
C XC 
1
  0 1/ 4 0 
 0 0 1 / 4

slide 120
Algunos conceptos relevantes en la
experimentación
 Como puede observarse los coeficientes en este caso no tendrán influencia sobre los
demás, resultando en el mismo estimado del coeficiente independiente del modelo
lineal considerado. Así puede comprobarse de los siguientes modelos obtenidos de
MINITAB para este diseño:
respuesta = 29.8 - 1.25 Temperatura + 6.25 Presion

respuesta = 29.8 - 1.25 Temperatura

respuesta = 29.8 + 6.25 Presion

 Con este ejemplo hemos intentado cubrir algunos aspectos fundamentales de la


experimentación, lo relevante de las variables codificadas, las características de la
matriz (X’X)-1, los elementos positivos de los experimentos factoriales , y otras
consideraciones.

slide 121
Experimentos 2k con una sola réplica
 El número de tratamientos necesarios para conducir experimentos
factoriales aún para experimentos con un número moderado de
factores es bastante alto. Por ejemplo, cinco factores requerirían 32
tratamientos, seis necesitarían 64 tratamientos, etc. Debido a que
los recursos son regularmente limitados muy pocas veces podemos
tomar muchas repeticiones en cada condición experimental. Más
aún, en algunas ocasiones todo lo que nos permite el presupuesto
es realizar una sola observación en cada condición experimental.
Cuando esto sucede no tenemos estimado del error.

slide 122
Experimentos 2k con una sola réplica
 Para este problema, Daniels sugiere trazar los estimados de los efectos en
un gráfico de probabilidad normal. Los efectos no significativos, según este
autor, estarán normalmente distribuidos, con promedio cero (0) y varianza 2
y además van a tender a formar una línea recta en el gráfico. Aquellos
factores que sean significativos, en cambio, tendrán promedios distintos de
cero y se alejarán de la línea formada por los no significativos.
 Veamos el Ejemplo Factorial 3: Un experimento 24 con una sola observación
por tratamiento se conduce para ver el impacto que tienen en la razón de
filtración de un producto los factores: A (Temperatura), B (Presión), B
(Concentración de Compuesto) y D (Velocidad de Agitado).

slide 123
Experimentos 2k con una sola réplica

 La siguiente figura, muestra las 16 respuestas obtenidas del


experimento que se ejecutó de forma completamente aleatoria

Cube Plot - Means for filtraci

80 65 70 96

48 65 45 104
1

B 68 60 75 86
1

45 71 C 43 100
-1 -1

-1 1
A

-1 D 1

slide 124
Experimentos 2k con una sola réplica

 Siguiendo el procedimiento recomendado por Daniels es necesario


obtener el estimado de los efectos para todas las fuentes de variación.
EL siguiente es el resultado de MINITAB para un experimento como el
descrito.
Fractional Factorial Fit
Estimated Effects and Coefficients for filtraci

Term Effect Coef


Constant 70.062
A 21.625 10.813
B 3.125 1.563
C 9.875 4.938
D 14.625 7.312
A*B 0.125 0.063
A*C -18.125 -9.063
A*D 16.625 8.312
B*C 2.375 1.187
B*D -0.375 -0.187
C*D -1.125 -0.562
A*B*C 1.875 0.937
A*B*D 4.125 2.063
A*C*D -1.625 -0.812
B*C*D -2.625 -1.312
A*B*C*D 1.375 0.687

slide 125
Experimentos 2k con una sola réplica

 Como podemos notar simplemente observando la magnitud de


estos efectos parecen distinguirse los efectos: A, C, D, AC y
AD. El gráfico de probabilidad normal para estos efectos se
muestra en la figura que se muestra a continuación.
Normal Probability Plot of the Effects
(response is filtraci, Alpha = .05)

A: A
A B: B
C: C
AD D: D

1 D
C
Normal Score

-1

AC

-20 -10 0 10 20

Effect

slide 126
Experimentos 2k con una sola réplica
 Usando este análisis los efectos que emergen del mismo como
relevantes o significativos vuelven a ser los efectos principales A, C,
D y las interacciones AC y AD. Note como los otros efectos se
alinean alrededor del cero (0) indicando que no son significativos.
Puede notar también que MINITAB solo nombra aquellos factores
cuyo efecto parece distanciarse de la línea.
 La siguiente figura muestra los efectos principales y las
interacciones de forma gráfica obtenidos de MINITAB.

slide 127
Experimentos 2k con una sola réplica

Main Effects for filtraci

-1 1 -1 1 -1 1 -1 1

80

75

filtraci
70

65

60

A B C D

Interaction Plot for filtraci


-1 1 -1 1 -1 1

-1

-1

C
1

-1

slide 128
Experimentos 2k con una sola réplica
 Note como una vez más se muestra que el factor B y sus interacciones
parecen no tener un impacto significativo en la respuesta. Por lo que
podríamos descartar este factor del experimento y proyectar el experimento
original en un experimento 23 con dos repeticiones por tratamiento. Esta
propiedad de proyección es otra ventaja del experimento factorial.
 Teóricamente ahora podríamos construir una tabla de ANOVA porque la
proyección a creado una réplica (algunos estadísticos discrepan de esta
metodología). MINITAB proporcionaría el siguiente ANOVA si proyectamos
el experimento al número reducido de dimensiones. Las mismas cinco
fuentes de variación son distinguidas como significativas.

slide 129
Experimentos 2k con una sola réplica

General Linear Model

Analysis of Variance for filtraci


Source DF Seq SS Adj SS Adj MS F P
A 1 1870.56 1870.56 1870.56 83.37 0.000
C 1 390.06 390.06 390.06 17.38 0.003
D 1 855.56 855.56 855.56 38.13 0.000
A*C 1 1314.06 1314.06 1314.06 58.57 0.000
A*D 1 1105.56 1105.56 1105.56 49.27 0.000
C*D 1 5.06 5.06 5.06 0.23 0.647
A*C*D 1 10.56 10.56 10.56 0.47 0.512
Error 8 179.50 179.50 22.44

slide 130
Experimentos 2k con una sola réplica
 El modelo lineal de regresión proyectado en los tres factores A, B
y C confirmaría estos resultados.

Fractional Factorial Fit

Estimated Effects and Coefficients for filtraci


Term Effect Coef StDev Coef T P
Constant 70.062 1.184 59.16 0.000
A 21.625 10.813 1.184 9.13 0.000
C 9.875 4.938 1.184 4.17 0.003
D 14.625 7.312 1.184 6.18 0.000
A*C -18.125 -9.063 1.184 -7.65 0.000
A*D 16.625 8.312 1.184 7.02 0.000
C*D -1.125 -0.563 1.184 -0.48 0.647
A*C*D -1.625 -0.812 1.184 -0.69 0.512

slide 131
Puntos centrales en los experimentos 2k
 Cuando efectuamos un experimento 2K lo hacemos bajo la suposición de
que los efectos tienen un comportamiento lineal.
 Existe la posibilidad de efectuar observaciones en ciertos puntos de nuestra
región experimental para detectar la presencia de curvatura en la misma, así
como el de propiciar un estimado de error independiente.
 El método para lograr esto consiste en añadir repeticiones en el punto
central del experimento 2K. Los nC puntos centrales se conducen en el
experimento en el nivel codificado Xi = 0 (i =1, 2, …, K).
 Esto se hace bajo la suposición que los K factores son cuantitativos,
veremos el impacto de que algunos de los factores sea cualitativo más
adelante. Algo obvio que puede ser señalado en este instante es que
factores de tipo cualitativo no tienen un nivel central.

slide 132
Puntos centrales en los experimentos 2k
 Suponga que tiene un experimento factorial 22 con una observación en cada
punto factorial (- , -), (- , +), (+ , -) y (+ , +) así como cinco (nC = 5)
observaciones en el nivel (0 , 0). Gráficamente esto se muestra en la figura
que sigue.

0 5 observaciones

-1

-1 0 1

slide 133
Puntos centrales en los experimentos 2k
 Si definimos como el promedio de las observaciones en las cuatro corridas
del experimento factorial y como el promedio de las nC observaciones en los
puntos centrales, entonces podemos decir que si la diferencia entre estos
promedios (-) es grande, la curvatura existe.
 Una suma de cuadrados para discriminar si la curvatura es o no significativa
está dada por
nF nC  y F  y C 
2

SS CURVATURA 
nF  nC

 Esta suma de cuadrados, con 1 grado de libertad, se compara con la media


del cuadrado del error para probar la existencia de curvatura.

slide 134
Puntos centrales en los experimentos 2k
Ejemplo

 Un ingeniero está estudiando el rendimiento de un proceso químico.


Las dos variables de interés en este estudio resultan ser: Tiempo de
Reacción y Temperatura de Reacción. Para cuidarse contra la
posibilidad de la existencia de curvatura se decide efectuar un
experimento factorial 22 con cinco puntos centrales.
 Las siguientes son las respuestas obtenidas del estudio:
Data Display

Row Tiempo Temperatura rendimiento


1 -1 -1 39.3
2 1 -1 40.9
3 -1 1 40.0
4 1 1 41.5
5 0 0 40.3
6 0 0 40.5
7 0 0 40.7
8 0 0 40.2
9 0 0 40.9

slide 135
Puntos centrales en los experimentos 2k
Ejemplo

 El ANOVA así como el modelo de regresión obtenido de


MINITAB se presenta a continuación:
Fractional Factorial Fit
Estimated Effects and Coefficients for rendimie

Term Effect Coef StDev Coef T P


Constant 40.4778 0.08795 460.26 0.000
Tiempo 1.5500 0.7750 0.13192 5.87 0.002
Temperat 0.6500 0.3250 0.13192 2.46 0.057
Tiempo*Temperat -0.0500 -0.0250 0.13192 -0.19 0.857

Analysis of Variance for rendimie

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 2.82500 2.82500 1.41250 20.29 0.004
2-Way Interactions 1 0.00250 0.00250 0.00250 0.04 0.857
Residual Error 5 0.34806 0.34806 0.06961
Curvature 1 0.02006 0.02006 0.02006 0.24 0.647
Pure Error 4 0.32800 0.32800 0.08200

slide 136
Puntos centrales en los experimentos 2k
Ejemplo
 El mismo indica que ambos factores Tiempo y Temperatura
muestran efectos principales significativos y que tanto la interacción
como la curvatura no parecen ser significativas para explicar la
interacción en la región experimental. Note en este análisis, que los
puntos centrales se dividen en la tabla para el estimado de curvatura
y para el estimado del error llamado error puro.
 Luego discutiremos, que haríamos para obtener un modelo de orden
mayor si la curvatura hubiese resultado significativa.

slide 137
Concepto de bloques en los experimentos
factoriales 2k
 Existen muchas situaciones en las cuales no es posible efectuar
todos los tratamientos del experimento factorial bajo condiciones
homogéneas. Suponga que está construyendo aviones de papel,
¿cuántos aviones puede construir con un papel? En este caso
probablemente usted quiera considerar el papel como una fuente a
ser bloqueada.
 En otros ejemplos más industriales o prácticos podemos encontrar
que el tiempo (días), lote de material, operadores, etc. son fuentes
que necesitan ser bloqueadas en los correspondientes estudios.
Discutiremos ahora como se asignan los tratamientos en
experimentos factoriales 2K en donde algún efecto tenga que ser
bloqueado.

slide 138
Concepto de bloques en los experimentos
factoriales 2k

 Suponga que un experimento factorial 2K puede ser repetido n


veces. Una forma, si es posible, es correr cada réplica del
experimento en un bloque distinto. Las corridas dentro de cada
bloque se seguirían efectuando de forma completamente
aleatoria. Para un experimento 22 en donde se ejecutan 4
bloques completos la siguiente tabla muestra las fuentes con
sus correspondientes grados de libertad.

Fuente de Variación grados de libertad


Bloques 3
A 1
B 1
AB 1
Error 9
Total 16 - 1 = 15

slide 139
Concepto de bloques en los experimentos
factoriales 2k
 En muchas otras situaciones, resulta imposible ejecutar todos los
tratamientos de la repetición del experimento factorial en un solo
bloque. La técnica de confusión es una técnica de diseño utilizada
para asignar los tratamientos de un experimento factorial a los
bloques. Cuando utilizamos esta técnica tendremos que sacrificar o
hacer indistinguibles ciertas fuentes de variación del efecto de los
bloques.
 Por ahora vamos a considerar experimentos 2K contenidos en 2p
bloques, donde obviamente p < K. En esta estructura sólo será
posible construir experimento con un número de bloques
equivalentes a una potencia de 2, esto es, 2 , 8, 16 bloques ,etc.

slide 140
Concepto de bloques en los experimentos
factoriales 2k

 Suponga que va a ejecutar un experimento con dos factores


cada uno a dos niveles. La siguiente tabla muestra dos distintas
notaciones para identificar los tratamientos de este
experimento.
Tratamiento A B
(1) - -
a + -
b - +
ab + +

 Suponga además que efectuar un tratamiento toma cierto


número de horas lo que resulta en obtener solo dos
observaciones cada día. La pregunta que tenemos que
contestar ahora es la siguiente: ¿ cuáles tratamientos ejecuto
cada día ?. La contestación a esta pregunta determinará la(s)
fuente(s) de variación que se confunden con el efecto bloque.
Por lo tanto, es una pregunta que debemos tomar con mucho
cuidado.

slide 141
Concepto de bloques en los experimentos
factoriales 2k

 Suponga que los tratamientos son asignados de la siguiente manera:

Bloque 1

(1)
b

Bloque 2

a
ab

 Observando la asignación de tratamientos nos percatamos que el total para el


Bloque 1 corresponde al total del factor A cuando se encuentra en su nivel bajo,
mientras que el total para el Bloque 2 corresponde al total del factor A cuando
se encuentra en su nivel alto. Por lo tanto obtener una suma de cuadrados para
bloques y/o para el factor A resulta en una misma cosa. Decimos entonces que
las fuentes Bloques y el factor A se encuentran confundidas, por lo que esta
asignación de tratamientos fue una selección muy pobre ya que sacrificó la
información de un efecto principal.

slide 142
Concepto de bloques en los experimentos
factoriales 2k
 La práctica común que se sugiere a la hora de realizar estos
experimentos es la de confundir los efectos de las interacciones de
orden mayor con los bloques, en general, cuando es posible,
interacciones de tres factores y mayores.
 Considere ahora un experimento 23 en 2 bloques. Tendríamos ahora
que determinar cuales tratamientos corresponden a cada bloque.

slide 143
Concepto de bloques en los experimentos
factoriales 2k
 La tabla que se presenta a continuación, contiene los signos para las
fuentes de variación cuando se consideran los 8 tratamientos de
este experimento.

Tratamiento A B C AB AC BC ABC
(1) - - - + + + -
a + - - - - + +
b - + - - + - +
ab + + - + - - -
c - - + + - - +
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +

slide 144
Concepto de bloques en los experimentos
factoriales 2k

 Si seguimos el criterio de confundir con bloques la interacción de mayor orden,


para este ejemplo sacrificaríamos el efecto de la interacción de tres factores
ABC. Los bloques quedarían constituidos así

Bloque 1 Bloque 2
(1) a
ab b
ac c
bc abc
 Podemos concluir, que siempre que deseemos dividir los tratamientos de un
diseño factorial 2K en 2 bloques seleccionaremos la interacción de orden mayor
como el efecto a confundirse con el bloque. Note que en un caso como este,
donde hay dos bloques, un (1) grado de libertad le corresponde a esta fuente de
variación. Por esta razón es que solo sacrificamos un efecto (recuerde que en
un exp. 2K todas las fuentes de variación, exceptuando al error, tienen un (1)
grado de libertad).

slide 145
Concepto de bloques en los experimentos
factoriales 2k
 Trabajemos ahora con un ejemplo donde el experimento por
necesidad tenga que ser dividido en cuatro (4) bloques incompletos.
Suponga que tiene un experimento 25, si cada bloque puede
contener 8 tratamientos, entonces necesitará 4 de estos.
 En circunstancias como la descrita será necesario seleccionar dos
efectos para confundirlos con los bloques. Tiene que tener
precaución porque el seleccionar las interacciones de orden mayor
en esta ocasión no necesariamente produce el mejor esquema de
experimentación. Este concepto será discutido en detalle más
adelante.

slide 146
Concepto de bloques en los experimentos
factoriales 2k
 Digamos que usted selecciona, los efectos ADE y BCE. Para determinar la
ubicación de los tratamientos en los bloques, deberá construir una tabla de
signos que contenga por filas los 32 tratamientos y por columnas las 31
fuentes de variación. Si las columnas de los efectos ADE y BCE son
consideradas habrá exactamente cuatro patrones de signos para las
mismas. Estos patrones se muestran en la siguiente tabla

ADE BCE
- -
+ -
- +
+ +

slide 147
Concepto de bloques en los experimentos
factoriales 2k
 El diseño se construye agrupando los tratamientos por patrones de signos.
Aquellos correspondientes a (- , -) en un bloque, los correspondientes a (+ ,
-) en otro y así sucesivamente. Los bloques quedarían constituidos así:

Bloque 1 Bloque 2 Bloque 3 Bloque 4


ADE - + - +
BCE - - + +
(1) abe a bc b abce e abcde
ad ace d abde abd ae ade bd
bc cde abc ce c bcde bce ac
abcd bde bcd acde acd de ab cd

slide 148
Concepto de bloques en los experimentos
factoriales 2k
 Una inspección cuidadosa de su tabla de signos lo hará notar que el efecto
ABCD también está confundido con bloques. Cualquier pareja de estos tres
efectos: ADE, BCD, ABCD hubiese generado los mismos cuatro (4) bloques.
Esto se debe a que cuando tenemos cuatro bloques, estos tendrán tres (3)
grados de libertad y la pareja seleccionada solo tendría dos. Por lo tanto,
otra fuente adicional, no seleccionada en la pareja inicial, estará
implícitamente confundida con los bloques.
 Este efecto puede ser determinado al obtener el producto de la pareja
original ADE y BCE en el módulo 2. Este producto sería ADE(BCE) =
ABCDE2 = ABCD módulo 2 (E2 = I).
 Ahora estamos en posición de discutir porque la selección de las
interacciones de orden mayor no son necesariamente la mejor alternativa
como lo eran cuando solo teníamos dos bloques. La selección en el ejemplo
25 de ABCDE y ABCD traería como consecuencia que E, un efecto principal,
estuviese también confundido con bloques, lo que resulta obviamente en un
experimento pobremente diseñado.

slide 149
Concepto de bloques en los experimentos
factoriales 2k
 Estos conceptos pueden extenderse a un número mayor de bloques. Para
obtener 8 bloques necesitaríamos 3 efectos originales a fundirse con
bloques, llamémoslos G1, G2 y G3. Los otro cuatro (4) grados de libertad
para completar los siete (7) correspondientes a bloques se obtendrían de los
siguientes efectos:

1 gl -> G1G2 1 gl -> G1G3


1 gl -> G2G3 1 gl -> G1G2G3

 Dieciséis bloque requerirían 4 efectos iniciales y el producto de todas las


combinaciones de estos generarían los once (11) efectos restantes que
están confundidos con bloques. De igual forma podría seguirse con más
bloques correspondientes a potencias de dos (32, 64, etc.)

slide 150
Experimentos fraccionarios 2k
 A medida que el número de factores aumenta en un experimento factorial
2K, el número de tratamientos hace prohibitivo la posibilidad de realizar una
repetición completa de todo el experimento. Tome por ejemplo un
experimento con seis (6) factores cada uno de ellos a dos niveles, el realizar
una réplica completa del mismo consistirá en 64 observaciones. En este
diseño solo seis grados de libertad son necesarios para estimar los factores
principales mientras que 15 grados de libertad se requieren para estimar las
interacciones dos factores.
 Si como ya se planteó en pasadas secciones es posible presumir que las
interacciones de muchos factores pueden ser consideradas insignificantes,
entonces la información de los efectos principales y las interacciones de
pocos factores puede obtenerse de correr solo una fracción de los
tratamientos necesarios en el experimento factorial completo.

slide 151
Experimentos fraccionarios 2k

 A estos experimentos le llamamos experimentos


factoriales fraccionarios y son de los diseños más
frecuentemente utilizados en la industria. Están
basados en los siguientes preceptos que podríamos
considerar como un dogma estadístico:
 Cuando existen múltiples variables en un sistema o un
proceso, el sistema o proceso va a estar principalmente
explicado por un puñado de efectos principales y de
interacciones de orden bajo (principio de Pareto).
 Los diseños factoriales fraccionarios pueden ser
proyectados a diseños con mayor capacidad de extraer
información en el subespacio formado por las variables
significativas.
 Es posible combinar las observaciones de dos o más
experimentos fraccionarios para producir en secuencia
un diseño que permita estimar los efectos deseados.

slide 152
Experimentos fraccionarios 2k

 Al igual que en las pasadas secciones introduciremos los


conceptos usando algunos ejemplos. Suponga que tiene un
experimento 23 donde solo hay presupuesto para efectuar la
mitad del total del experimento, es decir, 4 tratamientos. A este
experimento le llamaríamos la mitad del factorial o usando otra
notación se denotaría por un experimento 23-1. Considere la
siguiente tabla de signos:

Tratamiento A B C AB AC BC ABC
a + - - - - + +
b - + - - + - +
c - - + + - - +
abc + + + + + + +
ab + + - + - - -
ac + - + - + - -
bc - + + - - + -
(1) - - - + + + -

slide 153
Experimentos fraccionarios 2k
 Dos conceptos de extrema importancia pueden ser observados de
esta tabla. Para comentarlos primero presumamos que los cuatro
tratamientos seleccionados para nuestro experimento corresponden
a los cuatro en la parte superior de la tabla: a, b, c, abc.

 Lo primero que observamos es que los signos para ABC


correspondientes a estos cuatro (4) tratamientos son +´s. Por
consecuencia el efecto ABC se ha sacrificado completamente en este
experimento porque solo fue observado en su ‘nivel alto’. Al efecto
donde esto ocurre comúnmente se le da el nombre de generador, así
que en este ejemplo la interacción de tres factores ABC resulta ser el
generador de este experimento fraccionado.

slide 154
Experimentos fraccionarios 2k
 La segunda observación que hacemos de esta tabla está asociada
con las flechas dibujadas. Note que los signos para los tratamientos
seleccionados cuando se consideran las columnas A y BC son
idénticos. Lo mismo ocurre cuando observamos las parejas de
columnas B, AC y C, AB.
 Lo que esto nos está informando es que como consecuencia de
haber efectuado solo una fracción de la totalidad de los tratamientos
algunos efectos han resultado estar confundidos. En esta situación
no podemos distinguir los efectos A y BC, de B y AC ni los XC y AB.
O sea que cuando estimamos A, B y C realmente estamos
estimando A + BC, B + AC y C + AB respectivamente. Dos o más
efectos que tienen esta propiedad se conocen como aliases.

slide 155
Experimentos fraccionarios 2k

 Decimos pues que A y BC son aliases, que B y AC son aliases y que finalmente
C y AB también son aliases. Esta estructura de aliases puede determinarse
fácilmente sin necesidad de observar los signos de la tabla una vez se conoce
cual(es) es(son) el(los) efecto(s) generador(es). La misma se obtiene
multiplicando la columna o efecto de interés por el generador. De esta forma
también pudimos haber obtenido los aliases:
A(ABC) = A2BC = BC
A = BC
B(ABC) = AB2C = AC
B = AC
C(ABC) = ABC2 = AB
C = AB
 que es la estructura que precisamente había sido observada de la tabla. La
fracción que contiene el lado positivo es conocida como la fracción principal. No
importa si hubiésemos seleccionado la otra fracción, es decir los otro cuatro
tratamientos, la estructura sería la misma porque ambas fracciones pertenecen
a la misma familia.

slide 156
Resolución del diseño fraccionario

 Los diseños fraccionarios son clasificados de acuerdo a


su resolución. La resolución del experimento nos brinda
una idea del tipo de estructura de aliases que el diseño
posee. Regularmente trabajamos con experimentos de
resolución III, IV y V. Pasamos a definir cada una de
ellas.
 Diseños de Resolución III. En estos diseños ningún factor
principal está de alias con otro factor principal. Pero en
cambio encontramos factores principales de aliases con
interacciones de dos factores y también podemos
encontrar interacciones de dos factores de aliases con
otras interacciones de dos factores. El ejemplo que
acabamos de discutir 23-1 es un experimento de resolución
III y lo denominamos de la siguiente forma 2 31 .
III

slide 157
Resolución del diseño fraccionario
 Diseños de Resolución IV. En estos diseños ningún
factor principal está de alias con otro factor principal ni
con ninguna interacción de dos factores. Por otro lado,
encontraremos interacciones de dos factores de aliases
con interacciones de dos factores. Un diseño 24-1 con un
generador I = ABCD resultará en un diseño .
 Diseños de Resolución V. En estos diseños no
encontraremos ningún factor principal o ninguna
interacción de dos factores de aliases con factores
principales o con41otras interacciones de dos factores. Un
diseño 25-1 con 2un
IV generador I = ABCDE resultará en un
diseño .

2 V51

slide 158
Resolución del diseño fraccionario
 La resolución estará determinada por el número de letras del
generador del diseño que posea el número mínimo de letras. Como
veremos próximamente algunos diseños fraccionarios necesitarán
más de un generador. Aspiraremos en nuestros diseños a tener la
mayor resolución posible. Mientras mayor sea la resolución del
experimento mayor información podemos extraer de nuestra
experimentación, obviamente tomando en consideración las
restricciones en el número de observaciones que el presupuesto
impondrá.

slide 159
Resolución del diseño fraccionario Ejemplo
 En un proceso de manufactura de circuitos integrados cinco factores
son investigados con el objetivo de determinar como estos afectan la
resistencia del producto. Los factores investigados fueron : A =
Cantidad de Detergente, B = Temperatura, C = Tiempo, D = Espesor
de Oxido y E = Posición. Cada factor fue considerado a dos niveles y
el presupuesto en tiempo y materiales para conducir esta prueba
provee la oportunidad de realizar un total de 16 tratamientos. Este
experimento es la mitad de una repetición completa del experimento
factorial. Los resultados obtenidos al realizar los tratamientos en
forma completamente aleatoria se presentan a continuación en
forma de tabla y luego en forma gráfica.

slide 160
Resolución del diseño fraccionario Ejemplo

Data Display
Row A B C D E Resistencia
1 -1 -1 -1 -1 1 15.1
2 1 -1 -1 -1 -1 20.6
3 -1 1 -1 -1 -1 68.7
4 1 1 -1 -1 1 101.0
5 -1 -1 1 -1 -1 32.9
6 1 -1 1 -1 1 46.1
7 -1 1 1 -1 1 87.5
8 1 1 1 -1 -1 119.0
9 -1 -1 -1 1 -1 11.3
10 1 -1 -1 1 1 19.6
11 -1 1 -1 1 1 62.1
12 1 1 -1 1 -1 103.2
13 -1 -1 1 1 1 27.1
14 1 -1 1 1 -1 40.3
15 -1 1 1 1 -1 87.7
16 1 1 1 1 1 128.3

slide 161
Resolución del diseño fraccionario Ejemplo

Cube Plot - Means for Resisten


8 7 .5 1 2 8 .3

1 0 1 .0 6 2 .1

4 6 .1 2 7 .1

1 5 .1 1 9 .6
1

-1 1 1 9 .0 8 7 .7

6 8 .7 1 0 3 .2
1

B 3 2 .9 4 0 .3
1
2 0 .6 C 1 1 .3
-1 -1
-1 1
A
-1 D 1

slide 162
Resolución del diseño fraccionario Ejemplo
 La estructura de aliases para este experimento, MINITAB la produce
en este caso para la fracción principal del modelo. La selección del
‘software’ resulta muy adecuada porque para realizar un
experimento fraccionado que consta de la mitad de los tratamientos
totales de un factorial completo el mejor generador lo constituye la
interacción que contenga el número mayor de factores posible en
este caso, la interacción ABCDE. Como consecuencia obtenemos
un experimento de resolución V (ABCDE el único generador de este
diseño consta de cinco letras). Esta selección del generador
MINITAB la realiza de forma automática pero usted pudiera
cambiarla si ese fuese su interés.

slide 163
Resolución del diseño fraccionario Ejemplo

Factorial Design
Fractional Factorial Design

Factors: 5 Base Design: 5, 16 Resolution: V


Runs: 16 Replicates: 1 Fraction: 1/2
Blocks: none Center pts (total): 0

Design Generators: E = ABCD

Alias Structure

I + ABCDE

A + BCDE
B + ACDE
C + ABDE
D + ABCE
E + ABCD
AB + CDE
AC + BDE
AD + BCE
AE + BCD
BC + ADE
BD + ACE
BE + ACD
CD + ABE
CE + ABD
DE + ABC

slide 164
Resolución del diseño fraccionario Ejemplo

 Si la presunción de que interacciones de tres factores y


mayores no se consideren es adecuada entonces este
experimento brindará excelente información con respecto
a los factores principales y las interacciones de dos
factores. Como tenemos una observación por condición
experimental debemos recurrir al Gráfico de probabilidad
normal para los efectos sugerido por Daniels.

slide 165
Resolución del diseño fraccionario

Normal Probability Plot of the Effects

A: A
B B: B
C: C
A D: D
E: E
1 C
AB
Normal Score
0

-1

0 10 20 30 40 50 60 70

Effect

Los efectos A, B, C, AB parecen tener una influencia grande en la


respuesta. Estos mismos efectos se destacan cuando observamos la
magnitud de sus coeficientes así como sus pendientes en un gráfico de
efectos principales y el gráfico de las interacciones. Es posible comparar la
magnitud de los coeficientes del modelos debido a que proviene de
variables codificadas.

slide 166
Resolución del diseño fraccionario

Main Effects for Resisten

-1 1 -1 1 -1 1 -1 1 -1 1

90

75
R e s i s te n

60

45

30

A B C D E

slide 167
Resolución del diseño fraccionario

Interaction Plot for Resisten


-1 1 -1 1 -1 1 -1 1

A
1
-1

B
1
-1

C
1
-1

D
1
-1

slide 168
Resolución del diseño fraccionario

Estimated Effects and Coefficients for Resisten

Term Effect Coef


Constant 60.6562
A 23.2125 11.6063
B 68.0625 34.0312
C 20.9125 10.4562
D -1.4125 -0.7062
E 0.3875 0.1938
A*B 13.1625 6.5812
A*C 1.4125 0.7062
A*D 2.5875 1.2938
A*E 2.5875 1.2938
B*C 0.9625 0.4813
B*D 2.6875 1.3438
B*E -0.3125 -0.1562
C*D 0.8875 0.4438
C*E 1.8875 0.9438
D*E -1.7375 -0.8687

slide 169
Resolución del diseño fraccionario
 El modelo que se usará par pronosticar la resistencia en la región
sobre la cual se experimentó será:

y  60.656  11.606x1  34.031x 2  10.456x 3  6.581x1 x 2

 en donde las tres variables son codificadas dentro del rango -1, +1.
Note que dos factores y ninguna de sus interacciones resultaron ser
significativos, estos fueron los factores D y E. Los experimentos
fraccionarios 2K tienen una propiedad que les permite proyectarse
muy bien en el subespacio de aquellos factores que sí son
relevantes. La siguiente gráfica muestra el experimento proyectado
sólo a los factores significativos A, B y C.

slide 170
Resolución del diseño
fraccionario
 Esta gráfica muestra la respuesta en
cada tratamiento ya que los 16
tratamientos del experimento
original proyectan a dos repeticiones
en cada uno de los 8 tratamientos
Cube Plot - Means for Resisten
del 23. Esta propiedad de
proyección es muy particular a los
experimentos factoriales y
8 7 .6 0 1 2 3 .6 5
factoriales fraccionarios lo que los
hace muy atractivos. De
1
6 5 .4 0 1 0 2 .1 0 inspeccionar el cubo proyectado
podemos concluir que la resistencia
B 3 0 .0 0 4 3 .2 0
mayor ocurre cuando todos los
1
factores A, B, C están en su nivel
-1
1 3 .2 0 2 0 .1 0
-1
C
alto.
-1
A
1
 Finalmente la próxima figura
muestra el gráfico de probabilidad
normal para los residuales y el
gráfico de los residuales contra los
valores pronosticados con el fin de
cotejar la idoneidad del modelo.
Ambos trazos parecen ser
satisfactorios.

171
slide 171
Resolución del diseño fraccionario

Normal Probability Plot of the Residuals


(response is Resisten)

Residual
-1

-2

-3

-4

-5

-6
-2 -1 0 1 2

Normal Score

Residuals Versus the Fitted Values


(response is Resisten)

0
Residual

-1

-2

-3

-4

-5

-6
0 50 100

Fitted Value

slide 172
Resolución del diseño fraccionario
 Cuando el número de factores en un experimento aumenta
tendremos que considerar fracciones menores al ½ considerado en
el ejemplo pasado. Si se toma una cuarta (1/4) parte del total de los
tratamientos en un experimento que tiene K factores, conocemos a
este experimento como un 2K-2 fraccionario. Como ejemplo tome un
experimento 26-2, para este caso es necesario seleccionar dos
generadores (note lo análogo con los experimentos factoriales en
bloques: 2 bloques una fuente sacrificada, ½ repetición un contraste
generador; 4 bloques dos fuentes de variación sacrificadas
inicialmente una implícita, 1/4 repetición en el fraccionario, dos
generadores iniciales y uno implícito).

slide 173
Resolución del diseño fraccionario
 Suponga que se seleccionan los efectos ABCE y BCDF. El producto
de los seleccionados también es un generador en este caso sería:

ABCE(BCDF) = ADEF

 Así que los generadores para este experimento serían I = ABCE =


BCDF = ADEF. La estructura de aliases resultante sería como se
presenta a continuación:

slide 174
Resolución del diseño fraccionario

Factorial Design

Fractional Factorial Design

Factors: 6 Base Design: 6, 16 Resolution: IV


Runs: 16 Replicates: 1 Fraction: 1/4
Blocks: none Center pts (total): 0

Design Generators: E = ABC F = BCD

Alias Structure

I + ABCE + ADEF + BCDF

A + BCE + DEF + ABCDF


B + ACE + CDF + ABDEF
C + ABE + BDF + ACDEF
D + AEF + BCF + ABCDE
E + ABC + ADF + BCDEF
F + ADE + BCD + ABCEF
AB + CE + ACDF + BDEF
AC + BE + ABDF + CDEF
AD + EF + ABCF + BCDE
AE + BC + DF + ABCDEF
AF + DE + ABCD + BCEF
BD + CF + ABEF + ACDE
BF + CD + ABDE + ACEF
ABD + ACF + BEF + CDE
ABF + ACD + BDE + CEF

slide 175
Resolución del diseño fraccionario

 El experimento resultaría uno de resolución IV, como puede notarse de


la estructura de aliases y del número de letras de los generadores los
cuales todos en este casos consisten cuatro letras.
 Note que el experimento puede consistir de cuatro distintos grupos de
tratamientos, según los patrones que se generan en la tabla de signos.
Estos patrones se muestran en la siguiente tabla:

ABCE BCDF
-ABCE BCDF
ABCE -BCDF
-ABCE -BCDF

 Usando la última de las combinaciones cuando ambos signos son


negativos obtendríamos los siguientes tratamientos acompañados en
la última columna de las respuestas. Los últimos cuatro (4)
tratamientos representan cuatro puntos centrales añadidos para
investigar la presencia de curvatura.

slide 176
Resolución del diseño fraccionario

Data Display

Row A B C D E F Respuesta

1 -1 -1 -1 -1 -1 -1 6
2 1 -1 -1 -1 1 -1 10
3 -1 1 -1 -1 1 1 32
4 1 1 -1 -1 -1 1 60
5 -1 -1 1 -1 1 1 4
6 1 -1 1 -1 -1 1 15
7 -1 1 1 -1 -1 -1 26
8 1 1 1 -1 1 -1 60
9 -1 -1 -1 1 -1 1 8
10 1 -1 -1 1 1 1 12
11 -1 1 -1 1 1 -1 34
12 1 1 -1 1 -1 -1 60
13 -1 -1 1 1 1 -1 16
14 1 -1 1 1 -1 -1 5
15 -1 1 1 1 -1 1 37
16 1 1 1 1 1 1 52
17 0 0 0 0 0 0 29
18 0 0 0 0 0 0 34
19 0 0 0 0 0 0 26
20 0 0 0 0 0 0 30

slide 177
Resolución del diseño fraccionario

 Un gráfico de probabilidad normal para los efectos nos


distingue los efectos de A, B y AB como los que mayor
influencia tienen en la respuesta. El estimado del error puro en
ANOVA se obtiene de las repeticiones efectuadas en el punto
central y lo utilizamos para efectuar la prueba de curvatura.
Como podemos notar la misma resultó en una razón F muy
baja, indicando que el modelo lineal parece ser razonable en
esta región.
Normal Probability Plot of the Standardized Effects
(response is Respuest, Alpha = .01)

A: A
B B: B
C: C
A D: D
E: E
1 AB F: F
Normal Score

-1

0 10 20

Standardized Effect

slide 178
Resolución del diseño fraccionario

Fractional Factorial Fit


Estimated Effects and Coefficients for Respuest

Term Effect Coef StDev Coef T P


Constant 27.800 0.8044 34.56 0.000
A 13.875 6.938 0.8993 7.71 0.002
B 35.625 17.812 0.8993 19.81 0.000
C -0.875 -0.438 0.8993 -0.49 0.652
D 1.375 0.687 0.8993 0.76 0.487
E 0.375 0.187 0.8993 0.21 0.845
F 0.375 0.187 0.8993 0.21 0.845
A*B 11.875 5.938 0.8993 6.60 0.003
A*C -1.625 -0.813 0.8993 -0.90 0.417
A*D -5.375 -2.688 0.8993 -2.99 0.040
A*E -1.875 -0.937 0.8993 -1.04 0.356
A*F 0.625 0.313 0.8993 0.35 0.746
B*D -0.125 -0.062 0.8993 -0.07 0.948
B*F -0.125 -0.063 0.8993 -0.07 0.948
A*B*D 0.125 0.063 0.8993 0.07 0.948
A*B*F -4.875 -2.437 0.8993 -2.71 0.054

slide 179
Resolución del diseño fraccionario

Analysis of Variance for Respuest

Source DF Seq SS Adj SS Adj MS F P


Main Effects 6 5858.37 5858.37 976.40 75.45 0.000
2-Way Interactions 7 705.94 705.94 100.85 7.79 0.033
3-Way Interactions 2 95.12 95.12 47.56 3.68 0.124
Residual Error 4 51.76 51.76 12.94
Curvature 1 19.01 19.01 19.01 1.74 0.279
Pure Error 3 32.75 32.75 10.92
Total 19 6711.20

 Nuestro modelo resultaría entonces ser:

y  27.800  6.938 x1  17.812 x 2  5.938 x1 x 2

donde x1, x2 y x1x2 son variables codificadas. El gráfico de probabilidad


normal para los residuales luce aceptable y se presenta en la siguiente
figura.

slide 180
Resolución del diseño fraccionario

Normal Probability Plot of the Residuals


(response is Respuest)

la
u
d 0
is
e
R

-5

-2 -1 0 1 2

Normal Score

El modelo de regresión utilizado para producir los residuales


fundamentalmente ha removido los efectos de localización de A, B Y AB
de los datos originales. Los residuales retienen el resto de la variabilidad
no explicada por el modelo. Mostraremos ahora porque es necesario
estudiar estos residuales.

slide 181
Resolución del diseño fraccionario
 La siguiente figura nos presenta el gráfico de los niveles de la
variable C contra los residuales. Note como existe una mayor
variabilidad en los residuales cuando el factor C se encuentra en su
nivel alto. Esta información es relevante ya que si tomamos la
información del modelo solamente no nos percataríamos de que
mantener la variable C en su nivel alto resultaría en una mayor
variabilidad del proceso. En muchos problemas entonces es mejor
construir modelos tanto para el promedio como para la variabilidad
en la respuesta.
 Esto lo discutiremos con mayor detenimiento cuando discutamos los
experimentos robustos sugeridos por Genichi Taguchi.

slide 182
Resolución del diseño fraccionario

Residuals Versus C
(response is Respu)

5
Residual

-5

-1 0 1

slide 183
Resolución del diseño fraccionario

 Por último, para este ejemplo, se muestra el diseño proyectado a las tres
variables significativas A, B y C. Note que C se introduce en el cubo como
consecuencia de su aportación a la variabilidad en el proceso. Para facilitar
este entendimiento el rango de las respuestas de la proyección de los seis (6)
factores en 3 dimensiones 23 acompaña a las respuestas promedio en cada
tratamiento. Los rangos son mucho menores en el nivel bajo de C cuando se
comparan con su nivel alto.
Centerpoint Cube Plot - Means for Respuest
Factorial Point

31.5 56.0

33.0 60.0
1

29.75

B 10.0 10.0
1

C
7.0 11.0
-1 -1
R=2 -1 1 R=
A

slide 184
Uso de secuencia de fracciones para
separar efectos confundidos
 Cuando analizamos experimentos fraccionarios de resoluciones bajas en
muchas ocasiones encontramos que efectos confundidos resultan ser
significativos y no podemos aislar las fuentes de variación que componen el
alias. Esto puede lograrse mediante la combinación de experimentos
fraccionarios. La estructura de aliases para cualquier fracción del experimento
se consigue cambiando los signos de los factores concernidos en la estructura
de aliases de la fracción original. A este procedimiento se le conoce como ‘fold-
over’.
 En un ‘fold-over’ completo, añadimos una segunda fracción a la original
cambiando los signos para todos los factores. La combinación de ambas
fracciones nos permitirá estimar los efectos de los factores principales y las
interacciones de dos sin estos estar confundidos cuando los experimentos son
de resolución III. Así que técnicamente, un experimento ‘fold over’ completo que
inicialmente era resolución III se convierte en un resolución IV. Lo mismo no
puede decirse de un resolución IV, no hay garantía que con esta técnica se
convertirá en uno de resoulión V.

slide 185
Uso de secuencia de fracciones para separar
efectos confundidos
 Otra variación de este tipo de experimento es el ‘fold-over’ para
el factor sencillo. En esta modalidad se añade una segunda fracción
del mismo tamaño, sólo que cambiamos los signos de uno de los
factores solamente. Considerando ambas fracciones seremos
capaces de estimar el efecto principal al cual se le cambiaron los
signos así como las interacciones de dos factores que envuelvan al
mismo.

slide 186
Uso de secuencia de fracciones para separar
efectos confundidos
 Un ejemplo de un ‘fold-over’ completo para un experimento original
se presenta en la siguiente tabla:

2 7III 4

I = ABD = ACE = BCF = BCDE = ACDF = ABEF = DEF

Primera Fracción Segunda Fracción

def abcg

afg bcde

beg acdf

abd cefg

cdg abef

ace bdfg

bcf adeg

abcdefg (1)

slide 187
Uso de secuencia de fracciones para separar
efectos confundidos
 Usando el mismo ejemplo para el ‘fold-over’ cambiando un sólo
factor obtendríamos las siguientes fracciones:

Primera Fracción Segunda Fracción


def ef
afg adfg
beg bdeg
abd ab
cdg cg
ace acde
bcf bcdf
abcdefg abcefg

slide 188
Diseños Plackett-Burman
 Estos diseños corresponden a experimentos fraccionarios de dos
niveles para estudiar hasta K = N - 1 en N observaciones,
cuando N es un múltiplo de 4. Si N es una potencia de dos
entonces estos experimentos resultarán en experimentos
similares a los ya discutidos. Pero presentan una alternativa para
cuando esto no se cumple, como en los casos N = 12, 20, 24,
etc. MINITAB puede ayudarle a construir dichos experimentos.

slide 189
Diseños Plackett-Burman
 Una nota de cautela con estos experimentos es que los mismos contienen
una estrucutra de aliases bastante complicada. Como un ejemplo de esto,
un experimento Plackett-Burman con 12 corridas resulta en una estructura
que tiene a cada factor principal de alias con toda interacción de dos
factores que no contenga al efecto principal. O sea que la interacción entre
los factores A y B (AB) se encuentra de alias en este experimento con los 9
restantes factores principales.
 Las propiedades de proyección de estos experimentos tampoco resultan ser
muy atractivas cuando son comparadas con los experimentos discutidos
previamente. Por estas razones, estos experimentos Plackett-Burman que
resultan ser atractivos por ser altamente fraccionados son vistos con
escepticismo por muchos científicos y estadísticos.

slide 190
Experimentos factoriales con factores aleatorios

 Hasta el momento hemos presumido que los factores en nuestros


experimentos eran de naturaleza fija; esto es los niveles en que los
factores fueron evaluados eran los niveles específicos de interés. En
otras palabras, que nuestras inferencias estadísticas estaban
limitadas a estos niveles específicamente.
 En algunas situaciones en la experimentación, el experimentador
selecciona aleatoriamente los niveles de una población potencial de
estos, con el fin de concluir sobre la población total de niveles sin
limitarse a los niveles seleccionados para conducir el experimento.
Cuando esto sucede, decimos que el factor es aleatorio.

slide 191
Experimentos factoriales con factores aleatorios

 Si consideramos un experimento con dos factores A y B donde los a, b


niveles correspondientes son seleccionados aleatoriamente de un
número grande de posibilidades, en donde se toman n repeticiones en
un arreglo factorial, obtendremos el siguiente modelo lineal:
yijk     i   j    ij  ijk

 donde  i ,  j ,   ij y  ijk son variables aleatorias independientes que se


presumen normales con promedio cero (0) y varianzas  2 ,  2 ,  2 y  2
respectivamente. Por lo que la varianza de cualquier observación
estará dada por :
 
V y ijk  2   2  2 +  2

donde los estimados de varianza son conocidos como los componentes


de varianza.

slide 192
Experimentos factoriales con factores aleatorios

 En estos casos las hipótesis que resultan de interés son:


H0 :2  0 H0 : 2 = 0 H0 :2  0

 Los estimados de las sumas de cuadrados para las distintas fuentes


de variación se obtendrán de la misma forma en que los estimamos
hasta el momento (presumiendo factores fijos). Al introducir el
concepto de factores aleatorios, lo que puede cambiar es la forma
de conducir la prueba F; con esto nos referimos al cociente que
consideraremos para realizar la misma. Para hacer esto
correctamente es necesario considerar las medias cuadradas
esperadas.

slide 193
Experimentos factoriales con factores aleatorios

 Puede probarse (más adelante veremos cómo desarrollarlas) que


las medias cuadradas para el experimento con dos factores A, B y la
interacción son:
E MS A    2  n 2  bn 2
E  MS B    2  n 2  an 2
E  MS AB    2  n2
E  MS E    2

 Entonces para probar H0 :  0 usaríamos:


2

MS AB
F0 
MS E

slide 194
Experimentos factoriales con factores aleatorios

 porque bajo la hipótesis nula (H0) ambos términos tendrían valor esperado
2 y se rechazaría solo si hubiese evidencia de que E(MSAB) es mayor que
E(MSE). En cambio para probar H 0 :  2  0 usaríamos el siguiente cociente:
MS A
F0 
MS AB
 Note que este cociente es distinto al que hubiésemos utilizado considerando
ambos factores fijos. En los capítulos pasados como consecuencia de
suponer que todos los factores eran fijos todas estas fuentes de variación se
probaban contra el MSE. Como acabamos de mostrar, esto no es cierto en
todos los casos. Por lo tanto, usaremos las medias cuadradas esperadas de
guía para establecer correctamente nuestra prueba F.

slide 195
Experimentos factoriales con factores
aleatorios

 Estimar los componentes de varianza resulta de mucho interés en


estos experimentos que contienen factores aleatorios. Considerando
los estimados de las medias cuadradas estos componentes se
obtienen:
 2  MS E
MS AB  MS E
2 
n
MS B  MS AB
 2 
an
MS   MS AB
2 
bn
 Esta manera de estimar los componentes no garantiza la no
negatividad de los mismos. Algunos autores presumen que la
aportación de ese componente es cero (0) cuando sucede.

slide 196
Diseños Jerárquicos o Anidados (Nested)
 Considere el siguiente ejemplo. Usted está realizando un estudio en
una planta embotelladora. En la misma existen cinco máquinas de
llenado cada una de ellas con cuatro boquillas lo que permite llenar
hasta un máximo de cuatro botellas simultáneamente como se
muestra en el siguiente dibujo.

Máquina 1 Máquina 2 Máquina 3 Máquina 4 Máquina 5

1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4

slide 197
Diseños Jerárquicos o Anidados (Nested)
 Resulta muy relevante entender que esta situación no se presta par realizar
un experimento factorial con cinco niveles por máquina y cuatro niveles por
boquilla. Esto es así porque las boquillas de cada máquina son distintas o
pertenecen a cada máquina. En estos circunstancias llamamos al
experimento, experimento jerárquico o anidado.
 Para realizar este experimento como uno factorial tendríamos que conducir
el mismo de forma ilógica, cambiando las boquillas de máquinas para que
éstas fuesen las mismas a través de todos los tratamientos. Como esto es
prácticamente imposible, además conducir el experimento de esta manera
nos brindaría información que no es muy útil para mejorar el proceso, la
interacción entre máquinas y boquillas no existe en este tipo de
experimento.

slide 198
Diseños Jerárquicos o Anidados (Nested)

 La siguiente tabla muestra las respuestas obtenidas (diferencia


en ml del valor deseado) de un experimento en donde cuatro
observaciones se hicieron en cada boquilla de cada máquina.
Debido a que las boquillas de cada máquina no son las mismas
algunos autores prefieren darle distintos identificadores a las
boquillas, bajo este argumento en nuestro caso tendríamos
boquillas identificadas del 1 al 20.
Máquina 1 2 3 4 5
Boquilla 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4
6 13 1 7 10 2 4 0 0 10 8 7 11 5 1 0 1 6 3 3
2 3 10 4 9 1 1 3 0 11 5 2 0 10 8 8 4 7 0 7
0 9 0 7 7 1 7 4 5 6 0 5 6 8 9 6 7 0 2 4
8 8 6 9 12 10 9 1 5 7 7 4 4 3 4 5 9 3 2 0

El modelo matemático que describe un experimento de esta


naturaleza está dado por:
yijk    M i  B j (i )  ijk

slide 199
Diseños Jerárquicos o Anidados (Nested)

 El paréntesis del suscrito de las boquillas indica


que éstas pertenecen a cada máquina cuyo
suscrito es el i. El siguiente es el ANOVA de
MINITAB cuando consideramos las máquinas
como un factor fijo mientras que las boquillas
dado que las montadas en determinada
máquina se selecciona de una selección de un
conjunto potencial de boquillas es considerado
un factor aleatorio.

slide 200
Diseños Jerárquicos o Anidados (Nested)

Analysis of Variance (Balanced Designs)

Factor Type Levels Values


Maquinas fixed 5 1 2 3 4 5
Boquillas(Maquinas)random 4 1 2 3 4

Analysis of Variance for respuest

Source DF SS MS F P
Maquinas 4 45.07 11.27 0.60 0.670
Boquillas(Maquinas) 15 282.88 18.86 1.76 0.063
Error 60 642.00 10.70
Total 79 969.95

Source Variance Error Expected Mean Square


component term (using unrestricted model)
1 Maquinas 2 (3) + 4(2) + Q[1]
2 Boquillas(Maquinas) 2.040 3 (3) + 4(2)
3 Error 10.700 (3)

slide 201
Diseños Jerárquicos o Anidados (Nested)
 Los grados de libertad para las boquillas son 15. La lógica que permite
entender de donde provienen es la siguiente: existen 4 boquillas por
máquina por lo tanto hay tres grados de libertad para las boquillas por
máquina pero existen cinco de estas últimas para el total de 15 grados de
libertad. MINITAB nos brinda las medias cuadradas esperadas indicando
como se efectuarán las pruebas F. El cuadrado de las medias para las
máquinas será comparado contra el cuadrado de las medias para boquillas
mientras que éste último se comparará con el cuadrado de las medias del
error.
 Este análisis nos brinda en forma global la contribución de las máquinas y
las boquillas, sin embargo la información que realmente nos interesa es la
de saber si hay diferencias entre las máquinas y si dentro de cada máquina
hay diferencia en sus boquillas, porque esto sería lo que podemos mejorar
en el proceso.

slide 202
Diseños Jerárquicos o Anidados (Nested)
 La diferencia en máquinas puede concluirse del ANOVA presentado y
considerando el valor p diríamos que no existe. De forma global las
boquillas se encuentran en una zona de indecisión si consideramos un error
Tipo I entre un 5 y un 10%, pero como señalamos lo relevante es distinguir
diferencias en las boquillas dentro de las máquinas. Para lograr esto todo lo
que necesitamos es realizar un ANOVA para un solo factor por máquina
donde los tratamientos pasan a ser las boquillas. Mostraremos como la
suma de cuadrados global para las boquillas corresponde a la suma de
boquillas por máquina cuando consideramos las cinco máquinas. A
continuación los cinco análisis descritos:

slide 203
Diseños Jerárquicos o Anidados (Nested)

One-Way Analysis of Variance Máquina 1

Analysis of Variance for Respuest


Source DF SS MS F P
Boquilla 3 50.2 16.7 1.19 0.354
Error 12 168.3 14.0
Total 15 218.4

One-Way Analysis of Variance Máquina 2

Analysis of Variance for respuest


Source DF SS MS F P
Boquilla 3 126.19 42.06 4.32 0.028
Error 12 116.75 9.73
Total 15 242.94

One-Way Analysis of Variance Máquina 3

Analysis of Variance for respuest


Source DF SS MS F P
Boquilla 3 74.75 24.92 3.22 0.062
Error 12 93.00 7.75
Total 15 167.75

One-Way Analysis of Variance Máquina 4

Analysis of Variance for respuest


Source DF SS MS F P
Boquuill 3 6.5 2.2 0.16 0.924
Error 12 167.5 14.0
Total 15 174.0

One-Way Analysis of Variance Máquina 5

Analysis of Variance for respuest


Source DF SS MS F P
Boquilla 3 25.25 8.42 1.05 0.407
Error 12 96.50 8.04
Total 15 121.75

slide 204
Diseños Jerárquicos o Anidados (Nested)

 Podemos observar que las sumas de cuadrados para las Boquillas por cada
Máquinai (i = 1,…5) resultaron ser: 50.2, 126.19, 74.75, 6.5 y 25.25
respectivamente. La suma de todas éstas corresponde a la suma global para
Boquillas del ANOVA original (282.88). Podemos entonces construir un ANOVA
desglosado que nos brindaría una información de mayor utilidad. La misma se
presenta a continuación:

Analysis of Variance (Balanced Designs)

Analysis of Variance for respuest

Source DF SS MS F P
Maquinas 4 45.07 11.27 0.60 0.670
Boquillas(Maquinas) 15 282.88 18.86 1.76 0.063
Boquilla 1 3 50.2 16.7 1.56 0.208
Boquilla 2 3 126.18 42.06 3.93 0.013
Boquilla 3 3 74.75 24.92 2.33 0.083
Boquilla 4 3 6.5 2.2 0.21 0.889
Boquilla 5 3 25.25 8.42 0.79 0.504
Error 60 642.00 10.70
Total 79 969.95

De este análisis podemos apreciar que las Boquillas en las Máquinas 2 y 3 son significativas al
10%. Conociendo esta información podemos concentrarnos en la solución del problema.

slide 205
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)

 En muchos experimentos donde un arreglo factorial es deseable, es


posible que no pueda conducirse el mismo de forma completamente
aleatoria. Considere el siguiente ejemplo para aclarar este concepto. La
temperatura T y el tiempo de horneado H son factores de interés al
analizar el largo de vida Y, de componentes electrónicos. Suponga que
el experimento evaluará cuatro niveles de temperatura ( 580, 600, 620
y 640 F) mientras que tres niveles de tiempo de horneado (5, 10 y 15
min.) serán considerados. Para conducir este experimento como uno
factorial, tendríamos que seleccionar una combinación de las cuatro
temperaturas y los tres tiempos de forma aleatoria, colocar un
componente en el horno por el tiempo seleccionado y proseguir de esta
manera hasta que todas las observaciones fuesen realizadas. Conducir
el experimento de esta forma resulta no muy práctico y a la misma vez
muy costoso. Existen experimentos que puede manejar tratamientos
que ocurren de forma simultánea, como se desea en esta situación,
aún con algunas restricciones en la aleatoriedad. A estos experimentos
los llamamos parcelas o cuadrantes partidas/os.

slide 206
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)
 Una forma lógica de conducir el experimento antes descrito sería seleccionar una de
las cuatro temperaturas del horno de forma aleatoria y colocar tres componentes
cuyos tiempos de horneado sería asignados aleatoriamente pero que estarían siendo
tratados de forma concurrente. En otras palabras, a una temperatura dada los tres
componentes son puestos en el horno por tres períodos de tiempo distintos.
 En este caso la temperatura actúa como cuadrante o parcela mientras que el tiempo
es el que parte la parcela. Luego la temperatura se ajusta a otro nivel y se repite este
procedimiento hasta que las cuatro temperaturas sean consideradas, a esto le
llamamos una réplica del experimento. El experimento se completa efectuando
algunas de estas repeticiones.

slide 207
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)
 La siguiente tabla muestra el esquema de un experimento como el
que acabamos de describir.

Temperatura
Réplica Tiempo 580 600 620 640
I 5
10
15
II 5
10
15
III 5
10
15

slide 208
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)
 El modelo que describe este experimento está dado por:

yijk    Ri  Tj  RTij  TI k  RTI ik  TTI jk  RTTI ijk


  
parcela completa parcela partida

donde Ri, Tj y TIk son los efectos de las réplicas, las temperaturas y
los tiempos de horneado respectivamente. Se pudiera pensar que el
efecto de tiempo en este experimento se encuentra anidado dentro
de las temperaturas, pero esto no es así ya que los mismos niveles
de tiempo se efectúan en todas las temperaturas.

slide 209
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)
 La siguiente tabla muestra los resultados obtenidos de un
experimento conducido en la forma descrita.

Temperatura
Réplica Tiempo 580 600 620 640
I 5 217 158 229 223
10 233 138 186 227
15 175 152 155 156
II 5 188 126 160 201
10 201 130 170 181
15 195 147 161 172
III 5 162 122 167 182
10 170 185 181 201
15 213 180 182 199

slide 210
Experimentos de cuadrantes o parcelas
partidas (Split-Plot)

 El resultado de efectuar el procedimiento de <<Balanced


Anova >> en MINITAB produce el siguiente resultado.
Analysis of Variance (Balanced Designs)

Factor Type Levels Values


Replica random 3 1 2 3
Temperat fixed 4 580 600 620 640
Tiempo fixed 3 5 10 15

Analysis of Variance for Respuest

Source DF SS MS F P
Replica 2 1962.7 981.4 * *
Temperat 3 12494.3 4164.8 14.09 0.004
Replica*Temperat 6 1773.9 295.7 * *
Tiempo 2 566.2 283.1 0.16 0.856
Replica*Tiempo 4 7021.3 1755.3 * *
Temperat*Tiempo 6 2600.4 433.4 1.79 0.185
Replica*Temp*Tiempo 12 2912.1 242.7 * *
Error 0____________
Total 35 29331.0

slide 211
Experimentos de cuadrantes o parcelas partidas
(Split-Plot)

 Donde las medias cuadradas esperadas se presentan a continuación y explican la


forma de conducir las distintas pruebas F para los efectos en el experimento.

Source Variance Error Expected Mean Square


component term (using restricted model)
1 Replica 61.56 7 (8) + 12(1)
2 Temperat 3 (8) + 3(3) + 9Q[2]
3 Replica*Temperat 17.66 7 (8) + 3(3)
4 Tiempo 5 (8) + 4(5) + 12Q[4]
5 Replica*Tiempo 378.16 7 (8) + 4(5)
6 Temperat*Tiempo 7 (8) + 1(7) + 3Q[6 ]
7 Replica*Temp*Tiemp 242.67 (8) + 1(7)
8 Error (8)

 Note que el error no es estimable en este experimento. El efecto de temperatura


se prueba contra la interacción de (réplica x temperatura), mientras que el efecto
del tiempo se prueba contra la interacción de (réplica x tiempo). Finalmente la
interacción de los dos factores de interés: (temperatura x tiempo) se prueba
contra la interacción de los tres efectos (réplica x temperatura x tiempo) según
muestran las flechas en la tabla. En algunos casos no es posible realizar una
prueba F exacta, pero esto no es de mucha pero esto no debe ser de mucha
preocupación dado que el efecto de las réplicas no es de primordial interés, más
bien su efecto es como de bloque, se introduce con la idea fundamental de reducir
el error experimental.

slide 212
Modelos de Segundo Orden
 En las pasadas secciones nos limitamos a diseños que
generan modelos de primer orden o contienen términos para
la interacciones.
 Discutimos además el concepto de puntos centrales en los
experimentos 2k para detectar curvatura en el modelo.
 Estimar los términos de segundo orden, de ser necesarios,
requiere el efectuar tratamientos adicionales.

slide 213
Modelos de Segundo Orden

 Un modelo de segundo orden típico, proveniente de la expansión de


Taylor sería:

y     x   x   x   x   x   x x
0 1 1 2 2 k k 11
2
1 kk
2
k 12 1 2

  x x   
13 1 3 k 1 ,k
x x 
k 1 k

CCD - Central Composite Design CCD consiste de:


Puntos
Factoriales
Puntos
Axiales
Puntos
Centrales

slide 214
Ejemplo - CCD
 Se desea construir un modelo de segundo orden para el esfuerzo
de remoción de etiqueta de botellas de empaque como función de
energía y velocidad de la correa.

CCD
 x1 x2 y 
 1  1 88.55

 1 1 86.29
 1  1 85.80
 
 1 1 80.44
 1.414 0 85.50
 
 1.414 0 85. 39 
 
 0  1.414 86.22
 0 1.414 85.70
 
 0 0 90 .21 
 0 0 90.85
 
 0 0 91.31

slide 215
Ejemplo CCD
Estimated Regression Coefficients for Esfuerzo
Contour Plot of Esfuerzo vs B, A
Esfuerzo
Term Coef SE Coef T P 1.0 78
< 78
- 81
81 - 84
Constant 90.7900 1.0224 88.797 0.000 84
87
- 87
- 90
0.5 > 90
A -0.9719 0.6261 -1.552 0.181
B -1.1669 0.6261 -1.864 0.121 0.0

B
A*A -2.7806 0.7452 -3.731 0.014 -0.5

B*B -2.5231 0.7452 -3.386 0.020 -1.0

A*B -0.7750 0.8855 -0.875 0.421


-1.0 -0.5 0.0 0.5 1.0
A

S = 1.771 R-Sq = 84.0% R-Sq(adj) = 68.1%


Surface Plot of Esfuerzo vs B, A

90

85
Esfuerzo

80

1
75 0 B
-1 0 -1
A 1

slide 216
CCD – “Face Centered”
 CCD centrado en la cara consiste
de:
• Puntos Factoriales
• Puntos Axiales
• Puntos Centrales
 Matriz de Diseño

 1  1
 1 1  Factoriales

1  1
 
1 1
 1 0
  Axiales
1 0
0  1
 
0 1
0 0
  Centrales
0 0
 
0 0

slide 217
Metodología de Superficie de Respuestas
 En las pasadas secciones nos hemos concentrado en diseñar experimentos para
construir modelos que nos permitan entender el comportamiento de la variable
observada en el espacio de inferencia de los factores alterados en el experimento.
Estos modelos nos han provisto de información referente a las propiedades del
sistema bajo estudio, los signos y las magnitudes de los coeficientes así como la
presencia o ausencia de las interacciones en los procesos bajo estudio. En muchas
ocasiones eso es todo lo que queremos obtener de estos modelos.
 En ocasiones estos modelos se utilizan para optimizar o mejorar los procesos. Las
técnicas que utilizamos para alcanzar estos objetivos las denominamos como
métodos de superficie de respuesta. En estas ocasiones utilizamos esta colección de
técnicas matemáticas para modelar y analizar problemas donde la respuesta de
interés es influenciada por múltiples variables y cuyo objetivo es optimizar la
respuesta.

slide 218
Metodología de Superficie de Respuestas
 El diseño experimental, el método para construir modelos y la
secuencia de experimentación a utilizarse en búsqueda de una
región de mejoramiento para el proceso o sistema se conoce
como el método de máxima pendiente en ascenso (‘steepest
ascent method’). El tipo de diseño utilizado son los discutidos en
las secciones anteriores, factoriales y fraccionarios 2K con y sin
puntos centrales etc.
 La estrategia envuelve una búsqueda de regiones mejoradas por
lo que se espera que sea necesario una secuencia de
experimentos.
 Se comienza por presumir que en la región de operación actual
un modelo de primer orden es una aproximación razonable del
sistema cuando consideramos x1, x2, ……, xK variables.

slide 219
Metodología de Superficie de Respuestas

 El método de la máxima pendiente ascendente consiste de los


siguientes pasos:

1. Ajuste un modelo de primer orden. Los experimentos factoriales con dos


niveles y puntos centrales son muy recomendados para lograr esto.
2. Determine el paso de máxima pendiente en ascenso si se quiere optimizar la
respuesta.
3. Conduzca corridas experimentales a lo largo del paso determinado hasta un
punto en donde el mejoramiento desaparece. Esto ocurrirá en regiones donde
el modelo obtenido ya no tenga mucho carácter predictivo.
4. En alguna localización, en donde una aproximación de la respuesta
máxima/mínima se localiza existe base para un modelo de segundo orden.

 Este procedimiento constituye solo una guía veremos como


en ocasiones tendremos que tomar algunas determinaciones
de tipo estadístico y otras de tipo ingenieril.

slide 220
Metodología de Superficie de Respuestas
 Ejemplo: Se quiere encontrar el ajuste de tiempo y temperatura que producen el máximo
rendimiento de un proceso químico. Las condiciones actuales del proceso presentan un tiempo de
75 minutos y una temperatura de 130C. Los ingenieros están dispuestos a experimentar en la
siguiente región: 70 < Tiempo < 80 y 127.5 < Temperatura < 132.5. Se decide usar un diseño
factorial 22 con tres puntos centrales. La siguiente tabla muestra las variables naturales, las
variables codificadas y la respuesta obtenida de un experimento como el descrito.

Variables Naturales Variables Codificadas y


Tiempo Temperatura X1 X2 rendimiento
70 127.5 -1 -1 54.3
80 127.5 1 -1 60.3
70 132.5 -1 1 64.6
80 132.5 1 1 68.0
75 130..0 0 0 60.3
75 130.0 0 0 64.3
75 130.0 0 0 62.3

slide 221
Metodología de Superficie de Respuestas

 El resultado del análisis proporcionado por MINITAB para el


Ejemplo se presenta de inmediato.
Fractional Factorial Fit
Estimated Effects and Coefficients for respuest

Term Effect Coef StDev Coef T P


Constant 62.0143 0.6335 97.89 0.000
A 4.7000 2.3500 0.8381 2.80 0.068
B 9.0000 4.5000 0.8381 5.37 0.013
A*B -1.3000 -0.6500 0.8381 -0.78 0.495

Analysis of Variance for respuest

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 103.090 103.090 51.5450 18.35 0.021
2-Way Interactions 1 1.690 1.690 1.6900 0.60 0.495
Residual Error 3 8.429 8.429 2.8095
Curvature 1 0.429 0.429 0.4286 0.11 0.775
Pure Error 2 8.000 8.000 4.0000
Total 6 113.209

slide 222
Metodología de Superficie de Respuestas

 Del mismo se desprende que un modelo lineal parece


razonable ya que solo los efectos lineales para ambos factores
A y B son significativos (los gráficos que se presentan a
continuación comprueban estos hallazgos analíticos). Tanto la
interacción como el efecto de curvatura resultan no
significativos en este modelo. Así que es posible establecer el
paso de máxima pendiente ascendente.
Centerpoint
Main Effects for respuest

-1 1 -1 1

66

64
respuest

62

60

58

A B

slide 223
Metodología de Superficie de Respuestas

Interaction Plot for respuest

A
-1
1
-1
65
1

Centerpoint

Mean
60

55

-1 1
B

Centerpoint Cube Plot - Means for respuest


Factorial Point

64.6 68.0
1

62.3
B

54.3 60.3
-1
-1 1

slide 224
Metodología de Superficie de Respuestas

 De nuestro análisis se desprende que el modelo matemático que


describe nuestra respuesta en esta región está dado por:

y =62.01 + 2.35 X1 + 4.50 X2

 Por lo tanto, a partir de este modelo queremos movernos más


rápidamente en X2 que en la variable X1 porque con la evidencia
presente, este movimiento deberá aumentar nuestra respuesta que es
el objetivo de este ejercicio. Este movimiento debe ser cercano al
perímetro de experimentación original que es donde nuestro modelo es
válido. Por esta razón se recomienda dar un paso de 1 en términos de
la variable codificada para el factor de mayor impacto en la respuesta y
un paso de una fracción para las variables restantes. Esta fracción
comúnmente se determina usando
bi
X i  
|b |
j

slide 225
Metodología de Superficie de Respuestas
 donde es el coeficiente de la variable i y es el coeficiente mayor del
modelo. Para el ejemplo entonces se realiza un paso de 1 en la
variable X1 por cada 2.35/4.50 = 0.52 en X2. Entonces decimos que
X1 = 0.52 y X2 = 1. En variables naturales esto corresponde a:

 10 
1    (0.52)  75  77.6
 2
 5
 2    (1)  130  132.5
 2

slide 226
Metodología de Superficie de Respuestas

 El paso en ambas variables se toma en la dirección positiva ya que sus


correspondientes coeficientes eran positivos y queremos aumentar la
respuesta. Si el objetivo hubiese sido disminuir se tomaría el paso de
mejoramiento en la dirección contraria. Gráficamente la dirección de
pendiente máxima ascendente se muestra a continuación.
(77.6, 132.5)
+1 (132.5)

X2 0 (130.0)

-1 (127.5)
0
-1 (75) +1
(70) (80)
X1

slide 227
Metodología de Superficie de Respuestas

 Establecido el paso, podemos ejecutar observaciones en esa dirección hasta


que no exista más evidencia de mejoramiento. Regularmente esto se
comprueba cuando la respuesta consecutiva de dos experimentos no presenta
mejoría. La siguiente tabla muestra resultados de realizar estos tratamientos.
Variables Naturales Variables Codificadas y
Tiempo Temperatura X1 X2 Rendimiento
75 130 0 0 62.3 (promedio)
77.6 132.5 .52 1 73.3
80.2 135.0 1.04 2
82.8 137.5 1.56 3 86.8
85.4 140.0 2.08 4
88.0 142.5 2.60 5 58.2

 La tabla de forma esquemática muestra que hasta 82.8 y 137.5 para tiempo y
temperatura respectivamente la respuesta fue aumentando y en los últimos dos
pasos las misma disminuyó. Así que el tratamiento referido se convierte en
nuestro nuevo punto central para el siguiente experimento de primer orden., que
consistirá en un nuevo experimento 22 con puntos centrales y el análisis
comenzará de nuevo. De acuerdo al procedimiento de la pendiente máxima en
ascenso seguiremos en esta secuencia hasta que un modelo de primer orden
no sea razonable para explicar el comportamiento de la variable respuesta en la
región experimental.

slide 228
Metodología de Superficie de Respuestas
 El procedimiento de Superficie de Respuesta exige construir un nuevo
experimento con punto central igual al tratamiento hasta donde la respuesta
fue mejorada en este caso Tiempo = 83 y Temperatura = 137.5. El nuevo
experimento con sus correspondientes respuestas se presenta en la
siguiente tabla.

Tiempo Temperatura X1 X2 respuesta


78 135 -1 -1 78
88 135 1 -1 84.5
78 140 -1 1 91.2
88 140 1 1 77.4
83 137.5 0 0 89.7
83 137.5 0 0 86.8
83 137.5 0 0 87.0
83 137.5 0 0 86.0

slide 229
Metodología de Superficie de Respuestas

 Los resultados del análisis usando MINITAB son los siguientes:


Factorial Design
Full Factorial Design

Factors: 2 Base Design: 2, 4


Runs: 8 Replicates: 1
Blocks: none Center pts (total): 4

All terms are free from aliasing

Fractional Factorial Fit

Estimated Effects and Coefficients for respuest

Term Effect Coef StDev Coef T P


Constant 85.175 1.205 70.67 0.000
A -4.050 -2.025 1.705 -1.19 0.301
B 2.650 1.325 1.705 0.78 0.480
A*B -9.750 -4.875 1.705 -2.86 0.046

Analysis of Variance for respuest

Source DF Seq SS Adj SS Adj MS F P


Main Effects 2 23.425 23.4250 11.713 1.01 0.442
2-Way Interactions 1 95.063 95.0625 95.063 8.18 0.046
Residual Error 4 46.487 46.4875 11.622
Curvature 1 38.720 38.7200 38.720 14.95 0.031
Pure Error 3 7.768 7.7675 2.589
Total 7 164.975

slide 230
Metodología de Superficie de Respuestas
 De este análisis podemos observar que la curvatura es significativa,
indicando con esto que un modelo de primer orden en esta región no es
muy aconsejable. Esto también podría notarse del análisis de residuales
para los factores. Aquí mostramos el mismo para el factor A.

Residuals Versus A
(response is respu)

3
Residual

-1

-2

-1 0 1

slide 231
Metodología de Superficie de Respuestas
 Note que los residuales para los puntos centrales están al lado superior de esta
gráfica indicando que el modelo no aproxima muy bien este comportamiento.
 Añadimos los puntos axiales para construir el modelo de segundo orden. En variables
codificadas estos corresponden a los siguientes tratamientos:

X1 X2 y
-1.41 0 83.3
1.41 0 81.2
0 1.41 79.5
0 1.41 79.5

 El análisis correspondiente a las 12 observaciones (22 + 4 puntos centrales + 4 puntos


axiales) se presenta a continuación.

slide 232
Metodología de Superficie de Respuestas

Central Composite Design

Central Composite Design

Factors: 2 Blocks: none Center points: 4


Runs: 12 Alpha: 1.414

Response Surface Regression

The analysis was done using coded units.

Estimated Regression Coefficients for respuest

Term Coef StDev T P


Constant 87.375 1.0018 87.216 0.000
A -1.384 0.7084 -1.953 0.099
B 0.362 0.7084 0.511 0.628
A*A -2.144 0.7920 -2.707 0.035
B*B -3.094 0.7920 -3.906 0.008
A*B -4.875 1.0018 -4.866 0.003

S = 2.004 R-Sq = 88.7% R-Sq(adj) = 79.2%

Analysis of Variance for respuest

Source DF Seq SS Adj SS Adj MS F P


Regression 5 188.189 188.189 37.638 9.38 0.008
Linear 2 16.366 16.366 8.183 2.04 0.211
Square 2 76.760 76.760 38.380 9.56 0.014
Interaction 1 95.063 95.063 95.063 23.68 0.003
Residual Error 6 24.088 24.088 4.015
Lack-of-Fit 3 16.320 16.320 5.440 2.10 0.279
Pure Error 3 7.768 7.768 2.589
Total 11 212.277

slide 233
Metodología de Superficie de Respuestas

 Se puede apreciar del análisis que en esta región experimental los


componentes cuadráticos de ambos factores son significativos, así
como la interacción, por lo que obviamente un modelo lineal no sería
capaz de describir adecuadamente lo que sucede con el rendimiento
en esta vecindad. Regularmente se utilizan dos gráficos para estudiar
los efectos en la región, a uno le llamamos el gráfico de superficie y al
otro el gráfico de contornos. Ambos se presentan de forma
consecutiva.

90

80
respuesta
70

-1.5
-1.0 -1.5
-0.5 -1.0
0.0 -0.5
A 0.5 0.0
1.0 0.5
1.0 B
1.5 1.5

slide 234
Metodología de Superficie de Respuestas

Contour Plot of respuest


73
78
1
83
88

B
0

-1

-1 0 1
A

 La respuesta aumenta según A (Tiempo) se acerca a sus niveles bajos mientras


que la Temperatura la interesamos en valores altos.
 Una nueva suma de cuadrados para la carencia de ajuste (‘lack of fit’) aparece
en nuestro análisis. Esta de ser significativa indicaría que un modelo de orden
mayor es necesario. En este caso no lo es dado la magnitud de su valor p. Si
las pruebas de idoneidad del modelo cumplen con las presunciones de Anova
sabemos que tenemos un modelo que explica muy bien la respuesta en esta
región y que debemos estar cerca de un óptimo aunque sea local.

slide 235
Diseños Robustos
 El diseño robusto es esencialmente un principio que hace énfasis en
seleccionar adecuadamente los niveles de los factores controlables
en el proceso para la manufactura de productos. El principio de la
selección de los niveles está basado principalmente en la variación
alrededor de un valor nominal (deseado) preestablecido para el
proceso bajo estudio. Se presume que la mayoría de la variabilidad
alrededor del valor nominal se debe a la presencia de un segundo
conjunto de factores llamado factores de ruido.

slide 236
Diseños Robustos
 Estos experimentos se le atribuyen al profesor Genichi Taguchi quien
recomendó hacer uso de estos factores de ruido durante las etapas de
desarrollo y experimentación para buscar los niveles de los factores
controlables que hacen el proceso insensible a los factores de ruido de
forma tal que se pueda disminuir la variabilidad que estos últimos causan en
el proceso. El profesor Taguchi se refiere a este problema como el
problema de diseño de parámetros (‘Parameter Design’), el incluye las
siguientes cuatro ideas como fundamentales a la hora de atacar el mismo:
1. Además de entender el efecto en el promedio (localización), la varianza es
importante.
2. Debido a lo anterior es importante entonces modelar la varianza.
3. Existen dos tipos de variables: variables de control y factores de ruido.
4. Es importante 8incluir los factores de ruido en el experimento.

slide 237
Diseños Robustos
 La metodología de Taguchi para los diseños robustos envuelve el
uso de diseños ortogonales donde se cruza un diseño ortogonal que
contiene los factores controlables con un arreglo ortogonal
constituido por los factores de ruido. Por ejemplo en un 22 X 22, el
experimento 22 para los factores controlables es llamado el arreglo
interno (‘inner array’) y el 22 para los factores de ruido se le conoce
como arreglo externo (‘outer array’). Esto resulta en un diseño de 16
tratamientos conocido como arreglo cruzado (‘crossed array’). La
figura que sigue muestra este tipo de arreglo.

slide 238
Diseños Robustos

Los círculos sin sombrear representan el arreglo interno para


los factores controlables. Los puntos sombreados representan
las localizaciones de las observaciones.

slide 239
Diseños Robustos
 El arreglo cruzado comienza con dos diseños experimentales, uno
para las variables de ruido y el otro para las variables controlables.
Cada diseño individual es regularmente eficiente porque cuando el
número de factores aumenta se puede considerar uno fraccionario.
El producto de ambos (diseño cruzado) muchas veces no produce
un diseño muy económico. Como veremos existen diseños, ya
conocidos por nosotros que resultan en experimentos más eficientes
que los cruzados en número de tratamientos y en información
obtenida. La dificultad con los arreglos cruzados puede explicarse
por medio de los grados de libertad.

slide 240
Diseños Robustos
 Considere el experimento donde un arreglo interno 23-1 para los factores A,
B, C se cruza con otro 23-1 para los factores D, E y F en el arreglo externo.
Esto resulta en 16 tratamientos con el siguiente desglose de grados de
libertad:

Efecto Grados de Efecto Grados de


Libertad Libertad
A 1 D 1
B 1 E 1
C 1 F 1
AD 1 CD 1
AE 1 CD 1
AF 1 CF 1
BD 1
BE 1
BF 1

slide 241
Diseños Robustos

 Note que todos los grados de libertad son para los efectos
principales y para las interacciones de los factores controlables
x factores de ruido. Ningún grado de libertad permite estimar
las interacciones dentro de los factores controlables y/o dentro
de los factores de ruido. Esto representa una desventaja de los
diseños cruzados. Las interacciones que son estimables son
importantes pero estos diseños descartan muchas otras que
resultan de interés y podrían llevarnos a conclusiones
incorrectas.
 Por las razones expuestas muchos autores han sugerido el
incorporar factores controlables y factores de ruido dentro de
un mismo experimento fraccionario. El siguiente ejemplo
muestra este concepto junto con el análisis de las variables que
explican la localización y las variables que afectan la
dispersión.

slide 242
Diseños Robustos
 Ejemplo: En una planta de manufactura se producen piezas
plásticas usando el proceso de moldeo por inyección. En la
producción regular se ha encontrado que las piezas sufren un
encogimiento excesivo. El personal de la planta identificó siete
variables del proceso para ser utilizadas en el estudio. Las cuatro
variables controlables son: temperatura de moldeo (A), velocidad
(B), tiempo (C) y tolerancia del pasante (‘Gate Size’) (D). Las
variables que no se controlan en la manufactura rutinaria son:
tiempo de ciclo (E), contenido de humedad (F) y presión de aguante
(‘Holding Pressure). Se decide por un experimento fraccionario 27-3
con cuatro puntos centrales en vez del diseño cruzado propuesto por
Taguchi. Usando E=ABC, F=BCD y G=ACD obtenemos los
siguientes tratamientos que se presentan a continuación con sus
respectivas respuestas.

slide 243
Diseños Robustos

A B C D E F G respuesta
-1 -1 -1 -1 -1 -1 -1 6
1 -1 -1 -1 1 -1 1 10
-1 1 -1 -1 1 1 -1 32
1 1 -1 -1 -1 1 1 60
-1 -1 1 -1 1 1 1 4
1 -1 1 -1 -1 1 -1 15
-1 1 1 -1 -1 -1 1 26
1 1 1 -1 1 -1 -1 60
-1 -1 -1 1 -1 1 1 8
1 -1 -1 1 1 1 -1 12
-1 1 -1 1 1 -1 1 34
1 1 -1 1 -1 -1 -1 60
-1 -1 1 1 1 -1 -1 16
1 -1 1 1 -1 -1 1 5
-1 1 1 1 -1 1 -1 37
1 1 1 1 1 1 1 52
0 0 0 0 0 0 0 25
0 0 0 0 0 0 0 29
0 0 0 0 0 0 0 24
0 0 0 0 0 0 0 27

slide 244
Diseños Robustos
 Debido a que se efectuó una observación por tratamiento es posible usar el
gráfico sugerido por Daniels para detectar los efectos significativos. El
mismo se presenta en la figura que sigue.

Normal Probability Plot of the Standardized Effects

A: A
B B: B
C: C
A D: D
E: E
1 AB F: F
G: G
Normal Score

-1

0 10 20 30

Standardized Effect

slide 245
Diseños Robustos
 Notamos que los efectos A, B y AB afectan el promedio o localización del
proceso. La normalidad de los residuales parece ser adecuada como
muestra la siguiente gráfica de probabilidad normal.

Normal Probability Plot of the Residuals


(response is respuest)

0
Residual

-1

-2

-3

-2 -1 0 1 2

Normal Score

slide 246
Diseños Robustos
 El gráfico de los residuales contra los niveles del factor C nos indica que
parece existir una diferencia en la varianza, esto lo observamos del
siguiente gráfico.

Residuals Versus C
(response is respu)

5
Residual

-5

-1 0 1

slide 247
Diseños Robustos
 Una nueva estadística se sugiere para determinar que factores afectan
significativamente la varianza. La misma está dada por:

S (  ) 2

Fi *  ln i
Si (  ) 2

donde representa el estimado de varianza del efecto en el nivel superior


basado en el residual de las observaciones y tendría el mismo significado
solo que en el nivel inferior de cada efecto. Note que sencillamente esta
estadística compara los estimados de varianza para cada nivel de cada
efecto, en ANOVA esto se presumía como constante.

slide 248
Diseños Robustos

 Usando los residuales como los datos para esta nueva


estadística obtenemos los siguientes Fi* para cada efecto:

Efecto Si ( ) 2 S i ( ) 2 Fi*

A 3.80 4.59 -0.38


B 4.01 4.41 -0.18
AB 4.33 4.10 0.11
C 5.70 1.63 2.50
AC 3.68 4.52 0.41
AE 3.85 4.33 -0.24
E 4.17 4.25 -0.03
D 4.64 3.59 0.51
AD 3.39 2.75 0.42
BD 4.0 4.41 -0.18
ABD 4.72 3.64 0.52
AG 3.64 3.64 0.51
G 3.65 3.65 0.23
F 3.12 3.12 -0.30
AF 4.52 4.52 0.72

slide 249
Diseños Robustos

 Donde sobresale el factor C. Los autores sugieren hacer un nuevo gráfico de


probabilidad normal para la estadística Fi*. , que indicaría C como el único factor
afectando la varianza. Así que el modelo de dos etapas determina que A, B y
AB afectan el promedio mientras que C afecta la variabilidad. Para hacer el
proceso insensible debemos colocar el factor C en su nivel bajo lo que redunda
en una menor dispersión como muestra la siguiente representación gráfica:

Centerpoint Cube Plot - Means for Respuest


Factorial Point

31.5 R=11 56.0

R=8
R=2
33.0 60.0
1
R=0
29.75

R=11
B 10.0 R=12 10.0
1

C
7.0 11.0
-1 -1
R=2 -1 1 R=2
A

slide 250