Vous êtes sur la page 1sur 6

Artculo

IETA

Varianza

Copyright 2015 Instituto de Estadstica Terica y Aplicada

Superficies de Respuesta mediante un Diseo Central Compuesto


Lic. Mara Gilka Jimnez Careaga
gilka.jimenez@gmail.com

1. Introduccin
La Metodologa de Superficies de Respuesta (MSR) es una combinacin de anlisis de Regresin y Diseo
Experimental que fue introducida por Box y Wilson en 1951. Es una estrategia de experimentacin secuencial y modelacin que conduce a la localizacin de los valores ptimos de las variables independientes que
maximizan, minimizan o cumplen ciertas restricciones en la variable respuesta.

2. Construccin de una superficie de respuesta


La investigacin de una superficie de respuesta en primera instancia aborda la localizacin de la regin en la
cual se encuentra la respuesta ptima Y , en las siguientes etapas, luego de comprobar experimentalmente,
va reduciendo la superficie de respuesta en estudio, en algunos casos hasta obtener la convergencia en
un punto ptimo.
El proceso se inicia con la planificacin de un diseo experimental exploratorio que permite la aproximacin
a la superficie mediante la representacin matemtica de los modelos ms simples, entre estos tenemos:
Un modelo de primer orden (lineal) sin interacciones o productos cruzados:
Y = 0 +

(1)

i xi +

i=1

Modelo de primer orden (lineal) con interacciones o productos cruzados:


Y = 0 +

i xi +

i=1

j1
k

ij xi xj + ,

(2)

j=2 i=1

donde representa el ruido o error observado en la respuesta Y , xi son factores cuantitativos observados.
En esta primera fase, se utilizan experimentos factoriales completos 2k o fraccionarios 2kp , con el fin de
estimar las respuestas medias para un modelo lineal o de primer orden, como el de la ecuacin (2). Se
recomienda generalmente agregar dos o ms observaciones en el nivel medio de cada uno de los factores
para estimar el error experimental y tener un mecanismo de evaluacin para saber si el modelo lineal es
apropiado.
En la siguiente etapa, una vez identificada la regin de respuesta ptima, los diseos factoriales completos
o fraccionarios a dos niveles no son suficientes, pues se requieren al menos tres niveles para cada factor
y el diseo debe de tener 1 + 2k + k(k 1)/2 puntos distintos para estimar los parmetros de un modelo
de regresin cuadrtica.
Modelo cuadrtico o de segundo orden:
Y = 0 +

i=1

i xi +

j1
k

j=2 i=1

ij xi xj +

ii x2 +

(3)

i=1

Entre los diseos experimentales que pueden ser utilizados en esta fase estn los experimentos factoriales
3k , sin embargo son considerados poco prcticos por el elevado nmero de combinaciones de tratamientos que requiere. Existen otros diseos desarrollados para la aproximacin a una superficie de segundo
orden, que no requieren tantas combinaciones de tratamientos, entre estos estn los diseos centrales
compuestos propuestos por Box y Wilson, y los diseos Box-Behnken.
Revista Varianza 11, 3136

31

M. G. Jimnez

Varianza

3.

IETA

Anlisis de la superficie de respuesta

La naturaleza secuencial e iterativa de la metodologa de Superficie de Respuesta requiere que en cada fase
se identifiquen los factores significativos, se realice un anlisis de adecuacin del modelo y se determine
la direccin en la cual se encuentran las condiciones ptimas de experimentacin.
Para identificar los factores que tienen mayor influencia en la respuesta y examinar la bondad de ajuste
del modelo se utiliza el anlisis de varianza. Mediante el mtodo de mxima pendiente se determina la
direccin en la cual se encuentra la regin ptima. El anlisis de la superficie ajustada se realiza mediante
el anlisis cannico, el cual permite determinar la naturaleza del punto estacionario.
En el caso de un modelo de segundo orden, la ecuacin escrita en forma matricial es:
Y = 0 + x b + x Bx

(4)

El punto crtico, si es que existe, ser un conjunto de condiciones en x tal que las derivadas parciales
son simultneamente cero, es decir:

Y
xi

Y

=
(x b + x Bx) = 0
x
x
b + 2Bx = 0,
siendo el punto estacionario

B 1 b
.
(5)
2
El punto estacionario puede ser un punto mximo, un punto mnimo o un punto de ensilladura (minimax),
la forma cannica de la funcin permite establecer su condicin.
x0 =

Reemplazando (5) en (4)


Forma cannica:

Y = 0 + x0 b/2.
Y = Y0 + 1 w12 + 2 w22 + + k wk2 ,

donde Y0 es la respuesta estimada en el punto x0 , i son las races caractersticas de la matriz B y w = M z


(siendo M la matriz de los vectores propios asociados a i ).
Si todos los i son negativos, x0 representa un punto de mxima respuesta; si los i son todos positivos, x0
es un mnimo de la superficie observada. En el caso de que los i difieran en signo, el punto estacionario es
un punto de ensilladura. En general si algn i es cero o un valor muy cercano a cero, el punto estacionario
no es nico, se encuentra en una loma estacionaria.

4.

Diseo central compuesto

Para comprender los diseos centrales compuestos, que se utilizarn en el ejemplo que se abordar, es
necesario mencionar que los factores generalmente se codifican, pues facilita los clculos, estandariza
las variables eliminando las unidades de medida de las variables originales y se incrementa la precisin al
estimar los coeficientes del modelo.
Los niveles codificados de los factores de un diseo factorial 2k se obtienen mediante la siguiente frmula:

xi = 2(Ai A)/R
i , donde Ai es el i-simo nivel del factor A, A es el nivel promedio del factor A y Ri es
el rango entre el valor ms alto y el ms bajo de del factor A. Con este procedimiento, se asigna valores
1 a las variables asociadas al arreglo factorial 2k .
Los diseos centrales compuestos son diseos de tratamientos factoriales 2k con 2k combinaciones adicionales llamadas puntos axiales y nc puntos centrales. Las coordenadas de los puntos axiales de los ejes
del factor codificado son (,0,0,. . .,0), (0, ,0,. . .,0), . . ., (0,0,0,. . ., ), y los puntos centrales son de
32

Revista Varianza 11, 3136

Artculo

IETA

Varianza

la forma (0,0,0,. . .,0). Dependiendo de la eleccin de en los puntos axiales, el diseo central compuesto
puede tener diferentes propiedades como ortogonalidad, rotabilidad y uniformidad. Se considerar solamente una propiedad deseable en estos diseos consistente en que la varianza de los valores estimados
sea constante en puntos equidistantes del centro del diseo. Esta propiedad llamada rotabilidad se logra
estableciendo = (2k )1/4 . As, el valor de para un diseo con dos factores es = 1,414 y para tres
factores = 1,682. La frmula para cambiar si se realizan rplicas del diseo o si se utiliza un diseo
factorial fraccionario.

5. Ejemplo de aplicacin
Para ejemplificar el procedimiento de superficies de respuesta se utilizarn los datos del ejercicio propuesto
5.6 del libro Response Surfaces de Andr I. Khuri, John A. Cornell.
Se aplicaron a parcelas experimentales de man dos tipos de fertilizantes, uno estndar de la combinacin
de Nitrgeno-Fsforo-Potasio (Factor A) y el otro un suplemento nutricional (Factor B), se observar los
efectos en el rendimiento del man medido en libras por parcela. Los niveles de cantidad (libras/parcela) de
cada fertilizante aplicado fueron determinados de acuerdo a lo requerido por el diseo central compuesto
rotable.
En el siguiente cuadro se presenta los datos utilizados, el procedimiento se realiz aplicando el software
Statgraphics, en el cual se eligi el diseo compuesto 2k estrella y el modelo cuadrtico para la estimacin
del rendimiento (Y ).
Cuadro 1 Niveles de los factores, variables codificadas y variable respuesta

Factor 1
50
120
50
120
35,5
134,5
85
85
85
85

Factor 2
15
15
25
25
20
20
12,9
27,1
20
20

x1
1
1
1
1
1,414
1,414
0
0
1,414
0
1,414
0
0
0
0

x2
1
1
1
1
0
14,22
7,9
16,49
15,73
16,3

Rendimiento (Y )
(lb/parcela)
Rplica 1 Rplica 2
7,52
8,12
12,37
11,84
13,55
12,35
16,48
15,32
8,63
9,44
12,57
7,33
17,4
17
16,3

Cuadro 2 Efectos estimados para rendimiento (lb)


Efecto
promedio
A: Factor A
B: Factor B
AA
AB
BB
bloque

Estimado
16,33250
3,35025
5,52991
4,89439
0,66750
3,82938
0,15200

Int. Confianza
0,97102
0,97102
0,97102
1,28454
1,37323
1,28454
0,44010

V.I.F.
1,000
1,000
1,225
1,000
1,225
1,000

Intervalos de confianza del 95.0 de confianza (intervalos) basados en el error puro con 2 g.l. (t = 4.30265).

Revista Varianza 11, 3136

33

M. G. Jimnez

Varianza

IETA

Diagrama de Pare to Estandarizada para VRe n


Grfico 1 Diagrama
de Pareto estandarizada para VRen

+
-

B:Factor_B
AA
A:Factor_A
BB
AB
0

10
15
Efecto estandarizado

20

25

El Cuadro 2 muestra las estimaciones para cada uno de los efectos estimados y las interacciones. Igualmente se muestran los intervalos de confianza del 95,0 % para los estimados. Note tambin que el factor
de inflacin de varianza (V.I.F.) ms grande, es igual a 1,225. Para un diseo perfectamente ortogonal,
todos los factores seran igual a 1.
Cuadro 3 Anlisis de varianza para el rendimiento (Y )
Fuente
A: Factor A
B: Factor B
AA
AB
BB
bloques
Falta de ajuste
Error puro
Total (corr.)

Suma de
Cuadrados
44,8965
122,319
54,754
0,891112
33,5179
0,11552
9,90654
0,40745
241,688

Gl
1
1
1
1
1
1
11
2
19

Cuadrado
Medio
44,8965
122,319
54,754
0,891112
33,5179
0,11552
0,900595
0,203725

Razn-F

Valor-P

220,38
600,41
268,76
4,37
164,52
0,57
4,42

0,0045
0,0017
0,0037
0,1716
0,0060
0,5300
0,1988

R-cuadrada = 95,7325 por ciento

Error absoluto medio = 0,606823

R-cuadrada (ajustada por g.l.) = 93,7629 por ciento

Estadstico Durbin-Watson = 1,88927 (P =0,3267)

Error estndar del est. = 0,451359

Autocorrelacin residual de Lag 1 = 0,0523126

El cuadro 3 (ANOVA) particiona la variabilidad de Y (rendimiento) en valores separados para cada uno de
los efectos, prueba la significancia estadstica de cada efecto comparando su cuadrado medio contra un
estimado del error experimental. En este caso, 4 efectos tienen una valor-P menor que 0,05 indicando
que son significativamente diferentes de cero con un nivel de confianza del 95,0 %.
La prueba de falta de ajuste est diseada para determinar si el modelo seleccionado es adecuado para describir los datos observados o si se debera usar un modelo ms complicado. La prueba se realiza
comparando la variabilidad de los residuos del modelo actual con la variabilidad entre observaciones obtenidas en condiciones repetidas de los factores. Dado que el valor-P para la falta de ajuste en la tabla
ANOVA es mayor que 0,05, el modelo cuadrtico parece ser adecuado para los datos observados al nivel
de confianza del 95,0 %.
El estadstico R-cuadrado indica que el modelo, as ajustado, explica 95,7325 % de la variabilidad en Y .
El estadstico R-cuadrado ajustado, que es ms adecuado para comparar modelos con diferente nmero
de variables independientes, es 93,7629 %. El error estndar del estimado muestra que la desviacin
34

Revista Varianza 11, 3136

Artculo

IETA

Varianza

estndar de los residuos es 0,451359. El error medio absoluto (MAE) de 0,606823 es el valor promedio
de los residuos. El estadstico de Durbin-Watson (DW) prueba si en los residuos hay alguna correlacin
significativa basada en el orden en que se presentan los datos en el archivo. Puesto que el valor-P es
mayor que 5,0 %, no hay indicacin de autocorrelacin serial en los residuos con un nivel de significancia
del 5,0 %.
Cuadro 4 Coeficientes de regresin para VRen
Coeficiente
constante
A: Factor A
B: Factor B
AA
AB
BB

Estimado
16,3325
1,67512
2,76495
2,44719
0,33375
1,91469

La ecuacin del modelo ajustado es:


Rendimiento = 16,3325+1,67512 FactorA + 2,76495 FactorB 2,44719 Factor2A
0,33375 FactorA FactorB 1,91469 Factor2B
Grfica de Inte raccin para VRen
Grfico
2 Interaccin para VRen
19
17
Factor_B=1,0
VRen

15
Factor_B=1,0

13

Factor_B=-1,0

11
9
Factor_B=-1,0

-1,0

1,0
Factor_A

Supe rficie de Re spue sta Estimada

Grfico 3 Superficie de respuesta estimada

19

VRen

15
11
7
3
-1
-1,5

0,5

-1

-0,5

0,5

1,5

0
-0,5
-1
1,5 -1,5
Factor_B

Factor_A

Revista Varianza 11, 3136

35

M. G. Jimnez

Varianza

IETA

Cuadro 5 Camino de mximo ascenso para rendimiento (lb)


Factor A

Factor B

0,0
1,0
2,0
3,0
4,0
5,0

0,0
0,913353
1,21709
1,51843
1,81851
2,11775

Prediccin para
Rendimiento (Y ) (lb)
16,3325
16,1837
9,61052
2,40338
19,8535
42,7373

Contornos de la Supe rficie de Re spue sta Estimada

Grfico 4 Contornos de la superficie de respuesta estimada


1,5

Factor_B

17,0

0,5
0
-0,5

13,0 VRe n
-1,0
1,0
15,0
3,0
5,0
7,0
9,0
11,0
13,0
15,0
17,0
11,0
19,0

-1

9,0
1,0 3,0

-1,5
-1,5

-1

7,0

5,0
-0,5

0
Factor_A

0,5

1,5

Para esta superficie el punto estacionario es:


x0 =

1
B 1 b
=
2
2

2,447190 0,166875
0,166875 1,914690

]1 [

16,7512
2,76495

[
=

3,3934690
0,4262777

Y0 = 19,5422679
Se observa que el Rendimiento (Y ) es mayor para este punto.
Este es el trayecto, desde el centro de la regin experimental actual, a travs del cual la respuesta estimada
(Y ) cambia ms rpidamente con un cambio menor en los factores experimentales. Indica buenas caractersticas para ejecutar experimentos adicionales si el objetivo es incrementar el Rendimiento. Se nota que
la mayor respuesta (16,3325) se encuentra prxima al origen por tanto los nuevos puntos experimentales
deberan estar en esa direccin.

Referencias
[1] Box, George E. P.; Draper, Norman R. Empirical Model Building and Response Surfaces.
[2] Cochran, William G.; Cox, Getrude M. Diseos Experimentales.
[3] Draper, N. R. Center Points in Second Order Response Surface Design. Technometrics Vol.18.
[4] Heiberger, Richard M. Computation for the Analysis of Designed.
[5] Khuri, Andr I.; Cornell, John A. Response Surfaces Designs and Analyses.

36

Revista Varianza 11, 3136

Vous aimerez peut-être aussi