Vous êtes sur la page 1sur 22

UNIVERSIDAD TÉCNICA DE AMBATO

FACULTAD DE CIENCIA E INGENIERIA EN


ALIMENTOS
CARRERA DE INGENIERIA EN ALIMENTOS

Diseño Experimental
Proyecto de Exposición
Docente: MSc. Yoel Hernández
Sexto Nivel
Integrantes:
 Arroba Carolina
 Bajaña Geanella
 Bravo Estefanía
 Escobar Verónica
 Núñez Henrry
 Pruna Dayana
 Rodríguez Dayana
 Santamaria Andrés
 Tamayo Ricardo
 Vaca Guadalupe
Periodo Académico
Septiembre 2017-Febrero 2018
METODOLOGÍA DE SUPERFICIE DE RESPUESTA
INTRODUCCIÓN
El diseño experimental es el procedimiento de planeación y conducción de experimentos,
así como la definición del análisis estadístico para evaluar los resultados, con el objetivo
de tener conclusiones válidas y objetivas.
El objetivo del diseño de experimentos es estudiar si cuando se utiliza un determinado
tratamiento se produce una mejora en el proceso o no. Para ello se debe experimentar
aplicando el tratamiento y no aplicándolo. Si la variabilidad experimental es grande, sólo
se detectará la influencia del uso del tratamiento cuando éste produzca grandes cambios
en relación con el error de observación.
La metodología de superficie de respuesta (MSR),es una colección de técnicas que
permite al investigador inspeccionar una respuesta, que se puede mostrar como una
superficie, cuando los experimentos investigan el efecto que tiene al variar factores
cuantitativos en los valores que toma una variable dependiente o respuesta
OBJETIVOS
Objetivo General.
 Comprender la parte teórica y la importancia sobre metodología de superficie de
respuestas.
Objetivos específicos.
 Aplicar el diseño superficie de respuestas en ejercicios que se relacionen en
ingeniería de alimentos.
 Concluir las gráficas del diseño de superficie de respuestas.
METODOLOGÍA SUPERFICIE DE RESPUESTA (MSR)
La Metodología de Superficies de Respuesta (RSM) es un conjunto de técnicas
matemáticas utilizadas en el tratamiento de problemas en los que una respuesta de interés
está influida por varios factores de carácter cuantitativo. El propósito inicial de estas
técnicas es diseñar un experimento que proporcione valores razonables de la variable
respuesta y, a continuación, determinar el modelo matemático que mejor se ajusta a los
datos obtenidos. El objetivo final es establecer los valores de los factores que optimizan
el valor de la variable respuesta.
Terminología a emplear.
Factores. Son las condiciones del proceso que influencian la variable de respuesta. Estos
pueden ser cuantitativos o cualitativos
Respuesta. Es una cantidad medible cuyo valor se ve afectado al cambiar los niveles de
los factores. El interés principal es optimizar dicho valor.
Función de respuesta. Al decir que un valor de respuesta Y depende de los niveles y de
k factores se dice que existe una función matemática cuyo valor para una combinación
dada de los niveles de los factores corresponde a Y, esto es Y=f(x1, x2, ... xk).
Función de respuesta predicha. La función de respuesta se puede representar con una
ecuación polinomial. El éxito en una investigación de una superficie de respuesta depende
de que la respuesta se pueda ajustar a un polinomio de primer o segundo orden
Y   0  1 x1   2 x2 , donde  son los coeficientes de regresión a estimar, x1 y x2
representan los niveles.
Superficie de respuesta. La relación Y=f(x1, x2,... xk) entre Y y los niveles de los k
factores x1, x2,... xk representa una superficie. Con k factores la superficie está en k+1
dimensiones. Por ejemplo cuando se tiene Y=f(x1) la superficie esta en dos dimensiones,
mientras que si tenemos Y=f(x1, x2.) la superficie está en tres dimensiones.

Grafica de contornos.
Una técnica utilizada para ayudar a visualizar la forma que puede tener una superficie de
respuesta tridimensional consiste en representar la gráfica de contornos de la superficie,
en la que se trazan las denominadas líneas de contorno, que son curvas correspondientes
a valores constantes de la respuesta sobre el plano X1X2 (plano cuyos ejes coordenados
vienen dados por los niveles X1 y X2 de los factores). Geométricamente, cada línea de
contorno es una proyección sobre el plano X1X2 de una sección de la superficie de
respuesta al intersectar con un plano paralelo al X1X2. La gráfica de contornos resulta útil
para estudiar los niveles de los factores en los que se da un cambio en la forma o altura
de la superficie de respuesta. La representación matemática de los modelos de MSR puede
ser de diversas maneras:
El método clásico de MSR
En un problema de estudio de cierta función expectativa, cuya expresión en general puede
denotarse como f (ξ, θ), al experimentador le resultara de enorme valor conocer cual es la
forma que realmente tiene esta función, ya que la misma es desconocida. La idea básica
es utilizar funciones de aproximación del tipo g(x, β) ≈ f (ξ, θ) para ir experimentando
secuencialmente la función desconocida a través de diseños sucesivos, en donde x
representara un vector columna de factores elegido por el experimentador de un grupo
de mayor dimensión, ξ y β será el vector columna de parámetros del modelo así elegido,
también como subconjunto de otro mayor θ.
Ya que en la generalidad de los casos esta función no se conoce, mediante este enfoque
se irán realizando una serie de experimentos, secuencialmente diseñados. El pasaje de un
diseño a otro estará por lo general ligado al comportamiento que tengan los valores de los
factores x de tal modo que se observe que valores de dicho vector van conduciendo a
obtener valores mayores o menores del valor esperado de la respuesta
Las estrategias suelen comenzar ajustando modelos de primer orden, las cuales parten de
la hipótesis que la zona de experimentación se encuentra relativamente alejada del valor
critico de la función. Entonces, el valor esperado de la respuesta se va aproximando
mediante aproximaciones polinómicas de primer orden, que permite averiguar cuál es la
dirección (dentro de plano de factores) en donde aquella función crece más rápidamente.
Esto se va repitiendo secuencialmente, considerando nuevos puntos de x en la dirección
´precipitada. Al ajustarse el modelo siguiente, se buscará nuevamente otra dirección de
máximo crecimiento de la función, que definirá la pauta para establecer nuevos puntos de
diseño. De esta forma, se continua se continua hasta que se detecte falta de ajuste de los
modelos de primer orden, lo cual seguramente será indicativo de que se esta en presencia
de curvaturas en la función teórica que se está explorando. En las etapas siguientes se
utilizara entonces aproximaciones polinómicas de segundo orden para g(x, β) para seguir
ganando conocimiento acerca de f (ξ, θ), lo que redundara en funciones polinómicas que
ajusten cada vez mejor a la función verdadera.
Finalmente, a través del llamado análisis canónico de la superficie ajustada, se podrá
identificar a que forma geométrica corresponde la superficie estudiada, luego de lo cual,
será necesario verificar el cumplimiento de las hipótesis tenidas en cuenta a la hora de
comenzar el estudio.
A continuación, se presenta un resumen de la forma de proceder ordenada y
sistemáticamente para el avance secuencial del conocimiento de sistemas cuyo
funcionamiento se desconoce y se desea conocer mediante la experimentación secuencial
Estrategia clásica de experimentación secuencial

Polinomio de primer orden


Se utiliza cuando se desconoce la relación entre la respuesta y las variables
independientes, por ello requerimos un modelo que aproxime la relación funcional entre
Y y las variables independientes.
Un modelo de primer orden (lineal) sin interacciones o productos cruzados
y   0  i 1 1 x1  e
k

Dónde: e representa el ruido o error observado en la respuesta y.


Los parámetros del modelo se estiman mediante el método de mínimos cuadrados. Una
vez que se tienen los estimadores se sustituyen en la ecuación y obtenemos el modelo
ajustado Y  b0  b1 x1  b2 x2
Donde la matriz X puede escribirse alternativamente como X = [ 1 : D ], con D la matriz
de combinaciones de niveles de los factores, denominada matriz de diseño.
Cuando se trabaja con dos factores y se utiliza el modelo lineal ajustado de primer orden
La superficie de respuesta y sus curvas de nivel, que son las líneas con valores iguales de
respuesta, se podrían representar con las siguientes gráficas tomadas de un ejemplo donde
los factores son temperatura y tiempo y la respuesta es el rendimiento:

Si el modelo anterior lo convertimos en un modelo de segundo orden, el modelo ajustado


sería:
yˆ = β0 + β1 x1 + β2 x2 + β11 x1 + β22 x2 + β12 x1 x1,
Podría ser representado gráficamente de la siguiente manera:

En la fase inicial del estudio de una superficie de respuesta se trata de identificar la región
de respuesta óptima y para ello se utilizan experimentos factoriales completos 2k o
fraccionarios 2 k − p , con el fin de estimar las respuestas medias para un modelo lineal o
de primer orden.
Se recomienda generalmente agregar dos o más observaciones en el nivel medio de cada
uno de los factores para estimar el error experimental y tener un mecanismo de evaluación
para saber si el modelo lineal es apropiado
Hipótesis para los coeficientes del modelo:
H 0 : i  0
H 0 : i  0
Significancia del coeficiente:

Se rechazará la hipótesis nula, en el caso de que la probabilidad calculada sea menor que
el nivel de significancia especificado, en este caso se utilizó a = 0.05 o el 95% del nivel
de confianza.
Análisis del error en el modelo ajustado
Para estimar los coeficientes se requieren N൒k+1 valores de respuesta (Y). El análisis de
los datos se suele representar en una tabla de análisis de varianza. La tabla presenta las
diferentes fuentes de variación que contribuyen a la variación total de los datos. La
variación total recibe el nombre de suma de cuadrados total SST, y se calcula de la
siguiente manera:
n 
SST   (Y  Y ) 2
i 1

Donde Yi es el valor observado en la i-ésima muestra.


La suma de cuadrados se compone por la suma de cuadrados debido a la regresión. La
fórmula de la suma de cuadrados debido a la regresión es:
2

N 

SSR    yi  y 
i 1  
La suma de cuadrados residual se calcula:
2
N
 

SSR    yi  yi 
i 1  

Se puede hacer un análisis del ajuste del modelo con la R2 , que es la proporción total de
la variación de las Yi con respecto a la media que se puede explicar con la ecuación de
regresión ajustada.
SSR
R2 
SST

DISEÑOS DE SUPERFICIE DE RESPUESTA


Diseños de primer orden
Diseño para ajustar modelos en los que sólo son importantes los efectos principales y no
existen efectos de interacción. Estrictamente hablando, para estimar los k + 1 parámetros
del modelo de primer orden se requiere un mínimo de k + 1 puntos experimentales.
Un criterio de selección del diseño de primer orden es que la varianza de la respuesta
predicha (var[Yˆ (x)]) en el punto x´= (x1, x2,..., xk) sea mínima. Este criterio es
importante porque cuando se busca determinar la dirección óptima de movimiento a partir
de los predichos por el modelo, éstos tienen mayor precisión, lo cual se traduce en mayor
certeza de la dirección seleccionada. Los diseños que satisfacen este criterio son los que
tienen la propiedad de ortogonalidad. Entre los más utilizados están los siguientes:

1. Diseños factoriales 2k
2. Diseños factoriales fraccionados 2k – p
3. Diseño de Plackett-Burman
4. Diseño simplex

Todos estos diseños, excepto el diseño simplex, emplean dos niveles en cada factor, lo
cual tiene que ver con el hecho de que sólo interesa detectar el efecto principal de cada
factor.
Diseños de segundo orden
Son aquellos diseños que permiten ajustar un modelo de segundo orden para así estudiar,
además de los efectos lineales y de interacción, los efectos cuadráticos o de curvatura
pura. Por consiguiente, estos diseños se emplean cuando se quiere explorar una región
que se espera sea más compleja o cuando se cree que el punto óptimo ya se encuentra
dentro de la región experimental. El modelo de segundo orden está dado por:

Aquí se tienen k = 2 términos de primer orden, dos términos puros de segundo orden o
cuadráticos y un término de interacción dado por β12x1x2. Los términos x1 y x2 se
codifican en la forma conocida de ±1. El término ε denota al acostumbrado error del
modelo.

Los diseños de segundo orden más recomendados como son: el diseño de Box-Behnken
y el diseño central compuesto o de composición central.

Diseño de Box-Behnken. Este diseño se aplica cuando se tienen tres o más factores, y
suelen ser eficientes en cuanto al número de corridas. Es un diseño rotable o casi rotable
que se distingue porque no incluye como tratamientos a los vértices de la región
experimental. Pueden estimar eficientemente los coeficientes de primer y segundo orden;
sin embargo, no pueden incluir corridas de un experimento factorial.

Tabla de la Matriz del diseño de Box-Behnken para tres factores


Representación del diseño de Box-Behnken para tres factores.

Diseño de composición central. El diseño de composición central (DCC) es el más


utilizado en la etapa de búsqueda de segundo orden debido a su gran flexibilidad: se puede
construir a partir de un diseño factorial com pleto 2k o fraccionado 2k – p agregando
puntos sobre los ejes y al centro, además de otras propiedades deseables. Este diseño se
compone de tres tipos de puntos:
1. Una réplica de un diseño factorial en dos niveles, completo o fraccionado. A esta parte
del DCC se le llama porción factorial.
2. n0 puntos o repeticiones al centro del diseño, con n0 ≥ 1.
3. Dos puntos sobre cada eje a una distancia a del origen. Estos pun tos se llaman porción
axial.

Representación y construcción de los DCC para k = 2 y 3 factores

Cuando es posible, el diseño central compuesto tiene las propiedades convenientes de


bloques ortogonales y rotabilidad.
Bloques ortogonales
Con frecuencia, los diseños centrales compuestos se ejecutan en más de un bloque.
Los diseños centrales compuestos pueden crear bloques ortogonales, lo que
permite estimar los términos del modelo y los efectos de bloque de manera
independiente y minimizar la variación en los coeficientes de regresión.
Rotabilidad
Los diseños rotables ofrecen varianza de predicción constante en todos los puntos
que están equidistantes del centro del diseño.

NOTA: Cuál diseño de segundo orden utilizar?


Existen varios criterios que se pueden tomar en cuenta para seleccionar un diseño de
segundo orden, entre los que destacan:
1. Que tenga un número mínimo de tratamientos y que permita estimar todos los
parámetros del modelo de segundo orden completo.
2. Que sea flexible, en el sentido de que se pueda construir a partir de diseños de primer
orden.
3. Que tenga buenas propiedades como ortogonalidad, rotabilidad y/o precisión
uniforme, las cuales tienen que ver con la calidad de estimación con el modelo.
MÉTODO DE MÁXIMA PENDIENTE EN ASCENSO
El método de máxima pendiente en ascenso consiste en ejecutar una secuencia de
experimentos a lo largo de la línea de máximo incremento de la respuesta. Si el modelo
ajustado de primer orden es adecuado, la información que éste proporciona se utiliza para
determinar una dirección en la cual se espere observar mayores valores de la variable
respuesta. A medida que se avanza sobre la superficie ajustada en la dirección en que se
incrementan los valores de la respuesta y se va llegando a una región en la que haya
curvatura en la superficie real, el incremento en la respuesta se estabilizará en el punto
más alto de la superficie ajustada. Si se continúa en esta dirección y la altura de la
superficie disminuye, se lleva a cabo un nuevo conjunto de experimentos y se ajusta de
nuevo el modelo de primer orden. Se determina una nueva dirección hacia valores
crecientes de la respuesta y se ejecuta otra secuencia de experimentos en la dirección
determinada. Este proceso continúa hasta que se hace evidente que a partir del método no
se puede obtener un incremento en la respuesta o éste es muy pequeño.
Diseños experimentales para ajustar superficies de respuesta.
El ajuste y análisis de una superficie de respuesta se facilita con la elección apropiada de
un diseño experimental. Un diseño es el conjunto específico de combinaciones de los
niveles de las k variables que se utilizará al llevar a cabo el experimento. La elección de
un diseño adecuado del experimento a realizar es fundamental para modelar y explorar la
superficie de respuesta usada para ajustar un modelo polinómico al conjunto de datos
recogidos en los puntos del diseño. Así pues, sería deseable que el diseño tuviera, de las
características que se enumeran a continuación, y dado que algunas de ellas resultan
conflictivas entre sí, las que más sirvan al interés del experimento:
 Generar una distribución razonable de puntos y, por tanto, de información, en toda
la región de interés, pero utilizando el menor número posible de puntos
experimentales.
 Asegurar que, para cada punto x, el valor ajustado, Ŷ(x), está tan cerca como sea
posible del valor real, Y(x).
 Permitir la detección de falta de ajuste en el modelo.
 Permitir la ejecución de los experimentos en bloques.
 Permitir la construcción secuencial de diseños de orden creciente.
 Proporcionar una estimación interna de la varianza del error.
 Asegurar simplicidad en los cálculos de las estimaciones de los parámetros del
modelo.
La diferencia entre (RSM) y un diseño experimental corriente estriba en que un diseño
experimental por si solo tiene como objetivo localizar el tratamiento “ganador” entre
todos aquellos que se han probado. En cambio, RSM pretende localizar las condiciones
óptimas de operación del proceso. Ello supone un reto para el investigador, requiere una
estrategia más completa e incluye la posibilidad de efectuar varios experimentos
secuenciales y el uso de técnicas matemáticas más avanzada.

Diseños para ajustar modelos de primer orden.


Si el modelo es una representación adecuada de la respuesta real esperada, entonces el
diseño elegido para estimar los parámetros debe proporcionar valores razonables de la
respuesta sobre la región de interés. Los diseños considerados con el propósito de recoger
datos para ajustar un modelo de primer orden se conocen como diseños de primer orden.
Un criterio razonable para la elección de un diseño de primer orden adecuado es la
minimización de Var(Ŷ), lo que se logra minimizando la varianza de los estimadores de
los parámetros βi, i=1, ..., k. Hay una única clase de diseños que lo consiguen, los
ortogonales, que en los modelos de primer orden son aquellos para los que se verifica que
los elementos de fuera de la diagonal principal de la matriz (XTX) son cero, lo que nos
permite determinar de manera independiente los efectos de los k factores (medidos a
través de los valores de bi, i = 1, ..., k). Además, se verifica que todo diseño ortogonal de
primer orden es invariante por rotación.
Una clase única de diseños que minimizan la varianza de los coeficientes de regresión
(βi) son los diseños ortogonales de primer orden. Por ortogonal se entiende que los
elementos fuera de la diagonal de la matriz (XTX) son iguales a cero, lo cual implica que
los productos cruzados de las columnas de la matriz X es igual a cero.
En esta clase de diseños ortogonales de primer orden se incluyen:
1. Diseños factoriales 2k .
2. Fracciones de la serie 2k .
3. Diseños simplex.
Como concluir un modelo de metodología de superficie de respuesta.
Se puede usar el análisis canónico para caracterizar la superficie de respuesta, por medio
de la identificación de los valores propios en una ecuación de determinantes:
=  #  # 
 # 0
 # 
2  #   #  0
1 # 2 #
y  ys  #1  # 2
ys  Valor del punto estacionario
Es el punto del espacio de los factores en el cual el plano tangente a la superficie tiene
pendiente igual a cero y es un “candidato al óptimo”.
De manera que dependiendo de los signos que tengan los valores propios se concluye
que:
Positivos: es un mínimo.
Negativos: es un máximo.
Signos diferentes: puntos de silla.

Si ambos negativos, se puede decir que un movimiento en cualquier dirección, alejándose


del centro del nuevo sistema de coordenadas, resulta en una pérdida cuadrática de
respuesta, es por eso que la superficie ajustada (elipsoide) tiene un máximo.
En el caso de ser ambos positivos se tendrá un mínimo (también elipsoide). Por otra parte
si uno de los términos es negativo y el otro termino es positivo entonces se dice es un
punto silla (paraboloide hiperbólico), como en la figura.

Fuente: Cámara, De Zan, Candioti & Goicoechea, 2016.


Ejercicio de aplicación
Uso de software estadístico para diseño de superficie de respuesta
Se obtuvieron los porcentajes de proteína de cáscara de naranja secada a varios tiempos (min) y
temperaturas (°C). ¿Hay un modelo que explique la relación entre las variables?. Para esto se
obtuvieron los siguientes datos:

Temperatura Tiempo(min) Proteína


(°C)
60 11,2 0,5
60 20,0 1,0
60 20,0 1,5
60 11,0 0,5
60 12, 0,5
70 13,0 1,6
70 11,5 2,0
70 21,0 1,5
70 20,0 0,5
70 21,0 1,5
Gráficos
Optimización de Superficie de respuesta máxima
Optimización de Superficie de respuesta mínima
Conclusión

Se puede observar que al optimizar nuestro diseño podemos obtener las temperaturas así como el
tiempo idóneo para aumentar o disminuir la cantidad de proteína requerida.
Bibliografía
Akira, I. (2003). Metodología de Superficie de Respuesta. Obtenido de
http://bibing.us.es/proyectos/abreproy/70238/fichero/Capitulo+7.pdf
Armendariz, M. (2008). Apliaciones de superficie de respuesta. Obtenido de
http://catarina.udlap.mx/u_dl_a/tales/documentos/lii/peregrina_p_pm/capitulo2.p
df
Cámara, M., De Zan, M., Candioti, L. & Goicoechea, H. (2016). DISEÑO
EXPERIMENTAL Y OPTIMIZACIÓN DE SISTEMAS CON MÚLTIPLES
RESPUESTAS. Obtenido de http://www.fbcb.unl.edu.ar/laboratorios/ladaq/wp-
content/uploads/2016/06/3-RSM_Mezclas_2016.pdf
Cespón, R. (2007). Analisis de diseños experimentales. España: Universidad Compostola.
Obtenido de
https://books.google.com.ec/books?id=BQwTqorJNIsC&pg=PA211&dq=dise%
C3%B1o+de+superficie+de+respuesta&hl=es&sa=X&ved=0ahUKEwi30uvetdb
YAhWa3oMKHfXtBLIQ6AEILDAB#v=onepage&q=dise%C3%B1o%20de%2
0superficie%20de%20respuesta&f=false
De Zan, A. (2006). Principios de metodología de superficie de respuesta para modelos
logísticos. Tesis Doctoral. Universidad politécnica de Cataluña. Obtenido de:
http://hdl.handle.net/10803/6518
Gutiérres Pulido, H., & De la Vara Salazar, R. (2008). Análisis y diseño de experimentos.
urnal of Chemical Information and Modeling (Vol. 53).
https://doi.org/10.1017/CBO9781107415324.004