Vous êtes sur la page 1sur 81

M.Sc. Lic.

Oscar Soliz Vásquez 1 QMC 304


CAPITULO Nº 1

DISEÑO DE EXPERIMENTOS

1.1. INTRODUCCIÓN

En un intento de captar que la Estadística puede ser un campo interesante y estimulante que
toca muchísimos aspectos de gran importancia en la vida diaria, en toda rama del saber
humano, como son las ciencias e ingeniería, es necesario presentar un texto que además de
contener los conceptos teóricos, sea instructivo y legible con énfasis en datos químicos
obtenidos como fruto de la experimentación.

En muchos problemas de tipo práctico es imposible probar u observar la totalidad de los


elementos que intervienen, por consiguiente es necesario recurrir al muestreo, así se miden o
consideran las propiedades de una muestra con el objeto de estimar las características de la
población de donde se extrajo la muestra. No sólo es conveniente tomar la muestra
representativa de la población, sino también de que la conclusión a la que se llegue es sólo
probablemente correcta, no se puede tener una certeza total con base en el muestreo.

Es muy importante que todo profesional de Ciencias o ingeniería, cuando pretenda realizar
una investigación o un experimento, planifique adecuadamente sus procedimientos y pasos a
seguir, esto quiere decir que “diseñe” un buen plan de acción.

En la industria es una práctica hacer experimentos o investigaciones con la intención de que al


hacer cambios en los materiales, métodos o condiciones de operación de un proceso se
puedan detectar, resolver y minimizar los problemas de calidad.

Sin embargo es común que las pruebas experimentales se realicen apelando a la experiencia
y a la intuición, en lugar de seguir un plan experimental adecuado que garantice una buena
respuesta a las interrogantes planteadas.

El diseño de experimentos es la forma eficaz de hacer pruebas en los procesos, ya que


proporciona la técnica y las estrategias necesarias para llevar de manera eficiente los
procesos a mejores condiciones de operación.

Algunos problemas de la industria que se pueden resolver con el diseño y análisis de


experimentos son los siguientes:
M.Sc. Lic. Oscar Soliz Vásquez 2 QMC 304
 Comparar a dos o más materiales, con el fin de elegir el mejor y que cumpla los
requerimientos.

 Comparar varios instrumentos de medición para verificar la precisión y exactitud.

 Proponer nuevos procesos, variar sus condiciones y hacer cambios para reducir los
errores o defectos.

 Determinar los factores o fuentes de variabilidad que afectan al proceso.

 Localizar las condiciones de operación.

 Apoyar en el diseño o rediseño de un producto o proceso para mejorar su desempeño.

1.2. EL EXPERIMENTO

Los investigadores realizan experimentos en todos los campos del saber, para descubrir algo
acerca de un proceso o sistema en particular.

El término experimento puede tener dos acepciones una general y otra particular:

 La general se refiere a tomar una acción y después observar las consecuencias;

 La acepción particular se refiere a un estudio de investigación en el que se manipulan


deliberadamente una o más variables independiente para analizar las consecuencias que
la manipulación tiene sobre una o varias variables dependientes.

La experimentación proporciona datos de observación directa sobre los elementos de una


población o muestra, y no deben ser cambiados ni modificados durante la investigación.

A menudo, es difícil asignar causa y efecto por el estudio de los datos de observación, si el
interés es establecer relaciones causales se debe trabajar con datos experimentales, donde
se ha controlado o modificado ciertos factores, que son resultados de experimentos
lógicamente diseñados que ofrecen pruebas a favor o en contra de las relaciones causales.

Causa Efecto
(Variable independiente) (Variable dependiente)

X Y

Entonces el experimento “es una prueba o ensayo, que se basa en reproducir algún hecho
diferente de lo habitual, la aparición de circunstancias extrañas en presencia de características
especialmente preparadas para interpretar y extraer conclusiones de lo que ocurra”.

Desde otro punto de vista se puede definir: “un Experimento es la Muestra en espacio y
tiempo en base a la cual se estimaran parámetros poblacionales, y se tomaran decisiones
basadas en las comparaciones de las poblaciones en estudio”.

Cada experimento es una pregunta que se hace respecto a productos y/o procesos.
M.Sc. Lic. Oscar Soliz Vásquez 3 QMC 304
Para que las respuestas no sean confusas es necesario que el experimento sea:

 Técnicamente muy bien planeado

 Cuidadosamente conducido.

 Adecuadamente analizado

 Correctamente interpretado

¿Cuáles son las etapas principales en un experimento?

 Buscar o definir un problema - donde las investigaciones experimentales de


resultados iniciales son tenidas en cuenta para plantear nuevas hipótesis a ser
probadas.

 Diseño del experimento - donde algunas formas para probar una nueva hipótesis son
desarrolladas.

 Desarrollo del experimento – donde se ejecuta el experimento planificado.

 Análisis, donde los datos experimentales son cuidadosamente examinados para


determinar que evidencia tienen en relación con la hipótesis de estudio.

Como lo fundamental en la decisión sobre la hipótesis son los experimentos planeados, es


necesario que se tenga en cuenta las siguientes características generales para estos ensayos:

 Simplicidad – se debe tener en cuenta que tanto la selección de los tratamientos


como la disposición experimental deberá hacerse de la forma más simple.

 Grado de precisión – el experimento debe tener la capacidad de medir diferencias


entre tratamientos con los grados de precisión que desee el investigador.

 Ausencia de error sistemático – se debe planear un experimento con el propósito de


asegurar que las unidades experimentales que reciban un tratamiento no difieran
sistemáticamente de aquellas que reciben otro, procurando obtener una estimación
insesgada del efecto de tratamiento.

 Rango de validez de las conclusiones – las conclusiones deberán tener un rango de


validez tan amplio como sea posible.

 Calculo del grado de incertidumbre – en todo experimento existe algún grado de


incertidumbre en cuanto a la validación de las conclusiones.

1.3. DISEÑO DE EXPERIMENTOS

De acuerdo a la definición de Gutiérrez (2003), “el diseño de experimentos consiste en planear


un conjunto de pruebas experimentales, de tal manera que los datos generados puedan
analizarse estadísticamente para obtener conclusiones válidas y objetivas acerca del proceso
o experimento”.
M.Sc. Lic. Oscar Soliz Vásquez 4 QMC 304
La metodología del diseño de experimentos estudia cómo variar deliberadamente las
condiciones habituales de un proceso empírico para aumentar la probabilidad de detectar
cambios significativos en la respuesta y obtener así un conocimiento más profundo y científico
sobre el comportamiento del proceso.

El proceso o sistema es una combinación de máquinas, métodos, personas y otros recursos


que transforman alguna característica de entrada (variable independiente), en una
característica de salida (variable dependiente) que tiene respuestas observables.

Existen diferentes tipos de experimentos y de acuerdo al diseño se puede indicar:

a) Experimentos donde se investiga la relación causa – efecto

En este tipo de experimentos se estudia el efecto de varias variables independientes


(TRATAMIENTOS) en una respuesta (Variable dependiente). Las variables
independientes se llaman tratamientos o factores que pueden ser de naturaleza
cualitativa o cuantitativa.

b) Experimentos controlados

Los experimentos controlados son los que se hace variar uno o más factores, mientras
que los demás factores permanecen constantes, sin embargo no es posible controlar
un solo factor presentado siempre un error experimental, que se mide por la variación
de las observaciones.

Por lo que también se define al diseño de experimentos como: la secuencia de pasos tomados
de antemano (Planeados) para asegurar que los datos se obtienen adecuadamente, lo que
permitirá un análisis objetivo conducente a conclusiones válidas del problema de
investigación.

Factores y variables en un proceso experimental:

(Factores controlables) X1 X2 … Xk

Materia PROCESO O
RESPUESTA
prima UNIDAD
EXPERIMENTAL

(Factores no controlables) Z1 Z2 … Zk

Al diseñar un experimento se debe realizar las siguientes preguntas:

¿Qué características de calidad se van a medir?

¿Cuáles de los factores controlables deben incluirse en el experimento?

¿Qué niveles debe utilizar cada factor?


M.Sc. Lic. Oscar Soliz Vásquez 5 QMC 304
¿Cuál diseño experimental es el adecuado?

En cada diseño experimental es importante definir algunos términos, que coadyuvan en el


desarrollo del experimento y la investigación.

Unidad experimental – son los elementos sobre los cuales se hacen mediciones y a los
cuales un tratamiento puede ser asignado independientemente. Ejemplo: suelo, agua,
materia o fenómeno que es necesario producir una medición o datos representativos.

Variable respuesta – Es la característica, variable de salida o propiedad del producto,


cuyo valor interesa mejorar y que determina la calidad del producto

Factores controlables – Son variables de proceso o variables de entrada que se pueden


fijar en un punto o en un nivel de operación.

Factores no controlables – Son variables que no se pueden controlar durante el


proceso. Ejemplo, humedad, luz, ruido, partículas, etc.

Variables de estudio – Son las variables que se investigan en el experimento, en cuanto


a cómo influyen o afectan a las variables respuesta, y pueden ser controlables o no
controlables. Para que un factor pueda ser estudiado es necesario que durante el
experimento se haya probado en al menos dos niveles su efecto.

Niveles y tratamientos – Los diferentes valores que se asignan a cada factor estudiado
en un diseño experimental se llaman niveles. Una combinación de niveles de todos los
factores se llama tratamiento. En caso de experimentar con un solo factor, la combinación
de niveles es a la vez un tratamiento.

1.4. LA ESTADÍSTICA COMO HERRAMIENTA EN EL DISEÑO DE EXPERIMENTOS

En muchos problemas de tipo experimental, es imposible probar u observar la totalidad de


los elementos que intervienen y por consiguiente es necesario recurrir al muestreo, así se
miden o consideran las propiedades de una muestra con el objeto de estimar las
características de la población de donde se extrajo. No sólo es conveniente tomar la
muestra representativa de la población, sino también de que la conclusión a la que se
llegue sea la más correcta.

La estadística es una ciencia de rápido crecimiento y contribuye de manera sustancial en


los avances tecnológicos, donde para la mayoría de los científicos, la estadística es la
lógica o el ingrediente de procedimientos aritméticos.

Una definición indica: “La estadística es la ciencia pura y aplicada que crea, desarrolla y
aplica técnicas de modo que pueda evaluarse la incertidumbre de inferencias inductivas”.

Otra definición indica “que es el arte y ciencia de recoger datos observables, cuantificables
y clasificables”. Arte por la habilidad de utilizar un conjunto de artificios necesarios para la
recolección de datos y ajustar a la realidad reduciendo errores; Ciencia porque se aplican
el método científico (observación, experimentación, hipótesis, prueba y errores). (Moya R.
“Estadística….....p. 5)
M.Sc. Lic. Oscar Soliz Vásquez 6 QMC 304
La estadística se encarga de:

OBTENER DESCRIBIR PREDECIR INFORMACIÓN


DATOS ESTOS DATOS A PARTIR DE LOS DATOS

Todo lo concerniente a la recolección de datos se conoce como diseño de experimentos


y la organización, tabulación e interpretación de dichos datos se llama método
estadístico.

Muchos químicos consideran las pruebas estadísticas como métodos que sólo se utilizan
para juzgar los resultados de un experimento concluido, sin embargo es necesario estar
consciente de la importancia de los conceptos estadísticos en la planificación y el diseño
de experimentos.

Se ha observado que en muchos análisis químico se encuentra que una o más


características deseables del método (Ejemplo: sensibilidad, selectividad, velocidad de
muestreo, bajo costo, etc) dependen de una serie de factores experimentales. Al diseñar
el experimento, hay que intentar que se use de manera adecuada la combinación óptima
de estos factores y obtener la mejor sensibilidad, selectividad, etc. Sin embargo puede ser
necesario realizar algunos experimentos preliminares o conocimientos anteriores.

Dentro de los elementos esenciales para la obtención y análisis de datos tenemos:

1.4.1. Medidas de tendencia central

Algunas medidas descriptivas se pueden calcular a partir de un conjunto de datos, que


se conocen como medidas de tendencia central, que son valores repres entativos del
conjunto de datos que conllevan información respecto al valor promedio de un conjunto
de valores.

Cuando los experimentadores recolectan datos, gastando tiempo, energía y dinero, no


pueden darse el lujo de presentar información vaga, necesitan una medida definida de
tendencia central.

a) Media aritmética o promedio aritmético: (Ẍ, µ )

La media aritmética es una medida de valor central que da una información precisa,
y alrededor de la cual se distribuyen las observaciones individuales. Su valor
numérico se obtiene calculando el promedio aritmético de los valores obtenidos.

La media aritmética se puede calcular:

X 
 Xi
N

X = valor de la obs. i = observación 1, 2, 3, ..... hasta N N = Nº de obs.


M.Sc. Lic. Oscar Soliz Vásquez 7 QMC 304
b) Mediana: (Ẍ, Xme, Me o Me(x))

La mediana es aquel valor que divide a la población en dos grupos de igual número
de observaciones, cuando se han ordenado por su magnitud creciente.

Cuando el número de observaciones ya ordenadas es impar, entonces el valor


central es el valor de la mediana. Ejemplo: Se tiene 19, 24, 27, 37, 39. Entonces 27
es la mediana. Si hay un número par de observaciones en una serie, el promedio
de los dos valores centrales se toma como la mediana. Ejm: 19, 24, 27, 37, 39, 43
la Me = 32

c) Moda: (Mo o Xmo)

La moda es una constante o parámetro de posición que indica el valor de la clase


más frecuente. También se puede decir que la moda de una muestra x1, x2, ....xn es
aquel valor de la variable que se expresa con mayor frecuencia. Ejemplo: Se tiene
valores: 2, 8, 5, 7, 4, 5, 6, 5, 6, 5; de este conjunto de datos el 5 es el que más
veces se repite.

1.4.2. Medidas de dispersión

La dispersión de un conjunto de observaciones se refiere a la variedad que muestran


éstas, que conlleva información respecto a la cantidad total de variabilidad presente en
el conjunto de datos. Si todos los valores son iguales, no hay dispersión, pero si no son
iguales, entonces existe dispersión en los datos.

Una medida de tendencia central solo proporciona un resumen parcial de la


información de un conjunto de datos; es evidente la necesidad de una medida de
variación. La variación se puede obtener mediante el cálculo de las siguientes
constantes:

a) Desviación estándar: ( σ , s)

Es una constante universalmente utilizada para medir la variabilidad de una


población. Su valor se expresa de un modo absoluto y en las mismas unidades que
aquellas que se utilizan para medir las observaciones individuales en la población.

Una desviación estándar de valor pequeño indica que la dispersión alrededor de la


media es pequeña, es decir que la intensidad del carácter considerado en los
individuos que forman la población difiere poco del promedio.

 Cálculo de σ con los valores originales de la población


 ( Xi   )
N 1

La expresión (Xi – u) indica el valor de la desviación de una observación con


respecto a la media. Si Xi – u = x i entonces tenemos que:
M.Sc. Lic. Oscar Soliz Vásquez 8 QMC 304

  
N 1

Donde x i2 se calcula con la siguiente fórmula

 x  X  N
( X) i
i i

Indica la suma de los cuadrados de las desviaciones.

Ejemplo: Cuatro estudiantes de Química han realizado la valoración de una base


con un ácido y el volumen gastado por cada estudiante fue lo siguiente:

Estudiante Resultados (mL)


A 10.08 10.11 10.09 10.10 10.12
B 9.88 10.14 10.02 9.80 10.21
C 10.19 9.79 9.69 10.05 9.78
D 10.04 9.98 10.02 9.97 10.04

Calcular la media aritmética de cada estudiante; la media aritmética poblacional; la


mediana; la moda y la desviación estandar

b) Coeficiente de variabilidad (CV)

Otra forma de evaluar la variación en una población o muestra es considerar la


variación relativa mediante el cálculo del coeficiente de variabilidad, y se define
como la relación entre la desviación estándar y la media, expresada en % conforme
a:


CV  *100

Ejemplo: Teniendo la media aritmética 78.89 cm y la desviación estandar 8.68 cm.


Calcular el coeficiente de variabilidad.

8.68cm
CV  x100  11%
78.89cm

El coeficiente de variabilidad representa el 11% de la media en la población de


estudio. En general se puede decir que CV informa sobre la variación o uniformidad
de población o muestra; se utiliza cuando se comparan diferentes poblaciones o
muestras, considerando más variable aquella cuyo CV sea mayor.
M.Sc. Lic. Oscar Soliz Vásquez 9 QMC 304
c) Varianza o cuadrado medio

La desviación estándar y la varianza son las formas más usuales de medir la


variación de una población o muestra. La varianza o cuadrado medio (CM) es igual
al cuadrado de la desviación estándar; las unidades son por lo tanto cuadráticas.


x
N 1

La expresión ∑Xi2 = (X – u)2 = SC. Significa la suma de los cuadrados de las


desviaciones con respecto a la media. N – 1 = grados de libertad = GL.

SC SC
CM =   
N  1 GL

Algunas de las propiedades de la varianza son:

 La varianza de una constante es cero

 La varianza de una constante por una variable es igual al cuadrado de la


constante por la varianza de la variable.

 La varianza de una suma o de una diferencia de dos o más variables


independientes es igual a la suma de las varianzas de las variables.

1.5. FUENTES DE VARIACIÓN

En química, como en otras ciencias experimentales, las leyes o hipótesis deben ser
demostradas experimentalmente, para lo cual es necesario realizar mediciones. Medir una
propiedad supone admitir que la misma posee un valor definido, el cual se llama valor real.

Para medir cierta magnitud es necesario disponer de un instrumento que responda


produciendo una señal. Si tomamos un sistema y realizamos más de una medición de una
propiedad en iguales condiciones podremos observar que el resultado obtenido es distinto.
Esto se debe a ciertas indeterminaciones inherentes al proceso de medición llamadas error
de medición.

Sabiendo que los errores son propios de cualquier proceso de medición podemos advertir que
no es conveniente realizar una única medición de la propiedad en estudio. Para una buena
estimación del valor real se deben realizar múltiples medidas en iguales condiciones y luego
promediar los resultados. Entonces para detectar estas diferencias las unidades
experimentales deberán ser homogéneas o de lo contrario pueda existir una variación entre
cada tratamiento y se denomina error.

Los científicos experimentales hacen una distinción fundamental de tres tipos de errores:
aleatorios, sistemáticos y experimentales o crasos.
M.Sc. Lic. Oscar Soliz Vásquez 10 QMC 304
1.5.1. Error aleatorio, error sistemático y error experimental

Error aleatorio

Siempre que se realiza un estudio experimental, parte de la variabilidad observada no


se podrá explicar por los factores estudiados. Esta variabilidad constituye el llamado
error aleatorio, que no es error en el sentido de equivocación, sino variabilidad no
explicada.

Los errores aleatorios provocan que los resultados individuales se encuentren a ambos
lados del valor medio, afectando a la precisión o reproducibilidad de un experimento.

Error sistemático

Los errores sistemáticos provocan que todos los resultados sean erróneos en el mismo
sentido, con relación a un valor de comparación, afectando a la exactitud o sea la
proximidad al valor verdadero.

Cuando los resultados no están sujetos a errores experimentales o accidentales, la


medición es exacta. Sin embargo, esto no implica que el resultado sea preciso, dado
que los valores medidos pueden hallarse muy dispersos alrededor del valor verdadero.
Por otro lado una medida inexacta puede ser precisa, si los valores medidos tienen una
buena reproducibilidad. A cualquier resultado de una medida experimental se le debe
exigir que sea exacto y preciso. Resumiendo: la precisión depende del grado de
dispersión de los datos; la exactitud depende de la diferencia entre los valores
medidos y el valor real.

  

No exacto Exacto Exacto


Preciso No preciso Preciso

Error experimental, accidental o craso

Los errores experimentales o crasos pueden definirse como errores graves que no
queda otra alternativa que abandonar el experimento y empezar de nuevo, que pueden
ser atribuibles a errores personales, de medición, instrumentación, accidental y otros.

Cuando se corre un diseño experimental, es importante que la variabilidad de la


respuesta observada se deba principalmente a los factores estudiados y en menor
medida al error aleatorio, y además que este error sea afectivamente aleatorio.

1.5.2. Distribución de errores

Aunque la desviación estándar proporciona una medida de la dispersión de un conjunto


de valores alrededor del valor medio, no indica la forma en que están distribuidos los
resultados. Para conocer se tiene varios métodos que a continuación se detallan.
M.Sc. Lic. Oscar Soliz Vásquez 11 QMC 304
a) Distribución normal estándar

La distribución normal también es conocida como distribución de Gauss o de Laplace y


se manifiesta en muchos fenómenos. Las características de la distribución normal de
una población son:

1. Distribución simétrica de las observaciones alrededor de un valor central (µ).

2. Forma simétrica de campana, cóncava descendente para X hasta una σ menor de


la media µ y convexa ascendente para X mayor que una σ de la media µ .

3. El valor de la media, de la moda y de la mediana coinciden en la curva.

4. La distribución está caracterizada por dos constantes (parámetros): la media µ y la


desviación estándar σ ; una curva normal se simboliza por la expresión: N( µ , σ )

5. La ecuación teórica para una curva normal se expresa por la ecuación:

1 1 X 
Y e ( )
 2 2 

6. Si a ambos lados de µ se levantan perpendiculares a una distancia de µ, 2µ y 3µ,


las áreas bajan la curva y las perpendiculares representan los porcentajes del área
total de la curva

Conforme a las siguientes expresiones:

a. Área entre µ +- σ = 0,6826

b. Área entre µ +- 2σ = 0.9545

c. Área entre µ +- 3σ = 0.9973


M.Sc. Lic. Oscar Soliz Vásquez 12 QMC 304
Para los casos b y c también se usan las expresiones:

 Área entre µ +- 1.96σ = 0.95

 Área entre µ +- 2.58σ = 0.99

Esta característica es útil si se relaciona con datos experimentales en una


población numerosa.

1. p( - 2 < X < +2 ) = 0.9545

2. p( - 3 < X < +3 ) = 0.9973

3. p( - 2 > X > +2 ) = 1 – 0.95545 = 0.0455 5%

4. p( - 1.96 > X > + 1.96 ) = 5%

5. p( - 2.58 > X > + 2.58 ) = 1%

La distribución Normal estándar es un caso particular de la Distribución Normal con


µ =0y σ = 1. Cualquier variable distribuida normalmente se puede
transformar en una normal estándar. Se han calculado diversas tablas
matemáticas de áreas bajo la curva normal, llamadas tablas de probabilidad
integral.

Las tablas dan el valor del área y la variable X se expresa como Z. Estas tablas
pueden usarse para calcular las probabilidades asociadas con cualquier
distribución normal si se conocen la media y la varianza.

La variable X de cualquier distribución normal puede ser transformada en valores Z


usando la siguiente relación:

X 
Z

Si Ẍ=µ ,Z=0 Si X - µ = σ, Z=1

Ejemplo: Suponiendo una distribución normal. ¿Cuál es la probabilidad de


ocurrencia de una muestra de suelo que tenga 2.12 ppm o más, si µ = 1.94 y σ =
0.78?

2.12  1.94
Z  0.231
0.78

p(X > 2.12) = p(Z > 0.231 = 0.4090 = 40.90%

El valor de 0.4090 se localiza en la tabla (VII) 0.2 (vertical) y 0.03 (horizontal)


M.Sc. Lic. Oscar Soliz Vásquez 13 QMC 304
b) Distribución t (student)

Esta distribución fue estudiada por William Sealy Gosset (1908), quien escribió
diversas investigaciones de estadística con el seudónimo de “Student” perfeccionada
posteriormente por Ficher (1924).

El cálculo de t es análogo a Z, y se puede calcular mediante la siguiente relación:

x
t
Sx

µ = media poblacional Ẍ = media muestral Sx = error estandar

S S
Sx  
n n

n = tamaño de la muestra S2 = varianza de la muestra

Varianza de la media de una muestra es:

S
Sx 
n

Sx indica la confiabilidad de x como un estimador de µ.

Una de la característica más importante de la distribución de t de student es:

1. Si se tiene una muestra tan pequeña como n = 5: GL = 4 y la probabilidad es 5% (α =


0.05 o α = 5%). Se tiene de la tabla t (GL) = t0.05, 4 = 2.776

Para cualquier tamaño de muestra:

P ( Ẍ – t *Sx ≤ µ ≤ Ẍ + t * Sx ) = 95%

P (Ẍ – t * Sx ≤ µ ≤ Ẍ + t * Sx ) = 99%

Estas cantidades se llaman límites de confiabilidad.

L1 = Ẍ – t * Sx L2 = Ẍ + t * Sx

La distribución de los valores dentro del área de probabilidad se denomina intervalo de


confianza y los valores extremos de dicho intervalo se llaman límites de confianza. El
termino confianza implica que se puede afirmar con un grado de confianza dado, es decir
con una cierta probabilidad, que el intervalo de confianza sí incluye al valor verdadero. El
M.Sc. Lic. Oscar Soliz Vásquez 14 QMC 304
tamaño del intervalo de confianza dependerá de la certeza que se quiera tener, que
incluya el valor verdadero; cuanto más grande sea la certeza, más grande será el intervalo
requerido.

1.6. OBJETIVOS Y APLICACIÓN.

El diseño de experimentos se aplica para mejorar el rendimiento del proceso y el


desarrollo de nuevos procesos y su uso puede dar como resultado productos con mayor
confiabilidad, mejor funcionamiento en el campo, menores costos, menor tiempo y
desarrollo de productos.
Así mismo se puede indicar que se aplica en la caracterización de variables en un
proceso, optimización de variables de un proceso y el diseño de un nuevo producto.

 Caracterización de variables en un proceso

Se debe determinar o caracterizar cuales son las variables más importantes en un


proceso. Ejemplo El proceso de flotación sirve para concentrar o aumentar el
contenido de un átomo o molécula donde influyen varias variables que se pueden
controlar como ser: Tamaño de grano del mineral; Tiempo de acondicionamiento;
Velocidad de Agitación; PH de la Turba; Concentración del agente de flotación y otros

Así mismo existen algunos factores que no se pueden controlar: equipo de flotación,
presión atmosférica, etc.

Por lo tanto se debe caracterizar las variables que influyen en la concentración, para
lograr se puede diseñar el experimento de tal manera que permita estimar los efectos
del factor; CUANTO cambia, la variable respuesta (defectos por unidad); CUANTO se
modifica cada factor y si cambian los factores simultáneamente.

 Optimización de variables de un proceso

Consiste en determinar en que región los procesos conducen a la mejor respuesta


posible. Ejemplo: Si la respuesta es rendimiento se debe buscar una región en que
esta fuera.

 Diseño de un nuevo producto

Consiste en diversas combinaciones de niveles de los factores para obtener


información acerca de que factores influyen más en el resultado y mediante un análisis
mejorar el diseño.

1.7. PLANIFICACIÓN DE EXPERIMENTOS.

Puede ser peligroso analizar datos que no proceden de una adecuada planificación
experimental, aunque también se puede aprender de los estudios realizados a partir de
datos recogidos por observación, de forma aleatoria y no planificada. Si no se toman las
debidas precauciones en los estudios derivados de la observación muestral, existe un alto
riesgo de cometer los siguientes errores en el análisis estadístico:

 Inconsistencia de los datos.

 Rango de variables limitado.


M.Sc. Lic. Oscar Soliz Vásquez 15 QMC 304

 Variables altamente correlacionadas: confusión de efectos.

 Variables altamente correlacionadas: relación no causal (variable oculta).

Para que un experimento se realice en la forma más eficiente es necesario emplear


métodos científicos en su planificación, y el diseño estadístico de experimentos es el
proceso de planificar un experimento para obtener datos apropiados que pueden ser
analizados mediante métodos estadísticos y producir conclusiones válidas y objetivas.

Existen dos aspectos fundamentales en cualquier problema experimental:

 El diseño del experimento

 Análisis estadístico de los datos.

Las técnicas de diseño de experimentos se basan en estudiar simultáneamente los efectos


de todos los factores o variables de interés, son más eficaces y proporcionan mejores
resultados con un menor costo. A continuación se numeran las acciones que deben ser
ejecutadas secuencialmente en una correcta planificación experimental.

1) Comprensión del problema y definir los objetivos del experimento

Realizar una lista con las cuestiones concretas a las que debe dar respuesta el
experimento y los problemas que se quiere resolver. Un planteamiento claro del
problema contribuye a un mejor conocimiento del fenómeno y la solución.

2) Identificar todas las fuentes de variación

Una fuente de variación es cualquier aspecto que pueda generar variabilidad en la


respuesta y se distinguen: factores de tratamiento (de interés para el experimentador) y
factores nuisance (no son de interés pero que se contempla en el diseño).

a. Se debe elegir los factores y sus niveles. Factor tratamiento es la variable


cuyo efecto sobre los datos desea ser investigado. Los niveles de un factor
serán los grados específicos del factor que se utilizarán en el experimento.

b. Unidades experimentales. Son el material donde evaluar la variable respuesta


a al que se le aplican los distintos niveles de los factores de tratamiento.

c. Factores no controlables. En cualquier experimento también influyen otros


factores de poco interés en el estudio, pero cuya influencia sobre la respuesta
puede aumentar significativamente la variabilidad no planificada.

3) Determinación del tamaño muestral, condiciones de estudio y variable respuesta

Calcular el número de observaciones que se deben tomar para alcanzar los objetivos
del experimento. La regla de asignación o diseño experimental, especifica que
unidades experimentales se observarán bajo cada tratamiento (en función del tamaño
muestral, número de repeticiones, orden adecuado, todo en función de los objetivos).
M.Sc. Lic. Oscar Soliz Vásquez 16 QMC 304
Es importante precisar cuál será esta variable y en qué unidades serán medidos,
también es conveniente determinar con claridad la forma de medición, instrumentos de
medida, disponibilidad de instrumentos, etc.

4) Definir el diseño a utilizar, la hipótesis a probar y el modelo a seguir

Después de tener las variables de estudio los niveles y variable respuesta se define el
diseño a seguir en la experimentación, y comprobar una hipótesis estadística a
plantearse y el modelo a cual se va a seguir para el cumplimiento del objetivo

5) Ejecutar un experimento piloto

Se refiere a un pequeño experimento con un número reducido de observaciones, para


complementar y garantizar las acciones a realizar, que permita practicar la técnica
experimental e identificar problemas no esperados en el proceso de recogida de datos.

6) Realización del experimento

En la realización se debe controlar el proceso para asegurar la planificación, es el


proceso de recogida de datos, tarea que mayor tiempo consume.

7) Análisis estadístico

El análisis estadístico a realizar dependerá: los objetivos (paso 1), el diseño


seleccionado (paso 3) y su modelo asociado (paso 5).

8) Conclusiones y recomendaciones

Finalmente se debe extraer conclusiones prácticas de los resultados y recomendar un


curso de acciones. Se debe indicar que ningún método de análisis estadístico, por
sofisticado que sea, permite extraer conclusiones correctas cuando esta mal
planificado.

Debe quedar claro que el análisis estadístico es un paso más, completamente integrado
en el proceso de planificación, por último se puede indicar que toda persona implicada en
la ejecución del experimento y en la recolección de los datos debe ser informada con
precisión de las estrategias experimentadas diseñadas.

1.8. PRINCIPIOS BÁSICOS.

Para que un experimento se realice en la forma más eficiente es necesario emplear


métodos científicos en su planeación, el diseño estadístico de experimentos es el proceso
de planear un experimento para obtener datos apropiados que pueden ser analizados
mediante métodos estadísticos y producir conclusiones válidas y objetivas, incrementando
la eficiencia de estos experimentos.

Se puede indicar que existen tres principios básicos que se deben tener en cuenta:

 Obtención de replicas

 Aleatorización
M.Sc. Lic. Oscar Soliz Vásquez 17 QMC 304
 Análisis de bloques

1.8.1. Replicar para obtener experimentos válidos

La comunidad científica considera la réplica de un experimento como el primer


requisito para obtener resultados experimentales válidos. La réplica implica una
repetición independiente del experimento básico.

Existen diversas razones para hacer réplicas de un experimento y son:

 Demuestra que se pueden reproducir los resultados bajo las condiciones actuales.
 Proporciona cierto grado de seguridad contra resultados anormales en el
experimento.
 Proporciona las medias para estimar la varianza del error experimental, aun
cuando la experimentación previa proporcione estimaciones de la varianza.
 Proporciona la posibilidad de aumentar la precisión en la estimación de las medias
de los tratamientos.

¿Cuántas réplicas? El número de réplicas en un estudio de investigación afecta la


precisión de las estimaciones de las medias de los tratamientos, sin embargo, el costo
de conducir estudios de investigación restringe las réplicas. Entonces, el número de
réplicas está determinado por las restricciones prácticas que se pueden asignar al
problema.

1.8.2. Aleatorizar para tener inferencias válidas

La réplica de un experimento proporciona los datos para estimar la varianza del error
experimental. La bloquización proporciona un medio para reducir el error experimental.
Sin embargo, las réplicas y la bloquización por sí solos no garantizan estimaciones
válidas de la varianza del error experimental o de las comparaciones de tratamientos.

Fisher (1926) señaló que la sola aleatorización proporciona estimaciones válidas de la


varianza del error para los métodos de inferencia estadística justificados para la
estimación y pruebas de hipótesis en el experimento. La aleatorización es la asignación
aleatoria de tratamientos a las unidades experimentales.

1.8.3. Bloquización para reducir la variación del error experimental

Las unidades experimentales se agrupan de manera que su variabilidad dentro de los


grupos sea menor que entre las unidades antes de agruparlas. La práctica de bloquizar
o agrupar las unidades experimentales en conjuntos homogéneos, va de la mano con
la selección de las unidades experimentales para tener uniformidad.

En el análisis estadístico es posible separar el error experimental de la variabilidad


asociada con las diferencias del entorno entre los grupos de unidades. Las unidades
experimentales se bloquizan en grupos de unidades similares, con base en un factor o
factores que se espera o se sabe que tienen alguna relación con la variable de
respuesta o con la medición que se supone responde de manera diferente a los
tratamientos.

Cuatro importantes criterios para la bloquización


1. Proximidad en las unidades experimentales
M.Sc. Lic. Oscar Soliz Vásquez 18 QMC 304
2. Características físicas.
3. Tiempo.
4. Administración de tareas en el experimento.

ALEATORIZACIÓN SENSIBILIDAD

ESTIMACIÓN VALIDA
DEL ERROR EXP. EFICIENCIA

REPLICACIÓN
ORTOGONA LIDAD
REDUCCIÓN VARIANZA
ERROR EXPERIMENTAL
BALANCE
BLOQUIZACIÓN

CONFUNDIDAD

1.9. Modelo lineal aditivo

En una prueba común que trata de explicar fenómenos mediante modelos. Ejemplo: La
tierra es redonda y gira sobre un eje de norte a sur. En estadística un modelo corriente
que describa la naturaleza de una observación consta de una media más un error.

Yi    i

Yi = observación i-esima µ = media ε = error i-esimo

A esta relación se conoce como MODELO LINEAL ADITIVO, en donde Yi puede ser único
como la suma de parámetros.

El modelo también sirve para la prueba de la hipótesis. La estadística concede una gran
importancia a las pruebas de hipótesis que están basadas en la nulidad de las diferencias
(diferencia de promedios de muestras es cero).

Se simboliza H0 hipótesis nula y HA hipótesis alternativa.

H0 : µ1 = µ2 o µ1 - µ2 = 0

HA: µ1 ≠ µ2 o µ1 - µ2 ≠ 0

Para aceptar o rechazar es necesario considerar:

 La información disponible y alcance del investigador.


 La experiencia y conocimientos del investigador.
M.Sc. Lic. Oscar Soliz Vásquez 19 QMC 304
 El riesgo que se esté dispuesto a correr de que la decisión sea errónea.

1.10. CLASIFICACIÓN Y SELECCIÓN DE LOS DISEÑOS EXPERIMENTALES

Se han inventado y propuesto muchos diseños experimentales para poder estudiar la gran
diversidad de problemas o situaciones que ocurren en la práctica. Esta cantidad de
diseños hace necesario saber cómo elegir el más adecuado para el problema que se
quiere resolver, conocer cómo es que se clasifica de acuerdo al objetivo y a su alcance.

Estos son los aspectos que más influyen en la selección de un diseño experimental:

 El objetivo del experimento

 El número de factores a controlar

 El número de niveles que se prueban en cada factor

 Los efectos que interesa investigar (relación factor – respuesta)

 El costo del experimento, tiempo y precisión deseada.

Estos aspectos no son independientes entre sí, pero es importante señalar de manera
separada, ya que al cambiar cualquiera de ellos, cambia el diseño experimental a utilizar.

El objetivo del experimento se ha utilizado como un criterio general de clasificación de los


diseños experimentales, en este sentido se pueden clasificar en:

Diseños completamente al azar


1) Diseños para comparar dos o más Diseño de bloques completos al azar
Tratamientos Diseños en cuadrado latino y grecolatino.

Diseños factoriales 2k
2) Diseños para estudiar el efecto de varios Diseños factoriales 3k
factores sobre una o más variables respuesta Diseños factoriales fraccionarios 2k-p.

Diseños factoriales 2k y 2k - p
Diseños para modelo Diseño de Plakett -Burman
3) Diseños para la optimización de primer orden Diseño simplex
de procesos
Diseños para modelo Diseño central compuesto
De segundo orden Diseño de Box - Behnhen
Diseños factoriales 3k y 3k - p

4) Diseños robustos o para hacer el producto Arreglos ortogonales (diseños factoriales)


Insensible a factores no controlables Diseño con arreglos interno y externo

Diseño de latice - simplex


5) Diseños de mezclas o para la Diseño simples con centroide
optimización de una mezcla Diseño con restricciones
Diseño axial
M.Sc. Lic. Oscar Soliz Vásquez 20 QMC 304
EJERCICIOS DE APLICACIÓN
1. En un laboratorio de química se ha analizado seis muestras de polvo y se determinó el
contenido de mercurio en ng/g de cada muestra mediante el método de la polarografía,
teniendo los siguientes resultados:

Muestra 1 2 3 4 5 6
Conc. Mercurio (ng/g) 2.4 2.5 1.3 1.3 0.7 1.2

Determinar: la media aritmética, mediana, moda, desviación estandar, varianza y el


coeficiente de variación.

2. Al realizar el análisis químico de una solución patrón de plata por espectrometría de absorción
atómica, teniendo los siguientes resultados:

Muestra ng/mL 5 5 5 5 5 5 5
Conc. Mercurio (ng/g) 0.125 0.127 0.151 0.139 0.149 0.125 0.123
Determinar los limites de confianza y el intervalo de confianza al 95 y 99%

3. Se determino el contenido de ion sodio de una muestra de orina utilizando un electrodo


selectivo de iones, y se obtuvieron los siguientes valores: 102, 97, 99, 98, 101, 106, 105, 104
mM. ¿Cuáles son los límites de confianza al 95 y 99% para la concentración de ion sodio?
¿Cuál es la probabilidad de que se encuentre el valor de 105.5 mM de ion sodio en el intervalo
de confianza?

4. Para investigar la reproducibilidad de un método para la determinación de selenio en


alimentos, para lo cual se realizaron diez mediciones sobre un lote de arroz tostado, con los
siguientes resultados:

Muestra Selenio (ug/g) Muestra Selenio (ug/g) Muestra Selenio (ug/g)


1 0.075 5 0.082 9 0.081
2 0.070 6 0.084 10 0.085
3 0.080 7 0.090 11 0.082
4 0.078 8 0.080 12 0.082
Calcular los límites de confianza al 95% y el intervalo de confianza; ¿Cuál es la probabilidad
de que una décimo primera muestra con un valor de 0.071 ug/g se encuentre dentro del
intervalo de confianza?

5. Se ha realizado el muestreo de 50 muestras de agua, en el cauce de un río a lo largo de 50


km, para la determinación del contenido de plomo y evaluar el grado de contaminación,
teniendo los siguientes resultados en ppm:

0,750 0,784 0,762 0,900 0,738 0,756 0,730 0,729 1,151 0,750
0,760 0,721 0,78,5 0,875 0,739 0,758 0,746 0,78,9 0,751 0,722
0,747 0,750 0,750 0,752 0,748 0,754 0,793 0,760 0,794 0,730
0,753 0,750 0,762 0,750 0,758 0,751 0,774 0,749 0,739 0,751
0,811 0,755 0,770 0,662 0,783 0,745 0,756 1,230 0,956 0,990

Determinar: a) La media aritmética, moda, mediana, desviación estandar (por los 2 métodos),
coeficiente de variabilidad, varianza.
b) Los límites de confianza para una probabilidad del 95%; c) ¿Cuál la probabilidad de que una
muestra con 1,00 ppm de plomo de otro río se encuentre del intervalo de valores?
M.Sc. Lic. Oscar Soliz Vásquez 21 QMC 304
CAPITULO Nº 2

DISEÑOS EXPERIMENTALES DE COMPARACIÓN

2.1. Diseños unifactoriales o con un solo factor

Los diseños unifactoriales o de un solo factor son diseños que tienen el objetivo de comparar
dos o más tratamientos. Ejemplo comparar equipos, procesos, reactivos, métodos, etc.

Esta comparación surge como una necesidad en la lógica de pretender la toma de decisiones,
para la solución de un problema. Donde en un problema de investigación o mejora de un
proceso, es necesario realizar comparaciones de tratamientos con el fin de elegir la mejor
alternativa.

Desde el punto de vista estadístico, la hipótesis fundamental a probar cuando se comparan


varios tratamientos es:

Ho : µ1 = µ2 = …………….. = µK = µ

HA : µi = µj para algún i = j

Se debe decidir si los tratamientos son iguales estadísticamente en cuanto a sus medidas,
contra la alternativa de que al menos dos de ellas son diferentes.

El propósito de las pruebas de hipótesis es ayudar al químico, a tomar una decisión en torno a
una población o universo de estudio, al examinar una muestra de ella. La estimación y las
pruebas de hipótesis no son tan distintas como se supone.

Los diseños experimentales más utilizados para comparar tratamientos son:

 Diseño completamente aleatorizado. (DCA)

 Diseño en bloques completos al azar (DBCA)

 Diseño en cuadrado latino (DCL)

 Diseño en cuadrado grecolatino. (DCGL)

La diferencia fundamental entre estos diseños es el número de factores de bloque que se


incorporan o controlan de forma explícita durante el experimento.

El análisis de varianza (ANOVA), es una técnica en la que la varianza total de un conjunto de


datos se divide en varios componentes y cada uno de ellos se asocia a una fuente específica
de variación, de manera que durante el análisis es posible encontrar la magnitud con la que
contribuye cada una de esas fuentes en la variación total.

Para presentar el análisis de varianza según los diferentes diseños, se sigue el procedimiento:
M.Sc. Lic. Oscar Soliz Vásquez 22 QMC 304
 Descripción de los datos
 Suposiciones; se presentan el modelo de cada diseño estudiado.
 Hipótesis.
 Cálculo de la estadística de prueba
 Decisión estadística.
 Conclusión.

La hipótesis se prueba mediante el análisis de varianza (ANOVA):

DISEÑO Factores Factores Técnica estadística Modelo estadístico


de estudio de Bloque
Diseño completamente 1 0 ANOVA con un criterio de Yi = µ + ‫ﺡ‬i + εi
al azar (DCA) clasificación
Diseño en bloques 1 1 ANOVA con dos criterios Yij = µ + ‫ﺡ‬i + γ j + εij
completos al azar de clasificación
(DBCA)
Diseño en cuadrado 1 2 ANOVA con tres criterios Yijk = µ + ‫ﺡ‬i + γ j + δk + εijk
Latino (DCL) de clasificación
Diseño en cuadrado 1 3 ANOVA con cuatro Yijkl = µ+ ‫ﺡ‬i + γ j + δk + φl
Grecolatino (DCGL) criterios de clasificación + εijkl
Notación: Y = variable de salida; µ = media global; ‫ﺡ‬i = efecto de tratamiento i-esimo
ε = error aleatorio; γj δk φl = son los efectos de tres factores de bloque

Los modelos dados para cada diseño comparativo se tienen al menos dos fuentes de
variabilidad: los tratamientos o niveles del factor de interés y el error aleatorio.

2.2. Diseños completamente aleatorizados (DCA)

 Son los más simples de todos los diseños que se utilizan para comparar 2 o más
tratamientos, dado que solo considera dos fuentes de variabilidad: los tratamientos y el
error aleatorio.

 Este diseño se llama completamente aleatorizado o al azar porque todas las corridas
experimentales se realizan en forma aleatoria y completa ya que al no existir bloques no
existe restricción a la aleatorización.

 Si se hacen un total de N pruebas, estas se corren al azar, de tal manera que los posibles
efectos ambientales y temporales se vayan repartiendo equitativamente entre los
tratamientos.

Teoría general del diseño:

 Suponiendo que se tienen k tratamientos independientes.

 Con medias desconocidas µ1 , µ2 , ……, µk , con varianzas también desconocidas


pero que se suponen iguales σ12 = σ22 = …. = σk 2 = σ2 .

 Los tratamientos pueden ser k métodos, k tratamientos, k grupos.


M.Sc. Lic. Oscar Soliz Vásquez 23 QMC 304

TR A TAM IE NT OS
T1 T2 T3 ……. TK
Y11 Y21 Y31 ……. YK1
Y12 Y22 Y32 ……. YK2
Y13 Y23 Y33 …… YK3
. . . …… .
. . . …… .
. . . ……. .
Y1J Y2J Y3J …… YKJ

El número de tratamientos y repeticiones lo define el investigador.

En caso de que los tratamientos tengan efecto, las observaciones Yij se pueden describir con
el modelo lineal dado por:

Yij = µ + ‫ﺡ‬i + εij

Donde: µ es la media global; ‫ﺡ‬i es un parámetro que mide el efecto del tratamiento i; εij es el
error aleatorio.

Este modelo implica dos fuentes de variabilidad: tratamientos y el error aleatorio. La media
global no es fuente de variabilidad por ser una constante común a todos los tratamientos y
hace los puntos de referencia.

En la práctica puede suceder que los tratamientos que se desean comparar sean demasiados,
entonces se puede comparar una muestra de los tratamientos de modo que el efecto pasa a
ser una variable aleatoria con su propia varianza.

ANOVA para el diseño completamente al azar (DCA)

La idea general de esta técnica es separar la variación total en las partes (debida al
tratamiento y al error). Cuando predomina la primera se concluye que los tratamientos tienen
efecto o lo que es lo mismo las medias son diferentes.

(a) (b)
Variabilidad total Variabilidad total

Variabilidad Variabilidad
Debido al tratamiento
Debido al debido al
Tratamiento error

No hay efecto de tratamiento Si hay efecto de tratamiento


M.Sc. Lic. Oscar Soliz Vásquez 24 QMC 304
Notación de puntos: Sirve para representar de manera abreviada cantidades numéricas que
se pueden calcular, donde Yij representa la j-esima observación en el tratamiento i, con i =
1,2,……., k; y j = 1,2,…….., ni.

Yi. = suma de las observaciones del tratamiento i

Yi. = media de las observaciones del i-esimo tratamiento

Y.. = suma o total de las N = n1 + n2 + … + nk mediciones

Y.. = media global o promedio de todas las observaciones.

ANOVA (Análisis de varianza)

El objetivo del análisis de varianza en el DCA es probar la hipótesis de igualdad de las


respuestas medias dadas:

Ho: µ1 = µ2 = …………… µk = µ

HA: µi ≠ µj para algún i ≠ j

La cual se puede escribir de forma equivalente como:

Ho: ‫ﺡ‬1 = ‫ﺡ‬2 = …………… ‫ﺡ‬k = 0


HA: ‫ﺡ‬i ≠ 0 para algún i

Donde ‫ﺡ‬i es el efecto del tratamiento i sobre la variable de respuesta. Si se acepta Ho se


confirma que los efectos sobre la respuesta de los k tratamientos son estadísticamente nulos
(iguales a cero) y en caso de rechazar se estaría concluyendo que al menos un efecto es
diferente a cero.

Para probar la hipótesis dada mediante la técnica de ANOVA con un criterio de clasificación, lo
primero es descomponer la variabilidad total. Una medida de la variabilidad total presente en
las observaciones es la suma total de cuadrados dada:

k ni
Y ..
SC   Yij 
i 1 j 1 N

Y desarrollando el cuadrado, la SCT se puede partir en dos componentes como:

k k ni
SC   ni(Yi.  Y ..)   (Yij  Yi.)
i 1 i 1 j 1
M.Sc. Lic. Oscar Soliz Vásquez 25 QMC 304
Donde el primer componente es la suma de cuadrados de tratamiento (SC TRAT) y el segundo
es la suma de cuadrados del error (SC E). SCTRAT mide la variación entre tratamientos,
mientras que SCE mide la variación dentro del tratamiento, ya que si hay mucha variación
entre las observaciones de cada tratamiento entonces Yij – Yij tenderá a ser grande en
términos absolutos.

SCT = SCTRAT + SCE

Como hay un total de N = ni observaciones, la SC T tiene N – 1 grados de libertad. Hay k


tratamientos o niveles del factor de interés, así que SC TRAT tiene k – 1 grados de libertad,
mientras que la SCE tiene N – k los grados de libertad.

Las sumas de cuadrados divididas entre sus respectivos grados de libertad se llaman
cuadrados medios (CM).

CMTRAT = SCTRAT / k – 1 y CME = SCE / N – k

Fuente de SC GL CM Fo
variabilidad
Tratamientos k
Yi. Y .. k– 1 SCTrat CMTrat
SCTrat    CMTrat 
i 1 n N k 1 CME
Error SCE  SCT  SCTrat N–k SCE
CME 
k 1
Total k k
Y .. N–1
SCT   Yij 
i 1 j 1 N

Entonces bajo el supuesto de que Ho es verdadera, el estadístico

Fo = CMTRAT / CME

Debe distinguir una distribución F con (K – 1) grados de libertad en el numerador y (N – k)


grados de libertad en el denominador.

Por lo tanto se deduce que si Fo es grande se contradice la hipótesis de que no hay efectos de
tratamientos, en cambio si Fo es pequeño se confirma la validez de Ho. Así para un nivel de
significancia alfa prefijado, se rechaza Ho si F o > F , k-1, N-k donde F , k-1, N-k es el percentil (1 -
)* 100 de la distribución F.

Como se observa, el análisis de varianza es la técnica estadística fundamental para el análisis


de todo tipo de diseños experimentales.

Ejemplo: Se desea mejorar la fibra de llama que se emplea en una manufactura de tejidos. Se
sabe por experiencia que la resistencia es influida por el porcentaje de algodón presente.
Además se sospecha que elevar el contenido de algodón incrementará la resistencia. Para la
investigación experimental se desea probar a cinco niveles de porcentaje de algodón, teniendo
los siguientes resultados:
M.Sc. Lic. Oscar Soliz Vásquez 26 QMC 304

% de algodón OBSERVACIONES REALIZADAS


15 10 20 15 18 12
20 60 70 68 72 63
25 110 120 121 118 115
30 160 170 178 180 163
35 105 120 134 125 127

Comparar y determinar ¿Cuál es el porcentaje óptimo para obtener un tejido con mayor
resistencia?

2.3. Diseño de bloques completos aleatorizados (DBCA)

 Es un diseño en bloques completos al azar (DBCA) donde se consideran tres fuentes de


variabilidad: el factor de tratamientos, el factor de bloques y el error aleatorio.

 Es decir se tienen tres posibles culpables de la variabilidad presente en los datos.

 La palabra completo en el nombre del diseño se debe a que en cada bloque se prueban
todos los tratamientos, es decir que los bloques están completos.

 La aleatorización se hace dentro de cada bloque; no se realiza de manera total como en


el diseño completamente al azar.

 Este diseño mejora la precisión en las comparaciones al eliminar la variabilidad.

Análisis estadístico:

observación por tratamiento en cada bloque y el orden se determina aleatoriamente.

Bloque 1 Bloque 2 Bloque b


Y11 Y12 ----- Y1b
Y21 Y22 ----- Y2b
Y31 Y32 ----- Y3b
…. ….. ….. ….
Ya1 Ya2 ----- Yab

El modelo estadístico para este diseño es:

Yij = µ + ‫ﺡ‬i + βj + εij i = 1, 2, ………, a


j = 1, 2, …….., b

µ = media general ‫ﺡ‬i = efecto del i-esimo tratamiento εij = error aleatorio
βj = efecto del i-esimo bloque

Los tratamientos y bloques son factores fijos

Los ‫ﺡ‬i y βj son desviaciones de la media general.


M.Sc. Lic. Oscar Soliz Vásquez 27 QMC 304
Por lo tanto:

a b

i  0
i 1
  0
j 1
j

Se desea probar la hipótesis:

Ho : µ1 = µ2 = ………………= µk = µ

HA : µi ≠ µj para algún i ≠ j

Análisis estadístico

Sea Yi. = el total de observaciones del tratamiento i


Y. j = el total de observaciones de bloques j
Y. . = el total de todas las observaciones
N = ab = el número total de observaciones

b a a b
Yi.   Yij Y . j   Yij Y ..   Yij
i 1 j 1 i 1 j 1

La suma total de cuadrados corregida puede expresarse:

SCT = SCTRAT + SCBloques + SCE

Existen N = observaciones entonces SCT tiene N – 1 grados de libertad

SCTRAT tiene a – 1 grados de libertad ; SCBloques tiene b – 1 grados de libertad

ANOVA para un diseño de bloques completamente aleatorizado

Fuente de SC (Suma de cuadrados) GL (Grados CM (cuadrado Factor (Fo)


variación de libertad) medio)
Tratamiento a
Yi. Y .. a–1 SCTrat CMTrat
bN
i 1 a 1 CME

Bloques b
Y . j Y .. b–1 SCBloques CMBloques

j 1 a

N b 1 CME

Error SCE  SCT  SCTrat  SCBloques (a-1)(b-1) SCT


(a  1)(b  1)
Total a b
Y .. N–1
 Y
i 1 j 1
ij 
N
M.Sc. Lic. Oscar Soliz Vásquez 28 QMC 304
Por lo tanto para probar la igualdad en las CM se tienen

Fo = CMTRAT / CME

Que tiene una distribución F , a-1, (a-1)(b-1) Si Ho es verdadera Fo < F , a-1, (a-1)(b-1)
Ho debe rechazarse si Fo > F , a-1, (a-1)(b-1)

La comparación entre las medias de los bloques se debe realizar, porque si no existe gran
diferencia entre ellas, el análisis por bloques quiza no sea necesario en experimentos futuros.

Ho : µi = 0 puede probarse comparando F0 = CMBloques / CME con F , b-1, (a-1)(B-1)

Ejemplo: En un experimento de colaboración entre laboratorios en la determinación de


arsénico en carbón, se enviaron muestras de carbón de tres regiones diferentes (A, B, C) a
tres laboratorios. Cada laboratorio realizó un análisis por triplicado de cada muestra con los
resultados que se muestran a continuación (Medidos en ug/g)

MUESTRA LABORATORIO
1 2 3
A 5,1; 5,1; 5,2 5,3; 5,4; 5,4 5,3; 5,1; 5,3
B 5,8; 5,4; 5,5 5,4; 5,9; 5,7 5,2; 5,5; 5,4
C 6,5; 6,1; 6,3 6,6; 6,7; 6,8 6,5; 6,4; 6,6

a) Comprobar que no existe interacción significativa laboratorio – muestra.


b) Probar las diferencias significativas entre laboratorios.

2.4. Comparaciones o pruebas de rango multiples

Después que se rechaza Ho en análisis de varianza, es necesario ver ¿cuáles de los


tratamientos son diferentes? o ¿cuáles de los tratamientos provocan la diferencia?

Para los cual se tiene los siguientes métodos:

a) Método LSD (diferencia mínima significativa)

Ahora se debe probar

Ho : µi = µj

HA : µi ≠ µj ; para toda i ≠ J

Para k tratamientos se tiene en total k(k – 1) / 2 pares de medias

Ejemplo: Si k = 4 entonces 4(4 – 1) / 2 = 6 posibles pares de medias.

Se rechaza Ho : µi ≠ µj si ocurre que

/ Yi. - Yj. / > t /2 ,N–K 2 CME (1 / ni + 1 / nj ) = LSD


M.Sc. Lic. Oscar Soliz Vásquez 29 QMC 304
donde t /2 , N – K se lee en las tablas de t-student con N – K grados de libertad

ni y nj son el número de observaciones para los tratamientos i y j

LSD = diferencia mínima significativa; ya que es la diferencia mínima que debe haber
entre dos medias maestrales para poder considerar que los tratamientos
correspondientes son significativamente diferentes.

Si n1 = n2 = …………… = nk = n

La diferencia mínima significativa se reduce a:

LSD = t /2 ,N–K 2 CME / n

Ejemplo: De los ejemplos anteriores en los experimentos donde se definió rechazar la


hipótesis nula, realizar los cálculos comparativos.

Si k = 4 entonces los pares son:

Ho : µA = µB vs HA : µA ≠ µB

Ho : µA = µC vs HA: µA ≠ µC

Ho : µA = µD vs HA: µA ≠ µD

Ho : µB = µC vs HA: µB ≠ µC

Ho : µB = µD vs HA: µB ≠ µD

Ho : µC = µD vs HA: µC ≠ µD

Por lo tanto Yi. + - t /2 ,N–K CME / ni

Diferencia poblacional Diferencia muestral en Decisión


valor absoluto
µA - µB Valor de trat. >< de LSD Significativa o no
µA - µC significativa
…………………….
. .
. .
. .
. .
. .
. .

De esta forma si dos intervalos se traslapan, entonces no habrá diferencias entre las
medias de los tratamientos correspondientes.
M.Sc. Lic. Oscar Soliz Vásquez 30 QMC 304
b) Método de Tukey

Consiste en comparar las diferencias entre medias maestrales con el valor crítico dado por:

T = q (k, N – k) SY

Donde SY = CME / n se obtiene de la tabla de ANOVA, en función del cuadrado medio


del error y n es el número de observaciones por tratamiento; k es el número de
tratamientos, N – k es igual a los grados de libertad para el error; es el nivel de
significancia prefijado y el estadístico q (k, N – k) son puntos porcentuales de la
distribución del rango estudentizado, que se puede obtener de la correspondiente tabla en
el apéndice.

Se declaran significativamente diferentes los pares de medias cuya diferencia muestral en


valor absoluto sea mayor que T . A diferencia de los métodos LSD y Duncan, el método
de Tukey trabaja con un error , muy cercano al declarado por el experimentador.

Ejemplo:

Si tenemos que CME = 2.46; n = 4

Se calcula SY = CME / n = 2.46 / 4 = 0.78

De la tabla se tiene: q00.5 (4,12) = 4.20 de manera que el valor crítico es

T0.05 = q0.05 (4,12) SY = 4.20 * 0.78 = 3.27

Luego se compara

Diferencia poblacional Diferencia muestral Decisión


µA - µB 1.25 < 3.27 No significativa
µA - µC 5.50 > 3.27 Significativa

c) Método de Duncan

Si las k muestras son de igual tamaño se acomodan los k promedios en orden ascendente
y el error estándar de cada promedio se estima con:

SY = CME / n

Si alguna o todas las muestras tienen tamaños diferentes se remplaza n por la media
armónica de las ni al calcular el error estándar de los promedios.

La media armónica de las (ni) esta dada por:

k
nAR  k
1
 ni
i 1
M.Sc. Lic. Oscar Soliz Vásquez 31 QMC 304

Si n1 = n2 = ……..= nk = n ocurre que nAR = n

De la tabla de rangos significativos de Duncan se obtiene los valores críticos

R (p,l) ; p = 2,3,……, k donde es el nivel de significancia profijada, l son los grados de


libertad para el error. Con estos k – 1 valores se obtienen los rangos de significancia
mínima dados por:

Rp = r (p,l) SY ; p = 2,3, ……., k

Ejemplo:

Si CME = 2.46 N – k = l = 12; n = 4; p = 2,3,….., k

De la tabla de rangos significantes de Duncan se tiene pa alfa = 0.05 y l = 12

R0.05 (2,12) = 3.08; r0.05 (3,12) = 3.23 y r0.05 (4,12) = 3.33

Los rangos mínimos significantes son:

R2 = r0.05 (2, 12) SY = (3,08)(0.78) = 2.40

R3 = r0.05 (3, 12) SY = (3,23)(0.78) = 2.52

R4 = r0.05 (4, 12) SY = (3,33)(0.78) = 2.60

Estos valores se comparan con las diferencias de medias de acuerdo al método descrito
para Tukey.

EJEMPLO: Se estudia el rendimiento en el lavado de los siguientes detergentes: A, B, C


y D; obteniéndose los siguientes resultados de blanqueo para doce muestras de lavado.
Los resultados se miden en la cantidad de suciedad eliminada en mg en un primer remojo
de 5 minutos.

DETERGENTE LAVADO
A 45 43 31
B 47 46 47
C 49 51 55
D 42 37 44

Definir: a) Las variables de estudio y respuesta; b) El diseño a utilizar; c) realizar el análisis


estadístico y sacar conclusiones; d) Mediante los diferentes métodos de comparación realizar
el análisis comparativo.
M.Sc. Lic. Oscar Soliz Vásquez 32 QMC 304
2.5. Diseño de cuadrado Latino (DCL)

En el diseño cuadrado latino (DCL) se tienen cuatro fuentes de variabilidad que pueden
afectar la respuesta observada, éstas son: los tratamientos, el factor de bloque II (columnas),
el factor de bloque I (renglones) y el error aleatorio. Se llama cuadrado latino por dos razones:

 Es un cuadrado debido a que se tiene la restricción adicional de que los tres factores
involucrados se prueban en la misma cantidad de niveles.

 Es latino porque se utilizan letras latinas para denotar a los tratamientos o niveles del
factor de interés.

Sean A, B, C, ….., P, los P tratamientos a comparar, por lo tanto ambos factores de bloques
tienen también pbloques cada uno. Este diseño se utiliza para eliminar dos fuentes de
variabilidad problemática, y permite analizar sistemáticamente por bloques en dos direcciones.

En general un cuadrado latino para p factores o p x p que contiene p renglones y p columnas:

4x4 5 x5 6 x6 7x7
ABCD ABCDE ABCDEF ABCDEFG
BCDA BCDEA BCDEFA BCDEFGA
C D AB C D EAB C D EFAB C D E F G AB
D AB C D EAB C D EFAB C D EFG AB C
EABCD EFABCD EFG AB C D
FABCDE FG AB C D E
G AB C D EF

Una desventaja de este diseño cuando es pequeño es que proporcionan un número reducido
de Grados de Libertad del error, por lo que es necesario repetir con el fin de aumentar los
Grados de Libertad del error.

El modelo estadístico del diseño cuadrado latino es:

i = 1,2,3,……….p
Yijk = µ + ‫ﺡ‬j + βk + αi + εijk j = 1,2,3,……… p
K = 1,2,3,…….. p

El modelo es aditivo y no existe interacción entre renglones, columnas y los tratamientos.

El análisis de varianza consiste en descomponer la suma total de cuadrados:

SCT = SCRenglones + SCColumnas + SCTratamiento + SCError

Los Grados de libertad total es:

P2 – 1 = (P – 1) + (P – 1) + (P – 1) + (P – 2) (P – 1)
M.Sc. Lic. Oscar Soliz Vásquez 33 QMC 304
ANOVA para un diseño Cuadrado Latino

Fuente de SC (Suma de cuadrados) GL (Grados CM (cuadrado Factor (Fo)


variación de libertad) medio)
p
Y . j . Y ... SCTrat CMTrat
Tratamiento 
j 1 p

N
P–1
p 1 CME

p
Yi.. Y ... SCrenglon CMrenglon
Renglones 
i 1 p

N
P–1
p 1 CME
p
Y ..k Y ... SCcolumna CMcolumna
Columnas 
k 1 p

N
P–1
p 1 CME

(P-2)(P-1) SCE
Error Por diferencia
( p  2)( p  1)
p p p
Y ...
Total  Y
i 1 j 1 k 1
ijk 
N
N–1

Por lo tanto para probar la igualdad en las CM se tienen

Fo = CMTRAT / CME

Que tiene una distribución F , a-1, (a-1)(b-1)

Ho es verdadera si Fo < F , a-1, (a-1)(b-1)

Ho debe rechazarse si Fo > F , a-1, (a-1)(b-1)

Ejemplo:
Se estudia el efecto que tiene cinco productos químicos distintos de niquelado (A, B, C, D y E)
sobre el tiempo de reacción del proceso. Cada lote de material a niquelar es lo
suficientemente grande para permitir que solo se realicen cinco pruebas, más aún cada
prueba tarda hora y media en su realización. Por lo que solo se pueden realizar cinco ensayos
al día. Obteniéndose los siguientes resultados de niquelado en g/cm 2 :

MATERIAL DIAS
I II III IV V
1 8 3 7 1 7
2 11 8 3 7 2
3 4 5 1 10 9
4 6 10 6 6 8
5 4 8 8 3 2

Analizar los resultados y obtener las conclusiones.


M.Sc. Lic. Oscar Soliz Vásquez 34 QMC 304
2.6. Diseño de cuadrado Greco Latino (DCGL)

 Con el diseño cuadrado Greco Latino (DCGL) se controlan tres factores de bloque,
además del factor de tratamiento.

 Se llama Cuadrado Greco Latino porque los cuatro factores involucrados se prueban en la
misma cantidad de niveles, de aquí que se pueda escribir como un cuadrado.

 Se utilizan letras latinas para denotar a los tratamientos y letras griegas para nombrar a los
niveles o bloques del tercer factor de bloque.

 Al igual que en el Cuadrado Latino cada letra debe aparecer solo una vez en cada renglón
y en cada columna, y cada par de letras debe aparecer sólo una vez en todo el arreglo.

Diseño Cuadrado Greco Latino

COLUMNAS
1 2 3 4
Renglones 1
2
3
4

Este diseño puede utilizarse para controlar sistemáticamente tres fuentes extrañas de
variabilidad o diseño en tres dimensiones.

Permite controlar cuatro factores (renglón, columna, letra griega y letra latina), cada uno con p
niveles usando solamente P2 ensayos.

El modelo estadístico es:

Yijkl  u  i  j  k  l  ijkl i = 1, 2, 3, ……….p


j = 1, 2, 3, ……… p
k = 1, 2, 3, ………p
l = 1, 2, 3, ……… p
Donde:

Yijkl = observación que corresponde al renglón i, columna l, LL j y LG k.


Θi = efecto del i-esimo renglón ‫ﺡ‬j = efecto del tratamiento j de las L L
ωk = efecto del tratamiento de las LG φl = efecto de la columna L
εijkl = componente del error aleatorio.

El análisis de varianza es similar al cuadrado latino. El factor representado por las LG es


ortogonal a los renglones, columnas y los tratamientos de las LL porque cada LG ocurre una
sola vez en cada renglón, columna y para cada LL.
M.Sc. Lic. Oscar Soliz Vásquez 35 QMC 304
3x3 4x4 5 x5
Aα Bβ Cγ Aα Bβ Cγ Dδ Aα Bγ Cε Dβ Eδ
Bγ Cα Aβ Bδ Aγ Dβ Cα Bβ Cδ Dα Eγ Aε
Cβ Aγ Bα Cβ Dα Aδ Bγ Cγ Dε Eβ Aδ Bα
Dγ Cδ Bα Aβ Dδ Eα Aγ Bε Cβ
Eε Aβ Bδ Cα Dγ

Es importante no confundir las letras griegas del modelo que representan efectos, con las
letras griegas en el diseño que representan a los niveles del tercer factor de bloque.

La variabilidad total se puede determinar mediante la descomposición de la suma de


cuadrados.

SCT = SCTrat + SCB1 + SCB2 + SCB3 SCE

Donde las sumas de SC B1, SCB2 y SCB3 miden la variabilidad debida a los factores de bloque
(renglón, columna y de letras griegas respectivamente.

ANOVA para un diseño Cuadrado Greco Latino

Fuente de SC (Suma de GL (Grados CM (cuadrado Factor (Fo)


variación cuadrados) de libertad) medio)
Tratamiento p
Y . j .. Y .... SCTrat CMTrat
(LL) j 1 p

N
P–1
p 1 CME
Bloque I p
Yi... Y .... SCB1 CMB1
(renglón) i 1 p

N
P–1
p 1 CME
Bloque II p
Y ...l Y .... SCB 2 CMB 2
(columnas) l 1 p

N
P–1
p 1 CME
Bloque III p
Y ..k . Y .... SCB 3 CMB 3
(L G) k 1 p

N
P–1
p 1 CME
Error (p-3)(p-1) SCE
Por diferencia
( p  3)( p  1)
Total p p p p
Y ....
 Y
i 1 j 1 k 1 l 1
ijkl 
N
N – 1 o p2 – 1

Por lo tanto para probar la igualdad en las CM se tienen

Fo = CMTRAT / CME

Que tiene una distribución F , a-1, (a-1)(b-1)


M.Sc. Lic. Oscar Soliz Vásquez 36 QMC 304
Ho es verdadera si Fo < F , a-1, (a-1)(b-1)

Ho debe rechazarse si Fo > F , a-1, (a-1)(b-1)

EJEMPLO: Con el objetivo de mejorar la calidad en la crianza de pollos se han añadido dos
productos químicos en los alimentos. Las distintas cantidades del primer químico se indican
con las letras A, B, C y D; Las del segundo químico por alfa, beta, gama y delta. Se alimenta a
los pollos ordenando en grupos de acuerdo a su peso inicial de 1, 1.5, 1.8 y 2 kilogramos y
cuatro especies diferentes. El incremento de peso por unidad de tiempo (g/día) viene dado en
el siguiente cuadro:

ESPECIE PESO
1 kilo 1.5 kilos 1.8 kilos 2.0 kilos
Blanco 3 6 10 6
Amarillo 4 6 5 6
Gris 8 10 5 8
Negro 6 3 7 3

Definir las variables de estudio y de respuestas; realizar un analisis de varianza del


experimento y sacar conclusiones.
M.Sc. Lic. Oscar Soliz Vásquez 37 QMC 304
PROBLEMAS DE APLICACIÓN DE DISEÑOS DE COMPARACIÓN

A. DISEÑOS COMPLETOS AL AZAR (DCA)

1. En el laboratorio de Química se quiere investigar la repetitividad y reproducibilidad en


la titulación ácido – base por parte de los estudiantes, para lo cual se ha seleccionado
en forma aleatoria a cuatro estudiantes de la asignatura de Química Analítica para
realizar este estudio, teniendo los siguientes resultados en volumen gastado de ácido:

Estudiante Volumen de ácido gastado (mL)


María 10.08 10.11 10.09 10.10 10.12
Pedro 9.88 10.14 10.02 9.80 10.21
Carlos 10.19 9.79 9.69 10.05 9.78
Ximena 10.04 9.98 10.02 9.97 10.04

Realizar el análisis estadístico y sacar conclusiones.


Determinar ¿cuál de los estudiantes tiene mejor reproducibilidad en sus resultados?

2. Se quiere determinar el contenido de albúmina en una muestra de suero sanguíneo


humano, para lo cual se desea realizar el análisis y comparar en cinco laboratorios,
realizando cada uno seis determinaciones en el mismo día, con los siguientes
resultados en g/L.

Laboratorio Contenido de albúmina (g/L)


A 42.5 41.6 42.1 41.9 41.1 42.2
B 39.8 43.6 42.1 40.1 43.9 41.9
C 43.5 42.8 43.8 43.1 42.7 43.3
D 35.0 43.0 37.1 40.5 36.8 42.2
E 42.2 41.6 42.0 41.8 42.6 39.0

Realizar el análisis estadístico y sacar las conclusiones.


Comentar sobre la exactitud y precisión en los análisis químicos de cada laboratorio.

3. Se desea purificar el cloruro de sodio a partir de las salmueras del Salar de Uyuni con
un alto grado de pureza y poder obtener un producto de uso medicinal, para lo cual se
realiza un proceso de cristalización utilizando diferentes disolventes, teniendo los
siguientes resultados:

Disolvente Observaciones (g / L)
1 2 3 4
Etanol 95,5 96,0 94,9 95,8
Agua-etanol 90,9 92,7 93.0 93,1
Agua 90,2 90,3 91,2 89,5

Realizar el análisis estadístico y sacar las conclusiones

4. En la localidad de Puna se viene cultivando remolacha para su industrialización; se


quiere aprovechar el pigmento orgánico que tiene, para la determinación de la
M.Sc. Lic. Oscar Soliz Vásquez 38 QMC 304
estructura química, utilizando métodos de extracción por solventes, teniendo los
siguientes resultados:

Agente extractor Observaciones (mg de pigmento/g de remolacha)


Agua 0.15 0.14 0.16 0.14 0.14
Etanol 0.20 0.21 0.18 0.24 0.22
Diclorometano 0.09 0.10 0.08 0.09 0.07
Acetato de etilo 0.38 0.31 0.38 0.32 0.29
Éter de petróleo 0.14 0.18 0.13 0.14 0.16
Hexano 0.15 0.18 0.20 0.19 0.20

Analizar el experimento y sacar conclusiones

5. Se tiene cinco variedades de grano de trigo, y se realiza el cultivo en las Pampas de


Lequezana para conocer el grado de fertilidad del suelo, para lo cual se mide el
número de granos por plantula; así mismo se cree que puede afectar la ubicación de la
plantula en el terreno, teniendo los siguientes resultados:

Variedad de trigo Observaciones


1 10 25 30 15
2 18 30 32 32
3 18 20 30 25
4 14 22 28 24
5 20 22 26 20

Analizar el experimento y sacar conclusiones

B. DISEÑOS DE BLOQUES COMPLETOS AL AZAR (DBCA)

1. La eliminación del sodio por medio de la orina es importante para el metabolismo del
cuerpo humano, por lo que se determinó el contenido de ión sodio de una muestra de
orina, utilizando métodos como: un electrodo selectivo de iones; absorción atómica y
gravimetría. Realizando una lectura cada día, pudiendo influir en los resultados el
tiempo de conservación de la muestra. Obteniendo los siguientes resultados en mM.

Método Días de análisis


1 2 3 4
Electrodo selectivo 102 97 95 96
Absorción atómica 100 95 93 94
Gravimetría 95 90 93 92

Realizar el análisis estadístico y sacar conclusiones.


¿Cuál de los métodos es el más aconsejable por el alto contenido de Na?

2. Para investigar la reproducibilidad de un método para la determinación de Selenio en


alimentos, se realizaron el análisis en 4 diferentes cereales tostados, sin embargo la
temperatura de tostación puede influir en el contenido de selenio en los cereales.
Teniendo los siguientes resultados en ug/g.
M.Sc. Lic. Oscar Soliz Vásquez 39 QMC 304

Cereal Temperatura de tostación


1 2 3 4 5
Arroz 0.070 0.071 0.080 0.065 0.072
Trigo 0.053 0.058 0.055 0.060 0.058
Maíz 0.035 0.036 0.038 0.032 0.040
Cebada 0.045 0.050 0.044 0.060 0.051

Realizar el análisis estadístico y sacar conclusiones


Determinar Cual de los cereales contiene mayor cantidad de selenio

3. Un profesional Químico en una industria manufacturera desea probar el efecto que


tiene cuatro agentes químicos, para lo cual se utiliza cinco tipos de tela para observar
el efecto, sobre la resistencia de cada una de las tela, teniendo los resultados de la
resistencia de la tela en Newton:

Agente Tipo de de Tela


químico 1 2 3 4 5
1 73 68 74 71 67
2 73 67 75 72 70
3 75 68 78 73 68
4 73 71 75 75 69

a) Determinar el problema y el objetivo que tiene el profesional químico.


b) Determinar las variables de estudio, respuesta, niveles y diseño.
c) Estimar el análisis de varianza para sacar conclusiones.
d) Teniendo los valores promedio de cada tratamiento determinar la desviación
estándar.

C. DISEÑOS CUADRADOS LATINOS (DCL)

1. Se utilizan cinco reactores distintos sobre una solución galvánica de dorado


electrolítico. Para evaluar se utilizan varios lotes de material, donde solo permiten
cinco ensayos por día. La investigación con el fin de controlar sistemáticamente las
variables de material y día se tienen los siguientes resultados de electrodeposición en
mg/cm 3.

Lotes de DIAS
material I II III IV V
A 8 10 5 8 3
B 6 1 3 7 8
C 10 7 1 6 10
D 2 7 8 2 9
E 8 4 6 4 11

Realizar el análisis estadístico y sacar las conclusiones


M.Sc. Lic. Oscar Soliz Vásquez 40 QMC 304
2. Se han preparado tres diferentes tipos de soluciones para eliminar los óxidos
depositados en joyas (oro y plata). El análisis se realiza en un laboratorio, donde los
datos se recopilan durante tres días y tres distintas joyas, teniendo los siguientes
resultados en ug de óxido/g de joyas.

Joyas DIAS
I II III
Plata 13 44 16
Cobre 22 18 13
Oro 27 22 39

Realizar el análisis y sacar las conclusiones.

3. Se estudia la temperatura afectiva en el lavado de material de vidrio de un laboratorio


bacteriológico, para lo cual se utilizan cuatro diferentes soluciones para lavar el
material de vidrio en el laboratorio de Bioquímica, y de esta manera estudiar su
efectividad en el crecimiento bacteriano. Se realiza el experimento en un laboratorio en
diferentes días. La efectividad se puede determinar microscópicamente mediante
conteo bacteriano Teniendo los siguientes datos:
DIAS
Solución 1 2 3 4
1 13 22 18 39
2 16 24 17 44
3 5 4 1 22
4 4 6 2 10

a) Determinar el problema y el objetivo que tiene el laboratorio de Bioquímica


b) Determinar las variables de estudio, respuesta, niveles y diseño.
c) Estimar el análisis de varianza para sacar conclusiones.

D. DISEÑOS CUADRADOS GRECO LATINOS (DCGL)

1. Se utilizan cuatro reactores distintos (A, B, C, D), sobre el proceso de evaporación de


salmueras para la obtención del Li en forma de sales. Para la evaluación se utilizan
salmueras con diferentes concentraciones de Li, permitiendo realizar un proceso de
evaporación por día y debido a los cambios climáticos a diferentes temperaturas.
Teniendo los siguientes resultados de evaporación en % en volumen.

Salmueras Días
1 2 3 4
4.5 ppm 25 26 24 25
5.0 28 30 35 32
6.0 32 34 38 35
7.0 26 30 32 32

Realizar el análisis estadístico y sacar conclusiones


M.Sc. Lic. Oscar Soliz Vásquez 41 QMC 304
2. Para mejorar el proceso de elaboración de embutidos, se han utilizado dos diferentes
sustancias químicas como conservantes en diferentes dosificaciones. La primera
sustancia sus dosis son (A, B, C, D) y la segunda sustancia con ( , , , ). Se
elaboran diferentes tipos de embutidos (salame, jamón, mortadela, queso) y con
distinta carne. La calidad se mide en función al tiempo de conservación en días,
teniendo los siguientes resultados.

Embutidos Clase de carne


1 2 3 4
Salame 60 85 80 75
Jamón 90 120 110 100
Mortadela 85 98 120 110
Queso 100 150 180 120

Realizar el análisis estadístico y sacar conclusiones.

3. Una fábrica de calzados de cuero realiza el proceso de curtido para la fabricación de


calzados de calidad. En el curtido de cada cuero se estudia la utilización de diferente
reactivo químico. Para investigar se escogen cinco tipos de cueros diferentes, tiempo
de contacto del cuero con el reactivo químico y método del curtido. La calidad se mide
en función al desgaste en peso (mg). Obteniendo los siguientes datos:

Tipo de Tiempo de contacto


Cuero
1 14,0 14.0 14.2 14.0 14.1
2 13,9 13.8 13.9 14.0 14.0
3 16,0 16.0 16.1 15.9 16.5
4 13,6 13.8 14.0 13.8 13.7
5 12,8 12.6 12.9 12.8 13.0

 Determinar el problema y el objetivo que tiene la fábrica de calzados


 Determinar las variables de estudio, respuesta, niveles y diseño.
 Estimar el análisis de varianza para sacar conclusiones.
M.Sc. Lic. Oscar Soliz Vásquez 42 QMC 304
CAPITULO Nº 3

DISEÑOS FACTORIALES
3.1. Conceptos básicos de diseños factoriales

En los diseños anteriores estudiados, el objetivo principal era comparar varios tratamientos (o
niveles del mismo factor); no era el objetivo estudiar el efecto de los factores. Sin embargo es
frecuente que en muchos procesos existan varios factores de los que es necesario investigar
de manera simultánea su influencia sobre una o varias variables de respuesta, donde cada
factor tiene la misma importancia.

Los diseños experimentales que permiten estudiar de manera simultánea el efecto de varios
factores son los llamados diseños factoriales.

El objetivo de un diseño factorial es estudiar el efecto de varios factores sobre una o varias
respuestas características de calidad, es decir se busca estudiar la relación entre los factores
o variables independientes y la respuesta, con la finalidad de conocer mejor como es esta
relación y generar conocimiento que permita tomar acciones y decisiones que mejoren el
desempeño del proceso.

La necesidad de estudiar conjuntamente varios factores obedece principalmente a dos


razones:

 Encontrar un modelo que describa el comportamiento general del fenómeno en


estudio. Esto se restringe al rango de variación de los niveles de los factores.

 Optimizar la respuesta o variable independiente, es decir, encontrar la combinación de


niveles de los factores que optimizan esa respuesta.

Si se estudia un factor en forma separada el resultado puede ser diferente al que daría con un
estudio conjunto, y es más difícil describir el comportamiento general o encontrar el óptimo.

Los factores pueden ser de tipo cualitativo (máquinas, tipo de material, operador, etc), o de
tipo cuantitativo (temperatura, tiempo, velocidad, concentración, presión, etc). Para poder
estudiar la manera en que influye cada factor sobre la variable de respuesta, es necesario
elegir al menos dos niveles de prueba para cada uno de ellos.

Con el diseño factorial completo, se investigan aleatoriamente en el proceso, todas las


posibles combinaciones que pueden formarse con los niveles seleccionados.

Un diseño de experimentos factorial es el conjunto de puntos experimentales o tratamientos


que pueden formarse considerando todas las posibles combinaciones de los niveles de los
factores.

Por ejemplo: k = 2 factores ambos con dos niveles de prueba se forma un diseño factorial de 2
x 2 = 22 que consiste de cuatro combinaciones o puntos experimentales.

Si k = 2, donde uno es de 3 niveles y el otro de 2 niveles, se puede construir un diseño 3 x 2


combinaciones. Para obtener el número de corridas experimentales se multiplica el número de
tratamientos por el número de réplicas, donde una réplica se lleva a cabo cada vez que se
repite el arreglo completo.
M.Sc. Lic. Oscar Soliz Vásquez 43 QMC 304
Ventajas de los diseños factoriales:

1. Son necesarios cuando alguna interacción puede estar presente para evitar conclusiones
engañosas.

2. Permiten estimar los efectos de un factor en diversos niveles de los otros factores
produciendo conclusiones válidas.

3. Son diseños que se pueden aumentar para formar diseños compuestos en caso de que se
requiera una exploración más completa.

4. Se pueden correr fracciones de diseños factoriales, las cuales son de gran utilidad en las
primeras etapas de una investigación que involucra a muchos factores.

5. Pueden utilizarse combinaciones con diseños de bloques en situaciones en las que no


puede realizarse todo el diseño factorial completo bajo las mismas condiciones o
circunstancias.

6. La interpretación y cálculo de los efectos en los experimentos factoriales se puede hacer


con aritmética elemental, en particular cuando cada factor se prueba en dos niveles.

3.2. Diseño factorial de dos factores

Son diseños bastante sencillos e implican el estudio de dos factores o conjunto de


tratamientos.

 Existen a niveles del factor A y b niveles del factor B, dispuestos en un diseño factorial,
esto es cada repetición o réplica del experimento contiene todas las combinaciones de
tratamiento ab, hay n repeticiones.

 Disposición general para un diseño bifactorial:

FACTOR B
1 2 … b
Y111, Y112, …… Y121, Y122, …… Y1b1, Y1b2, …..
…….. Y11n ………Y12n …….Y1bn
Y211, Y212,……….. Y221, Y222, ….. Y2b1, Y2b2, ….
………Y21n ………Y22n ……. Y2bn
…….. …………….
…….. ………….
Ya11, Ya12, …… Ya21, Ya22, …. Yab1, Yab2, …..
………… Ya1n …….Ya2n ………Yabn

El orden en el cual se toman a*b*n observaciones es aleatorio, de modo que es un diseño


completamente aleatorizado.

Las observaciones pueden describirse mediante el modelo estadístico lineal:

Yijk = µ + ‫ﺡ‬i + βj + (‫ﺡ‬β)ij + εijk


M.Sc. Lic. Oscar Soliz Vásquez 44 QMC 304
µ = media general ‫ﺡ‬i = efecto i-esimo nivel del factor A (renglón)
βj = efecto j-esimo nivel del factor B (col) (‫ﺡ‬β)ij = efecto de interacción entre
εijk = componente del error aleatorio.

Se supone que:

 Ambos factores son fijos y los efectos de tratamiento se definen como desviaciones de la
media general.

 En un diseño factorial de dos factores, tanto los factores (tratamiento) de renglón como de
columna tienen la misma importancia.

Por lo tanto se debe probar la hipótesis acerca de la igualdad de los efectos de renglón:

H0: ‫ﺡ‬1 = ‫ﺡ‬2 = …………………..= ‫ﺡ‬i = 0

HA: al menos una ‫ﺡ‬i ≠ 0

Y la igualdad de los efectos de tratamiento de columnas:

H0: β1 = β2 = …………….. = βj = 0

HA: al menos una βj ≠ 0

Análisis estadístico:

Sea: Yi.. = total de observaciones bajo el i-esimo nivel del factor A


Y. j. = total de observaciones bajo el j-esimo nivel del factor B.
Yi j . = total de observaciones de la ij-esimo celda
Y. . . = total general de observaciones

Por lo tanto tenemos que:

b n a n
Yi..   Yijk Y .i.   Yijk
j 1 k 1 i 1 k 1

La suma total de cuadrados corregida es:

SCT = SCA + SCB + SCAB + SCE


M.Sc. Lic. Oscar Soliz Vásquez 45 QMC 304
a b n
Y ...
SC  Yijk 
i 1 j 1 k 1 abn

Yi.. Y ...
SC   
n abn

Y . j. Y ...
SC   
an abn

SCAB se calcula en dos etapas:

a b
Yij . Y ...
SCsubtotal es   
i 1 j 1 n N

Luego:

SCAB = SCsubtotales - SCA - SCB

Entonces: SCE = SCT - SCAB - SCA - SCB

O SCE = SST - SCsubtotales

Análisis de varianza para el modelo bifactorial

Fuente de Suma de Grados de Media de cuadrados Factor de


variabilidad cuadrados libertad probabilidad
Tratamiento A SCA a–1 CMA = SCA / a – 1 CMA / CME

Tratamiento B SCB b–1 CMB = SCB / b – 1 CMB / CME

Interacción SCAB (a -1)(b – 1) CMAB = SCAB / (a-1)(b-1) CMAB / CME

Error SCE ab(n – 1) CME = SCE / ab(n-1)

Total SCT abn – 1


M.Sc. Lic. Oscar Soliz Vásquez 46 QMC 304

Para la aceptación o el rechaza del efecto de cada factor o de la interacción se debe comparar
Fo con F teórico de las tablas, y de esta manera aceptar o rechazar la hipótesis planteada.

Ejemplo: Un ingeniero industrial en una fábrica de plásticos, sospecha que el acabado de


una pieza de polietileno depende de manera sustancial de la alimentación y la temperatura.
Para verificar se plantea investigar a tres niveles de alimentación y cuatro niveles de
temperatura teniendo los siguientes resultados de dureza en una escala de 1 a 12.

Alimentación Temperatura ( ºC )
M /min 160 180 200 240
0.508 6.0; 8.0; 7.6 7.4; 6.4; 6.0 9.9; 10.4; 9.6 9.8; 10.8; 9.9
0.635 9.9; 11.0; 11.1 11.9; 8.8; 9.2 10.4; 9.9; 9.5 9.2; 8.6; 8.8
0762 9.9; 11.0; 10.7 9.8; 10.4; 8.6 11.4; 10.8; 11.0 10.4; 8.8; 10.2

Analizar los datos y determinar la influencia de estos dos factores en el acabado de la pieza
de polietileno.

3.3. Diseño factorial con tres factores

Cuando se tienen tres factores (A, B y C) y el número de niveles de prueba en cada uno de
ellos son a, b y c, se puede construir el arreglo factorial a * b * c, que consiste de a*b*c
tratamientos o puntos experimentales.

Modelo estadístico:

En un diseño factorial a*b*c se supone que el comportamiento de la respuesta Y puede


describirse mediante el modelo de efectos dado por:

Yijkl = µ + αi + βj + γk + (αβ)ij + (αγ)ik + (βγ)jk + (αβγ)ijk + εijkl

Donde: µ = es la media general; αi = es el efecto del nivel i-esimo del factor A


Βj = es el efecto del nivel j del factor B γk = es el efecto del nivel k en el factor C
(αβ), (αγ), (βγ) = representan efectos de interacción dobles

El estudio factorial de tres factores (A, B y C) permite investigar los efectos: A, B, C,


principales y AB, AC, BC y ABC, efectos de interacción donde el nivel de desglose con el que
pueden estudiarse depende del número de niveles utilizado en cada factor.

En resumen se tiene siete efectos de interés y con ellos se pueden plantear las siete hipótesis
nulas Ho : efecto de A = 0; Ho : efecto de B = 0; ………….cada una aparejada con su
correspondiente hipótesis alternativa.

El ANOVA para probar estas hipótesis, para el diseño factorial a*b*c es:
M.Sc. Lic. Oscar Soliz Vásquez 47 QMC 304

Fuente de SC GL CM Fo
variabilidad
Efecto A SCA a–1 CMA CMA / CME
Efecto B SCB b–1 CMB CMB / CME
Efecto C SCC c–1 CMC CMC / CME
Efecto AB SCAB (a-1)(b-1) CMAB CMAB / CME
Efecto AC SCAC (a-1)(c-1) CMAC CMAC / CME
Efecto BC SCBC (b-1)(c-1) CMBC CMBC / CME
Efecto ABC SCABC (a-1)(b-1)(c-1) CMABC CMABC / CME
Error SCE abc(n – 1) CME
Total SCT abcn - 1

Se tiene siete efectos de interés, y con ellos se puede plantear siete hipótesis estadísticos
para su comprobación, mediante la técnica de la descomposición de cuadrados

SCT = SCA + SCB + SCC + SCAB + SCAC + SCBC + SCABC + SCE

Teniendo las fórmulas para el cálculo de la suma de cuadrados que son las siguientes:

a b c n
Y ....
SCT   Yijk 
i 1 j 1 k 1 l 1 N

a b c
Y . j .. Y ....
SCB  
Yi... Y .... Y ..k . Y ....
SCA     SCC   
i 1 bcn N j 1 acn N k 1 abn N

a b a c
Yij.. Y ....
SCAB  
Yi.k . Y ....
  SCA  SCB SCAC     SCA  SCC
i 1 j 1 cn N i 1 k 1 bn N

b c
Y . jk . Y ....
SCBC     SCB  SCC
j 1 k 1 an N

a b c
Yijk . Y ....
SCABC    SCA  SCB  SCC  SCAB  SCAC  SCBC
i 1 j 1 k 1 n N
M.Sc. Lic. Oscar Soliz Vásquez 48 QMC 304
Ejemplo: Se investiga el efecto de la temperatura (A) (ºC); el tamaño de grano (B) ( m); y la
concentración del agente precipitante (C) (ppm); en la cantidad de sedimentación (Y) (%) de
una solución. Para ello se decide correr un experimento factorial de 3 x 2 x 2 con 6 réplicas,
teniendo los siguientes resultados.

A1 A2 A3
B1 B2 B1 B2 B1 B2
C1 60 75 75 67 73 73 62 68 65 71 80 80 76 71 75 75 75 75
86 70 70 67 68 68 76 65 65 72 80 80 70 68 75 75 75 77
C2 53 53 55 52 52 57 44 44 45 60 60 60 52 51 50 56 55 57
55 55 55 52 54 54 48 48 45 67 67 65 52 48 54 59 50 55

Realizar el análisis estadístico y determinar la influencia de cada variable en estudio.

Para realizar los diferentes cálculos estadísticos del ANOVA se debe reemplazar los valores
en las fórmulas indicadas anteriormente

Yi... 2 = A12 + A22 + A3 2


Y.j.. = B12 + B22 Y..k. = C12 + C22

Yij.. 2 = (A1B1 )2 + (A1B2 )2 + (A2B1 )2 + (A2B2 )2 + (A3B1 )2 + (A3B2 )2

Yi.k. 2 = (A1C1 )2 + (A1C2 )2 + (A2C1 )2 + (A2C2 )2 + (A3C1 )2 + (A3C2 )2

Y.jk. 2 = (B1C1 )2 + (B1C2 )2 + (B2C1 )2 + (B2C2 )2

Yijk. 2 = (A1B1C1)2 + (A1B1C2)2 + (A1B2C1)2 + (A1B2C2)2 + (A2B1C1)2 + (A2B1C2)2 +


(A2B2C1)2 + (A2B2C2)2 + (A3B1C1)2 + (A3B1C2)2 + (A3B2C1)2 + (A3B2C2)2

3.4. Diseño factorial general

Los resultados del diseño factorial de dos factores pueden generalizarse donde existen a
niveles del factor A y b niveles del factor B; c niveles del factor C , etc.

Considerando z factores A, B, C, ............, Z con niveles a, b, c, ..., z, respectivamente


donde la letra z denota el z-esimo factor del conjunto de factores a estudiar. Con estos niveles
y factores se puede construir el diseño factorial general a x b x c x .....x z que consiste de a x b
x c ...x z tratamientos. Con este diseño se pueden estudiar z efectos principales z(z – 1) / 2
interacciones dobles; z(z – 1)(z – 2) / 3 x 2 interacciones triples; y así sucesivamente.

En general habrá un total de abc...n observaciones; si hay n replicas del experimento


completo, y los gados de libertad (GL) de cualquier efecto principal son igual al número de
niveles menos uno, y de las interacciones son el producto de los grados de libertad con los
componentes individuales de interacción.
M.Sc. Lic. Oscar Soliz Vásquez 49 QMC 304

EJERCICIOS DE APLICACIÓN DE DISEÑOS FACTORIALES

1. La insulina es una proteína que se halla formada por dos cadenas peptídicas unidas por
enlaces disulfuro y se encuentra en muchos alimentos proteicos. A partir del Yacon que es
un tubérculo se quiere separar la insulina por hidrólisis, para lo cual se plantea tres
variedades de Yacon, al cual se aplica la hidrólisis a diferente temperatura, teniendo los
siguientes resultados en mg/kg:

Variedad Temperatura (ºC)


10 20 30 40 50 60
1 23,5; 24,0 25,8; 25,6 30,2; 30,0 32,5; 33,0 30,1; 30.5 30,0; 30,2
2 20,9; 21,1 24,6; 25,4 25,1; 25,3 25,7; 26,0 24,5; 24,8 24,2; 24,6
3 25,1; 24,8 25,3; 25,3 25,9; 25,8 28,1; 27,8 28,0; 28,3 26,3; 26,1

Realizar el análisis estadístico y sacar conclusiones

2. Se encuentra en estudio el rendimiento de un proceso químico de purificación, donde se


cree que la presión y la temperatura, influyen en el proceso para la obtención de un
producto bastante puro y se mide en %. Teniendo los siguientes datos:

Presión (mmHg)
Temperatura (ºC) 200 215 230 250
10 90.4 90.7 90.2 92.5
90.2 90.6 90.4 93.0
30 90.1 90.5 89.9 100.1
90.3 90.6 90.1 99.0
50 90.5 90.8 90.4 90.3
90.7 90.9 90.1 90.5
a. Determinar el problema y el objetivo
b. Determinar las variables de estudio, respuesta, niveles y diseño.
c. Estimar el análisis de varianza para sacar conclusiones.

3. Se cree que la adhesividad de un pegamento de silicona, depende de la presión y de la


temperatura al ser aplicado. Se realiza un experimento con ambos factores. Teniendo los
siguientes con relación a la dureza de adherencia:

Presión Temperatura ( ºF )
(lb/plg2) 250 260 270 280
120 9.6; 9.2; 9.5 11.28; 10.98; 11.00 9.0; 9.1; 9.15 8.5; 8.7; 8.4
130 9.7, 9.75; 9.8 10.10: 10.08; 10.12 9.57; 9.6; 9.65 9.0; 8.9; 9.2
140 8.9; 8.9: 9.0 12.01; 12.0; 12.05 9.03; 9.00; 9.05 10.0; 9.8; 9.6
150 10.0; 9.8; 9.7 10.44; 10.4; 10.5 9.8; 9.8; 9.86 10.1; 10.0; 10.4
a) Determinar el problema y el objetivo
b) Determinar las variables de estudio, respuesta, niveles y diseño.
c) Estimar el análisis de varianza para sacar conclusiones.

4. En una fabrica de ladrillos se quiere mejorar la calidad de sus productos, para lo cual se
realiza un estudio sobre el tipo de arcilla que se utiliza (% Al 2O3) , temperatura de cocción
M.Sc. Lic. Oscar Soliz Vásquez 50 QMC 304
(ºC) y tiempo de cocción (Horas), midiendo la calidad en función a la dureza del producto
acabado, teniendo los siguientes resultados:

Temp. Arcilla (10% Al2O3) Arcilla (15% Al2O3) Arcilla (20% Al2O3)
ºC 12hrs. 18hrs. 24hrs. 12hrs. 18hrs. 24hrs 12hrs 18hrs 24hrs
500 6,8 7,7 8,2 7,5 7,8 8,1 6,9 7,4 8,6
7,0 7,6 8,2 7,5 7,9 8,0 6,8 7,3 8,5
800 7,6 7,8 9,2 7,8 8,2 9,6 7,2 8,1 9,0
7,5 7,9 9,0 7,6 8,2 9,5 7,0 8,0 8,8
1000 7,4 7,7 7,6 7,3 8,0 8,6 7,1 8,3 8,4
7,4 7,6 7,5 7,5 8,1 8,5 7,0 8,2 8,5

Realizar el análisis estadístico y sacar conclusiones

5. Una agencia de control de sustancias químicas realiza un control de contenido de nitrato


de amonio en lotes de fertilizante que son suministrados por un proveedor. Sin embargo el
comprador quiere realizar una investigación sobre la calidad del producto para lo cual
realiza un estudio de lote de material, método de análisis químico y el operario que analiza
la muestra, teniendo los siguientes resultados de nitrato de amonio en %:

Operario Lote 1 Lote 2 Lote 3


Trad. AA Col. Trad. AA Col Trad AA Col
1 12; 13 16 17 15 15 14 15 16 17 15 16 10 9 15 16 12 12
2 14 14 17 17 16 17 15 17 18 19 16 15 12 11 13 14 14 15
3 13 14 18 19 16 16 15 17 18 19 16 17 14 15 16 15 14 16
4 15 14 17 18 15 16 16 18 17 18 14 15 13 14 14 14 13 14

Realizar el análisis estadístico y sacar conclusiones

6. Se está investigando la obtención del limoneno a partir de la cáscara de frutas cítricas,


para lo cual se realiza la planificación para estudiar el tipo de fruto cítrico, el método de
extracción y tiempo de extracción, teniendo los resultados en mililitros.

Tiempo Arrastre de vapor Extracción continua Extracción discontinua


Limón Naranja Pomelo Limón Naranja Pomelo Limón Naranja Pomelo
12horas 0.7; 1.0 0.7 0.5 0.5 0.4 1.2 0.9 0.9
0.8; 1.1 0.9 0.5 0.6 0.3 1.2 0.8 0.7
0.75 0.98 0.6 0.5 0.4 0.3 1.3 0.9 0.7
24horas 1.1; 1.4 1.0 0.8 0.7 0.6 1.7 1.5 1,4
1.0 1.3 0.9 0.7 1.0 0.5 1.8 1.3 1.2
1.1 1.3 0.9 0.9 1.1 0.6 1.5 1.4 1.2
 Definir las condiciones de trabajo y el diseño que se utiliza.
 Analizar los datos y obtener las conclusiones.
 ¿En qué condiciones debe operar para obtener la mayor cantidad de limoneno?
M.Sc. Lic. Oscar Soliz Vásquez 51 QMC 304
CAPITULO Nº 4

DISEÑOS FACTORIALES 2K y 3K
4.1. Introducción

Los diseños factoriales 2k y 3k completos son útiles principalmente cuando el número de


factores a estudiar está entre dos y cinco, rango en el cual su tamaño se encuentra entre
cuatro y treinta y dos tratamientos, cantidad manejable en muchas situaciones experimentales.

Si el número de factores es mayor que cinco se recomienda utilizar un factorial fraccionado


2k-p . En general los factoriales en dos niveles, sean completos o fraccionados, constituyen el
conjunto de diseños de mayor impacto en las aplicaciones.

Algunas de las ventajas de esta clase de experimentos son:

 Al obtener información sobre varios factores sin aumentar el tamaño del experimento hay
economía en el material experimental.

 Se amplía la base de la inferencia en relación a un factor ya que se estudia en las


diferentes condiciones representadas por los niveles de otros factores.

 Se puede obtener una estimación de la interacción de los efectos, o sea, se determina el


grado y la forma en la cual se modifica el efecto de un factor en presencia de los niveles de
los otros factores.

 El conjunto de los tratamientos en el diseño factorial es óptimo para estudiar efectos


principales e interacciones.

Entre las desventajas más importantes se destacan:

 El gran número de combinaciones de tratamientos cuando se estudian muchos factores a


muchos niveles. Esto tiene dos efectos:

o Si se desea usar bloques completos es difícil encontrar grupos de unidades


experimentales homogéneos para asignar todos los tratamientos, esto se puede
eliminar usando el principio de confusión.

o b) Se aumenta el costo del experimento al tener muchas unidades experimentales,


problema que se minimiza usando experimentos factoriales fraccionados, en este
caso, se prueba solo una parte de los tratamientos posibles.

 Difícil interpretación principalmente de las interacciones de orden superior (interacciones


de más de tres efectos).

4.1. Diseño factorial 22

Con un diseño factorial 22 se estudia el efecto de dos factores considerando dos niveles en
cada uno. Cada replica de este diseño consiste 2 x 2 = 4 combinaciones o tratamientos que se
pueden denotar de diferentes maneras.
M.Sc. Lic. Oscar Soliz Vásquez 52 QMC 304
La notación de signos (+ , -) es muy práctica para escribir las matrices de diseño; esta
notación combinada con la de Yates permite representar y calcular fácilmente los efectos de
interés.

REPRESENTACIÓN GEOMÉTRICA

El diseño factorial 22 se representa geométricamente por los vértices del cuadrado:

(-1, 1) ( 1 , 1)
(-,+) (+,+)
(+)
b ab

Factor B

(1) a
(-)
(-) (+)

(-1, -1) (1, -1)


( -, - ) ( +, -)

Factor A

Cada vértice representa un punto de diseño o tratamiento, el área limitada por este cuadrado
se conoce como región experimental y en principio las conclusiones que se obtengan del
experimento sólo tienen validez sobre la región.

La notación de Yates [(1), a, b, ab] tiene un significado diferente, con ellas se representa el
total o suma de las observaciones en cada tratamiento. El punto (1) es la suma de todos los
datos obtenidos en el tratamiento (-1, -1); a es la suma de todas las mediciones hechas en la
combinación (1, -1) y así sucesivamente.

CÁLCULO DE EFECTOS

En este diseño hay tres efectos de interés: los efectos principales (A y B) y el efecto de
interacción (AB). Con el uso de la notación de Yates como los totales de las n repeticiones en
cada punto de diseño, se tiene que en el nivel alto del factor A se mide a y ab y en el nivel bajo
del mismo se observa b y (1). La media en el nivel alto de A es entonces (a + ab) / 2n y en el
nivel bajo es [b + (1)] / 2n, donde la constante 2n sale del hecho de que en cada nivel del
factor se están sumando 2n datos, que son la mitad de los datos del experimento.

De aquí que los efectos se calculan de la siguiente manera:


M.Sc. Lic. Oscar Soliz Vásquez 53 QMC 304

EfectoA 
1
a  ab  b  (1)  a  ab  b  (1)
2n 2n 2n

Y el efecto de B es:

EfectoB 
1
b  ab  a  (1)  b  ab  a  (1)
2n 2n 2n

El efecto de interacción entre los factores A y B esta dado por la diferencia entre el efecto de A
en el nivel alto de B y el efecto de A en el nivel bajo de B:

EfectoAB 
1
ab  (1)  a  b  ab  b  a  (1)
2n 2n 2n

ANALISIS DE VARIANZA

Para poder afirmar que los efectos contribuyen a explicar el comportamiento de la respuesta,
se debe hacer un análisis de varianza. Las sumas de cuadrados que componen el ANOVA se
pueden calcular en forma fácil una vez que se tienen los efectos estimados, pero se debe
definir los contrastes que son las sumas que definen a los efectos.

DEFINICIÓN DE CONTRASTE

Los contrastes correspondientes a los tres efectos A, B, AB en el diseño factorial 2 2 está dado
por:

Contraste A = [ a + ab - b - (1)]

Contraste B = [ b + ab - a – (1)]

Y Contraste AB = [ab + (1) - a - b]

Una manera práctica de calcular los contrastes de cualquier efecto, sea principal o de
interacción en el diseño factorial 2k , es mediante el auxilio de la tabla de signos. La tabla de
signos se construye a partir de la matriz de diseño multiplicando las columnas que intervienen
en la interacción que se quiera calcular.
M.Sc. Lic. Oscar Soliz Vásquez 54 QMC 304
Las combinaciones que se realizarán son como sigue:

A B AB Yates
- - + (1)
+ - - a
- + - b
+ + + ab

Después de obtener los contrastes, se procede a estimar los efectos, dividiendo éstos por la
constante que los convierte en diferencias de medias. En particular el diseño factorial 22 está
constante es 2n. Para investigar cuáles de los tres efectos son significativos se procede a
probar las hipótesis dadas por:

Ho : Efecto A = 0

H0 : Efecto B = 0

H0 : Efecto AB = 0

Cada una contra la alternativa de que el efecto es diferente de cero. Estas hipótesis se
prueban con el análisis de varianza, y para ello es necesario calcular las sumas de cuadrados
que corresponden a los efectos A, B, y AB, dados:

SCA = [a + ab - b - (1)]2 / n22

SCB = [b + ab - a - (1)]2 / n22

SCAB = [ab + (1) - a - b]2 / n22

La suma de cuadrados totales se calcula con la expresión:

2 2 n
Y
SCT  Yijl 
i 1 j 1 l 1 n2

y tiene n22 – 1 grados de libertad, es decir, el total de observaciones en el experimento menos


uno. Finalmente la suma de cuadrados del error se calcula por diferencia, restando de la suma
de cuadrados totales

ANOVA para el diseño factorial 22


M.Sc. Lic. Oscar Soliz Vásquez 55 QMC 304
FUENTE DE SC GL CM FO
VARIABILIDAD
A SCA a–1 SCA / a – 1 CMA /CME
B SCB b–1 SCB / b – 1 CMB / CME
AB SCAB (a – 1)(b – 1) SCAB / (a-1)(b-1) CMAB /CME
Error SCE 4(n – 1) SCE / 4(n – 1)
Total SCT n22- 1

EJEMPLO: Se realiza un experimento para determinar la influencia de la temperatura en la


cocción de un azulejo ordinario elaborado con arcillas de la localidad de Chaquilla Pampa
(Potosí). Teniendo los siguientes resultados, midiéndose la influencia la dureza de acuerdo a
la presión que se ejerce al producto acabado.

AZULEJO TEMPERATURA (ºC)


800 1200
1 988; 1026; 1004 526; 538; 532
2 1063; 1080; 1043 565; 510; 590

Realizar EL análisis de varianza para determinar la influencia de la temperatura y el tipo de


azulejo en la calidad del producto.

4.2. Diseño factorial 23

Como su nombre indica con este diseño se estudian tres factores en dos niveles cada uno, y
consta de 23 = 2 x 2 x 2 = 8 tratamientos diferentes, los cuales pueden nombrarse con la
misma notación que Yates propuso.

La representación geométrica ahora es mediante un cubo regular centrado en el origen (0, 0,


0) cuyos vértices son los ocho tratamientos
M.Sc. Lic. Oscar Soliz Vásquez 56 QMC 304
Con este diseño se pueden estudiar los 23 – 1 = 7 efectos, tres efectos principales A, B, C,
tres interacciones dobles AB, AC, BC, y una interacción triple ABC, sin embargo por lo general
el interés se centra en estudiar los efectos principales y las interacciones dobles; las
interacciones de mayor orden (tres o más) generalmente no influyen de manera significativa.

Tabla.- Tabla de signos del diseño factorial 23

TOTALES A B C AB AC BC ABC
(1) - - - + + + -
a + - - - - + +
b - + - - + - +
c - - + + - - +
ab + + - + - - -
ac + - + - + - -
bc - + + - - + -
abc + + + + + + +

Análisis del diseño factorial 23

Sean A, B, y C los factores que se quieren estudiar y sean (1), a, b, c, ab, ac, bc, abc, los
totales observados en cada uno de los ocho tratamientos escritos en su orden estándar.

Al multiplicar las columnas de signos de la tabla anterior por la columna de totales


representados por la notación de Yates, se obtienen los contrastes para los siete efectos,
dados por:

Contraste A = [a + ab + ac + abc - (1) - b - c - bc]

Contraste B = [b + ab + bc + abc - (1) - a - c - ac]

Contraste C = [c + ac + bc + abc - (1) - a - b - ab]

Contraste AB = [ab - b - a + abc + (1) - bc - ac + c]

Contraste AC = [(1) - a + b - ab - c + ac - bc + abc]

Contraste BC = [(1) + a - b - ab - c - ac + bc + abc]

Contraste ABC = [abc - bc - ac + c - ab + b + a - (1)]

Si se hacen la experimentación con réplicas de cada tratamiento, los efectos se estiman


dividiendo los contrastes entre 4n, por ejemplo el efecto principal de A se estima de la
siguiente manera:

Efecto A = Contraste A / n 2k-1


M.Sc. Lic. Oscar Soliz Vásquez 57 QMC 304
También las sumas de cuadrados de los efectos se calculan a partir de los contrastes con la
siguiente fórmula:

SCEFECTO = (Contraste EFECTO )2 / n 2k

La suma total de cuadrados se obtiene:

2 2 2 n
Y ....
SCT   Yijlm 
i 1 j 1 l 1 m 1 n2

Y finalmente, la suma de cuadrados del error se calcula por sustracción, para luego calcular el
ANOVA que para este diseño es:

FUENTE DE SC GL CM Fo
VARIABILIDAD
A SCA 1 CMA CMA / CME
B SCB 1 CMB CMB / CME
C SCC 1 CMC CMC / CME
AB SCAB 1 CMAB CMAB / CME
AC SCAC 1 CMAC CMAC / CME
BC SCBC 1 CMBC CMBC / CME
ABC SCABC 1 CMABC CMABC / CME
Error SCE 23 (n – 1) CME
Total SCT n 23 – 1

EJEMPLO:

En una empresa lechera se ha tenido problema con la viscosidad de cierta bebida


chocolatada. Se cree que tres ingredientes que se agregan en pequeñas cantidades son los
que pueden resolver este problema por lo que es necesario experimentar mediante un diseño
factorial 23 con dos replicas.

INGREDIENTES VISCOSIDAD
A B C
- - - 13.3 13.7 13.5
+ - - 14.7 14.4 14.5
- + - 14.6 14.5 14.8
+ + - 14.3 14.1 14.0
- - + 16.9 17.2 17.4
+ - + 15.5 15.4 15.6
- + + 17.0 17.1 17.3
+ + + 18.9 19.0 19.1
M.Sc. Lic. Oscar Soliz Vásquez 58 QMC 304
Estimar los efectos y determinar los más significativos; Realizar el ANOVA y obtener las
conclusiones.

4.3. Diseño factorial 2k

Un diseño 2k donde se consideran k factores con dos niveles de cada uno, y tiene 2 k
tratamientos o puntos de diseño. Las k columnas y 2k renglones que componen la matriz para
este diseño, considerando una replica, se puede construir de la siguiente manera

Trat. Yates A B C D E Trat. Yates A B C D E


1 (1) - - - - - 17 E - - - - +
2 A + - - - - 18 Ae + - - - +
3 B - + - - - 19 Be - + - - +
4 Ab + + - - - 20 Abe + + - - +
5 C - - + - - 21 Ce - - + - +
6 Ac + - + - - 22 Ace + - + - +
7 Bc - + + - - 23 Bce - + + - +
8 Abc + + + - - 24 Abce + + + - +
9 D - - - + - 25 De - - - + +
10 Ad + - - + - 26 Ade + - - + +
11 Bd - + - + - 27 Bde - + - + +
12 Abd + + - + - 28 Abde + + - + +
13 Cd - - + + - 29 Cde - - + + +
14 Acd + - + + - 30 Acde + - + + +
15 Bcd - + + + - 31 Bcde - + + + +
16 Abad + + + + - 32 Abcde + + + + +

ESTIMACIÓN DE CONSTRATES, EFECTOS Y SUMA DE CUADRADOS

Cada uno de los efectos se estima a partir de su contraste, el cual a su vez se puede obtener
construyendo la tabla de signos del diseño. Las columnas de signos para los constrastes que
definen a los efectos principales están directamente de la matriz de diseño, mientras que la
columna de un efecto de interacción.

DISEÑO FACTORIAL 25

La tabla de signos para los 15 (quince) efectos potencialmente más importantes, donde se
tiene 5 (cinco) efectos principales y 10 (diez) de interacción doble, 10 (diez) de interacción
triple, 5 (cinco) de interacción cuatriple y 1 (uno) de interacción quintruple. Una vez calculado
la tabla de signos para el factorial 2k podría utilizarse para calcular los contrastes de cualquier
diseño de la familia 2k con k < 5, preservando las letras y los renglones.
M.Sc. Lic. Oscar Soliz Vásquez 59 QMC 304
DISEÑOS FACTORIALES 2K Y SUS EFECTOS DE INTERES, K < 5

Yates A B C D E AB AC AD AE BC BD BE CD CE DE
(1) - - - - - + + + + + + + + + +
A + - - - - - - - - + + + + + +
B - + - - - - + + + - - - + + +
Ab + + - - - + - - - - - - + + +
C - - + - - + - + + - + + - - +
Ac + - + - - - + - - - + + - - +
Bc - + + - - - - + + + - - - - +
Abc + + + - - + + - - + - - - - +
D - - - + - + + - + + - + - + -
Ad + - - + - - - + - + - + - + -
Bd - + - + - - + - + - + - - + -
Abd + + - + - + - + - - + - - + -
Cd - - + + - + - - + - - + + - -
Acd + - + + - - + + - - - + + - -
Bcd - + + + - - - - + + + - + - -
Abad + + + + - + + + - + + - + - -
E - - - - + + + + - + + - + - -
Ae + - - - + - - - + + + - + - -
Be - + - - + - + + - - - + + - -
Abe + + - - + + - - + - - + + - -
Ce - - + - + + - + - - + - - + -
Ace + - + - + - + - + - + - - + -
Bce - + + - + - - + - + - + - + -
Abce + + + - + + + - + + - + - + -
De - - - + + + + - - + - - - - +
Ade + - - + + - - + + + - - - - +
Bde - + - + + - + - - - + + - - +
Abde + + - + + + - + + - + + - - +
Cde - - + + + + - - - - - - + + +
Acde + - + + + - + + + - - - + + +
Bcde - + + + + - - - - + + + + + +
abcde + + + + + + + + + + + + + + +

4.4. Diseños de 32

Estos diseños son alternativas experimentales que permite estudiar efectos de curvatura,
además de efectos lineales y de interacción.

Tratamiento A B A B
Bajo – Bajo -1 -1 0 0
Medio – Bajo 0 -1 1 0
Alto – Bajo 1 -1 2 0
Bajo – Medio -1 0 0 1
Medio – Medio 0 0 1 1
Alto – Medio 1 0 2 1
Bajo – Alto -1 1 0 2
Medio – Alto 0 1 1 2
Alto – Alto 1 1 2 2
Diseño factorial 32 en dos notaciones
M.Sc. Lic. Oscar Soliz Vásquez 60 QMC 304

Este diseño consiste de 32 = 9 tratamientos diferentes que corresponden a todas las combinaciones
de dos factores en tres niveles cada uno, donde los niveles se llaman bajo, medio y alto.

Los nueve puntos se pueden representar en forma geométrica sobre el cuadrado:

Análisis del diseño factorial 32

El modelo estadístico es:

Yijk    i  j  ( )ij  ijk

Con: i = 1, 2, 3; j = 1, 2, 3; k = 1, ……., n

Donde: γ = es el efecto del factor A; δ representa el efecto del factor B; (γδ) es la interacción
de ambos y n = número de repeticiones de cada tratamiento

La hipótesis a probar es:

Ho = γi = 0 Ho = δj = 0
HA = γi = 0 HA = δj = 0

Estas hipótesis se probaran con el ANOVA mediante la suma de cuadrados

3
Yi.. Y ...
SCA   
i 1 3n n3

3
Y . j. Y ...
SCB   
j 1 3n n3
M.Sc. Lic. Oscar Soliz Vásquez 61 QMC 304
3 3
Yij . Y ...
SCAB     SCA  SCB
i 1 j 1 n3 n3

Donde n es el número de replicas del experimento. La suma de cuadrados totales es:

3 3 n
Y ...
SCT   Yijl 
i 1 j 1 k 1 n3

Y el error aleatorio se calcula con la diferencia:

SCE  SCT  SCAB  SCA  SCB

ANOVA para el Diseño 32

Fuente de SC GL CM F0
variabilidad
Factor SCA k– 1 SCA / GL CMA / CME
A
Factor SCB k-1 SCB / GL CMB / CME
B
Interacción SCAB (k -1)(k-1) SCAB / GL CMAB / CME
AB
Error SCE 32 (n – 1) SCE / GL

Total SCT n 32 - 1

No se debe olvidar que este diseño requiere al menos de dos repeticiones para que haya
grados de libertad para el error

Para conocer el efecto lineal o cuadrático de cada factor, se puede desglosar en los
componentes AL y A2 (efecto lineal o cuadrático) cada uno con grado de libertad. El subíndice
L indica que es la parte lineal del efecto global de A, y el exponente denota la parte
cuadrática.
M.Sc. Lic. Oscar Soliz Vásquez 62 QMC 304
EJERCICIOS DE APLICACIÓN DE DISEÑOS 2K

1. Se quiere realizar un proceso por el cual se elimine el contenido de Ca y Mg para disminuir la


dureza del agua, para lo cual se utiliza ácido sulfúrico en diferentes concentraciones y
temperatura de reacción, para lo cual se plantea aplicar un diseño de experimento de dos
variables, teniendo como resultado los gramos de precipitado de calcio y magnesio.

Prueba H2SO4 Temperatura (ºC) gr precipitado gr precipitado


1 10 ppm 15 6.5 6.7
2 20ppm 15 12.4 12.2
3 10ppm 50 10.3 9.9
4 20ppm 50 8.4 8.0

Realizar el análisis estadístico y sacar conclusiones

2. Se investiga la influencia de la temperatura y el tiempo de acondicionamiento en un


experimento para aumentar el contenido de bacterias que permitan degradar la materia
orgánica y de esta manera eliminar la contaminación ambiental. Para lo se realiza el
experimento, teniendo los siguientes resultados en bacterias/ cm 2 aproximadamente.

Prueba Temperatura ºC Tiempo (horas) Bacterias/cm2 Bacterias/cm 2


1 20 1 3800 3700
2 20 5 5200 5100
3 40 1 4350 4200
4 40 5 3890 3800

Realizar el análisis estadístico y sacar las conclusiones

3. En el laboratorio de química se investiga sobre la influencia que tiene la temperatura y el


tiempo de reacción en el proceso de calcinación en el análisis de plata en muestras de
minerales complejos de Pb- Zn- Ag. Para lo cual se define realizar las pruebas a 500 y
1500ªC; un tiempo de 10 minutos y 60 minutos, teniendo los siguientes resultados:

Tiempo de reacción Temperatura (ºC)


(minutos) 500 1500
10 45 53
60 48 60
60 50 58
10 48 55
10 49 54
60 48 57
60 49 56
10 47 52
Determinar: a) Las variables de estudio la variable respuesta, los niveles y las replicas de la
experimentación; b) los efectos de cada variable; c) Analizar los datos y estimar la influencia
de variabilidad de cada variable.

4. En el laboratorio de concentración de minerales se realiza un experimento para estudiar los


efectos que influyen sobre la filtración de un mineral. Los factores que se estudian son
M.Sc. Lic. Oscar Soliz Vásquez 63 QMC 304
Tamaño de grano, Agitación de la mezcla y tiempo de filtración. Teniendo como resultados la
cantidad de filtrado

Prueba Tamaño (mm) Agitación (rpm) Tiempo (min) gr filtrado gr filtrado


1 0.2 50 5 1,5 1.4
2 0.5 50 5 1,2 1.0
3 0.2 100 5 1,8 1.6
4 0.5 100 5 2.4 2.8
5 0.2 50 10 2,8 3.2
6 0.5 50 10 2.5 2.4
7 0.2 100 10 1.9 1.8
8 0.5 100 10 2.0 1.9

Realizar el análisis estadístico y sacar las conclusiones

5. En una planta de fabricación de plásticos se sospecha que el acabado de una pieza de


polietileno depende de la velocidad de alimentación, la temperatura y el aire de entrada. Para
lo cual se selecciona un diseño factorial para su estudio, teniendo los resultados en función a
la dureza de la pieza.

Prueba Velocidad (g/seg) Temperatura ºC Aire (ml/seg) Dureza Dureza


1 1.0 30 50 1,9 2.2
2 1.0 30 100 1,8 2.0
3 1.0 60 50 1,8 1.6
4 1.0 60 100 2.4 2.8
5 5.0 30 50 3.8 4.2
6 5.0 30 100 2.9 2.4
7 5.0 60 50 3.9 3.8
8 5.0 60 100 3.0 3.1

Realizar el análisis estadístico y sacar las conclusiones

6. En el laboratorio de química se investiga sobre la influencia que tiene la temperatura, el


tiempo de reacción y tipo de fundente en el proceso de calcinación en el análisis de plata en
muestras de minerales complejos de Pb- Zn- Ag. Para lo cual se define realizar las pruebas a
500 y 1500ªC; un tiempo de 10 minutos y 60 minutos, y dos tipos de fundentes, teniendo los
siguientes resultados:

Tiempo de reacción Fundente Temperatura (ºC)


(minutos) 500 1500
10 A 45; 48 53; 54
60 A 48; 49 60; 57
60 B 50; 49 58; 56
10 B 48; 47 55; 57

Determinar: a) Las variables de estudio la variable respuesta, los niveles y las replicas de la
experimentación; b) Analizar los datos y estimar la influencia de variabilidad de cada variable.
M.Sc. Lic. Oscar Soliz Vásquez 64 QMC 304
CAPITULO Nº 5

DISEÑOS FACTORIALES FRACCIONARIOS


DE DOS NIVELES

5.1. Introducción

Cuando crece el número de factores también crece rápido el número de tratamientos en los
diseños factoriales completos 2k . Por ejemplo para k = 6 factores una sola réplica del diseño
factorial completo 26 implica 64 pruebas, para 27 = 128 puntos del diseño, siendo en la práctica
difícil de realizar estas pruebas experimentales.

Si se puede suponer que algunos factores son despreciables, entonces puede obtenerse la
misma información con menor número de ensayos, para lo cual se puede utilizar los DISEÑOS
FACTORIALES FRACCIONARIOS.

El uso importante de estos diseños es en experimentos denominados de tamizado o cribado,


donde se consideran muchos factores con el fin de identificar aquellos que tienen efectos
importantes de existir, para que posteriormente se investiguen con mayor detalle.

El empleo exitoso de estos diseños se basa en tres ideas fundamentales que son:

1. El principio de dispersidad de efectos - Cuando existen varias variables, es probable que


el sistema o proceso sea influido principalmente por algunos efectos de factores e
interacciones.

2. La propiedad de proyección – Pueden proyectarse en diseños más poderosos en el


subconjunto de factores significativos.

3. Experimentación secuencial – Es posible combinar las corridas de dos o más factores


fraccionarios y conforma de manera secuencial un diseño más grande.

5.2. Diseño factorial fraccionario 2 k-1

La notación 2k-1 significa una fracción a la mitad del diseño factorial completo 2 k , k 2(1/2 2k =
2k-1)
En muchos casos no es conveniente fraccionar, principalmente si es pequeño. Ejemplo 22
porque prácticamente desaparece: al tener sólo cuatro tratamientos, fraccionarlo a la mitad
implicaría correr dos tratamientos y con ellos no se podrían estimar los efectos principales.

 Diseño factorial fraccionado 23-1

El primer diseño que se puede fraccionar es el diseño 2 3, que al fraccionar a la mitad


este diseño, entonces es necesario seleccionar cuatro de ocho tratamientos. Para la
selección de los tratamientos se debe considerar que en el diseño 2 3 completo se
pueden estimar siete efectos: A, B, C, AB, AC, BC y ABC, por lo que de acuerdo a la
prioridad, el menos importante sería ABC, por lo que es el más sacrificable para que se
pierda un mínimo de información.
M.Sc. Lic. Oscar Soliz Vásquez 65 QMC 304
La generación de la fracción se hace con base en los signos del contraste ABC: los
signos “+” del contraste ABC señalan la fracción principal, y los signos “-“ señalan la
fracción complementaria, proporcionando ambos diseños la misma calidad de
información sobre los efectos importantes.

Diseño factorial completo 23 y contraste ABC

A B C ABC
-1 -1 -1 -
1 -1 -1 +
-1 1 -1 +
1 1 -1 -
-1 -1 1 +
1 -1 1 -
-1 1 1 -
1 1 1 +

Dos posibles diseños fraccionados 23-1

Fracción 1 (I = +ABC) Fracción 2 ( I = -ABC)


A B C A B C
1 -1 -1 a -1 -1 -1 (1)
-1 1 -1 b 1 1 -1 ab
-1 -1 1 c 1 -1 1 ac
1 1 1 abc -1 1 1 bc

Representación geométrica del diseño 23-1

Fracción principal
Fracción complementaria

Estructura de alias del diseño 23-1 con I = ABC

Al estimar los efectos potencialmente importantes cada efecto estimado tiene un alias.
Ejemplo: para el I = +ABC, la estructura de alias consiste en escribir cuales son las
alias de cada efecto, y esta estructura s deduce fácilmente del generador de la
fracción.
M.Sc. Lic. Oscar Soliz Vásquez 66 QMC 304

Contraste = [ a + abc – b – c]

Mientras que al multiplicar las columnas B x C se obtiene

Contraste BC = [ a + abc – b – c]

Ambos contrastes son iguales que significa que son alias, porque al estimar el efecto
de A también se estima el efecto BC. De igual forma se puede ver que:

Contraste B = Contraste AC = [ b + abc – a – c]

Y Contraste C = Contraste AB = [ c+abc – b – a]

En resumen, la estructura de alias del diseño factorial fraccionado 23-1 está dado por:

A + BC
B + AC
C + AB

La estructura alias de un diseño factorial fraccionado se puede obtener de la relación


definidora del diseño, en este caso es I = ABC, multiplicando cada efecto por esta
relación. Ejemplo:

A x I = A x ABC = A2 BC = BC

Para la interpretación de efectos alias es necesario suponer que solo uno de ellos es el
responsable del efecto observado y que los demás son nulos.

 Construcción de fracciones 2k-1

Una manera de construir en dos pasos es la siguiente:

 Se lista el diseño factorial completo para k – 1 factores, y de esta forma


se tienen las primeras k – 1 columnas de la fracción deseada.

 Las columnas faltantes (la k – ésima) se construye multiplicando entre sí


las columnas previas. Si se quiere la fracción complementaria se
cambian los signos de esta última columna. El diseño que resulta es un
diseño factorial fraccionado 2 k – 1 con resolución máxima R = k.
4–1
Estos dos pasos aplicados en la construcción del diseño factorial fraccionado 2 con
resolución IV y con generador I = -ABCD quedan de la siguiente manera:
M.Sc. Lic. Oscar Soliz Vásquez 67 QMC 304

Diseño factorial completo 2 4 – 1 = 23 es dado por:

A B C D
- - -
+ - -
- + -
+ + -
- - +
+ - +
- + +
+ + +

La columna faltante se obtiene de multiplicar A, B y C de acuerdo al generador,


haciendo el producto –ABC

A B C D = -ABC
- - - +
+ - - -
- + - -
+ + - +
- - + -
+ - + +
- + + +
+ + + -

Si se quiere la fracción principal que tiene generador I = +ABC, el primer paso es el


mismo y en el segundo paso los niveles de D se obtienen con el producto positivo de
las columnas (D = +ABC).

 Diseños factoriales fraccionados 2k-2

De acuerdo al número de factores y del costo del experimento, es necesario hacer


menor cantidad de pruebas del diseño factorial completo 2k . Un diseño factorial
fraccionado 2 k – 2 representa la cuarta parte del factorial original. Para obtener este
diseño se necesitan dos efectos generadores, de entre las interacciones del más alto
orden. Estos efectos generadores deben ser elegidos de manera que su producto sea
también una interacción del más alto orden posible.

El diseño factorial fraccionado 2 k – 2 se puede construir en dos pasos:

o Se escribe el diseño 2 k – 2 como si fuera un factorial completo en k – 2 factores,


y de esta forma se tienen los niveles de los primeros k – 2 factores.

o Los niveles que corresponden a los factores de las dos últimas columnas
(factores k – 1 y k) se obtienen multiplicando columnas previas de acuerdo a
los generadores.
M.Sc. Lic. Oscar Soliz Vásquez 68 QMC 304
Ejemplo: se tiene el diseño factorial completo 23

A B C D E
- - -
+ - -
- + -
+ + -
- - +
+ - +
- + +
+ + +

Los niveles para los factores D y E se obtienen a partir de los generadores que
son I = ABD y I = ACE y el tercer generador es el producto ABD x ACE = BCDE.
Por lo tanto I = ABD = ACE

A B C D E
- - - + +
+ - - - -
- + - - +
+ + - + -
- - + + -
+ - + - +
- + + - -
+ + + + +

5.3. Diseños de Plackett – Burman

Los diseños de Plackett – Burman representan otra alternativa para fraccionar diseños
factoriales completos 2k donde el número de puntos de diseño no necesariamente es potencia
de dos pero si es múltiplo de cuatro. Estas nuevas fracciones permiten en un momento dado
optimizar los recursos disponibles.

Los diseños experimentales atribuidos a Plackett y Burman, son diseños factoriales


fraccionarios de dos niveles, utilizados para estudiar k = N – 1 variables en N ensayos, donde
N es múltiplo de 4, donde los diseños básicos son 8, 12, 16, 20 hasta 100 pruebas
experimentales.

Para construir un diseño de Plackett – Burman para k factores, se selecciona un renglón o


columna de niveles codificados + y – de manera que el número de positivos sea (k + 1) /2 y el
negativos (k – 1) /2, este renglón es el primero del diseño. Los siguientes k – 1 renglones o
columnas se generan recorriendo cada vez un lugar el primer renglón.

K= 7 N=8 - - - + + + +
K = 11 N = 12 + - + - - - + + + -+
K = 15 N = 16 - - - - - - - + + + + + + + +
K = 19 N = 20 + - + + - - - - + - + - + + + + - - +
K = 23 N = 24 + - - - - + - + - - + + - - + + - + - + + + +
K = 35 N = 36 - - + - - + + - + - + - - - - + - - + + + - + + + + + - - - + + + - +
M.Sc. Lic. Oscar Soliz Vásquez 69 QMC 304

Para la realización de un experimento de varias variables, inicialmente se debe determinar el


número exacto de variables a estudiar y luego seleccionar el diseño a aplicar, por lo que se
puede utilizar el diseño de experimentos para la determinación de variables y optimización de
esas variables.

El diseño de Plackett y Burman es bastante utilizado para la caracterización de variables,


debiendo realizar el diseño de la siguiente manera:

Ejemplo un diseño para k = 11 y N = 12

 Determinar las variables de estudio, codificarlos y determinar los niveles de trabajo


(alto y bajo), debiendo incluir algunas variables ficticias que reemplacen algunas
variables que se haya omitido en su determinación, completando siempre a un múltiplo
de 4.

Nº Variables Código Nivel menor Nivel mayor


1 Variable real A - +
2 Variable real B - +
3 Variable ficticia (c) - +
4 Variable real D - +
5 Variable ficticia (e) - +
6 Variable real F - +
7 Variable ficticia (g) - +
8 Variable real H - +
9 Variable real I - +
10 Variable ficticia (j) - +
11 Variable real K - +

 Construir la Matriz de Plackett y Burman de acuerdo a los signos.

Corrida A B C D E F G H I J K
1 + - + - - - + + + - +
2 + + - + - - - + + + -
3 - + + - + - - - + + +
4 + - + + - + - - - + +
5 + + - + + - + - - - +
6 + + + - + + - + - - -
7 - + + + - + + - + - -
8 - - + + + - + + - + -
9 - - - + + + - + + - +
10 + - - - + + + - + + -
11 - + - - - + + + - + +
12 - - - - - - - - - - -

 Luego realizar el experimento programado se acuerdo al diseño planteado.

 Para la realización del análisis estadístico se realiza de la siguiente forma:


1. Determinación del efecto de las variables
M.Sc. Lic. Oscar Soliz Vásquez 70 QMC 304

Re n  Re n 
EA  
n n

EA = efecto de variable; R = resultado en (+) o (-); n = número de pruebas

2. Cálculo de la varianza del efecto

Varianza (efecto ) 
 ( Ed )
n

Ed = efecto mostrado por una variable ficticia; n = número de variables ficticias

3. Calcular la relación entre la varianza de un efecto y el error estandar

SEefecto  Varianza(efecto )

4. Determinación del t-test

efecto ( E ) A
t  test 
SEefecto

5. Con los valores determinados de t-test se determina el grado de probabilidad,


por comparación en la tabla de t-student y grados de libertad de acuerdo a las
variables ficticias y por extrapolación.

Para la extrapolación se interpreta como lineal donde (X0 , Y0) y (X1, Y1)

Donde X0 < X < X1

Y1  Yo
Y  Yo  ( X  Xo ) Y
X 1  Xo

6. Finalmente calcular el nivel de confianza de que la aceptación de la idea sea


correcta.

100 x ( 1 – probabilidad a la casualidad)

Prueba V R Variable Efecto T-test Probabilidad Confianza

Los resultados más altos del nivel de confianza se determinan las variables de
mayor influencia
M.Sc. Lic. Oscar Soliz Vásquez 71 QMC 304

 Con los resultados obtenidos se determina cuáles son las variables de mayor
influencia y que deben ser optimizados en su estudio.

Ejemplo:

Se estudia la flotación de un mineral sulfurado de cobre. Los factores que inicialmente se considera
son: Concentración colector (A); Concentración del agente espumante (B); tiempo de
acondicionamiento (C); tiempo de agitación (D); temperatura (E); % de sólidos (F); y pH (G). Se
sospecha que sólo unos cuantos factores son importantes por lo que se decide aplicar el diseño
factorial de Plackett y Burman, midiendo la concentración de cobre en la cabeza de la flotación.
Teniendo los siguientes resultados:

Código Variables Nivel ( - ) Nivel ( + )


A Concentración del colector (ppm) 0.1 1.0
B Concentración de espumante (ppm) 0.01 0.1
C Tiempo de acondicionamiento (min) 1 5
D Velocidad de agitación (rpm) 50 200
E Temperatura (ºC) 10 50
F % de sólidos 30 60
G pH 5.0 9.0
(H) Ficticio - -
(I) Ficticio - -
(j) Ficticio - -
(k) Ficticio - -

Matriz de Plackett y Burman para N = 12 y K = 11

Prueba A B C D E F G (H) (I) (J) (K) Y1 Y2


1 + - + - - - + + + - + 31.8 31.6
2 + + - + - - - + + + - 35.8 36.0
3 - + + - + - - - + + + 29.1 28.9
4 + - + + - + - - - + + 36.1 35.9
5 + + - + + - + - - - + 44.5 44.3
6 + + + - + + - + - - - 36.1 36.3
7 - + + + - + + - + - - 38.1 38.5
8 - - + + + - + + - + - 31.6 31.6
9 - - - + + + - + + - + 30.1 30.3
10 + - - - + + + - + + - 28.7 28.5
11 - + - - - + + + - + + 34.4 34.2
12 - - - - - - - - - - - 30.0 29.8
M.Sc. Lic. Oscar Soliz Vásquez 72 QMC 304
CAPÍTULO Nº 6

CORRELACIÓN Y REGRESIÓN LINEAL


6.1. Introducción

Las técnicas estadísticas estudiadas, tenían por objetivo fundamental la comprobación de


ciertas hipótesis, sin embargo un campo importante del análisis estadístico consiste en el
desarrollo de modelos matemáticos que representen situaciones físicas.

Los procedimientos estadísticos utilizados en análisis instrumental deben proporcionar


siempre información de la precisión y exactitud de las medidas. Deben reflejar además las
ventajas técnicas de dichos métodos, especialmente la posibilidad de cubrir un gran intervalo
de concentraciones, y manejar con rapidez muchas muestras. En la práctica se calculan los
resultados y se evalúan los errores de manera que difieran de los utilizados cuando una
medida sencilla se repita varias veces.

Los patrones de calibración se miden en el instrumento analítico bajo las mismas condiciones
que las utilizadas posteriormente para los materiales de ensayo. Una vez establecida la
gráfica de calibrado, puede obtenerse la concentración de analito por interpolación. Este
procedimiento general plantea varias cuestiones estadísticas importantes:

 ¿Es lineal la línea de calibrado? Si es una curva, ¿qué forma tiene dicha curva?

 Teniendo en cuenta que cada uno de los puntos de la línea de calibrado está sujeto a
errores, ¿cuál es la mejor línea recta (o curva) que pasa por esos puntos?

 ¿cuál es la relación de las variables de estudio (X) y la variable respuesta (Y)?

 ¿Cuál es la pendiente y ordenada en el origen de la recta?

 ¿Cuál es el límite de detección del método? Esto es, ¿cuál es la menor concentración
de analito que puede detectarse con un predeterminado nivel de confianza?

El estudio de la variación simultánea de 2 o más características puede hacerse por medio del
estudio de la correlación y de la regresión, y que está íntimamente relacionada con el modelo
del análisis de varianza.

6.2. Correlación Simple

La correlación estudia la variación simultánea de dos variables, el termino se debe a Karl


Pearson y se usa para indicar aquellos casos en que los cambios de una variable van
asociadas con cambios de otra variable, existiendo una relación entre dichas variables.

Cuando dos variables cambian juntas, el aumento de una de ellas va asociado con el
incremento en la otra, se dice que las variables están correlacionadas positivamente; si
disminuyen están correlacionadas negativamente y si no hay relación, se dice que no están
correlacionadas.
M.Sc. Lic. Oscar Soliz Vásquez 73 QMC 304
Es importante el conocimiento de la asociación de dos caracteres porque tiene un valor
predictivo.

Existen varios métodos para determinar la correlación entre las que se puede indicar:

 Diagramas de dispersión

Es un método gráfico para encontrar la dispersión de los valores determinados por la


variable X y la variable Y.

Correlación + perfecta + alta + baja

No existe correlación correlación - - perfecta

 Coeficiente de correlación

El coeficiente es un valor que indica el grado de asociación entre dos variables, existen
varios casos posibles de correlación.

o El valor del coeficiente de correlación es cero (0) o estima a cero, entonces se


dice que las variables son independientes y no hay correlación.

o El valor del coeficiente es +1 hay correlación positiva y perfecta.

o El valor del coeficiente es – 1 hay una correlación negativa y perfecta.

o Valores de 0 a +1 y de 0 a – 1 sugieren cierto grado de asociación.


M.Sc. Lic. Oscar Soliz Vásquez 74 QMC 304
El símbolo del coeficiente de correlación se representa por (rho)( ) y se calcula con
las siguientes fórmulas.

   ( X  x)(Y  y)   xy
( x)( y ) ( x)( y )

(X – x) = x desviación de la variable X

(Y – y) = y desviación de la variable Y

xy = producto de las desviaciones

xy = suma de los productos

x2 = suma de los cuadrados de las desviaciones de X

y2 = suma de los cuadrados de las desviaciones de Y

 x   X  n  y  Y  n
( X) ( Y)

 xy   XY   n 
( X )( Y )
n = número de pares
n – 2 = grados de libertad (GL)

Ejemplo: En la calibración de un espectrómetro, se ha examinado una serie de


soluciones patrón de fósforo en ppm, leyendo las siguientes absorbancias. Determinar
el coeficiente de correlación y definir la correlación de las dos variables.

X (ppm) Y (abs.) X-x Y-y X2 Y2 XY


0 0 -6 - 3.37 0 0 0
2 1.1 -4 -2.27 4 1.21 2.2
4 2.3 -2 -1.07 16 5.29 9.2
6 3.5 0 0.13 36 12.25 21.0
8 4.8 2 1.43 64 23.04 38.4
10 5.5 4 2.13 100 30.25 55.0
12 6.4 6 3.03 144 40.96 76.8
42 23.6 0 0 364 113.0 202.6

X= 6 y = 3.37

42
 x  0  2  4  6  8  10  12  7
 364  252  112
M.Sc. Lic. Oscar Soliz Vásquez 75 QMC 304
23.6
 y  0  1.1  2.3  3.5  4.8  5.5  6.4  7  113.0  79.57  33.43

42 * 23.6
 xy  0  2.2  9.2  21  38.4  55  76.8  7
202.6  141.6  61

   xy  61
 0.997
( x)( y ) 112 * 33.43

Las hipótesis que se plantean son:

Ho: = 0; no hay correlación

HA: = 0; hay correlación

Se rechaza Ho y se acepta HA si:

/ r / (calculada) > r (GL) (obtenida de tablas

/ 0.997 / > r0.05 (5) = 0.754

/ 0.997 / > r0.01 (5) = 0.874

6.3. Regresión lineal

La regresión lineal fue dado a conocer por Galton para explicar fenómenos debidos a la
asociación de dos variables donde X = V.I. y Y = V.D., y matemáticamente “Y es función de X”.
Generalmente se usa la regresión para predecir Y conociendo X o conocer la relación entre
las dos variables.

La regresión se mide por medio del coeficiente de regresión (b) y el valor indica el incremento
promedio de Y al aumentar X en la unidad.

Se calcula por medio de la siguiente relación:

by / x  b 
 xy
x
by /x = b = se lee “regresión de Y sobre X”

El valor de b también es la pendiente de una línea recta que pasa por x, y.


La ecuación de la línea recta esta determinada por:
M.Sc. Lic. Oscar Soliz Vásquez 76 QMC 304

Y  y  b( X  x)

Donde: y = valor teórico de la ordenada de la línea de regresión


Y = valor observado de la variable.
Y – Y = desviación de la regresión 0 y
Y–Y=0

Y = promedio de la variable dependiente

b = pendiente de la línea de regresión de la muestra o coeficiente de regresión


que estima a beta.
x = promedio de la variable independiente.
X = cualquier valor de la variable independiente

Aplicando el ejemplo anterior tenemos que:

x= 6 y = 3.37 b = 0.545

Cualquier punto de la línea que pasa por x , y tiene como ordenada:

Y = 3.37 + 0.545 (X – 6)

Entonces: Y =0.1 + 0.545X

Si X = 7.5 entonces Y = 4.19

También se puede calcular la regresión de X sobre Y

bx / y 
 xy
y
X  x  b(Y  y)

Conociendo los coeficientes de regresión:

By /x = b o bx/y

El coeficiente de correlación de calcula por medio de:

  b * bx / y
M.Sc. Lic. Oscar Soliz Vásquez 77 QMC 304
6.4. Tratamiento estadístico para análisis químico

Un químico analítico puede enfrentarse con dos tipos de problemas: 1) A veces se le solicita
sólo una respuesta cualitativa. Por ejemplo, la presencia de boro en agua destilada que es
muy peligrosa en la producción de componentes microelectrónicas; 2) otras veces la
comparación de muestras; 3) en otros casos, los problemas que se le plantean son
cuantitativo. Entonces la química analítica moderna es una ciencia cuantitativa. Obviamente
en muchos casos una respuesta cuantitativa es mucho más valiosa que otra cualitativa.

En un análisis químico puede existir errores aleatorios: éstos provocan que los resultados
individuales difieran uno de otro de manera que caigan a ambos lados del valor medio,
afectando a la precisión, o reproducibilidad, de un experimento. Sin embargo, también
existen errores sistemáticos: éstos provocan que todos los resultados sean erróneos en el
mismo sentido. El error sistemático total es denominado el sesgo de la medida.

En muchos experimentos analíticos la pregunta más importante es ¿hasta qué punto se


aproxima el resultado al verdadero valor de la concentración o cantidad que se pretende
medir? Esto se expresa como la exactitud del experimento.

La Organización Internacional de Estándares (ISO) define la exactitud como «el grado de


concordancia entre el resultado de un ensayo y el valor de referencia aceptado» del analito.
Bajo esta definición, la exactitud de un resultado individual puede estar afectada por los dos
errores, aleatorios y sistemáticos. La exactitud de un resultado promedio también tiene
contribuciones de ambas fuentes de error: incluso si los errores sistemáticos están ausentes,
el resultado promedio probablemente no será exactamente igual al valor de referencia, debido
a la existencia de errores aleatorios.

En los últimos años los químicos analíticos han reconocido la importancia de proporcionar
para cada análisis un único número que describa su efecto combinado. La incertidumbre de
un resultado es un parámetro que describe un intervalo dentro del cual se espera que se
encuentre la cantidad medida, teniendo en cuenta todas las fuentes de error. Para expresar la
incertidumbre se emplean dos símbolos. La incertidumbre estándar (u) expresa el concepto
como una desviación estándar. La incertidumbre expandida (U) define un intervalo que abarca
una fracción grande de valores dentro de los cuales caerá la cantidad que se está midiendo y
se obtiene multiplicando u por un factor de cobertura, k, elegido según el grado de confianza
exigido para el rango, es decir, U = u x k. Puesto que u es análoga a una desviación estándar,
si le es 2, entonces U proporciona aproximadamente una mitad del intervalo de confianza del
95 %.

Por lo que es importante en un experimento que los datos obtenidos tengan una precisión y
reproducibilidad de los datos, por lo que se plantea la determinación de los siguientes
parámetros en un experimento, principalmente de análisis químico.

a) Limite de detección (LD)

El limite de detección (LD), se evalúa para conocer el valor de detección que


puede tener los resultados obtenidos, mediante las siguientes ecuaciones:

Calculo del promedio de las mediciones individuales

Luego se calcula el limite de detección según:


M.Sc. Lic. Oscar Soliz Vásquez 78 QMC 304
3Sx / y
LD(%) 
b

Donde: LD = Limite de detección Sx/y = Desviación estándar residual


b = Pendiente (se calcula según el método de mínimos cuadrados

Calculo de la desviación estándar residual de la curva de calibración:


 
Sx / y 
(X  Y )
N 2

Donde: X = promedio de las mediciones individuales


Y = promedio de las mediciones corregidas

Calculo del promedio de las mediciones corregidas


Y  a  b·VR

Donde: a = Intersección b = Pendiente


VR = Valores de referencia Y = Promedio de las mediciones corregidas

El calculo de a y b se obtiene mediante el método de mínimos cuadrados

b) Reproducibilidad o repetibilidad

Una de las formas de evaluar la precisión es calculando la reproducibilidad o


repetibilidad. Para la verificación que los datos experimentales pertenecen a la
misma población estadística, se realiza la evaluación de la siguiente manera.

Calculo del promedio de los valores observados

Calculo de la desviación estándar


Si 
 ( Xi  X )
n 1

Donde: Si = desviación estándar X = promedio de las observaciones


Xi = observaciones

Calculo de los valores anómalos


M.Sc. Lic. Oscar Soliz Vásquez 79 QMC 304
Si
C exp 
 Si
Donde: Cexp = Prueba de Cochran experimental
Si2 = sumatoria de las desviaciones individuales al cuadrado

Con los datos obtenidos de la desviación estándar se calcula la repetibilidad

 (n  1)·s i

Sr  i 1
n

 (n  1)
i 1

Donde: Sr = repetibilidad n = número de mediciones individuales


Si = desviación estándar de las mediciones individuales

c) Sesgo

Cálculo del sesgo de las mediciones individuales


bi  X  VR

Donde: bi = sesgo de las mediciones individuales VR = valor de referencia


X = promedio de las mediciones individuales

Cálculo del sesgo en términos porcentuales


X  VR
b(%)  ·100
VR

Evaluación de valores anómalos


bi (%)  b (%)
G exp 
Sb

Donde: se compara los valores de Gexp con Gcri extraidos a partir de la tabla de t-
student; si Gexp es menor a Gcri entonces los valores de sesgo pertenecen a la
misma población estadística.
M.Sc. Lic. Oscar Soliz Vásquez 80 QMC 304
Es importante determinar la significancia del sesgo, vale decir los límites de
confianza de acuerdo a las relaciones conocidas.

d) Robustez

Para la evaluación de la robustez de los datos observados, se utiliza un diseño


experimental de Younden y Steiner, con valores inferiores (-) y superiores (+).
Ejm.

Nº A B C D E F G y
1 + + + + + + +
2 + + - + - - -
3 + - + - + - -
4 + - - - - + +
5 - + + - - + -
6 - + - - + - +
7 - - + + - - +
8 - - - + + + -

Calculo del promedio de los resultados individuales

Calculo de los efectos de una variable sobre la respuesta

Ei  2(
 R (  )   R ( ) )
N N

Calculo de la desviación estandar de los efectos

2
Se 
7
 ( Ei)

Calculo de la prueba estadística

S
F exp 
Se

Finalmente se compara Fexp con los valores de Fcri con un nivel de significación de
5%, donde Fexp Fcri los efectos son significativos
M.Sc. Lic. Oscar Soliz Vásquez 81 QMC 304

BIBLIOGRAFÍA

 Gutierrez P. Humberto – De la Vara S. Román. “Análisis y diseño de experimentos”. Editado


por Mc Graw Hill. INTERAMERICANA. Impreso en México. 2003.

 Miller J.C. – Miller J.N. “Estadística para química analítica”. Editorial ADDISON WESLEY
IBEROAMERICANA. Impreso en EE.UU. 1993.

 Miller J.C. – Miller J.N. “Estadística y quimiometría para química analítica”. Editorial
PRENTICE HALL. PEARSON EDUCACIÓN S.A. Impreso en Madrid – España. 2002.

 Montgomery D.C. “Diseño y análisis de experimentos”. Editorial Hispano – Americano.


Impreso en México. 1991.

 Moya C. Rufino. “Estadística descriptiva”. Editorial San Marcos. Impreso en Lima Perú. 1991.

 Palacios C. Severo. “Estadística aplicada”. Editorial Educación y Cultura. Impreso en


Cochabamba – Bolivia. 1998.

 Palacios C. Severo. “Estadística Aplicada”. Editorial Educación y Cultura. Impreso en


Cochabamba – Bolivia. 1998.

 Reyes C. Pedro. “Bioestadística aplicada”. Editorial TRILLAS. Impreso en México. 1995.

 Reyes C. Pedro. “Diseño de experimentos Agrícolas”. Editorial TRILLAS. Impreso en México


1978.

 Visauta V. Bienvenido. Análisis estadístico con SPSS 11.0 para Windows”. Editado por Mc
Graw Hill INTERAMERICANA. Impreso en España. 2002.

“Exígete mucho a ti mismo y espera poco de los


demás, así te ahorraras disgustos” (Confucio)

Vous aimerez peut-être aussi