Vous êtes sur la page 1sur 57

DISEÑO DE BLOQUES AL AZAR

Un solo factor
GENERALIDADES
En muchos problemas de investigación es necesario diseñar experimentos
en los que pueda controlarse sistemáticamente la variabilidad producida por
diversas fuentes extrañas

A estas variables se las denomina variables bloque, y se caracterizan porque:

• No son el motivo del estudio sino que aparecen de forma natural y obligada
en el mismo

• Se asume que no tienen interacción con el factor en estudio

• El experimentador no está interesado en investigar las posibles diferencias


de
• la respuesta entre los niveles de los factores bloque

La ventaja de bloquear un factor que se supone que tienen una clara influencia
en la respuesta pero en el que no se está interesado. Convierte la variabilidad
sistemática no planificada en variabilidad sistemática planificada.
Que es un DISEÑO DE BLOQUES AL AZAR

• Es el diseño experimental más ampliamente utilizado cuando se


presenta el caso de que las unidades experimentales no son
homogéneas.

• Se dividen las unidades experimentales en grupos llamados bloques de


modo que las observaciones realizadas en cada bloque se realicen bajo
condiciones experimentales lo más parecidas posibles

• En este diseño el experimentador agrupa las unidades experimentales en


bloques, a continuación determina la asignación de los niveles del factor
en cada bloque

• Requiere que cada uno de los niveles del factor de interés se


prueben por lo menos una vez en cada uno de los bloques
• Todos los posibles niveles del factor de interés los cuales se asignan
en forma aleatoria.
• Una variable bloque no presenta interacción con el factor en
estudio.
Se quieren determinar las necesidades energéticas de una
persona cuando anda, come o hace deporte.

Supongamos que se tienen 10 personas para realizar el


experimento y se considera como variable respuesta o
cuantitativa, el número de calorías consumidas por segundo.

Los resultados varían según el individuo considerado. Aquí, el


factor es la actividad realizada, con 3 posibles niveles: andar,
comer o hacer gimnasia

Si a cada una de las personas se le asigna una actividad distinta


puede ser que la variabilidad observada entre las distintas
actividades sea debida a las diferencias entre los propios
individuos

Una posible solución es que cada uno de los individuos realice las
tres actividades. De este modo, la variable bloque es el tipo de
persona y cada uno de los bloques es cada persona.
A cada bloque (persona) se le aplican los 3 niveles del factor por
orden aleatorio:

BLOQUES ASIGNACION
Persona 1 C A G
Persona 2 A C G
Persona 3 G A C
Persona 4 C G A
Persona 5 . . .
Persona 6 . . .
Persona 7 . . .
Persona 8 . . .
Persona 9 . . .
Persona 10 . . .

Esto quiere decir que cada persona realiza cada una de las
actividades y se mide la variable de respuesta
Se tienen cuatro máquinas y se quiere medir su desempeño
Se tienen 4 máquinas y se quiere
comparar su ALTERNATIVA
desempeño 2
ALTERNATIVA 1 Si hay otros factores que no se han
Tomar muestras de cada considerado y controlan o
máquina evitando al máximo nulifican para hacer las
comparaciones se afectan las
ALTERNATIVA
favorecer el desempeño 1 de
conclusiones
alguna de ellas para evitar
cualquier tipo de sesgo que Por ejemplo si la habilidad de los
pueda afectar la comparación operarios es diferente
del desempeño de las
máquinas

Cada operador
El mismo operario en trabaja con cada una
las cuatro máquinas de las máquinas
DCA

Se restringe la validez de la
comparación de los DBA
operarios
7
DEFINICION DEL
PROBLEMA

Comparar si hay diferencias


significativas entre los promedios
de los niveles del factor de interes

1
Determinar el efecto del factor de
interes sobre la variable de
respuesta

IDENTIFICACION Y DEFINICION
DEL PROBLEMA
2
MODELO ESTADÍSTICO

Hay dos formas de escribir el modelo


• Colocando los bloques en las filas y
los niveles del factor en las columnas
(2.1)
• Colocando los niveles del factor en
las filas y los bloques en las
columnas(2.2)
2.1
Yij =  +  i + j + ij
i =1.….n y j= 1.….k ij NID (0, ² )
Donde:
Yij = es la medición de la variable de respuesta en
el i-esimo bloque para el j-esimo nivel del
factor de interés
 = es la media total
j = es el efecto del j-esimo nivel del factor de
interés
 i= es el efecto del i-esimo bloque.
ij = es el error experimental.
2.2 MODELO ESTADÍSTICO
Yij =  +  j + i + ij
i =1.….k y j= 1.….n ij NID (0, ² )
Donde:
Yi j= es la medición de la variable de respuesta en
el i-esimo bloque para el j-esimo nivel del
factor de interés
 = es la media total
i = es el efecto del i-esimo nivel del factor de
interés
 j= es el efecto del j-esimo bloque.
ij = es el error experimental.
3 Hipótesis para un Factor de Interés Fijo
Para el factor de interés Para los bloques
Ho : 1 = 2 = . . . = k Ho : 1 = 2 = . . . = n
H1 : al menos una de las H1 : al menos una de las
medias de los niveles del medias de los bloques es
factor de interés es diferente diferente

Regla de Decisión Regla de Decisión


Se descarta Ho si Se descarta Ho si
Fc ≥ F,gln,gld Fc ≥ F,gln,gld

gln = ( k – 1) gln = ( n – 1)
gld = ( k – 1) (n – 1) gld = ( k – 1) (n – 1)

Para cualquiera de los dos formatos para el modelo


3

En este caso la hipótesis de los bloques sería


solo para confirmar que hay diferencias entre
estos

Si se ha considerado un diseño por bloques


es porque estos influyen en el experimento

Esto es válido tanto para factores fijos como


para factores aleatorios
3 Hipótesis para un Factor Aleatorio

Para el factor de interés


Ho : 1² = 2² =......... k²
H1 : al menos una de las varianzas de los niveles del
factor de interés es diferente

Regla de Decisión
Se descarta Ho si
Fc ≥ F,gln,gld

gln = ( k – 1)
gld = ( k – 1) (n – 1)
Para cualquiera de los dos formatos para el modelo
NOTA: Los factores de bloque no se incluyen en
el experimento porque interesa su efecto sino es
un medio de estudiar de manera más adecuada el
factor de interés
Tiene un grado de importancia secundaria en
relación al factor de interés
Pueden existir otros factores que deben
controlarse durante el experimento pero no se
tiene que caer en el extremo de controlar todo
Solo aquellos que por conocimiento del proceso o
experiencia previa se sabe que pueden afectar en
forma sensible el resultado de las comparaciones
4

16
4.1 Modelo: Yij =  +  j + i + ij

Asignar aleatoriamente cada uno de los k niveles


del factor de interés a cada uno de los n
bloques considerados en el experimento

B1: 1 2 3 4 ........k ( en forma aleatoria)

B2: 1 2 3 4 .........k ( en forma aleatoria)

.
Bn: 1 2 3 4 ..........k ( en forma aleatoria)

Para cualquiera de los dos formatos para el modelo


4.2 ModeloYij =  +  i + j + ij

Asignar aleatoriamente cada uno de los k niveles


del factor de interés a cada uno de los n
bloques considerados en el experimento

B1 B2 ……………………………… Bn
1 1 1
2 2 2
. . .
. . .
K k k
Ejemplo
3 Niveles A,B,C Para el factor de interés y
4 Bloques 1,2,3,4
Una posible configuración de la asignación aleatoria
de los niveles podría ser la siguiente:

Bloque 1 C( ) A( ) B( )
Bloque 2 A( ) C( ) B( )
Bloque 3 C( ) B( ) A( )
Bloque 4 A( ) B( ) C( )
5

20
5.1 MODELO: Yij =  +  i + j + ij

Totales/bloque

1 2 ... k Totales
/bloque

1 Y11 Y12 ... Y1k Y1.

2 Y21 Y22 ... Y2k Y2.

... ...

n Yn1 Yn2 ... Ynk Yn.

Totales Y.1 Y.2 Y.k Y..


/nivel
5.2 MODELO: Yij =  +  j + i + ij

REGISTRO DE DATOS
1 2 ... n
Totales
/nivel
1 Y11 Y12 ... Y1k Y1.
NN
I 2 Y21 Y22 ... Y2k Y2.
V
E ... ...

L
k Yn1 Yn2 ... Ynk Yn.
E
S Y.1 Y.2 Y.k Y..
Totales
/bloque
Se consideran las siguientes hipótesis sobre el modelo:

Normalidad: Yij sigue una distribución normal

Homocedasticidad: Var(εij) = σ2. Esto es equivalente a


que V ar(Yij) = σ2

Independencia: εij son independientes entre sí. Esto es


equivalente a que Yij son independientes
entre sí.

23
6

24
6.1 MODELO: Yij =  +  i + j + ij

Fuente de Grados Suma de Cuadrado Fc F


Variable de Cuadrados Medio
FV Libertad SC CM
Niveles CMN / CMEE F,gln,gld
N k-1 *SCN SCN / k -1

Bloques CMB / CMEE F, gln, gld


B n–1 *SCB SCB / n -1

Error SCEE /
EE (n -1)(k-1) *SCEE (n -1)(k-1)

Total nk - 1 * SCTo
To

*Ver fórmulas en la siguiente filmina


6.1
2
Y

1 k
SCN  Y 
2
j 1 . j
..
n nk

2
Y

1 n
SCB  Y 
2
i 1 i .
..
k nk

SCN  ( SCN  SCB)

n k 2
Y
SCT0   Y  2
ij
..

i 1 j 1 nk
6.1
MODELO: Yij =  +  j + i + ij

Fuente de Grados Suma de Cuadrado Fc F


Variable de Cuadrados Medio
FV Libertad SC CM
Niveles CMN / CMEE F,gln,gld
N k-1 *SCN SCN / k -1

Bloques CMB / CMEE F, gln, gld


B n–1 *SCB SCB / n -1

Error SCEE /
EE (n -1)(k-1) *SCEE (n -1)(k-1)

Total nk - 1 * SCTo
To

*Ver fórmulas en la siguiente filmina


6.1 2
Y

1 k
SCN  Y 2
i 1 i .
..
n nk

2
Y

1 n
SCB  2
j 1 . j
Y  ..
k nk

SCEE  SCT0  (SCN  SCB)


n k 2
Y
SCT0   Y  2
ij
..

i 1 j 1 nk
7 CONCLUSIONES
Se comparan los valores obtenidos
para la Fc con el punto crítico de
rechazo establecido en la Regla de
Decisión, tanto para los niveles del
factor como para los bloques

Se da respuesta al problema
planteado inicialmente en el
experimento
8
8.1 MODELO: Yij =  +  i + j + ij

Parámetros del Modelo:


n k

 Y ij

² = CMEE  i 1 j 1

nk
Estimación de las
Estimación de las
medias de los niveles medias de los bloques

.  Y
j
.j  Y..  i.  Yi  Y..
j= 1........k i= 1........n
8.2
MODELO: Yij =  +  j + i + ij
Parámetros del Modelo:
n k

 Y ij

² = CMEE  i 1 j 1

nk
Estimación de las
Estimación de las
medias de los niveles medias de los bloques

 i.  Y  Y i. ..  . j  Y. j  Y..

j= 1........k i= 1........n
9

33
MODELO: Yij =  +  i + j + ij
9.1

IC  j  y . j  t / 2,( k 1)( n 1) CMEE n

ICi  y i.  t / 2,( k 1)( n 1) CMEE k


MODELO: Yij =  +  j + i + ij
9.2

ICi  y i.  t / 2,( k 1)( n 1) CMEE n

IC  j  y . j  t / 2,( k 1)( n 1) CMEE k


10
Coeficiente de Determinación:
R² = (SCN + SCB) / SCTo

Interpretación:
Es un valor entre 0 y 1
Indica que el modelo explica en ese
porcentaje la variabilidad de las
mediciones de la variable de
respuesta
EJEMPLO
Problema 5.7 (Montgomery)

Un fabricante de aleación de aluminio produce refinadores de


textura en forma de lingotes. La compañía manufactura el
producto en cuatro hornos. Se sabe que cada horno tiene sus
propias características de operación , de modo que los hornos se
considerarán una variable problemática en cualquier corrida
experimental en la fundición que implique más de un horno.
Los ingenieros de proceso sospechan que la velocidad de
agitación influye en el tamaño de grano del producto. Cada
horno puede operarse a cuatro velocidades de agitación
distintas.
Se ejecuta un diseño de bloques aleatorizados para un refinado
en particular, y se mide el tamaño de grano.
Definición del Problema:
Determinar si existe diferencia significativa en el tamaño de
grano promedio pora las distintas velocidades de agitación
utilizando cuatro diferentes hornos.

Variable de Respuesta: Tamaño del grano .

Factores de Interés : velocidades de agitación


Bloques : hornos
Niveles=4 Bloques= 4
Modelo Estadístico:
Yij =  +  i + j + ij  i =1, ...,4 y j= 1,..., 4
Donde:
Yij = es el tamaño del grano para la j-esima
velocidad de agitación en el i-esimo horno
 = tamaño de grano promedio.
 i = es el efecto del i-esimo horno sobre el tamaño
de grano
j = es el efecto de la j-esima velocidad de agitación
sobre el tamaño de grano
ij = es el error experimental.
Hipotesis:
Niveles (Velocidad de Agitación )
Ho : 1 = 2 = 3 = 4
H1 : al menos uno de los tamaños promedio de grano es diferente
Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld
gln = ( k – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9

Bloques (Hornos)
Ho : 1 = 2 = 3 = 4
H1 : al menos uno de los tamaños promedio de grano es diferente
Regla de Decisión : Se descarta Ho si la Fc ≥ F0.05,gln,gld
gln = ( n – 1) = 4 – 1=3
gld = ( k – 1) (n – 1)= (4-1)(4-1)= 9
Procedimiento de Aleatorización:

Velocidades de Agitación

4() 2() 1() 3()


H
O 2 () 1() 3() 4()
R
4() 3() 1() 2()
N
O 3() 4() 2() 1()
S
Formato de Registro de Datos:
Velocidad de agitación
Hornos Totales/horno
5 10 15 20

1 8 14 14 17 53

2 4 5 6 9 24

3 5 6 9 3 23

4 6 9 2 6 23
Totales/velocidad
de agitación 23 34 31 35 123
SUPUESTOS DEL MODELO

43
ANDEVA
Fuente de Grados de Suma de Cuadrado Fc F
Libertad
Variable Cuadrados Medio
gl
FV SC CM

Velocidad 3 22.19 7.40 0.85 3.86


de Agitación
N

Hornos 3 165.19 55.06 6.35 3.86


B

Error 9 78.06 8.67


Experimental
EE

Total 15 265.44
To
Interpretación de Resultados

Para las Velocidades de Agitación :


Fc es menor que F 0.05,3,9 , por lo tanto no se descarta H0 . Se
concluye que no existe diferencia significativa en el tamaño de
grano promedio para las distintas velocidades de agitación.

Para los Hornos :


Fc es mayor que F 0.05,3,9 , por lo tanto se descarta
Ho. Se concluye que existe diferencia significativa
en el tamaño promedio del grano para los cuatro
hornos. Por lo tanto se confirma que los hornos tienen
características de operación propias.
Calculo de los Parametros

 = 123 / 16 = 7.69
² = CMEE = 8.67
Coeficiente de Determinación:

R² = (SCN + SCB) / SCTotal


R²= (22.19 + 165.19) / 265.44 = 0.71

Interpretación:
El modelo explica en un 71% la
variabilidad en los tamaños de grano
O el 71% de la variabilidad en el tamaño
del grano se debe a la velocidad de
agitación
Intervalos de confianza para los tamaños de grano
promedio de las distintas velocidades de agitación

Intervalos de confianza para los tamaños de grano


promedio de los hornos
Ejemplo 2
Una empresa de contabilidad grande trata de seleccionar un sistema de
computación integrado a la oficina entre los 3 modelos que están actualmente
en estudio.
La selección final dependerá de la productividad del sistema. Se
seleccionan aleatoriamente 5 operadores para manejar cada sistema
Es importante tener en cuenta que el nivel de experiencia que tienen los
empleados en el manejo de computadora puede afectar el resultado de la
prueba por lo tanto existe la necesidad de justificar el impacto de la
experiencia y determinar los méritos relativos de los sistemas de
comunicación.
Los niveles resultantes de producción medidos en unidades por hora
aparecen en la siguiente tabla.
Operadores Sistemas
1 2 3
1 27 21 25
2 31 33 35
3 42 39 39
4 38 41 37
5 45 46 45
Definición del Problema

Determinar si existe diferencia significativa en la productividad


promedio, de 3 tipos de sistemas de computación manejado por
cinco
operarios con diferente grado de experiencia.

Variable de Respuesta
Es la productividad del j-esimo sistema de computación
manejado por el i-esimo operario.
Factor de Interés: Tipo de Sistema de computación
Selección del Diseño Apropiado: Diseño de bloques al azar
Bloques: operadores
Continuación.............

Modelo Estadistico
Yij = µ + Bi + Tj + Eij
i = l,.....5 j = l,...3
Yij = es la productividad del i-esimo tipo de sistema de
computación manejado por el j-esimo operario.
µ = Productividad media Total
Bi = Es el efecto del i-esimo operario sobre la productividad
Tj = Es el efecto del j-esimo tipo de sistema de
computadora sobre la productividad
Eij = Error experimental
Continuación………..

Formulación de Hipotesis
Para Bloques ( operadores )
Ho: µ1 = µ2 =... = µ5
Hi: al menos un promedio es diferente
Para niveles ( sistemas )
Ho: µ1 = µ2 = µ3
Hi: al menos un promedio es diferente
Selección del nivel de significancia y regla de decisión
œ = 0.05%
Para los operadores: Descartar Ho Si Fc> F0.05, 4, 8
Para los tipos de sistemas: Descartar Ho si Fc> F0.05, 2, 8
Continuación………….

Procedimiento de Aleatorización

5 bloques: operadores : 1, 2, 3,4,5


3 niveles: tipos de sistemas 1, 2, 3, 4, 5
Operarios Sistemas
1 A(27) C(25) B(21)
2 A(31) B(33) C(35)
3 B(39) C(39) A(42)
4 B(41) A(38) C(37)
5 C(45) B(46) A(45)
Continuación………

9. Recolección de los datos del experimento

TIPOS DE SISTEMAS
OPERARIO A B C TOTALES
1 27 21 25 73
2 31 33 35 99
3 42 39 39 120
4 38 41 37 116
5 45 46 46 136
TOTALES 183 180 181 544
SUPUESTOS DEL MODELO

55
Continuación………

10. Andeva

FUENTE DE
VARIACION GL SC CM Fc Fcritica

TIPOS DE SISTEMAS 2 0.933 0.4665 0.09 4.46

OPERARIOS 4 764.93 191.23 37.28 3.84


E.E 8 41.07 15.13

Totales 14 806.93
Continuación…………

Conclusión:
Para el factor de interés se observa que Fc = 0.09 < F0.05,2, 8 =
4.46, por lo tanto no se descarta Ho. Se concluye que no existe
diferencia significativa en la productividad promedio para los 3
tipos de sistemas.

Para los operadores se observa que Fc = 37.28 > F0.05, 4, 8 = 3.84,


por lo tanto se descarta. Se concluye que existe diferencia
sigificativa en la productividad promedio de los operadores.

Vous aimerez peut-être aussi