MA461 - 2019 - 01 - Diseños Experimentales DCA - 1 PDF

DISEÑOS EXPERIMENTALES
Diseño completamente aleatorio (DCA)

Tema 1
Diseño completamente aleatorio

Temario
Diseño completamente aleatorio (DCA)
- Conceptos generales.
Análisis estadístico de un DCA

- Formula un diseño experimental de un factor.
- Verificación de supuestos.
- Comparar los efectos de un factor sobre una variable
respuesta de interés.
- Comparaciones múltiples de medias.
ENTRENAMIENTO PARA EMPLEADOS NUEVOS
El director de entrenamiento de una compañía está tratando de evaluar cual de los tres
métodos de entrenamiento mejora la producción diaria de los empleados nuevos.
Método 1: Asignar un Método 2: Ubicar a todos los

empleado nuevo con un empleados nuevos en un salón de
trabajador experimentado. entrenamiento separado de la
fábrica.
Método 3: Utilizar películas
de entrenamiento y
materiales de aprendizaje
programado.
¿ El método de entrenamiento no influirá

¿El método de entrenamiento influirá en la
en la producción diaria de los
producción diaria de los empleados nuevos?
empleados nuevos?
¿Cómo evaluar los Tres métodos?
¿Qué variable se podría analizar?
¿Cómo seleccionar el mejor de los Tres métodos?
¿Como identificar el mejor método de entrenamiento de los
empleados nuevos?
Selecciona al azar a 15 empleados nuevos.
Se asigna al azar cada empleado nuevo a uno de los tres métodos de
entrenamiento.
Método 1
REGISTRA
PRODUCCIÓN DIARIA
Método 2 DESPUÉS DEL
ENTRENAMIENTO
Método 3
Pautas generales para diseñar un experimento
Planeación
1. Identificación y 2. Elección de los previa
exposición del factores y los niveles del
problema experimento
4. Elección del 3. Selección de la

diseño experimental variable respuesta
5. Realización del 6. Análisis

experimento estadístico de los
datos
7. Conclusiones y
recomendaciones
El paso 2 y 3 suelen hacerse simultáneamente o en el orden inverso

Introducción
Un experimento diseñado es una prueba o serie de pruebas en las

cuales se inducen cambios deliberados en las variables de entrada
de un proceso o sistema, de manera que sea posible observar e
identificar cuál o cuáles de las variables de entrada produce
cambios en la variable respuesta o de salida.
Principios del experimento
Debe existir más de una réplica por tratamiento,

Repetición
y cada tratamiento puede tener un número de
réplicas diferentes entre ellas.
Aleatorización Los tratamientos se asignan aleatoriamente a las

unidades experimentales.
Todas las unidades experimentales deben de

Control
encontrarse en las mismas condiciones.
Conceptos generales
Variable independiente que afecta los resultados del
experimento: controlables o no controlables. En un
Factor experimento se puede evaluar uno o más factores.
• Susceptible a la manipulación.
• Sus valores son controlados.
• Sus efectos son evaluados en los resultados del
experimento (variable dependiente).
Tratamiento Es el nivel de un factor o a la combinación de los niveles de

dos o más factores.
Variable Es la variable en la cual se evaluarán los efectos de los

respuesta tratamientos.
Unidad Es la unidad (sujeto u objeto) sobre el cual se le aplica un

Experimental tratamiento.
Ejemplo de aplicación
El Director de entrenamiento de la compañía tiene interés en investigar el método de
entrenamiento que se utilizará para capacitar a los empleados nuevos.
Alguno de los Tres métodos de

Hipótesis de entrenamiento es diferente respecto
Investigación a la producción diaria de los
empleados nuevos
Factor en estudio Método de entrenamiento
Tratamientos Método 1, Método 2 y Método 3
Variable respuesta Producción diaria
Unidad experimental Un empleado nuevo

DCA
Medir el efecto del factor en estudio (variable

independiente de naturaleza cualitativa o cuantitativa)
Objetivo
sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).
Este diseño consiste en la asignación de los tratamientos

en forma completamente aleatoria a las unidades
experimentales (individuos, grupos, parcelas, animales,
áreas, etc.). Debido a su aleatorización es conveniente que
Definición
se utilicen unidades experimentales lo más homogéneas
posibles: personas de la misma edad, del mismo peso,
parcelas de igual tamaño, etc., de manera tal que permita
disminuir la magnitud del error experimental.
Modelo Lineal DCA
El modelo describe de manera adecuada a las observaciones y que los errores o
residuales siguen una distribución normal e independiente con media cero y varianza
σ2 desconocida pero constante.
yij     i   ij i  1, 2, . .., k ; j  1, 2, ..., n
El error experimental
Registro en el i-ésimo Efecto de i-ésimo asociado a la
tratamiento con la j- tratamiento observación yij.
ésima repetición
La media eij~ N(0,2)
poblacional
Supuestos
o Errores siguen distribución
normal.
o Errores con varianzas
homogéneas.
Esquema de análisis estadístico de datos
Comprobar el o Normalidad de errores

cumplimiento de los o Homogeneidad de
supuestos varianzas
Verificación del
problema de o Realización del análisis de
investigación varianza (Anva o Anova)
Comparaciones de los
o Prueba de Duncan o DMS
tratamientos en pares
Supuestos del modelo DCA
NORMALIDAD DE LOS
RESIDUOS
Se debe verificar si los residuos o

errores siguen una distribución normal
H0: Los errores se distribuyen normalmente

H1: Los errores no se distribuyen normalmente
Estadístico de prueba: Kolmogorov - Smirnov

Si Sig asintótico ≥ alfa No se rechaza H0
Se cumple el supuesto de Normalidad de errores.
Supuestos del modelo DCA
HOMOGENEIDAD DE Se debe verificar la homogeneidad de las

VARIANZAS varianzas
H0: σ12 =σ22 = … = σ𝑘 2

H1: Al menos una varianza diferente
Estadístico de prueba: Prueba de igualdad de Levene de varianzas de error

Si Sig ≥ alfa No se rechaza H0
Se cumple el supuesto de Homocedasticidad u homogeneidad de varianzas.
Análisis de varianza (Anva o anova)
Técnica estadística que permite descomponer la variabilidad total de los

resultados de un experimento en sus distintas fuentes (tratamientos,
bloques, interacciones entre factores, error experimental), con la
finalidad de compararlas e identificar su importancia relativa en la
explicación de la variación total.
Variabilidad entre Mide el efecto de los

grupos tratamientos
Variabilidad dentro Mide la variabilidad del

de los grupos error experimental
Análisis de varianza
1. Planteamiento de hipótesis
No hay diferencia en las El factor en estudio no afecta a

H0: 1 = 2 =… = k
medias poblacionales la variable respuesta
Al menos un i es Hay diferencia en al menos El factor en estudio afecta a la
H1:
diferente una media poblacional variable respuesta
2. Nivel de significación
CM (Tr )
3. Estadístico de prueba Fcalculado 
CME
Para obtener el valor del estadístico de prueba, se debe elaborar la tabla del Anva.
Disposición de los datos en un DCA
Tratamiento
Repeticiones
1 2 ... k
1 y11 y21 ... yk1

2 Y12 y22 ... yk2
3 y13 y23 ... yk3
. . . ... .
. . . ... .
. . . ... .
ni ...
Totales yi. y1 . y2 . ... yk .

Análisis de varianza
4. Criterio de decisión (Región critica)
Distribución F (Fisher)
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0.0
0
Punto crítico:
F(, grado de libertad Tratamiento) , grado de libertad Error)
5. Decisión
o Se Rechaza H0 Si Fcal > F(, gl Tratamiento, gl error)
o No se Rechaza H0
6. Conclusión
Comparaciones múltiples: Duncan o DMS
Permite evaluar si existen diferencias significativas entre todas las medias
de cada “par de tratamientos”.
H 0 : 𝝁𝒊 = 𝝁𝒋
H 1 : 𝝁𝒊 ≠ 𝝁𝒋 Para todo i diferente de j
Al comparar un par de medias:
Si sig ≥  te tomará la decisión de no rechaza Ho, con un nivel de

significación dado, las diferencias encontradas en las medias
muestrales no son significativas. Por lo tanto, no es posible afirmar
que exista diferencia en las medias poblacionales.
Si sig <  te tomará la decisión de rechaza Ho, con un nivel de

significación dado, las diferencias encontradas en las medias
muestrales son significativas. Por lo tanto, es posible afirmar que
exista diferencia en las medias poblacionales.
EJERCICIO DE APLICACIÓN
Estrella S.A., es una empresa que elabora y comercializa conservas de pescado
de alta calidad. El administrador desea mejorar la productividad del enlatado.
Por ello encarga al administrador Ramírez aplicar cierta técnica estadística que
ayude a determinar la marca de maquina que se debe adquirir para mejorar la
producción de enlatados por hora. Para tal fin, observa la producción de las
cuatro marcas, los resultados se observa en la tabla adjunta.
Marcas
A B C D
86 83 100 99
81 72 95 88
78 82 90 94
86 87 92 95
76 78 83 98
Situación: El administrador Ramírez debe preparar un informe estadístico para
la Gerencia de la empresa, donde sustente la recomendación por alguna marca
de estas maquinas que mejore la productividad de los enlatados.
Para este caso se usara un nivel de significación del 5%
Solución
Se resolverá este caso aplicando las cinco dimensiones:
Comunicación/
Interpretación Representación Cálculo Análisis
Argumentación
Identifica - Identifica la técnica - Presenta los - Presenta el valor Sustenta los

claramente el estadística a usar cálculos de tabla. resultados
problema que se - Identifica el factor, realizados. - Realiza la decisión y encontrados en
debe responder en niveles, tratamientos, - Presenta el conclusión la muestra y
el contexto del ANVA. estadística brinda una
variable respuesta,
caso. - El estadístico - Realiza los recomendación
unidad experimental
de prueba. supuestos de al problema.
- Plantea la hipótesis. normalidad de
- Presenta el modelo errores y
explicando con sus homogeneidad de
componentes. varianzas.
- Comparaciones
Múltiples.
Interpretación:
Se debe determinar la marca de máquina que mejore la productividad
del enlatado.
Representación:
- Factor: Marcas de Maquina.
- Niveles de tratamiento: k = 4 (A, B, C, D)
- Variable respuesta Y: unidades producidas por hora.
- Unidad experimental: Un enlatado.
Se utilizará la prueba de Análisis de varianza de un factor.
- Hipótesis a resolver:
Ho: El número de unidades promedio por hora producidos por las
cuatro marcas son iguales
H1: El número de unidades promedio por hora producido es diferente
para al menos una marca.
Modelo: yij     i   ij
μ: La media poblacional
𝜏𝑖 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑖é𝑠𝑖𝑚𝑎 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 , 𝑖 = 1,2,3,4
Ԑij = error aleatorio
Cálculo
𝑌..2 407 + 402 + 460 + 474 2 17432
= =
A B C D 𝑛. . 5+5+5+5 20
86 83 100 99 Hallando la suma de cuadrados:
81 72 95 88 17432
SC T = 862 + 812 + 782 + 862 + ⋯ . + 952 +982 −
20
= 1248.55
78 82 90 94
4072 4022 4602 4742 17432
86 87 92 95 𝐒𝐂 𝐓𝐫 =
5
+
5
+
5
+
5
− 20
= 803.35
Sumas 76 78 83 98
407 402 460 474 SC E = 1248.550 - 803.350 = 445.2
Se realiza el cuadro de análisis de varianza ANVA
Fuente de Grados de Suma de Cuadrado

F cal
variación libertad cuadrados medio
Tratamientos 4 - 1 =3 803.35 803.35/3 = 267.783
Error 20 – 4 = 16 445.2 445.2/16 = 27.825 267.783/27.825 = 9,624
20 – 1 =19 1248.55
Total
H0: El número de unidades promedio por hora producidos por las cuatro marcas
son iguales.
H1: El número de unidades promedio por hora producido es diferente para al
menos una marcas.
Gráfica de distribución
F, df1=3, df2=16
Nivel de significación: α = 0.05
0.8
Estadístico de prueba: F = 9.624 0.7
0.6
Análisis: 0.5
Densidad
Criterio de decisión: 0.4
0.3
Si Fcal≤ Fcrit, DE: N R Ho 0.2
0.1
Si Fcal > Fcrit, DE: R Ho 0.05
0.0
0 3.239
X
Fcrit(0.05,3,16)=3.239
=INV.F.CD(0.05;3;16)
Como Fcal = 9.624 > Fcrit = 3,239, DE: R Ho
Conclusión: A un nivel de significación del 5%, El número de unidades promedio

por hora producido es diferente para al menos una marca.
Verificación de supuestos
Prueba de normalidad de errores
Prueba de Kolmogorov-Smirnov para una muestra
Residuo para
unidades
N 20
Parámetros normalesa,b Media ,0000
Desviación estándar 4,84062
Máximas diferencias Absoluta ,104
extremas Positivo ,071
Negativo -,104
Estadístico de prueba ,104
Sig. asintótica (bilateral) ,200c,d
H0: Los errores se distribuyen normalmente

H1: Los errores no se distribuyen normalmente
Como Sig asintótico (bilateral) = 0.200 >  = 0.05
Decisión: No se rechaza H0
Conclusión: A un nivel de significación del 5%, no se afirma que los errores no se
distribuyen normalmente, es decir, los errores se distribuyen normalmente.
Se cumple el supuesto de Normalidad de errores.
Verificación de supuestos
Prueba de homogeneidad de varianzas:
Prueba de igualdad de Levene de

varianzas de errora
Variable dependiente: unidades
F df1 df2 Sig.
,228 3 16 ,875
H O :  12   22   32   42
H1 : Al menos un  i2 es diferente
Estadístico de prueba: F = 0,228

Como Sig = 0,875 >  = 0.05
Decisión: No se rechaza H0
Conclusión: A un nivel de significación del 5%, no se afirma que al menos una
varianza es diferente, es decir, existe homogeneidad de varianzas.
Se cumple el supuesto de homogeneidad de varianzas.
Comparaciones múltiples: Duncan
unidades
Ejemplo 1 Duncana,b
Subconjunto
Subconjunto 1 Marca N 1 2
Ho: 𝜇𝐴 =𝜇𝐵 , sig = 0.768 N R Ho B 5 80,40
A 5 81,40
C 5 92,00
Subconjunto 2 D 5 94,80
Ho: 𝜇𝐶 =𝜇𝐷 , sig = 0.414 N R Ho Sig. ,768 ,414
De los subconjuntos tenemos:

B A C D
Conclusión: A un nivel de significación del 5%, no hay diferencia significativa entre la

producción de la marca A y la marca B. Tampoco se encontró diferencia significativa
entre la producción de la marca C y la marca D. Las marcas con mayor producción
son C y D; por lo tanto, la empresa debe decidir comprar una de dichas marcas.
Comunicación/Argumentación:
El administrador Ramírez, luego de definir el modelo y validar los

supuestos, se realizo en ANVA, donde se encontró que el número de
unidades promedio por hora producido es diferente para al menos una
marca. Se realizó las comparaciones múltiples y se encontró que las
marcas C o D son las que mejoran la producción por hora del enlatado.
Por eso, debe recomendar a la gerencia de la empresa Estrella S.A

adquirir la marca C o D.
Comparaciones múltiples: Duncan
Como interpretamos cuando hay superposición
unidades
Subconjunto 1 Duncana,b
Ho: 𝜇𝐴 =𝜇𝐵 , sig = 0.768 No R Ho Subconjunto
Marca N 1 2
B 5 80,40
Subconjunto 2
A 5 85,40 85.40
Ho: 𝜇𝐴 =𝜇𝐶 =𝜇𝐷 , sig = 0.414 No R Ho
C 5 90,00
D 5 92,80
Sig. ,768 ,414
De los subconjuntos tenemos
B A C D
Conclusión: A un nivel de significación del 5%, No se encontró diferencia

significativa entre las marcas B y A, ni entre las marcas A, C y D. Pero si se
encontró que la marca C y la marca D tienen una mayor producción que la marcas
B. Por lo tanto, la empresa debe decidir comprar la marcas C o la máquina D.
Comparaciones múltiples: DMS
Comparaciones múltiples
Variable dependiente: unidades
(I) Diferencia de Intervalo de confianza al 95%
Marca (J) Marca medias (I-J) Error estándar Sig. Límite inferior Límite superior
DMS A B 1,00 3,336 ,768 -6,07 8,07
C -10,60* 3,336 ,006 -17,67 -3,53
D -13,40* 3,336 ,001 -20,47 -6,33
B A -1,00 3,336 ,768 -8,07 6,07
C -11,60* 3,336 ,003 -18,67 -4,53
D -14,40* 3,336 ,001 -21,47 -7,33
C A 10,60* 3,336 ,006 3,53 17,67
*
B 11,60 3,336 ,003 4,53 18,67
D -2,80 3,336 ,414 -9,87 4,27
D A 13,40* 3,336 ,001 6,33 20,47
B 14,40* 3,336 ,001 7,33 21,47
C 2,80 3,336 ,414 -4,27 9,87
Ho: 𝝁𝒊 =𝝁𝒊 vrs H1: 𝝁𝒊 ≠ 𝝁𝒊
Si no se rechaza Ho, con un nivel de significación dado, las diferencias

encontradas en las medias muestrales no son significativas. Por lo tanto, no es
posible afirmar que exista diferencia en las medias poblacionales.
Caso de A y B:
Ho: 𝜇𝐴 = 𝜇𝐵 vrs H1: 𝜇𝐴 ≠ 𝜇𝐵
Dif de medias (muestrales) = 1

Como sig = 0.768 >  = 0.05, N R Ho
A pesar que las medias muestrales se diferencian en 1, estadísticamente no se
encontraron diferencias entre la producción promedio de la máquina A y la
máquina B (𝜇𝐴 =𝜇𝐵 ).
Si rechazamos Ho, con un nivel de significación dado, las diferencias

encontradas en las medias muestrales son significativas. Esto es, las medias
poblacionales son diferentes y si
Diferencia de medias muestrales = (+) , 𝜇𝐴 > 𝜇 𝐵
Diferencia de medias muestrales = (-) , 𝜇𝐴 < 𝜇 𝐵
Caso de A y C:
Ho: 𝜇𝐴 = 𝜇𝐶 vs. H1: 𝜇𝐴 ≠ 𝜇𝐶
Dif de medias (muestrales) = -10.6

Como sig = 0.006 <  = 0.05, R Ho
Las máquinas A y C tienen una producción promedio diferente. Esto es , la
diferencia de las medias muestrales son significativas, y podemos afirmar

MA461 - 2019 - 01 - Diseños Experimentales DCA - 1 PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

MA461 - 2019 - 01 - Diseños Experimentales DCA - 1 PDF

Transféré par

Droits d'auteur :

Formats disponibles

DISEÑOS EXPERIMENTALES

Diseño completamente aleatorio (DCA)

Diseño completamente aleatorio

Análisis estadístico de un DCA

Método 1: Asignar un Método 2: Ubicar a todos los

¿ El método de entrenamiento no influirá

4. Elección del 3. Selección de la

5. Realización del 6. Análisis

El paso 2 y 3 suelen hacerse simultáneamente o en el orden inverso

Un experimento diseñado es una prueba o serie de pruebas en las

Debe existir más de una réplica por tratamiento,

Aleatorización Los tratamientos se asignan aleatoriamente a las

Todas las unidades experimentales deben de

Tratamiento Es el nivel de un factor o a la combinación de los niveles de

Variable Es la variable en la cual se evaluarán los efectos de los

Unidad Es la unidad (sujeto u objeto) sobre el cual se le aplica un

Alguno de los Tres métodos de

Factor en estudio Método de entrenamiento

Tratamientos Método 1, Método 2 y Método 3

Variable respuesta Producción diaria

Unidad experimental Un empleado nuevo

Medir el efecto del factor en estudio (variable

Este diseño consiste en la asignación de los tratamientos

yij     i   ij i  1, 2, . .., k ; j  1, 2, ..., n

Comprobar el o Normalidad de errores

Se debe verificar si los residuos o

H0: Los errores se distribuyen normalmente

Estadístico de prueba: Kolmogorov - Smirnov

HOMOGENEIDAD DE Se debe verificar la homogeneidad de las

H0: σ12 =σ22 = … = σ𝑘 2

Estadístico de prueba: Prueba de igualdad de Levene de varianzas de error

Técnica estadística que permite descomponer la variabilidad total de los

Variabilidad entre Mide el efecto de los

Variabilidad dentro Mide la variabilidad del

No hay diferencia en las El factor en estudio no afecta a

1 y11 y21 ... yk1

Totales yi. y1 . y2 . ... yk .

Al comparar un par de medias:

Si sig ≥  te tomará la decisión de no rechaza Ho, con un nivel de

Si sig <  te tomará la decisión de rechaza Ho, con un nivel de

Identifica - Identifica la técnica - Presenta los - Presenta el valor Sustenta los

Se realiza el cuadro de análisis de varianza ANVA

Fuente de Grados de Suma de Cuadrado

Tratamientos 4 - 1 =3 803.35 803.35/3 = 267.783

Error 20 – 4 = 16 445.2 445.2/16 = 27.825 267.783/27.825 = 9,624

Estadístico de prueba: F = 9.624 0.7

Si Fcal≤ Fcrit, DE: N R Ho 0.2

Conclusión: A un nivel de significación del 5%, El número de unidades promedio

H0: Los errores se distribuyen normalmente

Prueba de igualdad de Levene de

Estadístico de prueba: F = 0,228

Ho: 𝜇𝐶 =𝜇𝐷 , sig = 0.414 N R Ho Sig. ,768 ,414

De los subconjuntos tenemos:

Conclusión: A un nivel de significación del 5%, no hay diferencia significativa entre la

El administrador Ramírez, luego de definir el modelo y validar los

Por eso, debe recomendar a la gerencia de la empresa Estrella S.A

Conclusión: A un nivel de significación del 5%, No se encontró diferencia

Ho: 𝝁𝒊 =𝝁𝒊 vrs H1: 𝝁𝒊 ≠ 𝝁𝒊

Si no se rechaza Ho, con un nivel de significación dado, las diferencias

Dif de medias (muestrales) = 1

Si rechazamos Ho, con un nivel de significación dado, las diferencias

Dif de medias (muestrales) = -10.6

Vous aimerez peut-être aussi