Vous êtes sur la page 1sur 34

DISEÑOS EXPERIMENTALES

Diseño completamente aleatorio (DCA)


Tema 1

Diseño completamente aleatorio


Temario
Diseño completamente aleatorio (DCA)
- Conceptos generales.

Análisis estadístico de un DCA


- Formula un diseño experimental de un factor.
- Verificación de supuestos.
- Comparar los efectos de un factor sobre una variable
respuesta de interés.
- Comparaciones múltiples de medias.
ENTRENAMIENTO PARA EMPLEADOS NUEVOS
El director de entrenamiento de una compañía está tratando de evaluar cual de los tres
métodos de entrenamiento mejora la producción diaria de los empleados nuevos.

Método 1: Asignar un Método 2: Ubicar a todos los


empleado nuevo con un empleados nuevos en un salón de
trabajador experimentado. entrenamiento separado de la
fábrica.
Método 3: Utilizar películas
de entrenamiento y
materiales de aprendizaje
programado.

¿ El método de entrenamiento no influirá


¿El método de entrenamiento influirá en la
en la producción diaria de los
producción diaria de los empleados nuevos?
empleados nuevos?
¿Cómo evaluar los Tres métodos?
¿Qué variable se podría analizar?
¿Cómo seleccionar el mejor de los Tres métodos?
¿Como identificar el mejor método de entrenamiento de los
empleados nuevos?
Selecciona al azar a 15 empleados nuevos.
Se asigna al azar cada empleado nuevo a uno de los tres métodos de
entrenamiento.

Método 1

REGISTRA
PRODUCCIÓN DIARIA
Método 2 DESPUÉS DEL
ENTRENAMIENTO

Método 3
Pautas generales para diseñar un experimento
Planeación
1. Identificación y 2. Elección de los previa
exposición del factores y los niveles del
problema experimento

4. Elección del 3. Selección de la


diseño experimental variable respuesta

5. Realización del 6. Análisis


experimento estadístico de los
datos

7. Conclusiones y
recomendaciones

El paso 2 y 3 suelen hacerse simultáneamente o en el orden inverso


Introducción

Un experimento diseñado es una prueba o serie de pruebas en las


cuales se inducen cambios deliberados en las variables de entrada
de un proceso o sistema, de manera que sea posible observar e
identificar cuál o cuáles de las variables de entrada produce
cambios en la variable respuesta o de salida.
Principios del experimento

Debe existir más de una réplica por tratamiento,


Repetición
y cada tratamiento puede tener un número de
réplicas diferentes entre ellas.

Aleatorización Los tratamientos se asignan aleatoriamente a las


unidades experimentales.

Todas las unidades experimentales deben de


Control
encontrarse en las mismas condiciones.
Conceptos generales
Variable independiente que afecta los resultados del
experimento: controlables o no controlables. En un
Factor experimento se puede evaluar uno o más factores.
• Susceptible a la manipulación.
• Sus valores son controlados.
• Sus efectos son evaluados en los resultados del
experimento (variable dependiente).

Tratamiento Es el nivel de un factor o a la combinación de los niveles de


dos o más factores.

Variable Es la variable en la cual se evaluarán los efectos de los


respuesta tratamientos.

Unidad Es la unidad (sujeto u objeto) sobre el cual se le aplica un


Experimental tratamiento.
Ejemplo de aplicación
El Director de entrenamiento de la compañía tiene interés en investigar el método de
entrenamiento que se utilizará para capacitar a los empleados nuevos.

Alguno de los Tres métodos de


Hipótesis de entrenamiento es diferente respecto
Investigación a la producción diaria de los
empleados nuevos

Factor en estudio Método de entrenamiento

Tratamientos Método 1, Método 2 y Método 3

Variable respuesta Producción diaria

Unidad experimental Un empleado nuevo


DCA

Medir el efecto del factor en estudio (variable


independiente de naturaleza cualitativa o cuantitativa)
Objetivo
sobre la variable respuesta (variable dependiente de
naturaleza cuantitativa).

Este diseño consiste en la asignación de los tratamientos


en forma completamente aleatoria a las unidades
experimentales (individuos, grupos, parcelas, animales,
áreas, etc.). Debido a su aleatorización es conveniente que
Definición
se utilicen unidades experimentales lo más homogéneas
posibles: personas de la misma edad, del mismo peso,
parcelas de igual tamaño, etc., de manera tal que permita
disminuir la magnitud del error experimental.
Modelo Lineal DCA
El modelo describe de manera adecuada a las observaciones y que los errores o
residuales siguen una distribución normal e independiente con media cero y varianza
σ2 desconocida pero constante.

yij     i   ij i  1, 2, . .., k ; j  1, 2, ..., n

El error experimental
Registro en el i-ésimo Efecto de i-ésimo asociado a la
tratamiento con la j- tratamiento observación yij.
ésima repetición
La media eij~ N(0,2)
poblacional
Supuestos
o Errores siguen distribución
normal.
o Errores con varianzas
homogéneas.
Esquema de análisis estadístico de datos

Comprobar el o Normalidad de errores


cumplimiento de los o Homogeneidad de
supuestos varianzas

Verificación del
problema de o Realización del análisis de
investigación varianza (Anva o Anova)

Comparaciones de los
o Prueba de Duncan o DMS
tratamientos en pares
Supuestos del modelo DCA
NORMALIDAD DE LOS
RESIDUOS

Se debe verificar si los residuos o


errores siguen una distribución normal

H0: Los errores se distribuyen normalmente


H1: Los errores no se distribuyen normalmente

Estadístico de prueba: Kolmogorov - Smirnov


Si Sig asintótico ≥ alfa No se rechaza H0
Se cumple el supuesto de Normalidad de errores.
Supuestos del modelo DCA

HOMOGENEIDAD DE Se debe verificar la homogeneidad de las


VARIANZAS varianzas

H0: σ12 =σ22 = … = σ𝑘 2


H1: Al menos una varianza diferente

Estadístico de prueba: Prueba de igualdad de Levene de varianzas de error


Si Sig ≥ alfa No se rechaza H0
Se cumple el supuesto de Homocedasticidad u homogeneidad de varianzas.
Análisis de varianza (Anva o anova)

Técnica estadística que permite descomponer la variabilidad total de los


resultados de un experimento en sus distintas fuentes (tratamientos,
bloques, interacciones entre factores, error experimental), con la
finalidad de compararlas e identificar su importancia relativa en la
explicación de la variación total.

Variabilidad entre Mide el efecto de los


grupos tratamientos

Variabilidad dentro Mide la variabilidad del


de los grupos error experimental
Análisis de varianza
1. Planteamiento de hipótesis

No hay diferencia en las El factor en estudio no afecta a


H0: 1 = 2 =… = k
medias poblacionales la variable respuesta
Al menos un i es Hay diferencia en al menos El factor en estudio afecta a la
H1:
diferente una media poblacional variable respuesta
2. Nivel de significación
CM (Tr )
3. Estadístico de prueba Fcalculado 
CME
Para obtener el valor del estadístico de prueba, se debe elaborar la tabla del Anva.
Disposición de los datos en un DCA

Tratamiento
Repeticiones
1 2 ... k

1 y11 y21 ... yk1


2 Y12 y22 ... yk2
3 y13 y23 ... yk3
. . . ... .
. . . ... .
. . . ... .
ni ...

Totales yi. y1 . y2 . ... yk .


Análisis de varianza
4. Criterio de decisión (Región critica)

Distribución F (Fisher)
0.9

0.8

0.7

0.6

0.5

0.4

0.3

0.2

0.1

0.0
0

Punto crítico:
F(, grado de libertad Tratamiento) , grado de libertad Error)

5. Decisión
o Se Rechaza H0 Si Fcal > F(, gl Tratamiento, gl error)
o No se Rechaza H0

6. Conclusión
Comparaciones múltiples: Duncan o DMS
Permite evaluar si existen diferencias significativas entre todas las medias
de cada “par de tratamientos”.

H 0 : 𝝁𝒊 = 𝝁𝒋
H 1 : 𝝁𝒊 ≠ 𝝁𝒋 Para todo i diferente de j

Al comparar un par de medias:

Si sig ≥  te tomará la decisión de no rechaza Ho, con un nivel de


significación dado, las diferencias encontradas en las medias
muestrales no son significativas. Por lo tanto, no es posible afirmar
que exista diferencia en las medias poblacionales.

Si sig <  te tomará la decisión de rechaza Ho, con un nivel de


significación dado, las diferencias encontradas en las medias
muestrales son significativas. Por lo tanto, es posible afirmar que
exista diferencia en las medias poblacionales.
EJERCICIO DE APLICACIÓN
Estrella S.A., es una empresa que elabora y comercializa conservas de pescado
de alta calidad. El administrador desea mejorar la productividad del enlatado.
Por ello encarga al administrador Ramírez aplicar cierta técnica estadística que
ayude a determinar la marca de maquina que se debe adquirir para mejorar la
producción de enlatados por hora. Para tal fin, observa la producción de las
cuatro marcas, los resultados se observa en la tabla adjunta.

Marcas
A B C D
86 83 100 99
81 72 95 88
78 82 90 94
86 87 92 95
76 78 83 98
Situación: El administrador Ramírez debe preparar un informe estadístico para
la Gerencia de la empresa, donde sustente la recomendación por alguna marca
de estas maquinas que mejore la productividad de los enlatados.
Para este caso se usara un nivel de significación del 5%
Solución
Se resolverá este caso aplicando las cinco dimensiones:
Comunicación/
Interpretación Representación Cálculo Análisis
Argumentación

Identifica - Identifica la técnica - Presenta los - Presenta el valor Sustenta los


claramente el estadística a usar cálculos de tabla. resultados
problema que se - Identifica el factor, realizados. - Realiza la decisión y encontrados en
debe responder en niveles, tratamientos, - Presenta el conclusión la muestra y
el contexto del ANVA. estadística brinda una
variable respuesta,
caso. - El estadístico - Realiza los recomendación
unidad experimental
de prueba. supuestos de al problema.
- Plantea la hipótesis. normalidad de
- Presenta el modelo errores y
explicando con sus homogeneidad de
componentes. varianzas.
- Comparaciones
Múltiples.

Interpretación:
Se debe determinar la marca de máquina que mejore la productividad
del enlatado.
Representación:
- Factor: Marcas de Maquina.
- Niveles de tratamiento: k = 4 (A, B, C, D)
- Variable respuesta Y: unidades producidas por hora.
- Unidad experimental: Un enlatado.
Se utilizará la prueba de Análisis de varianza de un factor.
- Hipótesis a resolver:
Ho: El número de unidades promedio por hora producidos por las
cuatro marcas son iguales
H1: El número de unidades promedio por hora producido es diferente
para al menos una marca.

Modelo: yij     i   ij
μ: La media poblacional
𝜏𝑖 = 𝑒𝑓𝑒𝑐𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑖é𝑠𝑖𝑚𝑎 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 , 𝑖 = 1,2,3,4
Ԑij = error aleatorio
Cálculo
𝑌..2 407 + 402 + 460 + 474 2 17432
= =
A B C D 𝑛. . 5+5+5+5 20
86 83 100 99 Hallando la suma de cuadrados:
81 72 95 88 17432
SC T = 862 + 812 + 782 + 862 + ⋯ . + 952 +982 −
20
= 1248.55
78 82 90 94
4072 4022 4602 4742 17432
86 87 92 95 𝐒𝐂 𝐓𝐫 =
5
+
5
+
5
+
5
− 20
= 803.35
Sumas 76 78 83 98
407 402 460 474 SC E = 1248.550 - 803.350 = 445.2

Se realiza el cuadro de análisis de varianza ANVA

Fuente de Grados de Suma de Cuadrado


F cal
variación libertad cuadrados medio

Tratamientos 4 - 1 =3 803.35 803.35/3 = 267.783

Error 20 – 4 = 16 445.2 445.2/16 = 27.825 267.783/27.825 = 9,624

20 – 1 =19 1248.55
Total
H0: El número de unidades promedio por hora producidos por las cuatro marcas
son iguales.
H1: El número de unidades promedio por hora producido es diferente para al
menos una marcas.
Gráfica de distribución
F, df1=3, df2=16
Nivel de significación: α = 0.05
0.8

Estadístico de prueba: F = 9.624 0.7

0.6

Análisis: 0.5

Densidad
Criterio de decisión: 0.4

0.3

Si Fcal≤ Fcrit, DE: N R Ho 0.2

0.1
Si Fcal > Fcrit, DE: R Ho 0.05
0.0
0 3.239
X
Fcrit(0.05,3,16)=3.239
=INV.F.CD(0.05;3;16)
Como Fcal = 9.624 > Fcrit = 3,239, DE: R Ho

Conclusión: A un nivel de significación del 5%, El número de unidades promedio


por hora producido es diferente para al menos una marca.
Verificación de supuestos
Prueba de normalidad de errores
Prueba de Kolmogorov-Smirnov para una muestra
Residuo para
unidades
N 20
Parámetros normalesa,b Media ,0000
Desviación estándar 4,84062
Máximas diferencias Absoluta ,104
extremas Positivo ,071
Negativo -,104
Estadístico de prueba ,104
Sig. asintótica (bilateral) ,200c,d

H0: Los errores se distribuyen normalmente


H1: Los errores no se distribuyen normalmente
Como Sig asintótico (bilateral) = 0.200 >  = 0.05
Decisión: No se rechaza H0
Conclusión: A un nivel de significación del 5%, no se afirma que los errores no se
distribuyen normalmente, es decir, los errores se distribuyen normalmente.
Se cumple el supuesto de Normalidad de errores.
Verificación de supuestos
Prueba de homogeneidad de varianzas:

Prueba de igualdad de Levene de


varianzas de errora
Variable dependiente: unidades
F df1 df2 Sig.
,228 3 16 ,875

H O :  12   22   32   42
H1 : Al menos un  i2 es diferente

Estadístico de prueba: F = 0,228


Como Sig = 0,875 >  = 0.05
Decisión: No se rechaza H0
Conclusión: A un nivel de significación del 5%, no se afirma que al menos una
varianza es diferente, es decir, existe homogeneidad de varianzas.
Se cumple el supuesto de homogeneidad de varianzas.
Comparaciones múltiples: Duncan

unidades
Ejemplo 1 Duncana,b
Subconjunto
Subconjunto 1 Marca N 1 2
Ho: 𝜇𝐴 =𝜇𝐵 , sig = 0.768 N R Ho B 5 80,40
A 5 81,40
C 5 92,00

Subconjunto 2 D 5 94,80

Ho: 𝜇𝐶 =𝜇𝐷 , sig = 0.414 N R Ho Sig. ,768 ,414

De los subconjuntos tenemos:


B A C D

Conclusión: A un nivel de significación del 5%, no hay diferencia significativa entre la


producción de la marca A y la marca B. Tampoco se encontró diferencia significativa
entre la producción de la marca C y la marca D. Las marcas con mayor producción
son C y D; por lo tanto, la empresa debe decidir comprar una de dichas marcas.
Comunicación/Argumentación:

El administrador Ramírez, luego de definir el modelo y validar los


supuestos, se realizo en ANVA, donde se encontró que el número de
unidades promedio por hora producido es diferente para al menos una
marca. Se realizó las comparaciones múltiples y se encontró que las
marcas C o D son las que mejoran la producción por hora del enlatado.

Por eso, debe recomendar a la gerencia de la empresa Estrella S.A


adquirir la marca C o D.
Comparaciones múltiples: Duncan
Como interpretamos cuando hay superposición

unidades
Subconjunto 1 Duncana,b
Ho: 𝜇𝐴 =𝜇𝐵 , sig = 0.768 No R Ho Subconjunto
Marca N 1 2
B 5 80,40
Subconjunto 2
A 5 85,40 85.40
Ho: 𝜇𝐴 =𝜇𝐶 =𝜇𝐷 , sig = 0.414 No R Ho
C 5 90,00
D 5 92,80
Sig. ,768 ,414
De los subconjuntos tenemos
B A C D

Conclusión: A un nivel de significación del 5%, No se encontró diferencia


significativa entre las marcas B y A, ni entre las marcas A, C y D. Pero si se
encontró que la marca C y la marca D tienen una mayor producción que la marcas
B. Por lo tanto, la empresa debe decidir comprar la marcas C o la máquina D.
Comparaciones múltiples: DMS

Comparaciones múltiples
Variable dependiente: unidades
(I) Diferencia de Intervalo de confianza al 95%
Marca (J) Marca medias (I-J) Error estándar Sig. Límite inferior Límite superior
DMS A B 1,00 3,336 ,768 -6,07 8,07
C -10,60* 3,336 ,006 -17,67 -3,53
D -13,40* 3,336 ,001 -20,47 -6,33
B A -1,00 3,336 ,768 -8,07 6,07
C -11,60* 3,336 ,003 -18,67 -4,53
D -14,40* 3,336 ,001 -21,47 -7,33
C A 10,60* 3,336 ,006 3,53 17,67
*
B 11,60 3,336 ,003 4,53 18,67
D -2,80 3,336 ,414 -9,87 4,27
D A 13,40* 3,336 ,001 6,33 20,47
B 14,40* 3,336 ,001 7,33 21,47
C 2,80 3,336 ,414 -4,27 9,87
Comparaciones múltiples: DMS

Ho: 𝝁𝒊 =𝝁𝒊 vrs H1: 𝝁𝒊 ≠ 𝝁𝒊

Si no se rechaza Ho, con un nivel de significación dado, las diferencias


encontradas en las medias muestrales no son significativas. Por lo tanto, no es
posible afirmar que exista diferencia en las medias poblacionales.

Caso de A y B:
Ho: 𝜇𝐴 = 𝜇𝐵 vrs H1: 𝜇𝐴 ≠ 𝜇𝐵

Dif de medias (muestrales) = 1


Como sig = 0.768 >  = 0.05, N R Ho
A pesar que las medias muestrales se diferencian en 1, estadísticamente no se
encontraron diferencias entre la producción promedio de la máquina A y la
máquina B (𝜇𝐴 =𝜇𝐵 ).
Comparaciones múltiples: DMS

Si rechazamos Ho, con un nivel de significación dado, las diferencias


encontradas en las medias muestrales son significativas. Esto es, las medias
poblacionales son diferentes y si
Diferencia de medias muestrales = (+) , 𝜇𝐴 > 𝜇 𝐵
Diferencia de medias muestrales = (-) , 𝜇𝐴 < 𝜇 𝐵

Caso de A y C:
Ho: 𝜇𝐴 = 𝜇𝐶 vs. H1: 𝜇𝐴 ≠ 𝜇𝐶

Dif de medias (muestrales) = -10.6


Como sig = 0.006 <  = 0.05, R Ho
Las máquinas A y C tienen una producción promedio diferente. Esto es , la
diferencia de las medias muestrales son significativas, y podemos afirmar

Vous aimerez peut-être aussi