Vous êtes sur la page 1sur 33

ANLISIS DE VARIANZA

Estadstica II

Anlisis de varianza

En el captulo anterior hemos aplicado


los mtodos de contrastacin o prueba
de hiptesis a una o dos poblaciones,
pero muchas veces necesitamos tomar
decisiones con respecto a ms de dos
poblaciones, entonces qu hacer?

Estadstica II

Anlisis de varianza.

El Anlisis de Varianza se utiliza para


probar o contrastar si tres o ms
poblaciones tienen la misma media,
pero se comparan las varianzas
muestrales,
se
basa
en
una
comparacin de la cantidad de variacin
en cada uno de los tratamientos.

Estadstica II

Anlisis de varianza

El mtodo de anlisis de varianza se aplica


en estudios experimentales, entre los
principales tenemos:
Diseo Completamente Aleatorizado
El Diseo Aleatorizado en Bloques
Diseo Factorial
Diseo Cuadrado Latino
Estadstica II

Conceptos bsicos

1. Unidades Experimentales: Objetos que


reciben el tratamiento.
2. Factor: Es la fuerza o la variable cuyo
impacto en tales unidades experimentales
se desea medir.
3. Tratamientos: Niveles del factor.

Estadstica II

Conceptos bsicos

Ejemplo
Se quiere medir el efecto que tiene tres
programas de capacitacin (A, B, C) en la
produccin de los empleados.
Unidades Experimentales: Los empleados
Factor: Efectos en la produccin
Tratamientos: Programas A, B y C
Estadstica II

Modelos

Modelo de Efectos Fijos: En el cual se

seleccionan tratamientos especficos antes


del estudio (provienen de poblaciones
normales solo difieren en su media).
Modelos de Efectos aleatorios: En el cual
los tratamientos se seleccionan
aleatoriamente de una poblacin de niveles
posibles.
Estadstica II

Supuestos fundamentales

Todas las poblaciones involucradas son


normales
Todas las poblaciones tienen la misma
varianza
Las muestras se seleccionan
independientes

Estadstica II

La distribucin F

La distribucin F se utiliza como la entidad


estadstica de prueba en varios casos. Sirve
para probar si dos muestras proceden de
poblaciones con variancias iguales y tambin
sirve
cuando
se
desea
comprobar
simultneamente varias medias poblacionales.
Esta comparacin simultnea de varias de tales
medias se denomina anlisis de variancia
(ANOVA). En los casos mencionados las
poblaciones deben ser normales, y los datos,
estar al menos en escala de intervalo
Estadstica II

11-3

Caractersticas de la distribucin F

Existe una familia de distribuciones F.


Cada miembro de la familia est determinado
por dos parmeteros: los grados de libertad
(gl) en el numerador y los grados de
libertad en el denominador.
El valor de F no puede ser negativo y es una
distribucin continua.
La distribucin F tiene sesgo positivo.
Sus valores varan de 0 a . Conforme
F , la curva se aproxima al eje X.
Estadstica II

10

Distribucin F

Estadstica II

11

Uso de la funcin para el


clculo

Estadstica II

12

11-4

Prueba para variancias iguales

(comparacin de dos varianzas iguales)

Para prueba de dos colas, el estadstico de


prueba est dado por:
2
1
2
2

S
F
S

2
1

2
2

son las variancias muestrales para las


dos muestras. La hiptesis nula se rechaza si el
clculo del estadstico de prueba es ms grande
que el valor crtico (de tablas) con nivel de
confianza, / 2 y grados de libertad para el
numerador y el denominador.

S yS

Estadstica II

13

11-6

EJEMPLO 1

J.J. Campos, agente de bolsa, report que la


tasa media de retorno en una muestra de 10
acciones de software fue 12.6% con una
desviacin estndar de 3.9%. La tasa media
de retorno en una muestra de 8 acciones de
compaas de servicios fue 10.9% con
desviacin estndar de 3.5%. Para 0.05 de
nivel de significancia, puede J.J Campos
concluir que hay mayor variacin en las
acciones de software?
Estadstica II

14

11-7

EJEMPLO 1 continuacin

H1:s u
Paso 1: H0:s u
Paso 2: H0 se rechaza si F > 3.68,
gl = (9, 7), = 0.05
2
2
Paso 3: F (39
. ) / (35
. ) 12416
.
Paso 4: H0 no se rechaza. No hay evidencia
suficiente para asegurar que hay mayor
variacin en las acciones de software.

Estadstica II

15

Explicacin del ejercicio


RR Ho
RAHo

1.24

F 0.95;9,7

Estadstica II

3.68

16

11-8

Suposiciones de ANOVA

La distribucin F tambin se usa para probar


la igualdad de ms de dos medias con
una tcnica llamada anlisis de variancia
(ANOVA). ANOVA requiere las siguientes
condiciones:
La poblacin que se muestrea tiene una
distribucin normal
Las poblaciones tienen desviaciones
estndar iguales
Las muestras se seleccionan al azar y son
independientes
Estadstica II

17

11-9

Procedimiento de anlisis de variancia

Hiptesis nula: las medias de las poblaciones


son iguales.
Hiptesis alterna: al menos una de las
medias es diferente.
Estadstico de prueba: F = (variancia entre
muestras)/(variancia dentro de muestras).
Regla de decisin: para un nivel de
significancia , la hiptesis nula se rechaza si F
(calculada) es mayor que F (en tablas) con
grados de libertad en el numerador y en el
denominador.
Estadstica II

18

11-10

NOTA:

Si se muestrean k poblaciones, entonces los


gl (numerador) = k - 1
Si hay un total de N puntos en la muestra, entonces los gl
(denominador) = N - k
El estadstico de prueba se calcula con:
F = [(SST) /(k - 1)] /[(SSE) /(N - k)].
SSTotal es la suma de los cuadrados totales
SST es la suma de cuadrados de los tratamientos.
SSE es la suma de cuadrados del error.
Sea TC el total de la columna, nc el nmero de
observaciones en cada columna, y X la suma de todas las
observaciones.
Estadstica II

19

11-11

Frmulas
SS ( total ) X

T X

SST
n
nc
2
c

n
2

SSE SS (total) - SST

Estadstica II

20

11-12

EJEMPLO 2

Los restaurantes Rosenbaum se especializan en


comidas para retirados y familias. Su presidenta Katy
Polsby acaba de desarrollar un nuevo plato de pastel de
carne. Antes de hacerlo parte del men normal decidi
probarlo en varios de sus restaurantes. Quiere saber si
hay diferencia en el nmero medio de comidas
vendidas por da en los restaurantes Sylvania,
Perrysburg y Point Place para una muestra de cinco
das. Con 0.05 de nivel de significancia, puede Katy
concluir que hay una diferencia en el nmero medio de
comidas de carne vendidas por da en los tres
restaurantes?
Estadstica II

21

11-13

EJEMPLO 2 continuacin
EJEMPLO 2

SILVANIA

X^2

PERRYSBURG

X^2

POINT PLACE

X^2

13

169

10

100

18

324

12

144

12

144

16

256

14

196

13

169

17

289

12

144

11

121

17

289

17

289

TOTAL

TC

51

46

85

182

nc

13

X^2

653

534

Estadstica II

1447

2634

22

11-14

EJEMPLO 2 continuacin

De la tabla, Katy determina SST = 76.25, SSE =


9.75, y el estadstico de prueba:
F = [76.25 /2] /[9.75 /10] = 39.1026
Paso 1: H0: 1= 2= 3 H1: no todas las
medias son iguales
Paso 2: H0 se rechaza si F > 4.10
Paso 3: F = 39.10
Paso 4: H0 se rechaza. Existe una diferencia en
el nmero medio de comidas vendidas.
Estadstica II

23

11-15

Inferencias acerca de las medias de


tratamiento

Cuando se rechaza la hiptesis nula de


que las medias son iguales, quiz sea
bueno saber qu medias de tratamiento
difieren.
Uno de los procedimientos ms sencillos
es el uso de los intervalos de confianza.

Estadstica II

24

11-16

Intervalos de confianza para la


diferencia entre dos medias

1 1
X1 X 2 t MSE n n
1
2

donde t se obtiene de la tabla con (N - k)


grados de libertad.
MSE = [SSE /(N - k)]

Estadstica II

25

11-17

EJEMPLO 3

Del EJEMPLO 2 desarrolle un intervalo de


confianza de 95% para la diferencia en el
nmero medio de comidas de pastel de carne
vendidas en Point Place (pob # 1) y Sylvania
(pob # 2). Puede Katy concluir que existe
diferencia entre los dos restaurantes?

1 1
(17 12.75) 2.228 .975
4 5
4.25 148
. (2.77,5.73)
Estadstica II

26

11-18

Dos factores ANOVA

Para ANOVA de dos factores se prueba si existe


una diferencia signifcativa entre el efecto del
tratamiento y si existe una diferencia en la
variable de bloqueo.
Sea Br el total de bloque (r segn las filas)
SSB representa la suma de los cuadrados de los
bloques, donde:

Br2 ( X ) 2
SSB
n
k
Estadstica II

27

Para la PH de los bloques


Fuente de variacion
Tratamientos
Bloques
Error

Suma de cuadrados
SST
SSB
SSE
SSTotal

Grados de libertad
k-1
b-1
(k-1)(b-1)
n-1

Estadstica II

Cuadrado medio
F
SST/(k-1)=MST F=MST/MSE
SSB/(b-1)=MSB F=MSB/MSE
SSE/(k-1)(b-1)=MSE
MST

28

11-19

EJEMPLO 4

Una compaa opera 24 horas al da, cinco das a la


semana. Los trabajadores rotan su turno cada
semana. Ruso Toro, el propietario, se interesa en
saber si hay una diferencia en el nmero de
unidades producidas cuando los empleados trabajan
diferentes turnos. Se seleccion una muestra de
cinco trabajadores y se registr su produccin en
cada turno. Con 0.05 de nivel de significancia, se
puede concluir que existe una diferencia en la
produccin media por turno y por empleado?

Estadstica II

29

11-20

EJEMPLO 4 continuacin
Empleado Producci Producci
n en el da
n en la
tarde
McCartne
31
25
y
Neary
33
26

Producci
n en la
noche
35
33

Schoen

28

24

30

Thompson

30

29

28

Wagner

28

26

27

Estadstica II

30

11-21

EJEMPLO 4 continuacin

Variable de tratamiento
Paso 1: H0: 1= 2= 3
H1: no todas las
medias son iguales.
Paso 2: H0 se rechaza si F > 4.46, gl = (2,
12).
Calcule la varible de suma de cuadrados:
SS(total) = 139.73, SST = 62.53, SSB =
33.73, SSE = 43.47. gl(bloque) = 4,
gl(tratamiento) = 2, gl(error) = 8.
Paso 3: F = [62.53 /2] /[43.47 /8] = 5.75
Estadstica II

31

11-22

EJEMPLO 4 continuacin

Paso 4: H0 se rechaza. Existe una diferencia en el


nmero promedio de unidades producidas para los
distintos periodos o turnos.
Variable de bloqueo:
Paso 1: H0: 1= 2= 3= 4= 5 H1: no todas las
medias son iguales.
Paso 2: H0 se rechaza si F > 3.84, gl = (4,8)
Paso 3: F = [33.73 / 4] / [43.47 / 8] = 1.55
Paso 4: H0 no se rechaza ya que no existe una
diferencia significativa en el nmero promedio de
unidades producidas para los distintos trabajadores.

Estadstica II

32

Anlisis de varianza de dos factores con una sola muestra por grupo
RESUMEN
Cuenta
Suma
Promedio
Varianza
McCartney
3
91
30.33333333 25.33333
Neary
3
92
30.66666667 16.33333
Schoen
3
82
27.33333333 9.333333
Thompson
3
87
29
1
Wagner
3
81
27
1
Produccin en el da
Produccin en la tarde
Produccin en la noche

5
5
5

150
130
153

30
26
30.6

4.5
3.5
11.3

ANLISIS DE VARIANZA
Origen de las
variaciones
Filas
Columnas
Error

Suma de
cuadrados
33.73333333
62.53333333
43.46666667

Total

139.7333333

Grados de
libertad

Promedio de
los cuadrados
F
4
8.433333333 1.552147
2
31.26666667 5.754601
8
5.433333333

Valor
crtico
Probabilidad
para F
0.276151726 3.837853
0.028274953
4.45897

14

Estadstica II

33