Vous êtes sur la page 1sur 22

2014

UNMSM

Mariela
Medina Llactahuaman Mariela
Retiz Gutierrez Omar
Ynoan Cruz Yanina

[ANOVA Y REGRESION LINEAL]


LABORATORIO DE ESTADISTICA INDUSTRIAL

ANOVA EN UNA DIRECCION


1. La ciudad de Maumee est dividida en 4 distritos. El jefe de polica
quiere determinar si hay alguna diferencia en el nmero promedio de
crmenes cometidos en cada distrito. Registr el nuero de crmenes
reportados en cada distrito en una muestra de seis das. Al nivel de
significancia 0.05, Puede el funcionario concluir que hay diferencia
en el nmero promedio de crmenes?

Cantidad de crmenes
Rec Center Key Street Monclova Whitehouse
13 21 12 16
15 13 14 17
14 18 15 18
15 19 13 15
14 18 12 20
15 19 15 18

Solucin:

1. Ho: u1=u2=u3=u4
Ha: Al menos una es diferente

2. =0.05
3. F,
4.
G.L. del numerador: k-1= 4-1=3
G.L. del denominador: n-k= 24-4= 20

Ing. Rosmeri Mayta Pg. 1


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.

Cantidad de crmenes
Rec Center Key Street Monclova Whitehouse
13 21 12 16
15 13 14 17
14 18 15 18
15 19 13 15
14 18 12 20
15 19 15 18
73 87 69 88 317

1067 1539 959 1562 5127

2 ( )2 732 872 692 882 3172


= ( ) = + + + = 87.79
6 6 6 6 24

( )2 3172
= 2 = 5127 = 151.96
24

Ing. Rosmeri Mayta Pg. 2


LABORATORIO DE ESTADISTICA INDUSTRIAL

= = 151.96 87.79 = 64.17

Tabla Anova
Fuente de Suma de G.L. Media de F
variacin cuadrados cuadrados
Tratamientos 87.79 3 29.26 9.12
Error 64.17 20 3.21
Total 151.96 23

. .
Interpretacin:
A un nivel de significancia de 0.05 se concluye que no todos los promedios de
crmenes cometidos en cada distrito de la ciudad de Maumee, existe por lo menos
una diferencia estos promedios.

Uso de Minitab

Se puede apreciar que el valor de F =9.12 valor que es mayor al valor crtico, 3.86.
Por lo tanto, se rechaza la hiptesis nula acepta la hiptesis alternativa.

Ing. Rosmeri Mayta Pg. 3


LABORATORIO DE ESTADISTICA INDUSTRIAL

2. Se puede mostrar que cuando se tiene dos tratamientos, el ANOVA y


la prueba t de student se obtiene las mismas conclusiones. Adems
= . Como ejemplo, supngase que 14 estudiantes seleccionados
aleatoriamente se dividen en dos grupos, uno integrado por 6
escolares y el otro, por 8. A un grupo se le da curso usando una
combinacin de conferencias e instruccin programada y al otro, una
combinacin de conferencias y televisin. Al final del curso a cada
grupo se le aplica un examen de 50 preguntas. La siguiente es una
lista del nmero de respuestas correctas a cada uno de los grupos.

Conferencias
Conferencias
e instruccin
y televisin
programada

19 32
17 28
23 31
22 26
17 23
16 24
27
25

a) Mediante la tcnica de anlisis de varianza, pruebe la Ho las dos


puntuaciones promedio de los exmenes son iguales, =0.05.

Solucin:

1. Ho: u1=u2
Ha: Al menos una es diferente

2. =0.05
3. F,
4.
G.L. del numerador: k-1= 2-1=1
G.L. del denominador: n-k= 14-2= 12

Ing. Rosmeri Mayta Pg. 4


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.
Conferencias
Conferencias
e instruccin
y televisin
programada
19 32

17 28

23 31

22 26

17 23

16 24

27

25

114 216 330


n
6 8 14

2208 5904 8112

Ing. Rosmeri Mayta Pg. 5


LABORATORIO DE ESTADISTICA INDUSTRIAL

2 ( )2 1142 1162 3302


= ( ) = + = 219.43
6 8 14

( )2 3302
= 2 = 8112 = 333.43
14

= = 333.43 219.43 = 114

Tabla Anova
Fuente de Suma de G.L. Media de F
variacin cuadrados cuadrados
Tratamientos 219.43 1 219.43 23.10
Error 114 12 9.5
Total 333.43 13

. .
Interpretacin:
A un nivel de significancia del 0.05 existe una diferencia en el promedio de
preguntas respondidas por los 2 grupos de estudiantes seleccionados
aleatoriamente.

b) Usando la prueba t, calcule t.

Solucin:

1. Ho: u1=u2
Ha: u1u2
2. = 0.05
3. t, n<30
4.

Ing. Rosmeri Mayta Pg. 6


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.
2 (1 1)12 + (2 1)22 (6 1) 2.92 + (8 1) 3.212
= = = 9.51
1 + 2 2 6+82


1
2 19 27
= = = 4.80
2 1 1 9.51 (1 + 1)
(1 + 2) 6 8

t pertenece a R.C.: Por lo tanto rechazamos Ho y aceptamos Ha.

Interpretacin:
Existen diferencias entre los promedios de preguntas respondidas por ambos
grupos de estudiantes seleccionados aleatoriamente.

Ing. Rosmeri Mayta Pg. 7


LABORATORIO DE ESTADISTICA INDUSTRIAL

c) Interprete los resultados

Empleando ambos estadsticos concluimos en rechazar la hiptesis nula


y aceptar la alternativa, concluyendo en que existen diferencias entre el
promedio de preguntas contestadas por ambos grupos seleccionados
aleatoriamente.

Uso de Minitab

Ing. Rosmeri Mayta Pg. 8


LABORATORIO DE ESTADISTICA INDUSTRIAL

ANOVA EN DOS DIRECCIONES

1. La empresa Martin Motors tiene en almacn tres automviles de la


misma marca y al gerente le gustara comparar el consumo de
gasolina de los tres vehculos (designados A, B y C) usando cuatro
tipos diferentes de gasolina. Para cada prueba, se deposit la misma
cantidad de combustible en el tanque vaco de cada automvil y se
manej hasta agotar la gasolina. La siguiente tabla muestra el nmero
de millas recorridas en cada prueba.
Distancia (millas)
Tipo de Auto A Auto B Auto C
gasolina
Regular 22.4 20.8 21.5
Super 17.0 19.4 20.7
Regular
Sin plomo 19.2 20.2 21.2
Premium 20.3 18.6 20.4
sin plomo

Utilizando el nivel de significancia 0.05.


a) Hay diferencia entre los tipos de gasolina?
1. Ho: u1 = u2 = u3 = u4
Ha: Al menos una de las medias es diferente.

2. = 0.05

3. F, comparacin de medias

4. F (0.05, 3, 6) = 4.757

5. Tabla ANOVA

Ing. Rosmeri Mayta Pg. 9


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.1. Datos para la tabla

Distancia (millas)
Tipo de Auto A Auto B Auto C x nc
gasolina
Regular 22.4 20.8 21.5 64.7 3
Super 17.0 19.4 20.7 57.1 3
Regular
Sin plomo 19.2 20.2 21.2 60.6 3
Premium 20.3 18.6 20.4 59.3 3
sin plomo
x 78.9 79 83.8 241.7 = xt
x2 1571.49 1563 1756.34 4890.83 =
x2t
nc 4 4 4 N=
12

5.2. Clculos

( )2
= 2
241.72
= 4890.83
12
= 22.5892

2 2
=

241.72
= 4872.1625
12
= 3.9217

2 2
=

241.72
= 4878.45
12
= 10.2092

Ing. Rosmeri Mayta Pg. 10


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.3. Tabla ANOVA

Tabla ANOVA
Fv G.L. SS CM Fk
Trat 2 3.9217 1.9609 1.391
Bloque 3 10.2092 3.4031 2.4141
Error 6 8.4583 1.4097
Total 11 22.5892

6. Fk = 2.4141. Fk pertenece a R.A. Entonces, acepto Ho y rechazo Ha.

Interpretacin:
No hay diferencia entre los rendimientos medios de los diferentes
tipos de gasolina.

b) Hay diferencia entre los autos?


1. Ho: u1 = u2 = u3 = u4
Ha: Al menos una de las medias es diferente.
2. = 0.05
3. F, comparacin de medias
4. F (0.05, 2, 6) = 5.143
5. Fk = 1.391. Fk pertenece a R.A. Entonces, acepto Ho y rechazo Ha.

Interpretacin:
No hay diferencia entre los rendimientos medios de los diferentes
tipos de auto.

Resultados del Minitab

1. Uso de Estadsticas: ANOVA, Modelo lineal general

Ing. Rosmeri Mayta Pg. 11


LABORATORIO DE ESTADISTICA INDUSTRIAL

2. Grfica normal de residuos

2. Cada una de las tres cadenas de supermercados en la regin de


Denver indican que ofrecen los precios ms bajos. Como parte de un
estudio de investigacin sobre publicidad de supermercados, el diario
Denver Daily News realiz un estudio. Primero seleccion una muestra
aleatoria de 9 artculos comestibles. Despus se revis el precio de
cada uno de estos productos en cada una de las tres cadenas, el
mismo da. Al nivel de significancia 0.05, hay alguna diferencia en los
precios medios de los supermercados y de los artculos?

Artculo Super$ Ralphs Lowblaws


1 $1.12 $1.02 $1.07
2 1.14 1.10 1.21
3 1.72 1.97 2.08
4 2.22 2.09 2.32
5 2.40 2.10 2.30
6 4.04 4.32 4.15
7 5.05 4.95 5.05
8 4.68 4.13 4.67
9 5.52 5.46 5.86

Ing. Rosmeri Mayta Pg. 12


LABORATORIO DE ESTADISTICA INDUSTRIAL

I. Tratamiento (Supermercados)
1. Ho: u1 = u2 = u3
Ha: Al menos una de las medias es diferente
2. = 0.05
3. F, comparacin de medias
4. F (0.05, 2, 16) = 3.634
5. Tabla ANOVA
5.1. Datos para la tabla ANOVA

5.2. Clculos
( )2
= 2
83.742
= 331. 8218
27
= 72.1037

2 2
=

83.742
= 259.8551
27
= 0.137

2 2
=

83.742
= 331.3317
27
= 71.6136

Artculo Super$ Ralphs Lowblaws x nc


1 $1.12 $1.02 $1.07 3.21 3
2 1.14 1.10 1.21 3.45 3
3 1.72 1.97 2.08 5.77 3
4 2.22 2.09 2.32 6.63 3
5 2.40 2.10 2.30 6.8 3
6 4.04 4.32 4.15 12.51 3
7 5.05 4.95 5.05 15.05 3
8 4.68 4.13 4.67 13.48 3
9 5.52 5.46 5.86 16.84 3
x 27.89 27.14 28.71 83.74 = xt
x2 110.3977 104.9428 116.4813 331.8218
=x2t
nc 9 9 9 27

Ing. Rosmeri Mayta Pg. 13


LABORATORIO DE ESTADISTICA INDUSTRIAL

5.3. Tabla ANOVA

Tabla ANOVA
Fv G.L. SS CM Fk
Trat 2 0.137 0.0685 3.0996
Bloque 8 71.6136 8.9517 405.0543
Error 16 0.3531 0.0221
Total 26 72.1037

6. Fk = 3.0996. Fk pertenece a la R.A. Entonces, acepto Ho y rechazo


Ha.

Interpretacin:
No hay diferencia entre los precios medios de los supermercados.

II. Bloqueo
1. Ho: u1 = u2 = u3
Ha: Al menos una de las medias es diferente
2. = 0.05
3. F, comparacin de medias
4. F (0.05, 8, 16) = 2.591
5. Fk = 405.0543. Fk pertenece a la R.C. Entonces, rechazo Ho y
acepto Ha.

Interpretacin:
Al menos uno de los 9 artculos seleccionados tiene un precio
medio diferente al de los dems.

Resultados brindados por Minitab

1. Uso de Estadsticas: ANOVA, Modelo lineal general.

Ing. Rosmeri Mayta Pg. 14


LABORATORIO DE ESTADISTICA INDUSTRIAL

2. Grfica normal de residuos

REGRESIN LINEAL
1. Una tabla ANOVA es:

FUENTE GL SS MS F
Regresin 1 50
Error
Total 24 500

a) Complete dicha tabla

FUENTE GL SS MS F
Regresin 1 50 50 2.5556
Error 23 450 19.5652
Total 24 500

Ing. Rosmeri Mayta Pg. 15


LABORATORIO DE ESTADISTICA INDUSTRIAL

b) De qu tamao era la muestra?

Segn la Tabla ANOVA, el Total es 24, sin embargo, este valor de 24


representa a N 1. Por lo tanto, el tamao de la muestra es 25.

c) Determine el error estndar de estimacin



=
2

450
=
23
= 4.4233

d) Obtenga el coeficiente de determinacin



2 =

50
2 =
500
2 = 0.1

Ing. Rosmeri Mayta Pg. 16


LABORATORIO DE ESTADISTICA INDUSTRIAL

2. La empresa Bardi rucking Co., localiada en Cleveland Ohio, hace


entregas en la regin de los Grandes Lagos, el Sureste y el Noreste.
Jim Bardi, el presidente, estudia la relacin entre la distancia que debe
viajar un embarque y el tiempo-en das- que necesita para llegar a su
destino. Para investigar, el seor Bardi seleccion una muestra
aleatoria de 20 envos realizados el ltimo mes. El recorrido del
embarque es la variable independiente, y el tiempo necesario para la
entrega (tiempo de embarque), la variable dependiente. A continuacin
se presentan los resultados.

Distancia Tiempo
Embarque de de
embarques embarque
1 656 5
2 853 14
3 646 6
4 783 11
5 610 8
6 841 10
7 785 9
8 639 9
9 762 10
10 762 9
11 862 7
12 679 5
13 835 13
14 607 3
15 665 8
16 647 7
17 685 10
18 720 8
19 652 6
20 828 10

Ing. Rosmeri Mayta Pg. 17


LABORATORIO DE ESTADISTICA INDUSTRIAL

a) Trace un diagrama de dispersin. En base a estos datos, Parecera


que existe una relacin entre las millas que tiene que recorrer un envo y
el tiempo que tarda en llegar a su destino?

Se puede apreciar una relacin positiva dbil, puesto que varios puntos
estn alejados de la lnea de regresin.

Ing. Rosmeri Mayta Pg. 18


LABORATORIO DE ESTADISTICA INDUSTRIAL

b) Determine el coeficiente de correlacin, Se puede concluir que existe


una correlacin positiva entre la distancia y el tiempo? Use el nivel de
significancia de 0.05.

Distancia

Tiempo de
Embarque de

embarque = .

embarques = .
1 656 5 -69.85 -3.4 237.49
2 853 14 127.15 5.6 712.04
3 646 6 -79.85 -2.4 191.64
4 783 11 57.15 2.6 148.59
5 610 8 -115.85 -0.4 46.34
6 841 10 115.15 1.6 184.24
7 785 9 59.15 0.6 35.49
8 639 9 -86.85 0.6 -52.11
9 762 10 36.15 1.6 57.84
10 762 9 36.15 0.6 21.69
11 862 7 136.15 -1.4 -190.61
12 679 5 -46.85 -3.4 159.29
13 835 13 109.15 4.6 502.09
14 607 3 -118.85 -5.4 641.79
15 665 8 -60.85 -0.4 24.34
16 647 7 -78.85 -1.4 110.39
17 685 10 -40.85 1.6 -65.36
18 720 8 -5.85 -0.4 2.34
19 652 6 -73.85 -2.4 177.24
20 828 10 102.15 1.6 163.44
Media 725.85 8.4
Desv.Estand 87.5 2.703
Total 3108.2

( )( ) 3108.2
= = = 0.69
( 1) (20 1) 725.85 8.4

Si, ya que el coeficiente de correlacin es positivo, determinando una


relacin positiva entre variables de distancia y el tiempo. Este valor
indica una relacin directa entre las variables analizadas.

Ing. Rosmeri Mayta Pg. 19


LABORATORIO DE ESTADISTICA INDUSTRIAL

c) Calcule e interprete el coeficiente de determinacin.

2 = 0.692 = 47.9 %

Se deduce que el 47.9% de la variacin en los tiempos de entrega se


explica por la variacin en la distancia de recorrido de los embarques.

d) Evalu el error estndar de estimacin.

Embarque Distancia Tiempo de


de embarque
embarques
1 656 5 -69.85 -3.4 11.56
2 853 14 127.15 5.6 31.36
3 646 6 -79.85 -2.4 5.76
4 783 11 57.15 2.6 6.76
5 610 8 -115.85 -0.4 0.16
6 841 10 115.15 1.6 2.56
7 785 9 59.15 0.6 0.36
8 639 9 -86.85 0.6 0.36
9 762 10 36.15 1.6 2.56
10 762 9 36.15 0.6 0.36
11 862 7 136.15 -1.4 1.96
12 679 5 -46.85 -3.4 11.56
13 835 13 109.15 4.6 21.16
14 607 3 -118.85 -5.4 29.16
15 665 8 -60.85 -0.4 0.16
16 647 7 -78.85 -1.4 1.96
17 685 10 -40.85 1.6 2.56
18 720 8 -5.85 -0.4 0.16
19 652 6 -73.85 -2.4 5.76
20 828 10 102.15 1.6 2.56
138.8

( )2 138.8
= = = 2.77
2 20 2

Ing. Rosmeri Mayta Pg. 20


LABORATORIO DE ESTADISTICA INDUSTRIAL

Uso de Minitab

Ing. Rosmeri Mayta Pg. 21

Vous aimerez peut-être aussi