Vous êtes sur la page 1sur 31

UNIVERSIDAD TECNICA

“PARTICULAR DE LOJA”
TRABAJO#3
INTEGRANTES: Braulio Songor Flores
MATERIA: Estadística II
DOCENTE: Eco. Ronny Correa
FECHA: 14/01/2016
23. Un agente de bienes raíces del área costera de Georgia desea comparar la variación entre el
precio de venta de casas con vista al mar y el de las ubicadas a tres cuadras del mar. Una muestra
de 21 casas con vista al mar que se vendieron el año pasado reveló que la desviación estándar
de los precios de venta fue de $45 600. Una muestra de 18 casas, también vendidas el año
pasado, ubicadas de una a tres cuadras del mar, reveló que la desviación estándar fue de $21
330. A un nivel de significancia de 0.01, ¿puede concluir que hay más variación entre los precios
de venta de las casas con vista al mar?

𝐻0 = 𝜎12 ≤ 𝜎22

𝐻1 = 𝜎12 > 𝜎22


𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 = 0.01
𝑔𝑙1 = 21 − 1 = 20
𝑔𝑙2 = 18 − 1 = 17
La regla de decisión es: rechazar la hipótesis si la razón de las varianzas maestrales es mayor a
3.16.

𝜎12
𝐹=
𝜎22

(45 600)2
𝐹= = 4.57
(21 330)2
Se rechaza la hipótesis nula, existe más variación en los precios de venta de las casas con frente
al mar.

25. En Jamestown, Nueva York, hay dos concesionarios Chevrolet. Las ventas mensuales medias
en Sharkey Chevy y Dave White Chevrolet son más o menos iguales. Sin embargo, Tom Sharkey,
propietario de Sharkey Chevrolet, considera que sus ventas son más consistentes. A
continuación se presenta el número de automóviles nuevos que vendió Sharkey en los últimos
siete meses, y en los últimos ocho meses Dave Chevrolet. ¿Concuerda con Sharkey? Utilice el
nivel de significancia de 0.01.

Sharkey 98 78 54 57 68 64 70

Dave White 75 81 81 30 82 46 58 101


Sharkey:

𝑛=7 𝑠𝑠 = 14.79
Dave White:

𝑛=8 𝑠𝐷 = 22.95

𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎 = 0.01

𝐻0 = 𝜎𝐷2 ≤ 𝜎𝑠2

𝐻1 = 𝜎𝐷2 > 𝜎𝑠2


𝑔𝑙𝐷 = 8 − 1 = 7
𝑔𝑙𝑠 = 7 − 1 = 6

La regla de decisión es: rechazar la hipótesis si la razón de las varianzas maestrales es mayor a
8.26.

𝜎𝐷2
𝐹=
𝜎𝑠2
(22.95)2
𝐹= = 2.41
(14.79)2
No se rechaza la hipótesis nula. No existe diferencia entre las variaciones de las ventas
mensuales.

27. En una tabla ANOVA MSE fue igual a 10. Se seleccionaron muestras aleatorias de seis
personas a partir de cuatro poblaciones y la suma del total de cuadrados fue 250.

a) Formule las hipótesis nula y alternativa.

𝐻0 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻1 = 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

b) ¿Cuál es la regla de decisión? Utilice el nivel de significancia de 0.05.

𝛼 = 0,05
Grados de libertad del numerador: k – 1 = 4 – 1 = 3

Grados de libertad del denominador: n – k = 24 – 4 = 20

La regla de decisión es: rechazar la hipótesis si F > 3.10

c) Elabore la tabla ANOVA. ¿Cuál es el valor de F?


𝑆𝑆𝐸
= 𝑀𝑆𝐸
𝑛−𝑘
𝑆𝑆𝑇 = (10)(20) = 200

𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 = 𝑆𝑆𝑇 + 𝑆𝑆𝐸


250 = 200 + 𝑆𝑆𝐸
𝑆𝑆𝐸 = 50

Fuente de variación Suma de Cuadrados gl MS F

Tratamiento 50 4-1=3 50/3 = 16.67 MST/MSE=1.67

Error 200 24-4=20 10

Total 250 24-1=23

d) ¿Cuál es su decisión respecto de la hipótesis nula?

El valor calculado de F es 1.67, menor que el valor crítico de 3.10, por lo que la hipótesis nula no
se rechaza, porque todas las medias poblacionales son iguales.

29. Una organización de consumidores desea saber si hay una diferencia entre los precios de un
juguete en particular en tres tipos de tiendas. El precio del juguete se investigó en una muestra
de cinco tiendas de descuento, cinco de artículos diversos y cinco departamentales. Los
resultados se muestran a continuación. Utilice el nivel de significancia de 0.05

Descuento Variedad Departamento

12 15 19

13 17 17

14 14 16

12 18 20

15 17 19

𝐻0 = 𝜇1 = 𝜇2 = 𝜇3
𝐻1 = 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
𝛼 = 0,05
Grados de libertad del numerador: k – 1 = 3 – 1 = 2

Grados de libertad del denominador: n – k = 15 – 3 = 12

La regla de decisión es: rechazar la hipótesis si F > 3.89

Para determinar lis valores de SS total y SSE se comienza por calcular la Media Global o total
̅̅̅̅
(𝑋 𝐺 ).

238
̅̅̅̅
𝑋𝐺 = = 15.87
15
Descuento Variedad Departamento Total

12 15 19

13 17 17

14 14 16

12 18 20

15 17 19

total de la columna 66 81 91 238

N 5 5 5 15

Media 13,2 16,2 18,2 15,87

Se encuentra la desviación de cada observación a la media total

(𝑋𝐺 − ̅̅̅̅
𝑋𝐺 ).

Descuento Variedad Departamento

-3,87 -0,87 3,13

-2,87 1,13 1,13

-1,87 -1,87 0,13

-3,87 2,13 4,13

-0,87 1,13 3,13


Después se eleva al cuadrado cada una de estas diferencias y se suman todos los valores
(𝑋 − ̅̅̅̅
𝑋𝐺 )2.

Descuento Variedad Departamento

14,95 0,75 9,82

8,22 1,28 1,28

3,48 3,48 0,02

14,95 4,55 17,08

0,75 1,28 9,82

Total 42,36 11,36 38,02 91,73

Para calcular SSE se encuentra la desviación entre cada observación y su media de tratamiento.
Por ejemplo: (𝑋 − ̅̅̅̅̅̅̅̅̅̅̅̅̅
𝑋𝐷𝑒𝑠𝑐𝑢𝑒𝑛𝑡𝑜 ).

Descuento Variedad Departamento

-1,2 -1,2 0,8

-0,2 0,8 -1,2

0,8 -2,2 -2,2

-1,2 1,8 1,8

1,8 0,8 0,8

Cada uno de estos valores se eleva al cuadrado y después se suman las 15 observaciones. Los
valores se muestran en la siguiente tabla.

Descuento Variedad Departamento

1,44 1,44 0,64

0,04 0,64 1,44

0,64 4,84 4,84

1,44 3,24 3,24

3,24 0,64 0,64

Total 6,80 10,80 10,80 28,40

Por lo tanto, el valor SSE es 28,40

𝑆𝑆𝐸 = ∑(𝑋 − ̅𝑋̅̅𝐶̅)2 = 28,40


Por último, se determina SST, la suma de los cuadrados debida a los tratamientos, con la resta:

𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 = 𝑆𝑆𝑇 − 𝑆𝑆𝐸


𝑆𝑆𝑇 = 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆𝐸
𝑆𝑆𝑇 = 91.73 − 28.40 = 63.33

Fuente de variación Suma de Cuadrados gl Media Cuadrática F

Tratamiento 63,33 2 31,67 13,38

Error 28,4 12 2,37

Total 91,73 14

Se rechaza la hipótesis nula porque F calculada es mayor que 3.89.

31. La ciudad de Maumee comprende cuatro distritos. Andy North, jefe de la policía, desea
determinar si hay una diferencia entre los números medios de delitos cometidos en los cuatro
distritos. Para esto registra el número de delitos reportados en cada distrito durante seis días.
Con un nivel de significancia de 0.05, ¿el jefe de la policía puede concluir que hay una diferencia
entre los números medios de delitos?

Número de delitos

Rec Center Key Street Monclova Whitehouse

13 21 12 16

15 13 14 17

14 18 15 18

15 19 13 15

14 18 12 20

15 19 15 18

𝐻0 = 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻1 = 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠

𝛼 = 0,05
Grados de libertad del numerador: k – 1 = 4 – 1 = 3

Grados de libertad del denominador: n – k = 24 – 4 = 20

La regla de decisión es: rechazar la hipótesis si F > 3.10


Para determinar lis valores de SS total y SSE se comienza por calcular la Media Global o total
̅̅̅̅
(𝑋 𝐺 ).

379
̅̅̅̅
𝑋𝐺 = = 15.792
24

Número de delitos

Rec Center Key Street Monclova Whitehouse total

13 21 12 16

15 13 14 17

14 18 15 18

15 19 13 15

14 18 12 20

15 19 15 18

total de la
86 108 81 104 379
columna

N 6 6 6 6 24

Media 14,33 18 13,5 17,33 15,792

Se encuentra la desviación de cada observación a la media total

(𝑋𝐺 − ̅̅̅̅
𝑋𝐺 ).

Rec Center Key Street Monclova Whitehouse

-2,79 5,21 -3,79 0,21

-0,79 -2,79 -1,79 1,21

-1,79 2,21 -0,79 2,21

-0,79 3,21 -2,79 -0,79

-1,79 2,21 -3,79 4,21

-0,79 3,21 -0,79 2,21


Después se eleva al cuadrado cada una de estas diferencias y se suman todos los valores
(𝑋 − ̅̅̅̅
𝑋𝐺 )2.

Rec Center Key Street Monclova Whitehouse

7,79 27,13 14,38 0,04

0,63 7,79 3,21 1,46

3,21 4,88 0,63 4,88

0,63 10,29 7,79 0,63

3,21 4,88 14,38 17,71

0,63 10,29 0,63 4,88

TOTAL 16,09 65,26 41,01 29,59 151,96

Rec Center Key Street Monclova Whitehouse

-1,33 3 -1,5 -1,33

0,67 -5 0,5 -0,33

-0,33 0 1,5 0,67

0,67 1 -0,5 -2,33

-0,33 0 -1,5 2,67

0,67 1 1,5 0,67

Cada uno de estos valores se eleva al cuadrado y después se suman las 15 observaciones. Los
valores se muestran en la siguiente tabla.

Rec Center Key Street Monclova Whitehouse

1,78 9,00 2,25 1,78

0,44 25,00 0,25 0,11

0,11 0,00 2,25 0,44

0,44 1,00 0,25 5,44

0,11 0,00 2,25 7,11

0,44 1,00 2,25 0,44

TOTAL 3,33 36,00 9,50 15,33 64,17


𝑆𝑆𝐸 = ∑(𝑋 − ̅𝑋̅̅𝐶̅)2 = 64,17

𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 = 𝑆𝑆𝑇 − 𝑆𝑆𝐸


𝑆𝑆𝑇 = 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 − 𝑆𝑆𝐸
𝑆𝑆𝑇 = 151.96 − 64.17 = 87,79

Fuente de variación Suma de Cuadrados gl Media Cuadrática F

Tratamiento 87,79 3 29,26 9,12

Error 64,17 20 3,21

Total 151,96 23

La F calculada de 9.12 es mayor a 3.10, se rechaza la hipótesis nula, es decir, no hay diferencia
con el nivel de significancia de 0.05.

33. Cuando únicamente se implican dos tratamientos, ANOVA y la prueba t de Student (capítulo
11) dan como resultado las mismas conclusiones. De igual forma, t2 = F. Como ejemplo, suponga
que se dividió al azar a 14 estudiantes en dos grupos, uno de 6 estudiantes y el otro de 8. A un
grupo se le educó con una combinación de lectura y enseñanza programada, y al otro, con una
combinación de lectura y televisión. Al final del curso, a cada grupo se le aplicó un examen de
50 preguntas. La siguiente lista contiene el número correcto de respuestas de cada uno de los
dos grupos.

Lectura y Lectura programada y


enseñanza televisión

19 32

17 28

23 31

22 26

17 23

16 24

27

25
Con las técnicas del análisis de la varianza, demuestre H0 que las dos calificaciones medias son
iguales; α=0.05.

𝐻0 = 𝜇1 = 𝜇2
𝐻1 = 𝜇1 ≠ 𝜇2

Grados de libertad del numerador: k – 1 = 2 – 1 = 1

Grados de libertad del denominador: n – k = 14 – 2 = 12

La regla de decisión es: rechazar la hipótesis si F > 4.75

Con la prueba t descrita en el capítulo 11 calcule t.

Lectura y enseñanza (X1-X1) (X1-X1)2

19 0 0

17 -2 4

23 4 16

22 3 9

17 -2 4

16 -3 9

TOTAL 114

n 6 TOTAL 42

Media X1 19
∑(𝑋1 − ̅̅̅
𝑋1 )2 42
𝑠1 = √ = √ = 2,898
𝑛1 − 1 5

Lectura programada y
(X2-X2) (X2-X2)2
televisión

32 5 25

28 1 1

31 4 16

26 -1 1

23 -4 16

24 -3 9

27 0 0

25 -2 4

TOTAL 216

n2 8 TOTAL 72

Media X2 27

∑(𝑋2 − ̅̅̅
𝑋2 )2 72
𝑠2 = √ = √ = 3.21
𝑛2 − 1 7

AGRUPAR LA VARIANZAS DE LAS MUESTRAS:

(𝑛1 − 1)𝑠12 + (𝑛2 − 1)𝑠22


𝑠𝑝2 =
𝑛1 + 𝑛2 − 2
(6 − 1)(2.90)2 + (8 − 1)(3,21)2
𝑠𝑝2 =
6+8−2
𝑠𝑝2 = 9,5
̅̅̅
𝑋1 − ̅̅̅
𝑋2
𝑡=
1 1
√𝑠𝑝2 ( + )
𝑛1 𝑛2
19 − 27
𝑡= = −4.806
√9,5 (1 + 1)
6 8
Entonces t2=F

𝐹 = (−4.806)2 = 23.10

Interprete los resultados.

Se rechaza la hipótesis nula, porque hay una diferencia entre las calificaciones medias.

35. Se ingresan los rendimientos de combustible de una muestra de 27 automóviles compactos,


medianos y grandes en un paquete de software estadístico. Con el análisis de varianza se
investiga si hay una diferencia entre los kilometrajes medios de los tres tipos de automóviles.
¿Cuál es su conclusión? Utilice el nivel de significancia de 0.01.

Resumen

Grupos Conteo Suma Promedio Varianza

Compactos 12 268,3 22,35833 9,388106

Medianos 9 172,4 19,1556 7,315278

Grandes 6 100,5 16,75 7,303

ANOVA

Fuente de Variación SS gl MS F Valor p

Entre grupos 136,4803 2 68,2401 8,258752 0,001866

Dentro de grupos 198,3064 24 8,26277

Total 334,7867 26

Grados de libertad del numerador: k – 1 = 3 – 1 = 2

Grados de libertad del denominador: n – k = 27 – 3 = 24

La regla de decisión es: rechazar la hipótesis si F > 5,61

Se rechaza la hipótesis nula porque F (8,25) es mayor que 5,61, a un nivel de significancia de
0,01, asimismo el valor p es menor que el nivel de significancia. Los rendimientos de los tres
automóviles no son iguales
37) En sansas inc. Empresa publicitaria, desea saberse el tamaño y el color de un anuncio
publicitario generan respuestas diferentes de los lectores de revistas. A un grupo de
lectores se le muestran anuncios con cuatro colores distintos y de tres tamaños
diferentes .A cada lector se le pide dar a cada combinación de tamaña y color una
calificación entre 1 y 10. Suponga que las calificaciones siguen una distribución normal.
La calificación de cada combinación se muestra en la siguiente tabla.
color del anuncio
Tamaño del anuncio Rojo Azul Naranja Verde Total
Pequeño 2 3 3 8
Mediano 3 5 6 7
Grande 6 7 8 8
t. columan 11 15 17 23 66
n 3 3 3 3 12
media 3,67 5,00 5,67 7,67 5,5

¿Hay una diferencia de un anuncio con base en su color y tamaño? Utilice el nivel de
significancia de 0.05.

ANOVA
Fuente de variacion suma de cuadrados grados de libertad Media cuadratica F
Tratamiento SST K-1 SST/(K-1)=MST MST/MSE
Bloque SSB B-1 SSb/(b-1)=MSB MSB/MSE
Error SSE (K-1)(B-1) SSE/(N-K)=MSE
Total SS total

Hipótesis
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4

𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4

Primero se formula las hipótesis nulas y la alternativa.


Realizamos los cálculos para obtener el SS total aplicando la formula 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 =
Σ((𝑋 − 𝑋𝐺 )2
X es cada observación de la muestra
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
Se procede a elevar al cuadrado cada una de las diferencias y se suman todos los
valores y obtenemos SS total
2
SS total Σ( − ) TOTAL
Rojo Azul Naranja Verde
12,25 6,25 6,25 6,25
6,25 0,25 0,25 2,25
0,25 2,25 6,25 6,25
TOTAL(SS TOTAL) 18,75 8,75 12,75 14,75 55

2) se procede a encontrar SSB que es la suma de los cuadrados de cada bloque se


determina mediante la formula 𝑆𝑆𝐵 = Σ(𝑋𝑏 − 𝑋𝐺 )2
DONDE:
K es el número de tratamientos
B es el número de bloqueos
𝑋𝑏 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑘 𝑑𝑒𝑘 𝑏𝑙𝑜𝑞𝑢𝑒𝑜 𝑏
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
2
SSB 𝑘Σ( 𝑏 − ) TOTAL
Rojo Azul Naranja Verde suma Media
2 3 3 8 16 4 9
3 5 6 7 21 5,25 0,25
6 7 8 8 29 7,25 12,25
TOTAL(SSB) 21,5

3) se procede a calcular la variable con la cual encontraremos SSt con la desviación


entre cada observación y su media de tratamiento
2
Σ( − 𝑐)
Rojo Azul Naranja Verde total
2,78 4,00 7,11 0,11
0,44 0,00 0,11 0,44
5,44 4,00 5,44 0,11
TOTAL 8,67 8,00 12,67 0,67 30,00

SSE= SS TOTAL-SST-SSB

Remplazamos en la tabla ANOVA los valores y pasamos a responder la interrogante


ANOVA
Fuente de variacion suma de cuadrados grados de libertad Media cuadratica F
Tratamiento 25,00 3 8,33 5,88
Bloque 21,5 2 10,75 7,59
Error 8,50 6 1,42
Total 55 11
numerado (k-1) 3 cuando el nivel de significancia de 0.05 el valor
grados de libertad medias de tratamiento
denominador (b-1)(k-1) 6 critico de F es : 4.76

numerado (b-1) 2 cuando el nivel de significancia de 0.05 el valor


grados de libertad medias de bloques
denominador (b-1)(k-1) 6 critico de F es : 5.14

RT: Se rechaza las hipotesis nula ya que los valores de la F calculada


son mayores a los valores criticos

41) En la ciudad de Tucson, se emplean personas para valuar la casa con el fin de
establecer el impuesto predial. El administrador municipal envía a cada valuador a las
mismas cinco casas y después compara los resultado. La información se presenta a
continuación, en miles de dólares ¿puede concluir que hay una diferencia entre los
avalúos con α=0.05?

valuador
casa Zawodny Norman Cingle Holiday TOTAL
A 53 55 49 45
B 50 51 52 53
C 48 52 47 53
D 70 68 65 64
E 84 89 92 86
T. columna 305 315 305 301 1226
n 5 5 5 5 20
media 61 63 61 60,2 61,3

ANOVA
Fuente de variacion
suma de cuadrados
grados de libertad Media cuadratica F
Tratamiento SST K-1 SST/(K-1)
Bloque SSB B-1 SSb/(b-1)
Error SSE (K-1)(B-1) SSE/(N-K)
Total sst

Primero se formula las hipótesis nulas y la alternativa.

Hipótesis
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4

𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4
Realizamos los cálculos para obtener el SS total aplicando la formula 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 =
Σ((𝑋 − 𝑋𝐺 )2
X es cada observación de la muestra
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
Se procede a elevar al cuadrado cada una de las diferencias y se suman todos los
valores y obtenemos SS total

2
SS total Σ( − ) TOTAL
Zawodny Norman Cingle Holiday
68,89 39,69 151,29 265,69
127,69 106,09 86,49 68,89
176,89 86,49 204,49 68,89
75,69 44,89 13,69 7,29
515,29 767,29 942,49 610,09
TOTAL(SS TOTAL) 964,45 1044,45 1398,45 1020,85 4428,2

2) se procede a encontrar SSB que es la suma de los cuadrados de cada bloque se


determina mediante la formula 𝑆𝑆𝐵 = Σ(𝑋𝑏 − 𝑋𝐺 )2
DONDE:
K es el número de tratamientos
B es el número de bloqueos
𝑋𝑏 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑘 𝑑𝑒𝑘 𝑏𝑙𝑜𝑞𝑢𝑒𝑜 𝑏
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙

2
SSB
SSB 𝑘Σ( 𝑏− ) TOTAL
Zawodny Norman Cingle Holiday suma Media
53 55 49 45 202 50,5 466,56
50 51 52 53 206 51,5 384,16
48 52 47 53 200 50 510,76
70 68 65 64 267 66,75 118,81
84 89 92 86 351 87,75 2798,41
TOTAL(SSB) 4278,7
3) se procede a calcular la variable con la cual encontraremos SS T con la desviación
entre cada observación y su media de tratamiento

2
Σ( − 𝑐)
Zawodny Norman Cingle Holiday total
64,00 64,00 144,00 231,04
121,00 144,00 81,00 51,84
169,00 121,00 196,00 51,84
81,00 25,00 16,00 14,44
529,00 676,00 961,00 665,64
TOTAL 964,00 1030,00 1398,00 1014,80 4406,80

SSE= SS TOTAL-SST-SSB

Remplazamos en la tabla ANOVA los valores y pasamos a responder la interrogante


ANOVA
Fuente de variacion
suma de cuadrados grados de libertad Media cuadratica F
Tratamiento 21,40 3 7,13 0,67
Bloque 4278,7 4 1069,68 100,20
Error 128,10 12 10,675
Total 4428,2

numerado (b-1)
cuando el nivel de significancia
4 de 0.05 el valor critico de F es : 3.26
grados de libertad medias de bloques
denominador (b-1)(k-1) 12

RT: a) el valor critico de f es 3.49 . La F calculada es 0.668. con lo cual no se rechaza la hipotesis nula
RT: B) el valor critico de f es 3.26. La F calculada 100.203. con lo cual se rechaza la hipotesis nula de la media de los boques

43) Una empresa de investigación desea comparar el rendimiento, en millas por galón
de gasolina regular, de grado medio y Premium. Con base en el desempeño de los
diversos automóviles se selecciona y tratan como bloque siete automóviles. Por lo
tanto cada tipo de gasolina se probó en cada tipo de automóvil, los resultados de las
pruebas, en millas por galón, se muestran en la siguiente tabla. Con un nivel de
significancia de 0.05 ¿hay alguna diferencia entre las gasolinas o entre automóviles?
automovil regular de grado medio premium TOTAL
1 21 23 26
2 23 22 25
3 24 25 27
4 24 24 26
5 26 26 30
6 26 24 27
7 28 27 32
T. columna 172 171 193 536
n 7 7 7 21
media 24,57 24,43 27,57 25,52

ANOVA
Fuente de variacion
suma de cuadrados grados de libertad Media cuadratica F
Tratamiento SST K-1 SST/(K-1)
Bloque SSB B-1 SSb/(b-1)
Error SSE (K-1)(B-1) SSE/(N-K)
Total sst

Primero se formula las hipótesis nulas y la alternativa

Hipótesis
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3

𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3

Realizamos los cálculos para obtener el SS total aplicando la formula 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 =


Σ((𝑋 − 𝑋𝐺 )2
X es cada observación de la muestra
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
Se procede a elevar al cuadrado cada una de las diferencias y se suman todos los
valores y obtenemos SS total.
2
Σ( −
SS total )
regular de grado medio premium TOTAL
20,46 6,37 0,23
6,37 12,42 0,27
2,32 0,27 2,18
2,32 2,32 0,23
0,23 0,23 20,04
0,23 2,32 2,18
6,13 2,18 41,94
TOTAL(SS TOTAL) 38,06 26,11 67,06 131,24
2) se procede a encontrar SSB que es la suma de los cuadrados de cada bloque se
determina mediante la formula 𝑆𝑆𝐵 = Σ(𝑋𝑏 − 𝑋𝐺 )2
DONDE:
K es el número de tratamientos
B es el número de bloqueos
𝑋𝑏 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑘 𝑑𝑒𝑘 𝑏𝑙𝑜𝑞𝑢𝑒𝑜 𝑏
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
2
SSB 𝑘Σ( 𝑏 −SSB )
regular de grado medio premium suma Media TOTAL
21 23 26 70 23,33 14,39
23 22 25 70 23,33 14,39
24 25 27 76 25,33 0,11
24 24 26 74 24,67 2,20
26 26 30 82 27,33 9,82
26 24 27 77 25,67 0,06
28 27 32 87 29,00 36,25
TOTAL(SSB) 77,24

3) se procede a calcular la variable con la cual encontraremos SSt con la desviación


entre cada observación y su media de tratamiento
2
Σ( − 𝑐)
regular de grado medio premium suma
12,76 2,04 2,47
2,47 5,90 6,61
0,33 0,33 0,33
0,33 0,18 2,47
2,04 2,47 5,90
2,04 0,18 0,33
11,76 6,61 19,61
TOTAL 31,71 17,71 37,71 87,14

Remplazamos en la tabla ANOVA los valores y pasamos a responder la interrogante


ANOVA
Fuente de variacion
suma de cuadrados grados de libertad Media cuadratica F
gasolina 44,10 2 22,05 26,71
automoviles 77,24 6 12,87 15,60
Error 9,90 12 0,83
Total 131,24 20
grados de libertad medias de numerado (k-1) 2 con un nivel de significancia de 0.05 el valor
tratamiento denominador (b-1)(k-1) 12 critico de F es : 3.89

grados de libertad medias de numerado (b-1) 6 cuando el nivel de significancia de 0.05 el valor
bloques denominador (b-1)(k-1) 12 critico de F es : 3.00

RT: E n el caso de la gasolina se rechaza la hipotesis nula .


RT: E n el caso del automovil se rechaza la hipotesis nula . existe una diferencia tanto entre los autos y la gasolina

45) A continuación se enumera los pesos de una muestra de dulces M&M, clasificados
según su color. Utilice un paquete de software estadístico para determinar si hay
alguna diferencia entre los pesos medios de los dulces de colores distintos. Emplee
un nivel de significancia de 0.05.

rojo naranja amarillo café café claro verde TOTAL


0,946 0,902 0,929 0,896 0,845 0,935
1,107 0,943 0,96 0,888 0,909 0,903
0,913 0,916 0,938 0,906 0,873 0,865
0,904 0,91 0,933 0,941 0,902 0,822
0,926 0,903 0,932 0,838 0,956 0,871
0,926 0,901 0,899 0,892 0,959 0,905
1,006 0,919 0,907 0,905 0,916 0,905
0,914 0,901 0,906 0,824 0,822 0,852
0,922 0,93 0,93 0,908 0,965
1,052 0,883 0,952 0,833 0,898
0,903 0,939
0,895 0,94
0,882
0,906
T. columna 11,414 9,108 12,953 8,831 7,182 8,921 58,409
n 12 10 14 10 8 10 64
media 0,95 0,91 0,93 0,88 0,90 0,89 0,91

ANOVA
Fuente de variacion
suma de cuadrados
grados de libertadMedia cuadratica F
Tratamiento SST K-1 SST/(K-1) MST/MSE
Error SSE n-k SSE/(n-1)
Total sst

Primero se formula las hipótesis nulas y la alternativa.


Hipótesis
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4 = 𝜇5 = 𝜇6

𝐻1 : 𝜇1 ≠ 𝜇2 ≠ 𝜇3 ≠ 𝜇4 ≠ 𝜇5 ≠ 𝜇6
Realizamos los cálculos para obtener el SS total aplicando la formula 𝑆𝑆 𝑡𝑜𝑡𝑎𝑙 =
Σ((𝑋 − 𝑋𝐺 )2
X es cada observación de la muestra
𝑋𝐺 𝑒𝑠 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑔𝑙𝑜𝑏𝑎𝑙
Se procede a elevar al cuadrado cada una de las diferencias y se suman todos los
valores y obtenemos SS total
2
SS total Σ( − )
rojo naranja amarillo café café claro verde TOTAL
0,00111 0,00011 0,00027 0,00028 0,00458 0,00050
0,03778 0,00092 0,00224 0,00061 0,00001 0,00009
0,00000 0,00001 0,00064 0,00004 0,00157 0,00227
0,00007 0,00001 0,00041 0,00080 0,00011 0,00822
0,00018 0,00009 0,00037 0,00557 0,00188 0,00173
0,00018 0,00014 0,00019 0,00043 0,00215 0,00006
0,00872 0,00004 0,00003 0,00006 0,00001 0,00006
0,00000 0,00014 0,00004 0,00786 0,00822 0,00368
0,00009 0,00030 0,00030 0,00002 0,00274
0,01942 0,00088 0,00155 0,00634 0,00021
0,00009 0,00069
0,00031 0,00075
0,00094
0,00004
TOTAL(SS TOTAL) 0,07 0,0026 0,008482 0,022009 0,018529 0,019562 0,13917073
Se procede a calcular la variable con la cual encontraremos SSt con la desviación entre
cada observación y su media de tratamiento
2
Σ( − 𝑐)

rojo naranja amarillo café café claro verde suma


0,0000 0,0001 0,00001 0,00017 0,00278 0,00184
0,0243 0,0010 0,00121 0,00002 0,00013 0,00012
0,0015 0,0000 0,00016 0,00052 0,00061 0,00073
0,0022 0,0000 0,00006 0,00335 0,00002 0,00491
0,0006 0,0001 0,00005 0,00203 0,00339 0,00045
0,0006 0,0001 0,00069 0,00008 0,00375 0,00017
0,0030 0,0001 0,00033 0,00048 0,00033 0,00017
0,0014 0,0001 0,00037 0,00349 0,00574 0,00161
0,0009 0,0004 0,00002 0,00062 0,00531
0,0102 0,0008 0,00072 0,00251 0,00003
0,0023 0,00019
0,0032 0,00022
0,00187
0,00037
TOTAL 0,050 0,0026 0,0063 0,0133 0,0168 0,0153 0,10

SST= SS TOTAL-SSE
ANOVA
Fuente de variacion
suma de cuadrados
grados de libertadMedia cuadratica F
tratamiento 0,03478 5 0,00696 3,86446
Error 0,10439 58 0,00180
Total 0,13917 63

grados de libertad numerado (k-1) 5


medias de tratamiento denominador (n-k) 58 con un nivel de significancia de 0.05 el valor critico de F es : 2.37

RT: S e rechaza la hipotesis nula ya que F>2.37 . Existe una diferencia entre las ponderaciones medias

37)Una aerolínea comercial selección una muestra aleatoria de 25 vuelos y determino


que la correlación entre el número de pasajeros y el peso total en libras , del equipaje
almacenado en el compartimiento para ello es 0.94 . Con el nivel de significancia de
0.05. ¿Se puede concluir que hay una asociación positiva entre ambas variables?

Hipótesis formula
𝐻0 : 𝑝 ≤ 0 datos
n=25 𝑟√𝑛 − 2
𝐻1 : 𝑝 < 0 r:0.94 𝑡=
√1 − 𝑟 2
n.signif=0,05
0.94√25 − 2
𝑡=
√1 − 0.942
0.94(4.8)
𝑡=
0.34
t=13.27

grados de libertad (n-2) 1.714 rechazamos 𝐻 si t > 1.714

RT: No se rechaza 𝐻 no existe un correlacion entre el tamaño del motor y el desempeño


38) un sociólogo afirma que el éxito de los estudiantes en las universidades relaciona
con el ingreso familiar. En una muestra de 20 estudiantes, el coeficiente de correlación
es 0.40. Con el nivel de significancia de 0.01 ¿se puede concluir que hay una correlación
positiva entre las variables?

datos Desarrollo Hipótesis


n=20 𝑟√𝑛 − 2 𝐻0 : 𝑝 ≤ 0
r=0.40 𝑡=
√1 − 𝑟 2
n.signif=0.01
0.40√20 − 2 𝐻1 : 𝑝 < 0
𝑡=
√1 − 0.402

0.40(4.24)
𝑡=
0.84

t=2.01
grados de libertad (n-2) 2.878 rechazamos 𝐻 si t > 2.878

RT: No se rechaza 𝐻 no existe un correlacion entre el el ingreso familir y el éxito de los estudiantes

39. Un estudio que realizó la Agencia de Protección Ambiental en 12 automóviles


reveló una correlación de 0.47 entre el tamaño del motor y sus emisiones. Con un nivel
de significancia de 0.01, ¿se puede concluir que hay una asociación positiva entre
estas variables? ¿Cuál es el valor p? Interprete sus resultados.
n=12 H0: 𝜌 = 0
r=0,47 H1: 𝜌 ≠ 0
Valor crítico 3,169

𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
0,47√12 − 2
𝑡=
√1 − 0,22
𝑡 = 1,68
El valor t calculada se encuentra en la región de aceptación, es decir, se acepta la
hipótesis nula, esto significa que no hay correlación entre el tamaño del motor y sus
emisiones. Como 1,68 se encuentra entre 1,372 y 1,812, se concluye que el valor p está
entre 0,20 y 0,10.
40. Un hotel de los suburbios obtiene su ingreso bruto de la renta de sus instalaciones
y de su restaurante. Los propietarios tienen interés en conocer la relación entre el
número de habitaciones ocupadas por noche y el ingreso por día en el restaurante. En
la siguiente tabla se presenta una muestra de 25 días (de lunes a jueves) del año
pasado que indica el ingreso del restaurante y el número de habitaciones ocupadas.

Habitaciones Habitaciones
Día Ingreso ocupadas Día Ingreso ocupadas
1 1452 23 14 1425 27
2 1361 47 15 1445 34
3 1426 21 16 1439 15
4 1470 39 17 1348 19
5 1456 37 18 1450 38
6 1430 29 19 1431 44
7 1354 23 20 1446 47
8 1442 44 21 1485 43
9 1394 45 22 1405 38
10 1459 16 23 1461 51
11 1399 30 24 1490 61
12 1458 42 25 1426 39
13 1537 54

Utilice un paquete de software estadístico para responder las siguientes preguntas.


a) ¿Parece que aumenta el ingreso por desayunos a medida que aumenta el
número de habitaciones ocupadas? Trace un diagrama de dispersión para apoyar
su conclusión.
b) Determine el coeficiente de correlación entre las dos variables. Interprete el
valor
c) ¿Es razonable concluir que hay una relación positiva entre ingreso y habitaciones
ocupadas? Utilice el nivel de significancia 0.10.
d) ¿Qué porcentaje de la variación de los ingresos del restaurante se contabilizan
por el número de habitaciones ocupadas?

a. 70
Habitaciones ocupadas

60
50
40
30
20
10
0
1300 1400 1500 1600
Ingreso
Conforme aumenta los ingresos por desayunos, aumenta las habitaciones
ocupadas.

b.
∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 5319,64
𝑟= =
(𝑛 − 1)𝑆𝑥 𝑆𝑦 (25 − 1)(42,8)(12,25)

𝑟 = 0,43
c. Valor crítico 1,714

𝑟√𝑛 − 2
𝑡=
√1 − 𝑟 2
0,43√25 − 2
𝑡=
√1 − 0,19
𝑡 = 2,29
El valor t cae en la zona de rechazo, esto significa que si hay una relación positiva entre
los ingresos del restaurante y las habitaciones ocupadas.
46. La siguiente ecuación de regresión se calculó a partir de una muestra de 20
observaciones.

𝑌̂ = 15 − 5𝑋
El resultado para SSE fue 100, y para SS Total, 400.
a. Determine el error estándar de estimación.
b. Encuentre el coeficiente de determinación.
c. Determine el coeficiente de correlación.
𝑆𝑆𝐸
a. S.=√𝑛−2
100
Sy.x=√20−2
Sy.x=2,36
𝑆𝑆𝐸
b. r2=1− 𝑆𝑆 𝑇𝑜𝑡𝑎𝑙
100
r2=1− 400
r2= 0,75

c. r=√0,75
r= 0,87
47. Los planeadores urbanos piensan que las ciudades más pobladas por residentes de
más edad. Para investigar la relación, colectaron datos sobre la población y la edad
media en 10 grandes ciudades.
Población Edad
Ciudad (en millones) media
Chicago, IL 2833 31,5
Dallas,, TX 1233 30,5
Houston, Tx 2144 30,9
Los Ángeles, LA 3849 31,6
Nueva York, NY 8214 34,2
Philadelphia,
PA 1448 34,2
Phoenix, AZ 1513 30,7
San Antonio,
TX 1297 31,7
San Diego, CA 1257 32,5
San José, CA 0,93 32,6

a. Trace estos datos en un diagrama de dispersión, con la edad media como la


variable dependiente.
b. Encuentre el coeficiente de correlación.
c. Se realizó un análisis de regresión, y la ecuación de regresión resultante es Edad
media = 31,4+0,272 Población. Interprete el significado de la pendiente.
d. Estime la edad media en una ciudad de 2.5 millones de habitantes.
e. La siguiente es una fracción de la captura de pantalla del software de la
regresión. ¿Qué le dice esto?

Predictor Coef SE Coef T P


Constante 313.672 0.6158 50.94 0.000
Población 0.2722 0.1901 1.43 0.190

f. Utilizando un nivel de significancia de 0.10, pruebe la significancia de la


pendiente. Interprete el resultado. 35
¿Existe una relación significativa 34
Edad media

entre ambas variables? 33


32
a. – b. 31
∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 30
𝑟= 0 5000 10000
(𝑛 − 1)𝑆𝑥 𝑆𝑦
Población (en millones)
11413,9
𝑟=
(10 − 1)(2296,96)(1,33)

𝑟 = 0,42

c.
El valor 0,272 significa que por cada habitante (población en millones) adicional,
la ciudad debe aumentar la edad media en 0,272., es decir, 2 millones de
habitantes adicional generaría una edad media de 31,94.

d. Edad media = 31,4+0,272 Población


Edad media = 31,4+0,272(2,5)
Edad media = 32,08
e. La tabla muestra la información necesaria para efectuar la prueba de hipótesis
con respecto a la pendiente de la recta. Incluye el valor de la pendiente que es
0,272 y la intersección es 31,367. El error estándar del coeficiente de la
pendiente es 0,1901.
𝑏−0
f. 𝑡 =
𝑆𝑏
0.2722 − 0
𝑡=
0.1901
𝑡 = 1,43

El valor t calculado es menor al valor crítico de 1,397, así que se acepta la hipótesis nula,
lo que significa que no hay relación entre la población y la edad de las ciudades.

48. Emily Smith decide comprar un auto que consuma poco combustible. Considera
varios vehículos, con base en el costo estimado de compra y la edad del vehículo.
Costo
Vehículo estimado Edad
Honda Insight 5555 8
toyota Prius 17888 3
Toyota Prius 9963 6
Toyota Echo 6793 5
Honda Civic
Hybrid 10774 5
Honda Civic
Hybrid 16310 2
Chevrolet Prizm 2475 8
Mazda Protege 2808 10
Toyota Corolla 7073 9
Acura Integra 8978 8
Scion xB 11213 2
Scion xA 9463 3
Mazda3 15055 2
Mini Cooper 20705 2

a. Trace estos datos en un diagrama de dispersión, con el costo estimado como la


variable dependiente.
b. Calcule el coeficiente de correlación.
c. Se realizó un análisis de regresión y
la ecuación de regresión resultante 25000
es Costo estimado =18358 – 20000

Costo estimado
1534Edad. Interprete el significado 15000
de la pendiente. 10000
d. Calcule el costo de un auto de cinco 5000
años. 0
e. La siguiente es una fracción de la 0 5 10 15
Edad
captura de pantalla del software de
la regresión. ¿Qué le dice esto?

Predictor Coef SE Coef T P


Constante 18358 1817 10.10 0.000
Población -1533.8 306.3 -5.01 0.000

f. Utilizando un nivel de significancia de 0.10, pruebe la significancia de la


pendiente. Interprete el resultado. ¿Existe una relación significativa entre ambas
variables?

a. – b.
∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅)
𝑟=
(𝑛 − 1)𝑆𝑥 𝑆𝑦
−172314,786
𝑟=
(14 − 1)(2,94)(5482,34)

𝑟 = −0,82

C.
La pendiente es negativa, por tanto el valor 1534 significa que por cada año
(edad) adicional, la ciudad debe disminuir el costo estimado en 1534, es decir, 4
adicional generaría un costo estimado de $12222

d. Costo estimado = 18358 – 1534Edad


Costo estimado = 18358 – 1534(5)
Costo estimado = 10688
e. La tabla muestra la información necesaria para efectuar la prueba de hipótesis
con respecto a la pendiente de la recta. Incluye el valor de la pendiente que es -
1533,4 y la intersección es 18358. El error estándar del coeficiente de la
pendiente es 306,3.
𝑏−0
f. 𝑡 = 𝑆𝑏
−1534 − 0
𝑡=
306,3
𝑡 = −5,01
El valor t calculado es menor al valor crítico de ±1,356, así que se rechaza la hipótesis
nula, lo que significa que si existe relación entre la edad y el costo estimado

49. La National Highway Association estudia la relación entre el número de licitadores


en un proyecto para una carretera y la licitación más alta (menor costo) del proyecto.
De interés particular resulta saber si el número de licitadores aumenta o disminuye la
cantidad de la oferta ganadora.

Oferta Oferta
Número de ganadora Número de ganadora
licitadores, (millones de licitadores, (millones de
Proyecto X dólares), Y Proyecto X dólares), Y
1 9 5,1 9 6 10,3
2 3 8 10 6 8
3 3 9,7 11 4 8,8
4 10 7,8 12 7 9,4
5 5 7,7 13 7 8,6
6 10 5,5 14 7 8,1
7 7 8,3 15 6 7,8
8 11 5,5

a. Determine la ecuación de regresión. Interprete la ecuación. ¿Más licitadores


tienden a aumentar o a disminuir la cantidad de la oferta ganadora?
b. Estime la cantidad de la oferta ganadora si se hubieran presentado siete
licitadores.
c. Se desea construir una nueva entrada en la carretera Ohio Turnpike. Se
presentaron siete licitadores. Determine un intervalo de 95% de la oferta
ganadora.
d. Determine el coeficiente de determinación. Interprete su valor.

a. 𝑌̂ = 𝑎 − 𝑏𝑋
𝑠𝑦
𝑏 = 𝑟𝑆
𝑥
∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) −34,97
𝑟= = = −0,68
(𝑛 − 1)𝑆𝑥 𝑆𝑦 (15 − 1)(2,46)(1,52)
1,52
𝑏 = −0,68 = −0,42
2,46
𝑌̅ = 7,9 𝑋̅ = 6,73
𝑎 = 𝑌̅ − 𝑏𝑋̅ = 7,9 − (−0,42)(79,59) = 41,33

𝑌̂ = 41,33 − 0,42𝑋
La ecuación nos muestra que tiene pendiente negativa, es decir, si hay 6 licitadores en
el proyecto, habrá 38,81. Más licitadores tienden a disminuir la cantidad de la oferta
ganadora.

b. 𝑌̂ = 41,33 − 0,42(7)
𝑌̂ = 38,39
1 (𝑋−𝑋)̅ 2 ̂2
∑(𝑌−𝑌) 17,79
c. 𝑌̂ ± 𝑡𝑠𝑦.𝑥 √1 + 𝑛 + + ∑(𝑋−𝑋̅)2 𝑆𝑦.𝑥 √ =√ = 1,17
𝑛−2 13

1 (7−6,73)2
38,39 ± 2,179(1,17) √1 + 15 + ∑(7−6,73)2
38,39 ± 2,72
El intervalo cuando se presentaron 7 licitadores es 35,67 a 42,11 ofertas ganadoras.
d. r2=(0,68)2
r2= 0,46
El 46% de las ofertas ganadoras explica la variación del número de licitaciones.
50. El señor William Profit estudia compañías que se hacen públicas por primera vez.
Le interesa en particular la relación entre el tamaño de la oferta y el precio por acción.
Una muestra de 15 compañías que recién se hicieron públicas reveló la siguiente
información.

Tamaño Tamaño
(en Precio (en
millones por millones
de acción, de Precio por
Compañía dólares), X Y Compañía dólares), X acción, Y
1 9 10,8 9 160,7 11,3
2 94,4 11,3 10 96,5 10,6
3 27,3 11,2 11 83 10,5
4 179,2 11,1 12 23,5 10,3
5 71,9 11,1 13 58,7 10,7
6 97,9 11,2 14 93,8 11
7 93,5 11 15 34,4 10,8
8 70 10,7
a. Determine la ecuación de regresión.
b. Haga una prueba para determinar si el desplazamiento de la regresión lineal es
positivo.
c. Establezca el coeficiente de determinación. ¿Considera que el señor Profit debe
estar satisfecho con el tamaño de la oferta como variable independiente?

e. 𝑌̂ = 𝑎 − 𝑏𝑋
𝑠𝑦
𝑏 = 𝑟𝑆
𝑥
∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 94,26
𝑟= = = 0,47
(𝑛 − 1)𝑆𝑥 𝑆𝑦 (15 − 1)(47,24)(0,31)
0,31
𝑏 = 0,47 = 0,0031
47,24
𝑌̅ = 10,91 𝑋̅ = 79,59
𝑎 = 𝑌̅ − 𝑏𝑋̅ = 10,91 − 0,0031(79,59) = 10,66
𝑌̂ = 10,66 + 0,0031𝑋
f. Si
g. 𝑟 2 = (0,47)2
𝑟 2 = 0,22
No debe estar satisfecho con el tamaño de la oferta como variable independiente
porque el coeficiente de determinación es bajo.

Vous aimerez peut-être aussi