Vous êtes sur la page 1sur 21

PRODUCTO 3 - REGRESIONES LINEALES

ANDREA AYALA

LEIDY FONTECHA

Presentado a:

PROFESOR

MATERIA

CARRERA

UNIVERSIDAD

CIUDAD

2019
Tabla de contenido
EJERCICIO 1 .....................................................................................................................................3
EJERCICIO 2 .....................................................................................................................................8
EJERCICIO 3 .................................................................................................................................. 11
EJERCICIO 4 .................................................................................................................................. 14
EJERCICIO 5 .................................................................................................................................. 17

2
EJERCICIO 1

1. Los adelantos tecnológicos han hecho posible fabricar botes inflables. Estos
botes de goma inflables, que pueden enrollarse formando un paquete no
mayor que una bolsa de golf, tienen tamaño suficiente para dos pasajeros
con su equipo de excursionismo. La revista Canoe & Kayac probó los botes
de nueve fabricantes para ver su funcionamiento en un recorrido de tres días.
Uno de los criterios de evaluación fue su capacidad para equipaje que se
evaluó utilizando una escala de 4 puntos, siendo 1 la puntuación más baja y
4 la puntuación más alta. Con los datos en el archivo Boats disponible en el
foro de la unidad 3 resolver los siguientes interrogantes

Baggage
Boat Capacity Price ($)
S14 4 1595
Orinoco 4 1399
Outside Pro 4 1890
Explorer
380X 3 795
River XK2 2,5 600
Sea Tiger 4 1995
Maverik II 3 1205
Starlite 100 2 583
Fat Pack
Cat 3 1048

a. Trace el diagrama de dispersión de estos datos empleando la capacidad para


equipaje como variable independiente.

3
2500

2000
Precio ($)
1500

1000

500

0
0 1 2 3 4 5
Capacidad equipaje'

b. ¿Qué indica el diagrama de dispersión del inciso a) respecto a la relación entre


capacidad para equipaje y precio?

Una relación de crecimiento proporcional entre ambas variables; un aumento en la


capacidad de equipaje se relaciona con un incremento en el precio

c. A través de los puntos de los datos trace una línea recta para aproximar la relación
lineal entre capacidad para equipaje y precio.

4
2500

2000

1500
Precio ($)

1000

500

0
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
Capacidad equipaje'

5
d. Utilice el método de mínimos cuadrados para obtener la ecuación de regresión
estimada.

x y
Baggage Capacity
Price ($) x*y x² y² xi-x̅ yi-y̅ (xi-x̅)*(yi-y̅) (xi-x̅)²
4,00 1595,00 6380 16 2544025 0,72 360,56 260,40123 0,521605
4,00 1399,00 5596 16 1957201 0,72 164,56 118,84568 0,521605
4,00 1890,00 7560 16 3572100 0,72 655,56 473,45679 0,521605
3,00 795,00 2385 9 632025 -0,28 -439,44 122,0679 0,07716
2,50 600,00 1500 6,25 360000 -0,78 -634,44 493,45679 0,604938
4,00 1995,00 7980 16 3980025 0,72 760,56 549,29012 0,521605
3,00 1205,00 3615 9 1452025 -0,28 -29,44 8,1790123 0,07716
2,00 583,00 1166 4 339889 -1,28 -651,44 832,40123 1,632716
3,00 1048,00 3144 9 1098304 -0,28 -186,44 51,790123 0,07716
29,50 11110,00 39326,00 101,25 15935594,00 0,00 0,00 2909,89 4,56

b1 = Σ((Xi-x̅)(Yi-y̅)/Σ(Xi - x̅)²

b1 = 2909,88888888889/4,55555555555556

b1 = 638,7560976

b2 = (y̅)-(b1*x̅)

b2 = 1234,44444444444-638,756097560976*3,27777777777778

b2 = -859,2560976

Ecuación de regresión

Price ($)= 638,756097560976*Baggage Capacity-859,256097560976

e. Dé una interpretación de la pendiente de la ecuación de regresión estimada.

La pendiente de 638,75 muestra el alto impacto de la capacidad de equipaje sobre


el precio coincidiendo con la apreciación del literal b

6
f. Diga cuál será el precio de un bote que tenga 3 en la evaluación de su capacidad
para equipaje.

Price ($)= 638,756097560976*3-859,256097560976

Price ($)= 1057,012195

El precio estimado será de $1057,01

7
EJERCICIO 2

2. Wageweb realiza estudios sobre datos salariales y presenta resúmenes de


éstos en su sitio de la Red. Basándose en datos salariales desde el 1 de
octubre de 2002 Wageweb publicó que el salario anual promedio de los
vicepresidentes de ventas era $142 111 con una gratificación anual
promedio de $15 432 (Wageweb.com, 13 de mazo de 2003). Los datos se
dan en miles de dólares y los encuentra en el archivo VPSalary disponible
en el foro 3 de la plataforma del curso. Con esos datos dar respuestas a las
siguientes cuestiones

Salary Bonus
($1000s) ($1000s)
135 12
115 14
146 16
167 19
165 22
176 24
98 7
136 17
163 18
119 11

a. Trace un diagrama de dispersión con estos datos tomando como variable


independiente los salarios.

8
Bonus ($1000s)
30
y = 0.1843x - 10.164
25
Bonus ($1000s)

20

15

10

0
0 20 40 60 80 100 120 140 160 180 200
Salary ($1000s)

b. ¿Qué indica el diagrama de dispersión del inciso a) acerca de la relación entre


salario y gratificación?

Una relación lineal proporcional para el crecimiento entre ambas variables

c. Use el método de mínimos cuadrados para obtener la ecuación de regresión


estimada.

x y
Salary ($1000s)Bonus ($1000s) x*y x² y² xi-x̅ yi-y̅ (xi-x̅)*(yi-y̅) (xi-x̅)²
135 12 1620 18225 144 -7,00 -4,00 28 49
115 14 1610 13225 196 -27,00 -2,00 54 729
146 16 2336 21316 256 4,00 0,00 0 16
167 19 3173 27889 361 25,00 3,00 75 625
165 22 3630 27225 484 23,00 6,00 138 529
176 24 4224 30976 576 34,00 8,00 272 1156
98 7 686 9604 49 -44,00 -9,00 396 1936
136 17 2312 18496 289 -6,00 1,00 -6 36
163 18 2934 26569 324 21,00 2,00 42 441
119 11 1309 14161 121 -23,00 -5,00 115 529
1420 160 23834 207686 2800 0 0 1114 6046

b1 = Σ((Xi-x̅)(Yi-y̅)/Σ(Xi - x̅)²

b1 = 1114/6046

9
b1 = 0,184254052

b2 = (y̅)-(b1*x̅)

b2 = 16-0,184254052265961*142

b2 = -10,16407542

Ecuación de regresión

Bonus ($1000s)= 0,184254052265961*Salary ($1000s)-10,1640754217665

d. Dé una interpretación de la ecuación de regresión estimada

La pendiente de 0,1842 muestra que aunque la relación de crecimiento es


proporcional, la tendencia muestra una pendiente de crecimiento pequeña, menor
a 45 grados que sería una pendiente de 1

e. ¿Cuál será la gratificación de un vicepresidente que tenga un salario anual de


$120 000?

Bonus ($1000s)= 0,184254052265961*120-10,1640754217665

Bonus ($1000s)= 11,94641085

10
EJERCICIO 3

3. ¿Esperaría que los automóviles más confiables fueran los más caros?
Consumer Reports evaluó 15 de los mejores automóviles sedán. La
confiabilidad se evaluó con una escala de 5 puntos: mala (1), regular (2),
buena (3), muy buena (4) y excelente (5). Los precios y la evaluación sobre
la confiabilidad de estos 15 automóviles se encuentran en el archivo Cars
disponible en el foro de la unidad 3 de la plataforma del curso. Dar
respuesta a los siguientes interrogantes

Make and Model Reliability Price


Acura TL 4 33.150
BMW 330i 3 40.570
Lexus IS300 5 35.105
Lexus ES330 5 35.174
Mecedes-Benz C320 1 42.230
Lincoln LS Premium
(V6) 3 38.225
Audi A4 3.0 Quattro 2 37.605
Cadillacc CTS 1 37.695
Nissan Maxima 3.5 SE 4 34.390
Infiniti I35 5 33.845
Saab 9-3 Aero 3 36.910
Infiniti G35 4 34.695
Jaguar X-Type 3.0 1 37.995
Saab 9-5 Arc\ 3 36.955
Volvo S60 2.5T 3 33.890

11
a. Trace un diagrama de dispersión con estos datos tomando como variable
independiente las evaluaciones de confiabilidad.

Price
45,000
40,000
35,000
30,000
25,000
Price

20,000
15,000
10,000 y = -1301.2x + 40639
5,000 R² = 0.4991
0
0 1 2 3 4 5 6
Reliability

b. Dé la ecuación de regresión obtenida por el método de mínimos cuadrados.

x y
Reliability Price x*y x² y² xi-x̅ yi-y̅ (xi-x̅)*(yi-y̅) (xi-x̅)²
4 33150 132600 16 1098922500 0,87 -3412,27 -2957,2978 0,7511
3 40570 121710 9 1645924900 -0,13 4007,73 -534,3644 0,0178
5 35105 175525 25 1232361025 1,87 -1457,27 -2720,2311 3,4844
5 35174 175870 25 1237210276 1,87 -1388,27 -2591,4311 3,4844
1 42230 42230 1 1783372900 -2,13 5667,73 -12091,1644 4,5511
3 38225 114675 9 1461150625 -0,13 1662,73 -221,6978 0,0178
2 37605 75210 4 1414136025 -1,13 1042,73 -1181,7644 1,2844
1 37695 37695 1 1420913025 -2,13 1132,73 -2416,4978 4,5511
4 34390 137560 16 1182672100 0,87 -2172,27 -1882,6311 0,7511
5 33845 169225 25 1145484025 1,87 -2717,27 -5072,2311 3,4844
3 36910 110730 9 1362348100 -0,13 347,73 -46,3644 0,0178
4 34695 138780 16 1203743025 0,87 -1867,27 -1618,2978 0,7511
1 37995 37995 1 1443620025 -2,13 1432,73 -3056,4978 4,5511
3 36955 110865 9 1365672025 -0,13 392,73 -52,3644 0,0178
3 33890 101670 9 1148532100 -0,13 -2672,27 356,3022 0,0178
47 548434 1682340 175 20146062676 4,44089E-16 -5,09317E-11 -36086,5333 27,7333

b1 = Σ((Xi-x̅)(Yi-y̅)/Σ(Xi - x̅)²

b1 = -36086,5333333333/27,7333333333333

b1 = -1301,197115

12
b2 = (y̅)-(b1*x̅)

b2 = 36562,2666666667--1301,19711538462*3,13333333333333

b2 = 40639,35096

Ecuación de regresión

Price= -1301,19711538462*Reliability+40639,3509615385

c. De acuerdo con este análisis, ¿cree usted que los automóviles más confiables
sean más caros?

La tendencia es inversa; así que un automóvil más confiable será más barato

d. Estime el precio de un automóvil sedán cuya evaluación de confiabilidad sea 4

Price= -1301,19711538462*4+40639,3509615385

Price= 35434,5625

13
EJERCICIO 4

4. Las bicicletas de montaña que actualmente cuestan menos de $1000 tienen


muchos de los componentes de alta calidad que hasta hace poco sólo
tenían los modelos de alta calidad. Hoy, incluso modelos de menos de
$1000 suelen ofrecer suspensión flexible, pedales clipless y cuadro muy
bien diseñado. Una cuestión interesante es si precios más altos
corresponden a mayor facilidad de manejo, medida a través del agarre
lateral de la bicicleta. Para medir el agarre lateral, Outside Magazine
empleó una escala de evaluación del 1 al 5, en la que el 1 correspondía a
mala y 5 a promedio. En el archivo MtnBikes disponible en el foro de la
unidad 3 del curso se presenta el agarre lateral y los precios de 10
bicicletas de montaña probadas por Outside Magazine, con estos datos
responder los siguientes interrogantes

Manufacturer and Singletrack


Model Capability Price
Raleigh M80 1 600
Marin Bear Valley
Feminina 1 649
GT Avalanche 2.0 2 799
Kona Jake the Snake 1 899
Schwinn Moab 2 3 950
Giant XTC NRS 3 4 1100
Fisher Paragon
Genesisters 4 1149
Jamis Dakota XC 3 1300
Trek Fuel 90 5 1550

14
Specialized Stumpjumper
M4 4 1625

a. Trace un diagrama de dispersión con estos datos tomando como variable


independiente el agarre lateral.

Price
1800
1600
y = 204.24x + 490.21
1400
1200
Precio

1000
800
600
400
200
0
0 1 2 3 4 5 6
Agarre lateral

b. ¿Parecen indicar estos datos que los modelos más caros sean de más fácil
manejo? Explique.

Si, los datos muestran que los precios están directamente relacionados con el
agarre lateral y esto implica un mejor manejo

c. Dé la ecuación de regresión estimada obtenida por el método de mínimos


cuadrados.

15
x y
Singletrack Capability Price x*y x² y² xi-x̅ yi-y̅ (xi-x̅)*(yi-y̅) (xi-x̅)²
1 600 600 1 360000 -1,80 -462,10 831,78 3,24
1 649 649 1 421201 -1,80 -413,10 743,58 3,24
2 799 1598 4 638401 -0,80 -263,10 210,48 0,64
1 899 899 1 808201 -1,80 -163,10 293,58 3,24
3 950 2850 9 902500 0,20 -112,10 -22,42 0,04
4 1100 4400 16 1210000 1,20 37,90 45,48 1,44
4 1149 4596 16 1320201 1,20 86,90 104,28 1,44
3 1300 3900 9 1690000 0,20 237,90 47,58 0,04
5 1550 7750 25 2402500 2,20 487,90 1073,38 4,84
4 1625 6500 16 2640625 1,20 562,90 675,48 1,44
28 10621 33742 98 12393629 1,776E-15 9,095E-13 4003,2 19,6

b1 = Σ((Xi-x̅)(Yi-y̅)/Σ(Xi - x̅)²

b1 = 4003,2/19,6

b1 = 204,244898

b2 = (y̅)-(b1*x̅)

b2 = 1062,1-204,244897959184*2,8

b2 = 490,2142857

Ecuación de regresión

Price= 204,244897959184*Singletrack Capability+490,214285714286

d. ¿Cuál es el precio estimado de una bicicleta de montaña cuyo agarre lateral


tenga una evaluación de 4?

Price= 204,244897959184*4+490,214285714286

Price= $1.307,19

16
EJERCICIO 5

La Nacional Basketball Association (NBA) lleva un registro de diversos datos


estadísticos de cada equipo. Cuatro de estos datos estadísticos son la proporción
de juegos ganados (PCT), la proporción de anotaciones de campo (FG%), la
proporción de tiros de tres puntos hechos por el equipo contrario (Opp 3 Pt%) y la
cantidad de recuperaciones hechas por el equipo contrario (Opp TO). Los
siguientes datos muestran los valores de estas estadísticas para los 29 equipos de
la NBA en una fracción de la temporada 2004 (www.nba.com, enero 3, 2004)

Opp 3
Team PCT FG% Opp TO
Pt%
Atlanta 0,265 0,435 0,346 13,206
Boston 0,471 0,449 0,369 16,176
Chicago 0,313 0,417 0,372 15,031
Cleveland 0,303 0,438 0,345 12,515
Dallas 0,581 0,439 0,332 15
Denver 0,606 0,431 0,366 17,818
Detroit 0,606 0,423 0,262 15,788
Golden
State 0,452 0,445 0,384 14,29
Houston 0,548 0,426 0,324 13,161
Indiana 0,706 0,428 0,317 15,647
L.A.
Clippers 0,464 0,424 0,326 14,357
L.A. Lakers 0,724 0,465 0,323 16
Memphis 0,485 0,432 0,358 17,848

17
Miami 0,424 0,41 0,369 14,97
Milwaukee 0,5 0,438 0,349 14,75
Minnesota 0,677 0,473 0,348 13,839
New Jersey 0,563 0,435 0,338 17,063
New
Orleans 0,636 0,421 0,33 16,909
New York 0,412 0,442 0,33 13,588
Orlando 0,242 0,417 0,36 14,242
Philadelphia 0,438 0,428 0,364 16,938
Phoenix 0,364 0,438 0,326 16,515
Portland 0,484 0,447 0,367 12,548
Sacramento 0,724 0,466 0,327 15,207
San Antonio 0,688 0,429 0,293 15,344
Seattle 0,533 0,436 0,35 16,767
Toronto 0,516 0,424 0,314 14,129
Utah 0,531 0,456 0,368 15,469
Washington 0,3 0,411 0,341 16,133

a. Obtenga una ecuación de regresión estimada que sirva para predecir la


proporción de juegos ganados dada la proporción de anotaciones de campo del
equipo

18
x y
FG% PCT x*y x² y² xi-x̅ yi-y̅ (xi-x̅)*(yi-y̅) (xi-x̅)²
0,435 0,265 0,115275 0,189225 0,070225 0,00 -0,24 6,53603E-05 7,60999E-08
0,449 0,471 0,211479 0,201601 0,221841 0,01 -0,03 -0,0004245 0,000188352
0,417 0,313 0,130521 0,173889 0,097969 -0,02 -0,19 0,003452878 0,000334007
0,438 0,303 0,132714 0,191844 0,091809 0,00 -0,20 -0,00054192 7,42093E-06
0,439 0,581 0,255059 0,192721 0,337561 0,00 0,08 0,000294464 1,38692E-05
0,431 0,606 0,261186 0,185761 0,367236 0,00 0,10 -0,00044498 1,8283E-05
0,423 0,606 0,256338 0,178929 0,367236 -0,01 0,10 -0,00127754 0,000150697
0,445 0,452 0,20114 0,198025 0,204304 0,01 -0,05 -0,00048554 9,45589E-05
0,426 0,548 0,233448 0,181476 0,300304 -0,01 0,05 -0,00042733 8,60416E-05
0,428 0,706 0,302168 0,183184 0,498436 -0,01 0,20 -0,00148478 5,29382E-05
0,424 0,464 0,196736 0,179776 0,215296 -0,01 -0,04 0,000427705 0,000127145
0,465 0,724 0,33666 0,216225 0,524176 0,03 0,22 0,006600809 0,000883524
0,432 0,485 0,20952 0,186624 0,235225 0,00 -0,02 5,54637E-05 1,07313E-05
0,41 0,424 0,17384 0,1681 0,179776 -0,03 -0,08 0,001969774 0,000638869
0,438 0,5 0,219 0,191844 0,25 0,00 0,00 -5,2604E-06 7,42093E-06
0,473 0,677 0,320221 0,223729 0,458329 0,04 0,18 0,006604326 0,001423111
0,435 0,563 0,244905 0,189225 0,316969 0,00 0,06 -1,6847E-05 7,60999E-08
0,421 0,636 0,267756 0,177241 0,404496 -0,01 0,13 -0,00191395 0,0002038
0,442 0,412 0,182104 0,195364 0,169744 0,01 -0,09 -0,00060471 4,5214E-05
0,417 0,242 0,100914 0,173889 0,058564 -0,02 -0,26 0,004750464 0,000334007
0,428 0,438 0,187464 0,183184 0,191844 -0,01 -0,06 0,000465153 5,29382E-05
0,438 0,364 0,159432 0,191844 0,132496 0,00 -0,14 -0,00037574 7,42093E-06
0,447 0,484 0,216348 0,199809 0,234256 0,01 -0,02 -0,00021023 0,000137455
0,466 0,724 0,337384 0,217156 0,524176 0,03 0,22 0,006822878 0,000943973
0,429 0,688 0,295152 0,184041 0,473344 -0,01 0,19 -0,00116774 3,93864E-05
0,436 0,533 0,232388 0,190096 0,284089 0,00 0,03 2,24982E-05 5,24376E-07
0,424 0,516 0,218784 0,179776 0,266256 -0,01 0,01 -0,00015864 0,000127145
0,456 0,531 0,242136 0,207936 0,281961 0,02 0,03 0,000602429 0,00042949
0,411 0,3 0,1233 0,168921 0,09 -0,02 -0,20 0,00490205 0,000589317
12,623 14,556 6,363372 5,501435 7,847918 0 -4,663E-15 0,027496552 0,006947793

b1 = Σ((Xi-x̅)(Yi-y̅)/Σ(Xi - x̅)²

b1 = 0,0274965517241379/0,00694779310344828

b1 = 3,957595069

b2 = (y̅)-(b1*x̅)

b2 = 0,501931034482759-3,95759506864*0,435275862068966

b2 = -1,220714571

Ecuación de regresión

19
PCT= 3,95759506864*FG%-1,2207145707394

b. Interprete la pendiente de la ecuación de regresión estimada obtenida en el


inciso a).

La pendiente es 3,9576 , Este valor muestra una relación directamente


proporcional entre ambas variables, es una pendiente pronunciada

c. Obtenga una ecuación de regresión estimada que sirva para predecir la


proporción de juegos ganados dada la proporción de anotaciones de campo del
equipo, la proporción de tiros de tres puntos hechos por el equipo contrario y la
proporción de recuperaciones hechas por el equipo contrario.

Coeficientes
Intercepción -1,2474123
FG% 4,83416934
OPP3 PT% -2,5822644
OPP TO 0,03457946

Ecuación de regresión

PCT = 0,03*OPP TO+-2,58*OPP3 PT%+4,83*FG%-1,25

d. Analice las implicaciones prácticas de la ecuación de regresión estimada


obtenida en el inciso c).

20
El modelo indica que el factor que más incide en la victoria es la proporción de
anotaciones seguida del porcentaje de recuperaciones; mientras que el factor del
número de tiros del equipo contrario tiene una proporcionalidad negativa

e. Estime la proporción de juegos ganados por un equipo para el que los valores
de las tres variables independientes son: FG% = 0.45, Opp 3 Pt% = 0.34 y Opp
TO = 17

PCT = 0,0345794567375279*17+-
2,58226439592028*0,31+4,83416934438263*0,45-1,24741229678845

PCT = 0,71531271

La proporción sería de 71,53%

21

Vous aimerez peut-être aussi