Vous êtes sur la page 1sur 22

Cuarta Práctica Calificada

Estadística y Probabilidades
MB-613 A

Profesora:
-Liliana Huaman del Pino

Integrantes:

-Pérez-Palma Vásquez, Edgard 20080094a


-Yaranga Cáceres, Leonardo Andrés 20080062b

Rimac 09 de marzo del 2010


UNI-FIM
1.- La experiencia en la crianza en pollos New Jersey Red, reveló que el peso promedio
de tales aves a la edad de cinco meses es de 4.35 libras. Los pesos están distribuidos
normalmente. A fin de aumentar su peso, un aditivo especial se mezcló a su alimento
común. Los pesos subsecuentes de una muestra de pollos de cinco meses fueron:
4.41 4.37 4.33 4.35 4.25 4.68 4.40 4.26. Al nivel de 0.01, Incrementó el aditivo especial
el peso de las aves?

Tomamos nuestra hipótesis:


H0 : µ ≥ 4.35 H1 : µ < 4.35

Estandarizando la distribución:
x −µ
z=
δ
n
Como el α = 0.01, nuestro Z critico sera:
z 0.01 = −2,33 , quiere decir que para z < -2,33 se rechazara H0 , pues nuestra zona
crítica se encuentra en la cola izquierda.

Usando los valores de la muestra :


4,368 − 4.35
z= =1,6776
0.034 el cual es mayor al Z crítico, por lo que se acepta el H0 .
10
El aditivo favorece al peso de las aves.

2.- El cloro líquido que se agrega al agua de piscinas para combatir organismos de la
especie alga tiene una duración de almacenamiento relativamente corta antes de que
pierda su eficacia. Los registros indican que la duración promedio de almacenamiento
de una botella con 5 galones de cloro es 2 160 horas (90 días). Como un experimento, se
agregó el producto Holdlonger al cloro para averiguar si permite incrementar esta
duración. Una muestra de nueve botellas de cloro proporcionó os siguientes valores (en
horas): 2159, 2170, 2180, 2179, 2160, 2167, 2171, 2181, 2185. Al nivel de significancia
de 0.025, Incrementó Holdlonger el tiempo útil de almacenamiento de cloro?

Tomamos nuestra hipótesis:


H0 : µ ≥ 2160 H1 : µ < 2160

Estandarizando la distribución:
x −µ
z=
δ
n
Como el α = 0.025, nuestro Z critico sera:
z 0.025 = −1,96 , quiere decir que para z < -1,96 se rechazara H0 , pues nuestra zona
crítica se encuentra en la cola izquierda.

Usando los valores de la muestra:


2172 ,44 − 2160
z= =13 ,98
9,38 el cual es mayor al Z crítico, por lo que se acepta el H0 .
9
El producto Holdlonger resulta beneficioso para el propósito.

3.- Las pescaderías de Wyoming afirman que el número medio de truchas que se
atraparon durante un día completo de pesca con caña en los ríos Snake, Bufalo y otros
ríos y arroyos en el área de Jackson Hole, es de 4,0. Para realizar su actualización anual,
se pidió a una muestra de pescadores con caña que anotaran el número de truchas que
atrapan durante el dia. Las cantidades fueron: 4, 4, 3, 2, 6,8,7,1,9,3,1,6. Al nivel de 0.05,
hay evidencia convincente de que ha aumentado el número de truchas que se atrapan al
dia?

Tomamos nuestra hipótesis:


H0 : µ ≥ 4.0 H1 : µ < 4.0

Estandarizando la distribución:
x −µ
z=
δ
n
Como el α = 0.05, nuestro Z critico sera:
z 0.05 = −1,65 , quiere decir que para z < -1,65 se rechazara H0 , pues nuestra zona
crítica se encuentra en la cola izquierda.

Usando los valores de la muestra :


4,5 − 4.0
z= = 0,646
2,68 el cual es mayor al Z crítico, por lo que se acepta el H0 .
12
Es evidente que el número de truchas pescadas ha aumentado.

4.- Una empresa de encuestas afirma que un agente realiza 53 investigaciones a fondo
en hogares cada semana. S presentó un formulario de encuesta moderno y la compañía
desea evaluar su eficiencia. Las encuestas realizadas durante una semana por una
muestra aleatoria de agentes son: 53, 57, 50, 55, 54, 60, 52, 59, 63, 60, 60, 61, 51, 56.
Al nivel de significancia de 0.05, Se puede concluir que el número medio de encuestas
realizadas por los agentes es mayor que 53 a la semana?
Tomamos nuestra hipótesis:
H0 : µ ≥ 53 H1 : µ < 53

Estandarizando la distribución:
x −µ
z=
δ
n
Como el α = 0.05, nuestro Z critico sera:
z 0.05 = −1,65 , quiere decir que para z < -1,65 se rechazara H0 , pues nuestra zona
crítica se encuentra en la cola izquierda.

Usando los valores de la muestra:


56 ,4 − 53
z= = 3,523
3,738 el cual es mayor al Z crítico, por lo que se acepta el H0 .
15
Las encuestas realizadas en la semana son mayores a 53.

5.- En forma reciente se ha incrementado el interés de avaluar el efecto del ruido sobre
la habilidad de las personas para llevar a cabo una determinada tarea. Un investigador
diseña un experimento en el que se pedirá un determinado número de sujetos que lleven
a cabo una tarea específica en un medio controlado y bajo 2 niveles de ruido de fondo.
El investigador selecciona 32 personas que son capaces de realizar la misma tarea y de
manera práctica en el mismo tiempo. Del total de personas, 16 seleccionadas al azar
realizan esta tarea bajo un mismo nivel modesto de ruido de fondo 1. Las restantes 16
personas llevarán a cabo la misma tarea bajo un ruido de nivel 2, el cual es más severo
que el ruido de nivel 1. Los siguientes datos representan los tiempos observados en
minutos que fueron necesarios para completar la tarea para cada una de las 16 personas
de cada nivel.

a) Las varianzas de ambos niveles de ruido son homogéneas?, haga la prueba


de homogeneidad de varianzas correspondientes.
b) Existe alguna razón para creer que el tiempo promedio para el nivel 2 es
mayor por más de dos minutos que para el nivel 1 con α = 0.05?

Nivel1: media: 14.375 Desv. Std.: 2.2044, n=16, s 2 =4.8593


Nivel2: media: 18.5 Desv. Std.: 2.3717, n=16, s 2 =5.625

Suponemos
H0: σ 12 = σ 22
α = 0.05
2
s12σ 2 s12
F= 2
= 2 …. F(15,15) / H0 verdadera
s 22σ 1 s2

1 1
P(X<x)=0.05…. P( > )= 0.05
X x
1 1
1- P( ≤ )= 0.05
X x
1 1
P( ≤ )= 0.95… F(15,15) ….
X x
1/X=2.4
X=0.416
2
s12σ 2 s12 4.8593
F= 2 2
= 2= = 0.8638 , 0.8638>0.416

2 1
s2 5.625

Por lo tanto se acepta H0, eso quiere decir que las varianzas de ambos niveles son
homogéneas.

6.- Una muestra de las calificaciones en un examen presentado en un curso de


Estadistica es:

Hombres: 72 69 98 68 85 76 79 80 77
Mujeres : 81 67 90 78 81 80 76

Al nivel de significancia 0.01, La calificación media de las mujeres es más alta que la de
los hombres?

De los resultados:
Estadísticos de muestras relacionadas

Desviación Error típ. de


Media N típ. la media
Par 1 hombres 77.86 7 10.915 4.126
mujeres 79.00 7 6.880 2.600

Correlaciones de muestras relacionadas

N Correlación Sig.
Par 1 hombres y mujeres 7 .748 .053

Prueba de muestras relacionadas

Diferencias relacionadas gl
95% Intervalo de Sig.
confianza para la (bilateral)
Error típ. diferencia Desviación típ.
Desviació de la Superio
Media n típ. media r Inferior t Inferior
Par hombres -
-1.143 7.358 2.781 -7.948 5.662 -.411 6 .695
1 mujeres

Haciendo una prueba de hipótesis


t -0.411
H0=las medias son iguales
Observamos el SIG bilateral es de 0.695
SIG=0.695>0.01
Por lo tanto no se rechaza H0. Lo que quiere decir que las medias de ambos son
razonablemente cercanas. Concluimos que tienen las mismas calificaciones medias.

7.- Un estudio reciente comparó el tiempo que pasan juntos los matrimonios en los que
solo un conyuge trabaja, y que parejas en las que los dos lo hacen. De acuerdo con los
registros elaborados por las esposas durante el estudio, el tiempo medio que pasan
juntos viendo la televisión las parejas en las que solamente uno labora fue de 61
minutos por día, con una desviación estándar de 15.5 min. Para los matrimonios en los
que los dos conyugues trabajan, el número medio de minutos ante el televisor fue de
48.4 min, con una desviación estándar de 18.1 min. Al nivel de significancia de 0.01, Se
puede concluir que las parejas donde solamente una persona trabaja, pasan en promedio
mayor tiempo observado la televisión juntos? Se estudiaron quince parejas en las que
solo un conyugue labora y 12 donde los 2 laboran.

Caso1: media: 61.0 Desv. Std.: 15.5, n=15, s 2 =240.25


Caso2: media: 48.4 Desv. Std.: 18.1, n=12, s 2 =327.61

Suponemos
H0: σ 12 = σ 22
α = 0.01
2
s12σ 2 s12
F= 2
= 2 …. F(14,11) / H0 verdadera
s 22σ 1 s2

1 1
P(X<x)=0.01…. P( > )= 0.01
X x
1 1
2- P( ≤ )= 0.01
X x
1 1
P( ≤ )= 0.99… F(11,14) …. Asumimos un F(10,15) ya que estos
X x
grados de libertad se encuentran en las tablas
1/X=3.8
X=0.263
2
s12σ 2 s12 240 .25
F= 2
= 2= = 0.733 , 0.733>0.263
s 22σ 1 s2 327 .61

Por lo tanto se acepta H0, eso quiere decir que ambas parejas observan el mismo tiempo
televisión.

8.- Lisa Monnin, directora de presupuesto en la empresa New Process Company,


desearía comparar los gastos diarios de transporte del equipo de ventas y del personal de
cobranza. Recopilo la siguiente información muestral.

Ventas 131 135 146 165 136 142


Cobranza 130 102 129 143 149 120 139

Al nivel de significancia de 0.1, Puede concluirse que los gastos medios diarios son
mayores para el equipo de ventas?

Según los datos:


Estadísticos de muestras relacionadas
Desviación Error típ. de
Media N típ. la media
Par 1 ventas 142.50 6 12.243 4.998
cobranza 128.83 6 16.774 6.848

Correlaciones de muestras relacionadas

N Correlación Sig.
Par 1 ventas y cobranza 6 .371 .470

Prueba de muestras relacionadas

Diferencias relacionadas gl
95% Intervalo de Sig.
Error típ. confianza para la (bilateral)
Desviación de la diferencia Desviación típ.
Media típ. media Superior Inferior t Inferior
Par ventas -
13.667 16.705 6.820 -3.864 31.198 2.004 5 .101
1 cobranza

Haciendo una prueba de hipótesis


t 2.004
H0=las medias son iguales
Observamos el SIG bilateral es de 0.101
SIG=0.101>0.01
Por lo tanto no se rechaza H0. Lo que quiere decir que las medias de ambos son
razonablemente cercanas. Concluimos que tienen los mismos gastos medios.

9.- La Cámara de Comercio del área Booty Bay desea saber si el sueldo medio semanal
de enfermeras fue mayor que el de maestros de escuela primaria. Para investigar
recopilaron la siguiente información de muestra.

Maestros 545 526 527 575 484 509 502 520 529 530 542 532
Enfermeras 541 590 521 471 550 559 525 529

Es razonable concluir que el sueldo medio semanal de enfermeras es mayor? Utilice


nivel de significancia 0.01.

Obteniendo los resultados


Estadísticos de muestras relacionadas
Desviación Error típ. de
Media N típ. la media
Par 1 maestros 523.50 8 27.718 9.800
enfermeras 535.75 8 34.404 12.164

Correlaciones de muestras relacionadas

N Correlación Sig.
Par 1 maestros y enfermeras 8 -.567 .143

Prueba de muestras relacionadas

Diferencias relacionadas gl Sig.


95% Intervalo de (bilateral)
Error típ. confianza para la
Desviación de la diferencia Desviación típ.
Media típ. media Superior Inferior t Inferior
Par maestros -
-12.250 55.071 19.470 -58.290 33.790 -.629 7 .549
1 enfermeras

Haciendo una prueba de hipótesis


t -0.629
H0=las medias son iguales
Observamos el SIG bilateral es de 0.549
SIG=0.549Z>0.01
Por lo tanto no se rechaza H0. Lo que quiere decir que los sueldos de ambos son
razonables cercanos. En conclusión no es razonable concluir que el sueldo de las
enfermeras sea mayor.

.
10.- Dado el siguiente conjunto de datos, utilice el paquete de cómputo que tenga
disponible para encontrar la ecuación de regresión de mejor ajuste y responda a lo
siguiente:

a) Cual es la ecuación de regresión?


b) Cual es el error estándar de la estimación?
c) Cual es el R² para esta regresión?
d) Cual es el valor predicho para Y cuando X1=5.8, X2=4.2, X3=5.1?
e) Analice si el modelo tiene buen ajuste.

Y X1 X2 X3
------------------------------------
64.7 3.5 5.3 8.5
80.9 7.4 1.6 2.6
24.6 2.5 6.3 4.5
43.9 3.7 9.4 8.8
77.7 5.5 1.4 3.6
20.6 8.3 9.2 2.5
66.8 6.7 2.5 2.7
34.3 1.2 2.2 1.3

Los resultados son:


Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 x3, x1, x2(a) . Introducir
a Todas las variables solicitadas introducidas
b Variable dependiente: y

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 .992(a) .983 .971 4.0688
a Variables predictoras: (Constante), x3, x1, x2

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 3927.678 3 1309.226 79.082 .001(a)
Residual 66.222 4 16.555
Total 3993.900 7
a Variables predictoras: (Constante), x3, x1, x2
b Variable dependiente: y

Coeficientes(a)

Coeficientes
Coeficientes no estandarizado
estandarizados s

Modelo B Error típ. Beta t Sig.


1 (Constante) 34.808 4.708 7.394 .002
x1 5.262 .651 .554 8.077 .001
x2 -8.019 .556 -1.112 -14.413 .000
x3 6.808 .680 .807 10.016 .001
a Variable dependiente: y

A). La ecuación de regresión es: Y= 34.808 + 5.262X1 – 8.019X2 + 6.808X3


B). El error estándar de la estimación es 4.068.

C). El R2 para esta regresión es 0.983. Esto explica que X1, X2 y X3 afecta linealmente
a Y en un 98.3% la linealidad. Al tener un alto porcentaje es un buen ajuste.

D). Reemplazando:
Y= 34.808 + 5.262(5.8) – 8.019(4.2) + 6.808(5.1) = 66.3686

E). Para eso haremos una prueba de hipótesis


F 79.082
H0=0
Observamos el SIG de la ecuación es de 0.001
SIG=0.001<0.05
Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste.

11.- El consejo municipal de la cuidad de ThunderBluff esta considerando aumentar el


número de agentes de policía, en un esfuerzo por reducir los delitos. Antes de tomar una
decisión final, el organismo pide al jefe de policía que haga una encuesta en otras
ciudades de tamaño similar, a fin de determinar la relación entre el número de vigilantes
y el de delitos reportados. El funcionario recopilo la siguiente información:

Cuidad Agentes Delitos


----------------------------------------------------
Oxford 15 17
Stormwind 17 13
Danville 25 5
Athens 27 7
Orgrimmar 17 7
Carey 12 21
Whistler 11 19
Woodville 22 6

a) Si se desea evaluar los delitos con base en la cantidad de guardianes, Cual es la


variable dependiente y cual es la independiente.
b) Trace un diagrama de dispersión
c) Determine el coeficiente de correlación.
d) Calcule el coeficiente de determinación.
e) Analice si el modelo tiene buen ajuste.

Los resultados obtenidos por el SPSS son:


Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 agentes(a) . Introducir
a Todas las variables solicitadas introducidas
b Variable dependiente: delitos

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 .874(a) .765 .725 3.378
a Variables predictoras: (Constante), agentes

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 222.394 1 222.394 19.485 .004(a)
Residual 68.481 6 11.414
Total 290.875 7
a Variables predictoras: (Constante), agentes
b Variable dependiente: delitos

Coeficientes(a)

Coeficientes no Coeficientes
estandarizados estandarizados

Modelo B Error típ. Beta t Sig.


1 (Constante) 29.388 4.143 7.093 .000
agentes -.960 .217 -.874 -4.414 .004
a Variable dependiente: delitos

A). La variable dependiente es Numero de delitos, mientras que Agentes de policía será
la variable independiente.

B). El diagrama de dispersión es:


25

20
delitos

15

10

10 15 20 25 30
agentes

C). El coeficiente de correlación es 0.874


D). El coeficiente de determinación es 0.765. Esto quiere que X1 influencia linealmente
a Y en un 76.5%. Al ser un valor alto tiene un buen ajuste.
E). Para eso haremos una prueba de hipótesis
F 19.485
H0=0
Observamos el SIG de la ecuación es de 0.004
SIG=0.004<0.05
Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste.

12.- El dueño de Mulgore Motors desea estudiar la relación entre la antigüedad de un


automóvil y su precio de venta. A continuación aparece la lista de una muestra aleatoria
de 12 autos usados vendidos en ese establecimiento durante el último año.

a) Si se desea calcular el precio de venta con base en la antigüedad del vehículo,


Cual es la variable dependiente y cual es la independiente?
b) Trace el diagrama de dispersión
c) Establezca el coeficiente de correlación
d) Calcule el coeficiente de determinación
e) Analice si el modelo tiene buen ajuste

Obteniendo estos datos del SPSS


Resumen del modelo
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
1 .544(a) .296 .225 1.7321
a Variables predictoras: (Constante), antiguedad

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 12.587 1 12.587 4.195 .068(a)
Residual 30.002 10 3.000
Total 42.589 11
a Variables predictoras: (Constante), antiguedad
b Variable dependiente: precio

A). La variable dependiente será el precio de venta mientras que la variable


independiente será la antigüedad.

B). El diagrama de dispersión es:


10,0

8,0
precio

6,0

4,0

6 7 8 9 10 11 12
antiguedad

C). El coeficiente de correlación (R) es de 0.544


D). El coeficiente de determinación (R2) es de 0.296. Esto quiere que X1 influencia
linealmente a Y en un 29.6%. Al ser un número bajo la ecuación no tiene buen ajuste
E). Para eso haremos una prueba de hipótesis
F 4.195
H0=0
Observamos el SIG de la ecuación es de 0.68
SIG=0.068>0.05
Por lo tanto no se rechaza H0. Lo que quiere decir que no tiene buen ajuste.
13.- El departamento de personal de la empresa HoS está interesando en estudiar la
relación que tiene el salario, el tamaño de la familia y la antigüedad en el trabajo con los
gastos (Y). Para este estudio, el especialista en la materia escogió una muestra al azar de
10 miembros de todo el personal de la empresa, considerando:

Y = Gasto semanal X1 = Salario semanal


X2 = Tamaño de familia X3 = Antigüedad en el trabajo

A partir de la salida SPSS que estaba a continuación responda lo siguiente:

a) Escriba el modelo de regresión lineal múltiple estimado, reemplazando los


coeficientes de regresión.
b) Usando el ANOVA haga la prueba de hipótesis para saber si el modelo de
regresión lineal tiene buen ajuste y por que? Use α =0.05
c) Diga si las variables X1, X2, X3 son importantes en el modelo, ósea si las
variables tienen una buena contribución lineal al modelo. Use α =0.05
d) Comente el valor del coeficiente R²

Según la salida del SPSS observamos:

A). La ecuación de mejor ajuste es: Y= -2.79 + 0.584X1 + 3.42X2 – 0.409X3


Gasto Semanal: Y
Salario Semanal: X1
Tamaño de la familia: X2
Antigüedad en el trabajo: X3

B). Para eso haremos una prueba de hipótesis


F 99.102
H0=0
Observamos el SIG de la ecuación es de 0.0
SIG=0.0<0.05
Por lo tanto se rechaza H0. Lo que quiere decir que tiene buen ajuste.

C). Para X1
t 11.09
H0=0
Observamos el SIG de X1 es de 0.0
SIG=0.0<0.05
Por lo tanto se rechaza H0, esto quiere decir que la variable Salario es importante en el
ajuste.

Para X2
t 3.473
H0=0
Observamos el SIG de X2 es de 0.013
SIG=0.013<0.05
Por lo tanto se rechaza H0, esto quiere decir que la variable Tamaño de la familia es
importante en el ajuste.
Para X3
t -0.932
H0=0
Observamos el SIG de X3 es de 0.387
SIG=0.387>0.05
Por lo tanto no se rechaza H0, esto quiere decir que la variable Antigüedad no es
importante en el ajuste.

D). El valor de R2 es 0.98 esto quiere que X1, X2 y X3 influencian linealmente a Y en


un 98%. Al ser un valor alto, la ecuación tiene un buen ajuste.
14.- Una línea aérea cuya base esta en Nueva Inglaterra ha efectuado una investigación
sobre sus 15 terminales y ha obtenido los siguientes datos correspondientes al mes de
febrero en los que:
Ventas = recuperación total basada en el número de boletos vendidos.
Pormoc = cantidad gastada en promover la línea aérea
Compet = numero de aerolíneas competidoras en ese aeropuerto
Gratis = porcentaje de pasajeros que vuelan gratis

a) Utilize un programa para determinar la ecuación de regresión de mejor ajuste


para la aerolínea.
b) Los pasajeros que vuelan gratis ocasionan que las ventas bajen
significativamente? Establezca y prueba las hipótesis apropiadas. Use α =0.05
c) Un aumento en las promociones de 1000 cambia las ventas en 28000, o es el
cambio significativamente diferente a 28000? Establezca y pruebe las hipótesis
apropiadas.

Los análisis estadísticos son:


Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 gratis,
competencia, . Introducir
promcion(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: ventas

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 .953(a) .908 .883 27.3120
a Variables predictoras: (Constante), gratis, competencia, promcion

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 81341.725 3 27113.908 36.348 .000(a)
Residual 8205.392 11 745.945
Total 89547.117 14
a Variables predictoras: (Constante), gratis, competencia, promcion
b Variable dependiente: ventas

Coeficientes(a)
Coeficientes no Coeficientes
estandarizados estandarizados

Modelo B Error típ. Beta t Sig.


1 (Constante) 160.619 50.352 3.190 .009
promcion 24.927 4.461 .716 5.587 .000
competencia -11.851 3.682 -.378 -3.219 .008
gratis -2.479 1.873 -.135 -1.324 .212
a Variable dependiente: ventas

A). La ecuación de mejor ajuste es: Y= 160.619 + 24.927X1 – 11.851X2 - 2.479X3


Siendo:
Ventas: Y
Promoción: X1
Competencia: X2
Usuarios Gratis: X3

B).Para eso haremos una prueba de hipótesis


t -1.324
H0=0
Observamos el SIG de la componente Gratis es de 0.212
SIG=0.212>0.05
Por lo tanto no se rechaza H0, esto quiere decir que la variable de usuarios que viajan
gratis no es importante en el ajuste.
15.- Rick Darkspear está pensando en vender su casa con el fin de decidir qué precio
pedir por ella. Ha recogido daros de doce ventas recientes, Registró el precio de las
ventas, el número de pies cuadrados de construcción, el número de pisos, el número de
baños y la antigüedad de la casa.

a) Utilizando cualquier paquete de computadora que tenga, determine la ecuación


de regresión de mejor ajuste para los datos.
b) Cual es el valor de R² para esta ecuación?
c) Si la casa de Rick tiene 1800 pies cuadrados, un piso, 1.5 baños y seis años de
antigüedad, Que precio de venta podría esperar Rick?

Digitando los datos en el SPSS nos arrojó los siguientes datos:

Variables introducidas/eliminadas(b)

Variables Variables
Modelo introducidas eliminadas Método
1 antiguedad,
baños, pisos, . Introducir
pies(a)
a Todas las variables solicitadas introducidas
b Variable dependiente: precio

Resumen del modelo

R cuadrado Error típ. de la


Modelo R R cuadrado corregida estimación
1 .976(a) .952 .925 13.50726
a Variables predictoras: (Constante), antiguedad, baños, pisos, pies

ANOVA(b)

Suma de Media
Modelo cuadrados gl cuadrática F Sig.
1 Regresión 25608.547 4 6402.137 35.091 .000(a)
Residual 1277.123 7 182.446
Total 26885.670 11
a Variables predictoras: (Constante), antiguedad, baños, pisos, pies
b Variable dependiente: precio

Coeficientes(a)

Coeficientes no Coeficientes
estandarizados estandarizados

Modelo B Error típ. Beta t Sig.


1 (Constante) -1.381 13.360 -.103 .921
pies 2.852 1.507 .493 1.893 .100
pisos -3.713 10.125 -.047 -.367 .725
baños 30.285 15.563 .511 1.946 .093
antigüedad 1.172 1.102 .131 1.064 .323
a Variable dependiente: precio
A). Podemos ver que la ecuación de regresión es de Y= - 1.381 + 2.852X1 - 3.713X2 +
30.285 X3 + 1.172X4
Siendo:
Precio de Venta: Y
Pies Cuadrados: X1
Pisos: X2
Baños: X3
Antigüedad: X4

B). El valor de R2 nos aparece en el ANOVA y es .952. Esto nos indica que X1, X2, X3
y X4 influencian linealmente a Y en un 95.2%.

C). El valor esperado seria el de reemplazar en la ecuación:


Y= -1.381 + 2.852(18) - 3.713(1) + 30.285(1.5) + 1.172(6) = 98.7015
El valor esperado será de 98701.5 $

Vous aimerez peut-être aussi