Académique Documents
Professionnel Documents
Culture Documents
Unidad 1
Actividad: Problemario
1
1. Un estadístico que trabaja para un fabricante estadounidense de automóviles desearía
desarrollar un modelo estadístico para predecir el tiempo de entrega (la cantidad de días
transcurridos entre el pedido de un automóvil y la entrega real del mismo) de los pedidos
de automóviles nuevos. El estadístico piensa que existe una relación lineal entre el
número de opciones pedidas y el tiempo de entrega. Se seleccionó una muestra aleatoria
de 16 automóviles y se obtuvieron los resultados que se presentan a continuación:
2
b) Utilice el método de mínimos cuadrados para encontrar los coeficientes de
regresión b0 y b1.
, Dónde:
,
Respuesta.- Coeficientes de regresión: b0 = 21.9254 y b1 = 2.06871
3
c) Interprete el significado de la intersección con el eje Y, b0, y la pendiente, b1, de
este problema.
La línea recta que mejor explica la relación entre el número de opciones pedidas y el
tiempo de entrega, está dada por: yi = 21.9254 + 2.06871 xi
Total SST
4
Dónde:
5
Respuesta.- El coeficiente de correlación r = 0.9785.
Respuesta.- Se asegura con una confianza del 95%, que el intervalo de predicción
de entrega de un automóvil con 16 opciones está entre 48 y 62 días.
k) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación lineal
entre el número de opciones y el tiempo de entrega?
Respuesta.- Dado que el valor-P en la tabla ANOVA es menor que 0.05, existe una
relación lineal estadísticamente significativa entre el tiempo de entrega y número de
opciones de pedido con un nivel de confianza del 95.0%.
6
Sb = Error estándar = 0.116
7
Respuesta.- Después del análisis del gráfico observado vs. Predicho podemos
asegurar que no hace falta eliminar ninguna observación ya que ésta se adecua
correctamente al modelo de regresión lineal.
Respuesta.-
8
2. Al dueño de una gran cadena de expendios de helados le gustaría estudiar el efecto de
la temperatura ambiente sobre las ventas de sus productos durante la temporada de
verano. Se seleccionó una muestra aleatoria de 21 días y se obtuvieron los resultados
que se presentan a continuación:
9
b) Suponiendo que haya una relación lineal, utilice el método de mínimos cuadrados
para encontrar los coeficientes de regresión b0 y b1.
10
c) Interprete el significado de la pendiente b1 de este problema.
Respuesta.- Se puede interpretar que por cada punto porcentual de incremento en
la temperatura (°F), se espera un incremento aprox. en las ventas de 0.060728 ($), de
igual manera si la temperatura decrece la ventas también.
d) Prediga las ventas por tienda para un día en el que la temperatura es de 83° F.
Total SST
Dónde:
Sustituimos los datos:
SSR = (0.060728) (104.6315) = 6.35406
SST = 6.7597
SSE = 6.7597 – 6.35406 = 0.405601
SMR = 6.35406 / 1 = 6.35406
SME = 6.7597 / 19 = 0.0213474
F = 6.35406/ 0.0213474 = 297.65
11
Sustituimos lo valores en tabla ANOVA:
12
Estadístico de Durbin-Watson = 1.63907 (P = 0.1520)
j) Basándose en los resultados del inciso (i), ¿a qué conclusiones puede usted llegar
con respecto a la validez del modelo ajustado en el inciso (b)?
Respuesta.-
l) Establezca un intervalo de predicción de 95% para las ventas por tienda en un día
en el cual la temperatura es de 83° F.
Respuesta.- Se asegura con una confianza del 95%, que el intervalo de predicción
de ventas por tienda con 83°F de temperatura están entre 2.19 y 2.52 ($).
13
m) Al nivel de significación de 0.05, ¿existe evidencia de que haya una relación lineal
entre la temperatura ambiental y las ventas?
Respuesta.- Puesto que el valor-P en la tabla ANOVA es menor que 0.05, existe una
relación lineal estadísticamente significativa entre el tiempo de entrega y número de
opciones de pedido con un nivel de confianza del 95.0%.
o) Explique qué tan diferentes podrían ser los resultados obtenidos si el modelo
estuviera basado en una medida de la temperatura en la escala Celsius (°C).
14
Respuesta.- Dado la aleatoriedad de la ubicación de los puntos en el gráfico
(incluso con los pocos residuos atípicos ubicados), indica que el modelo de
regresión lineal simple se ajusta bien a los datos.
Respuesta.- Después del análisis del gráfico observado vs. Predicho podemos
asegurar que no hace falta eliminar ninguna observación ya que ésta se adecúa
correctamente al modelo de regresión lineal.
15
3. Suponga que una compañía grande de productos de consumo desea medir la
efectividad de los diferentes medios de propaganda en la promoción de sus productos. En
especial, se van a estudiar dos tipos de medios de promoción: propaganda en radio y
televisión y propaganda en periódicos (incluyendo el costo de los cupones de descuento).
Se seleccionó una muestra de 22 ciudades cuya población es aproximadamente igual
para realizar un estudio durante un periodo de prueba de un mes. A cada ciudad se le
asignó un nivel de gastos específico para publicidad en radio y televisión y para publicidad
en periódicos. Se registraron las ventas del producto (en miles de dólares) durante el mes
de prueba, junto con los niveles de gastos de los medios, y se tuvieron los siguientes
resultados:
Ventas
Publicidad en radio Publicidad en
(miles
y televisión (miles Periódicos
Ciudad de X1 Y X2 Y X1 X2 X12 X22
de dólares) (miles de dólares)
dólares)
X1 X2
Y
1 973 0 40 0 38920 0 0 1600
2 1,119 0 40 0 44760 0 0 1600
3 875 25 25 21875 21875 625 625 625
4 625 25 25 15625 15625 625 625 625
5 910 30 30 27300 27300 900 900 900
6 971 30 30 29130 29130 900 900 900
7 931 35 35 32585 32585 1225 1225 1225
8 1,177 35 35 41195 41195 1225 1225 1225
9 882 40 25 35280 22050 1000 1600 625
10 982 40 25 39280 24550 1000 1600 625
11 1,628 45 45 73260 73260 2025 2025 2025
12 1,577 45 45 70965 70965 2025 2025 2025
13 1,044 50 0 52200 0 0 2500 0
14 914 50 0 45700 0 0 2500 0
15 1,329 55 25 73095 33225 1375 3025 625
16 1,330 55 25 73150 33250 1375 3025 625
17 1,405 60 30 84300 42150 1800 3600 900
18 1,436 60 30 86160 43080 1800 3600 900
19 1,521 65 35 98865 53235 2275 4225 1225
20 1,741 65 35 113165 60935 2275 4225 1225
21 1,866 70 40 130620 74640 2800 4900 1600
22 1,717 70 40 120190 68680 2800 4900 1600
26953 950 660 1263940 851410 28050 49250 22700
16
Utilice un paquete de computación y lleve a cabo un análisis de regresión lineal múltiple.
Basándose en los resultados obtenidos:
c) Prediga las ventas para una ciudad en la cual el costo de la publicidad en radio y
televisión es de $20,000, y el de la publicidad en periódicos es también de
$20,000.
17
Y X1 X2 (Y - Ӯ)2 Ẏ (Ẏ - Ӯ)2
973 0 40 63572.744 828.242 157525.085
1,119 0 40 11264.9269 828.242 157525.085
875 25 25 122595.471 903.33 103559.295
625 25 25 360163.651 903.33 103559.295
910 30 30 99310.9254 1052.71 29730.829
971 30 30 64585.2895 1052.71 29730.829
931 35 35 86516.1983 1202.09 531.132
1,177 35 35 2317.10915 1202.09 531.132
882 40 25 117742.562 1099.5405 15774.305
982 40 25 59115.2896 1099.5405 15774.305
1,628 45 45 162299.112 1500.85 76018.044
1,577 45 45 123808.021 1500.85 76018.044
1,044 50 0 32810.3809 810.465 171952.287
914 50 0 96805.8345 810.465 171952.287
1,329 55 25 10787.6557 1295.751 4986.436
1,330 55 25 10996.383 1295.751 4986.436
1,405 60 30 32350.929 1445.131 48397.668
1,436 60 30 44463.4747 1445.131 48397.668
1,521 65 35 87535.2935 1594.511 136437.669
1,741 65 35 266115.295 1594.511 136437.669
1,866 70 40 410706.205 1743.891 269106.439
1,717 70 40 241929.84 1743.891 269106.439
2507793 26953.023 2028038
Dónde:
Ӯ = 1225.1363
18
Fuente Suma de Gl Cuadrado Razón-F Valor-P
Cuadrados Medio
Modelo 2028038 2 1.01402E6 40.16 0.0000
Residuo 479760 19 25250.5
Total (Corr.) 2507793 21
f) Determine si existe una relación significativa entre las ventas y las dos variables
explicativas (publicidad en radio y televisión y publicidad en periódicos), al nivel
significación de 0.05.
19
Dada la razón-F = 40.16, k = 2, y gl = n – k 1 = 19. t0.975 = 3.52
Respuesta.- Puesto que el valor-P es menor que 0.05, hay indicación de una posible
correlación serial con un nivel de confianza del 95.0%.
20
Error
Parámetro Estimación Estándar Límite Inferior Límite Superior
CONSTANTE 156.43 126.758 -108.495 421.354
P.RADIO Y TV (MIL 13.0807 1.759 9.404 16.756
P. PERIODICOS (MI 16.7953 2.963 10.572 22.988
Respuesta.- Los intervalos de confianza con un 95% para: las ventas se encuentran
entre -108.495 y 421.354, para la inversión en publicidad en radio y tv. Se encuentra
entre 9.404 y 16.756, y para la inversión en publicidad en periódicos se encuentra
entre 10.572 y 22.988. (Todos en miles de dólares).
21
4. El director de operaciones de transmisión de una estación de televisión desea estudiar
la cuestión de las "horas de reserva", tiempo que se les paga a los artistas gráficos
sindicalizados que trabajan en la estación, pero durante el cual realmente no existe
ninguna actividad. Las variables que se van a tomar en cuenta son:
• Horas de reserva (Y): número total de horas de reserva por semana.
• Personal total presente (X1): total por semana de los días-persona trabajados durante
una semana de siete días.
• Horas remotas (X2): número total de horas trabajadas por los empleados en
locaciones fuera de la planta central.
Horas
Personal total Horas
de
Semana reserva presente remotas X1 Y X2 Y X1 X2 X12 X22
X1 X2
Y
22
24 197 317 235 62449 46295 74495 100489 55225
25 261 315 164 82215 42804 51660 99225 26896
26 232 331 270 76792 62640 89370 109561 72900
4920 8428 9765 1609350 1833118 3190408 2742160 4090613
c) Prediga las horas de reserva para una semana en la que el personal total presente
es de 310 días-persona y las horas remotas son 400.
Y X1 X2 (Y - Ӯ)2 Ẏ (Ẏ - Ӯ)2
Ӯ = 189.2308
24
Fuente Suma de Gl Cuadrado Medio Razón-F
Cuadrados
Modelo k
SSR = (Ẏ - Ӯ)2
Residuo n-k-1
SSE = (Y - Ẏ)2
Total (Corr.) n-1
SST = (Y - Ӯ)2
25
Respuesta.- Dado la aleatoriedad de la ubicación de los puntos en el gráfico
(incluso con los pocos residuos atípicos ubicados), indica que el modelo de
regresión lineal múltiple se ajusta bien a los datos.
f) Grafique los residuos en función del tiempo (en semanas). ¿Existe alguna
evidencia de que haya un patrón en los resultados? Explique su respuesta.
26
Dada la razón-F = 11.07, k = 2, y gl = n – k 1 = 26 – 2- 1 = 23
El Valor-P = 0.0004
Respuesta.- Puesto que el valor-P es menor que 0.05, hay indicación de una posible
correlación serial con un nivel de confianza del 95.0%.
j) Determine si existe una relación significativa entre las horas de reserva y las dos
variables explicativas (personal total presente y horas remotas), al nivel
significación de 0.05.
27
• -0.139362 +/- 2.07 (0.0588) = -0.26105 – -0.01767
Error
Parámetro Estimación Estándar Límite Inferior Límite Superior
CONSTANTE -331.059 116.45 -571.955 -90.1628
PERSONAL TOTAL P. 1.76654 0.379023 0.98247 2.55061
HRS REMOTAS -0.139362 0.0588246 -0.26105 -0.0176739
Respuesta.- Los intervalos de confianza con un 95% para: las hrs. De reserva se
encuentran entre -571.955 y -90.1628, para el personal total presente se encuentra
entre 0.98247 y 2.55061 (días-persona), y para las hrs. Remotas se encuentra entre
-0.26105 y -0.017673.
28