Vous êtes sur la page 1sur 66

GUIA DE TRABAJO

STATISTICS II

2020-01
1
INTERVALOS DE CONFIANZA PARA LA MEDIA POBLACIONAL ( μ)

1. Se va a
vender un nuevo cereal para desayuno como prueba de mercados durante un mes
en las tiendas de una cadena de autoservicio. Los resultados de una muestra de 26
tiendas indicaron una venta promedio de 1250.8 soles con una desviación estándar
de 210.4 soles. Si las ventas tienen distribución normal.

a. Establezca una estimación por intervalo con un 95% de confianza para la venta
promedio por tienda de este cereal en este mes de prueba.
b. Si la cadena de autoservicios tiene 200 tiendas, estime con un 95% de confianza
el monto de las ventas que por concepto de este producto tendrían las 200
tiendas.

2. Respon
da las siguientes preguntas:
a. Suponga que de una población se seleccionó una muestra aleatoria de tamaño n
= 64 personas, con el objetivo de estimar el gasto promedio (en soles) en
consumo, por mes, el cual tiene una distribución normal. A un nivel de
confianza del 95% y sabiendo que la varianza (σ 2) es de es de 62 500 soles2,
se encontró el siguiente intervalo de confianza para la media
IC ( μ )=⟨ 1138,75 ; 1261,25 ⟩. Halle el valor de la media muestral utilizada y el
margen de error utilizado en el problema.

b. Dentro del contexto de la parte a), se desea reducir el error de estimación


(margen de error) en un 40%, manteniendo el mismo nivel de confianza,
calcule el tamaño de muestra que se requiere en este caso.

c. La siguiente información es una salida de MINITAB con respecto a una


estimación mediante intervalos de confianza para el promedio de peso de un
artículo:

Una muestral para Z: PESO

Desviación estándar asumida = 35

Variable N Media Desv. Est. ES Media IC _____%


PESO 11 246,2 21,3 _____
(228,8;_______)

Por error se borró el valor del nivel de confianza y el límite superior. Con la
información obtenida del resultado del minitab. Determine dichos valores.

d. En el problema anterior si el intervalo de confianza para la media es (226,4;


266,0). ¿Qué nivel de confianza se utilizó?

2
3. Se
seleccionó una muestra de 15 bodegas de cierta zona de la ciudad con la finalidad
de estimar el nivel promedio de ventas por semana (en miles de soles). Los datos
obtenidos se procesaron mediante el programa MINITAB, y los resultados se
muestran a continuación:

Z para una muestra: VENTAS

Desviación estándar asumida = 10

Variable N Media Desv. Est. ES Media ………………………………


VENTAS 15 ______ 10,21 _____ (56,21; 67,52)
A partir de esta información responda las siguientes preguntas:

a. Se afirma que el nivel de venta promedio semanal, de estas bodegas es superior


a los 54 500 soles. Con el reporte dado ¿Qué puede decir al respecto?
b. Halle el nivel promedio de las ventas.
c. ¿Qué nivel de confianza se utilizó en este reporte?

4. Una
casa comercial tiene 2500 clientes con cuenta de crédito. Para estimar el total
adeudado por estos clientes, se selecciona una muestra aleatoria de 25 cuentas la
cual da los siguientes resultados: una media de 950 soles y una desviación
estándar de 300 soles. Construya un intervalo de confianza del 99% para estimar la
cantidad total adeudada por los clientes de esta casa comercial, si se sabe que el
monto adeudado por los clientes tiene una distribución normal.

5. Una
empresa comercializa granos de café en bolsas de 150 gramos. Sin embargo,
INDECOPI ha recibido las quejas de un grupo de consumidores los cuales alegan
que el contenido de dichas bolsas es menor a lo indicado; para corroborar las
quejas, un funcionario de INDECOPI seleccionó una muestra aleatoria de diez
unidades del producto resultando los siguientes pesos en gramos:

150,5 150,7 149,0 150,4 149,6 151,0 150,9 149,2 150,3 149,3

a. Con un nivel de confianza del 98%, estime el contenido medio de las bolsas.
b. Al nivel de confianza del 98%, ¿puede el funcionario llegar a la conclusión que
los consumidores tienen la razón? Considere los resultados obtenidos en el ítem
a.

3
INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN
POBLACIONAL ( π )

6. Una
industria lechera ubicada en el departamento de Ica está estudiando la posibilidad
de cambiar sus botellas de vidrio para la leche a envases de plástico. Con esta
finalidad, se realizó el estudio considerando una muestra aleatoria de 450
personas, las cuales fueron clasificadas por estrato socioeconómico. Los
resultados se muestran en cuadro adjunto:

Estrato socioeconómico
A favor del cambio
A (Alto) B (Medio) C (Bajo)
Si 80 70 120
No 40 80 60

a. Estime la proporción de personas que están a favor del cambio. Use un nivel de
confianza del 92%.
b. Si en la ciudad residen 36000 personas, estime el número de personas que
están a favor del cambio de envase. Use los resultados obtenidos en a).

7. Un
inversionista desea analizar el comportamiento sobre la rentabilidad de dos tipos de
acciones asociadas a los fondos mutuos. Para ello, decide consultar a dos
agencias para averiguar cuál de las acciones es más rentable: agraria o minera. Se
seleccionan muestras aleatorias independientes por cada tipo de acción y los
resultados se muestran en cuadro adjunto:

Agencia A Agencia B
Acciones
Si son rentables No son rentables Si son rentables No son rentables
Agrarias 15 25 20 20
Mineras 20 40 25 35

a. Con un nivel de confianza del 95%, estime la proporción de acciones agrarias


rentables según la agencia A.
b. Estime la proporción de acciones mineras no rentables. Use un nivel de
confianza del 99%.

8. En un
estudio realizado a 2100 jóvenes encuestados con edades entre 17 a 22 años de
edad en el distrito A, se encontró que 1792 de ellos utilizan como medio de
mensajería rápida la aplicación WhatsApp. El investigador que realiza el estudio

4
piensa que el porcentaje de jóvenes que utilizan este medio de comunicación es
más del 80%. Con un nivel de confianza del 99%, ¿se puede concluir que la
afirmación del investigador es cierta?

9. En la
actualidad, la aseguradora del fondo de pensiones “AFP NEPTUNO” cuenta con 14
5000 afiliados que hacen sus aportaciones con regularidad. En una muestra
aleatoria de 1200 afiliados que hicieron sus aportaciones en el último trimestre, se
obtuvo un promedio $850 y una desviación estándar de $225. Se conoce también
que 650 de los 1 200 afiliados seleccionados hicieron aportaciones superiores a $1
250.
a. Estime con 95% de confianza el monto total de aportaciones de los afiliados a
esta AFP en el último trimestre.
b. Con 98% de confianza estime el número de afiliados con aportaciones
superiores a $1 250 en dicho trimestre.

10. En
cierto distrito de la capital se está realizando un estudio mediante el cual se podría
tener la posibilidad de otorgar crédito monetario a los comerciantes de la zona y de
este modo se puedan formalizar. Para esto se quiere estimar el ingreso mensual de
un sector de comerciantes informales. Se seleccionó una muestra aleatoria de 120
comerciales informales y se encontró entre otros datos lo siguiente: un ingreso
promedio de 1 800 soles y una desviación estándar de 150 soles; y sólo el 36%
tienen ingresos superiores a 2100 soles.
a. Construye un intervalo de confianza del 95% para estimar el ingreso promedio
mensual. Interprete los resultados.
b. Con un nivel de confianza del 90%, estime la proporción de comerciantes con
ingresos superiores a 2100 soles.

11. En un
instituto de Enseñanza Superior tiene 800 estudiantes matriculados. Se tomó una
muestra aleatoria de estudiantes la cual representa el 15% del total, y se llevó a
cabo una pequeña encuesta con las siguientes preguntas:
Pregunta 1: ¿Utiliza la cafetería del instituto? Sí_____ No____
Pregunta 2: Si la repuesta anterior es afirmativa, diga aproximadamente cuánto
dinero gasta al día en esta cafetería _________

Lo resultados: fueron:
1. Contest
aron negativamente a la pregunta 1 un total de 24 alumnos.

5
2. De los
que contestaron afirmativamente la pregunta 1, se obtuvo que el gasto promedio
diario es 12.2 soles con una desviación estándar de 3.48 soles.

Considere estas características y resultados mostrados para responder las


siguientes preguntas:
a. Defina la población de interés en este caso, indique las variables y el tipo de
variable involucradas en esta situación.
b. Estime la proporción de alumnos que utilizan la cafetería con un 90% de
confianza.
c. Determine, con un nivel de confianza del 97%, el máximo error de estimación
cometido con la estimación realizada en el inciso b.
d. Estime con un 97% de confianza, el monto promedio diario que gasta un
estudiante que utiliza la cafetería del instituto, suponiendo que el gasto diario
que realizan los alumnos que hacen uso de la cafetería del instituto se distribuye
normalmente.
CÁLCULO DE TAMAÑO DE MUESTRA (n)

13. El gerente de producción desea estimar el tiempo promedio de fabricación de


cierto artículo, en minutos; con un error máximo de 4 minutos. Además, por
experiencias anteriores, se sabe que la desviación estándar del tiempo de
fabricación es 10 minutos, ¿qué tamaño de muestra se debe de considerar para el
estudio, si se tiene una seguridad del 95% para sus resultados?
14. Un comerciante quiere estimar el porcentaje de personas que responden
favorablemente a una nueva campaña de publicidad televisiva. Este banquero
desea realizar dicha estimación con un error máximo de 2.5% y un nivel de
confianza del 90%. Determine el tamaño de muestra necesario para realizar dicha
estimación. Una muestra piloto determinó que el 65% de las personas respondieron
favorablemente a la campaña de publicidad televisiva.
15. Para adquirir un lote que contiene artículos, un comerciante desea estimar el
porcentaje de artículos defectuosos que contiene este lote, para lo cual se fija un
error de estimación de a lo más 3% y un nivel de confianza del 93%. ¿Qué número
de artículos será necesario para realizar la estimación, si por experiencias
anteriores, se sabe que aproximadamente este tipo de lotes tienen 7.5% de
artículos defectuosos?
16. En una muestra piloto, un ingeniero electrónico seleccionó al azar 150
componentes electrónicos y encontró que seis fallaron antes de cumplir su vida útil.
¿Qué tamaño de muestra se debe tomar con una confianza del 95% y con un error
de estimación no mayor a 0.005 para estimar la proporción de componentes
electrónicos que fallaron antes de cumplir su vida útil?
17. Un investigador quiere estimar la proporción de jóvenes entre 17 a 22 años de
edad que utilizan como medio de mensajería rápida la aplicación WhatsApp en
cierto distrito. Determine el número de jóvenes necesarios para estimar dicha
proporción si se tiene como máximo un error del 2.4% y una seguridad del 90%;
además de una muestra piloto, el 83.1% de los jóvenes utilizan la aplicación
WhatsApp como medio de mensajería rápida.

6
18. Un inversionista de cierta empresa publicitaria quiere determinar el número de
acciones necesarias para estimar la proporción de acciones con rentabilidad
negativa. Se desea tener una seguridad del 95% y un error de estimación de a lo
más 4.5%. Además, por estudios anteriores, se sabe que 68% de todas las
acciones presentan rentabilidad negativa.
19. El gerente comercial de una cadena de tiendas, que tiene un gran número de
establecimientos distribuidos en todo el país, desea estimar el nivel de ventas
promedio semanal de estos establecimientos, para lo cual se fija las siguientes
condiciones: está dispuesto a tolerar un error de a lo más 120 soles y desea estar
90% seguro de sus resultados. Si se tiene como información que la desviación
estándar en el nivel de ventas de dichos establecimientos es de 350 soles ¿Qué
tamaño de muestra debe utilizar este gerente?

INTERVALO DE CONFIANZA PARA LA DESVIACIÓN ESTÁNDAR


POBLACIONAL (σ)

20. Un empresario afirma que el riesgo de una cartera de inversión es


significativamente pequeño; es decir que, la desviación estándar de la utilidad es
menor a $500. Para verificar esto, un investigador decide seleccionar una muestra
aleatoria de tamaño 16 acciones y se obtuvo una varianza de 102 400 dólares2.
a. Defina adecuadamente el parámetro a estimar en este caso.
b. Utilizando un 95% de confianza, ¿se puede considerar que realmente el riesgo
es bajo? Justifique su respuesta.

21. Actualmente el costo promedio, por unidad producida, de un artículo es de 120


soles con una desviación estándar de 10 soles. Se realizan ciertas medidas de
reajuste en el proceso de producción de este artículo con la finalidad de disminuir
los costos de producción. Luego de estas medidas se toma una muestra aleatoria
de seis artículos y se registró los siguientes costos:

115,6 118,5 123,6 119,5 115, 116,3


2

Con esta información, utilizando un nivel de confianza del 90%, ¿Es posible
confirmar que se logró el objetivo?

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


POBLACIONALES (µ1- µ2)

7
22. Se llevó a cabo las pruebas de la resistencia a la tensión sobre dos diferentes
clases de barras de aluminio utilizados en la fabricación de alas de aeroplanos
comerciales. Por experiencia pasada con el proceso de fabricación de las barras y
del procedimiento de prueba, se sabe que, las desviaciones estándar de las
resistencias a la tensión de las barras de aluminio son 1 y 1,5 respectivamente. Los
datos resultantes de la prueba realizada se presentan en la siguiente tabla: 

Clase de Tamaño de la Resistencia promedio


barra  muestra  (kg/mm2)
1 10 87.6
2 12 74.5

Calcule e interprete el intervalo de confianza del 90% para la diferencia de medias. 

23. Un artículo publicado dio a conocer los resultados de un análisis del peso de
calcio, en gramos, en cemento estándar y en cemento contaminado con plomo. Los
niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda
bloqueado y esto permite que el agua ataque varias partes de una estructura de
cemento. Al tomar diez muestras de cemento estándar, se registró que el peso
promedio de calcio es de 90 gramos y los resultados obtenidos de 15 muestras de
cemento contaminado con plomo, el peso promedio fue de 87 gramos. Si se sabe,
que el peso de calcio está distribuido normalmente, estime mediante un intervalo
de confianza del 95% la diferencia entre medias de los dos tipos de cementos.
Además, se conoce que la varianza del peso de calcio en cemento estándar y en
cemento contaminado con plomo son: 27,5 gramos 2 y 15,875 gramos2
respectivamente.

24. Se ha realizado un estudio para comparar el contenido de nicotina (en gramos)


de dos marcas de cigarrillo (A y B) en base a muestras de tamaño diez y ocho
cigarrillos respectivamente. Se sabe que estas dos marcas de cigarrillos tienen la
misma varianza del contenido de nicotina de 0.36 gramos2. Los resultados del
estudio se presentan a continuación:

Marca Tamaño de muestra Promedio


A 10 3.1
B 8 2.1

Con un 95% de confianza, ¿se puede estimar que el contenido promedio de


nicotina de los cigarrillos de la marca A es superior a los de la marca B?

25. El jefe de personal de una empresa de confecciones quiere comparar los


tiempos promedios, en minutos, que operarios varones y mujeres utilizan para
confeccionar una camisa. Por estudios realizados anteriormente, se sabe que las
desviaciones estándar en cada uno de los grupos son de 2,5 y 1,2 minutos

8
respectivamente. Para realizar el estudio, el jefe de personal selecciona dos
muestras aleatorias de tamaño 16 en cada uno de los grupos dando como
resultado una media muestral de 48 y 32 minutos respectivamente. Con un 97% de
confianza, ¿se puede afirmar que las mujeres confeccionan camisas en menos
tiempo que los varones?

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES


POBLACIONALES (π1 y π2)

26. Con respecto al problema 11, se tiene que en un mismo período y basado en
una muestra de 1 500 afiliados, la competencia más cercana, AFP “VENUS” indica
que el promedio de aportaciones es $1 020 con desviación estándar $190, además
780 afiliados tuvieron aportaciones superiores a los $1 250.

a. Con esta información adicional, estime con un 98% de confianza la diferencia


entre las aportaciones promedios que realizan los afiliados de las dos
aseguradoras. Interprete sus resultados.
b. Con esta información adicional, estime con un 98% de confianza la diferencia
entre las proporciones de aportaciones superiores a $1 250 que realizan los
afiliados de las dos aseguradoras. Interprete sus resultados.

27. Se realizó un estudio, con la finalidad de explorar la aceptación de la gaseosa


light, según el nivel socioeconómico (NSE A y NSE B) y el grupo de edad del
público consumidor (jóvenes y adultos). Para realizar el estudio se consideró
muestras aleatorias de personas mayores de 18 años del nivel socioeconómico A y
otra del nivel socioeconómico B y se consultó acerca de su preferencia por la
gaseosa light o tradicional, y los resultados obtenidos se muestran en la siguiente
tabla:

Nivel Gaseosa Tradicional Gaseosa Light


Socioeconómico Jóvenes Adultos Jóvenes Adultos
NSE A 170 210 260 176

9
NSE B 203 250 188 120

a. Estime con una confianza del 96% la diferencia de proporción de personas


entre los estratos A y B que prefieren la gaseosa tradicional. Interprete el
resultado.
b. Estime con una confianza del 98% la diferencia de proporción de jóvenes que
prefieren la gaseosa light entre los niveles socioeconómicos A y B. Interprete el
resultado.

28. El jefe del área de marketing de una cadena televisiva realizó un estudio para
averiguar si existe alguna diferencia entre el contenido humorístico de los
programas peruanos y norteamericanos. En una muestra aleatoria independiente
de 115 programas televisivos peruanos, 32 fueron humorísticos. En otra muestra
aleatoria de 135 programas televisivos norteamericanos, 29 fueron humorísticas.
Con un 95% de confianza, se puede afirmar que la proporción de contenido
humorístico de los programas televisivos peruanos supera a los programas
televisivos norteamericanos.

29. El gerente de una empresa financiera afirma que la proporción de clientes


morosos con préstamos de a lo más 5000 soles de la sucursal A es mayor a la
proporción de clientes morosos con la misma categoría de la sucursal B. Para esto,
selecciona una muestra aleatoria de 200 clientes de la sucursal A, y 58 de ellos aún
no pagan el préstamo con dicho monto; y de 190 clientes de la sucursal B, y 50 de
ellos no pagan el préstamo con dicho monto.
a. Con un nivel de confianza del 96%, estime la diferencia de proporciones de
clientes morosos con préstamos de a lo más 5 000 soles de ambas sucursales.
b. Con un nivel de confianza del 96%, ¿se puede concluir que la afirmación del
gerente es correcta?

PRUEBA DE HIPÓTESIS PARA MEDIA POBLACIONAL (µ)

30. En cada uno de los siguientes casos se le pide plantear las hipótesis nula y
alternativa correspondientes:
a. El jefe de control de calidad de cierto producto desea determinar si el proceso de
envasado está bajo control, es decir: si el peso promedio envasado es de 450
gramos.
b. Las ventas semanales, en promedio, de cierto producto son de 4500 soles, se
realiza una campaña por TV y por radio. El Jefe de ventas desea probar si la
campaña realizada fue efectiva.
c. Una máquina, actualmente utilizada por una empresa en la fabricación de un
determinado artículo, produce un 3% de artículos defectuosos. Al jefe de
producción se le ofrece un nuevo modelo de máquina argumentado que esta

10
produce menos porcentaje de artículos defectuosos. El jefe de producción
desea probar si tal afirmación es válida.

31. Sean los siguientes enunciados:


a. Suponga que se plantean las siguientes hipótesis:
H0: El proceso de producción está bajo control.
H1: El proceso de producción no está bajo control y se debe detener para
reajustar.
Defina en términos de estas hipótesis el error tipo I y el error tipo II.

b. En la situación que se da a continuación, diga usted cual debe ser la hipótesis


nula (H0) de manera que el error tipo I sea el más grave: “El trabajo del
operador de un radar es detectar aeronaves enemigas, en un determinado
momento el tablero indica que algo invadió el espacio aéreo” el operador tiene
las dos siguientes hipótesis:
1. E
2. N

32. El gerente de control de calidad desea determinar si la máquina con la que


embolsan un cereal está bajo control, es decir si se está embolsando con un
promedio de 500 gramos. Para determinar esto, el gerente selecciona una muestra
aleatoria de 36 bolsas y encuentra un promedio de 496,5 gramos.

a. Plantee las hipótesis adecuadas. Indique, si es necesario, los supuestos bajo los
cuales se puede resolver este problema.
b. Describa en que consiste los errores tipo I y error tipo II.
c. Indique la estadística apropiada de esta prueba.
d. A que conclusión llegará el jefe de control de calidad, si sabe que el proceso
tiene una varianza de 81 gramos2 y utiliza una 5% de significancia.
e. Calcule la probabilidad de aceptar la hipótesis nula cuando la verdadera media
es de: 498 gramos y 502 gramos.

33. En una oficina de defensa del consumidor se han recibido quejas de los
consumidores con respecto a que una determinada marca de aceite vende botellas
que indican 850 c.c. pero que en realidad es menor a esa cantidad. Un funcionario
de esta oficina con la finalidad de determinar si los clientes tienen fundamento en
sus quejas decide tomar una muestra aleatoria de 49 botellas de aceite y encontró
que el promedio de esta muestra fue 848.3 c.c. y una desviación estándar de 10
c.c. Usando un nivel de significancia del 5%, ¿a qué conclusión llegará el
funcionario de la oficina de defensa del consumidor?

35. La
s cajas de avena llenadas por un proceso automático deben tener un contenido de
160 gramos en promedio, si no es así, debe detenerse la producción para regular la

11
máquina. El peso en gramos de cajas seleccionadas aleatoriamente de la
producción da los siguientes resultados:
10 10
∑ X i=1580 ∑ X 2i =249658
i=1 ; i=1

a. Con un nivel de significancia del 1%, ¿es razonable detener la producción?


b. Con que probabilidad se debe rechazar la hipótesis nula si el verdadero valor
promedio de la media es de 158 gramos.

PRUEBA DE HIPÓTESIS PARA LA PROPORCÍON POBLACIONAL (π)

36. El
área de Marketing de una compañía que fabrica laptops ABC encontró en una
muestra de 200 personas que el 20% utiliza esta marca de laptop. Después de una
intensa campaña publicitaria, se tomó otra muestra de 300 personas la que indicó
que el 27% favorece esta marca. Al 5% de significación, ¿el gerente puede
concluir, en base a los resultados de esta muestra, que la campaña fue exitosa?

37. U
na oficina relacionada con la cobranza de impuestos comprobó que el 5% de las
declaraciones juradas de impuestos eran inexactas. Después de un programa de
educación aplicado a los contribuyentes se comprobó que, de 1124 declaraciones
juradas, 45 eran inexactas. ¿Existe suficiente evidencia para concluir que el
programa de educación ha rendido buenos resultados?

38. Al
señor Juan Pérez le han propuesto participar en una lista para el congreso, en
representación de su provincia. Para aceptar la propuesta este señor quiere estar
seguro de que al menos el 25% de los votantes en la provincia que reside están a
favor de su candidatura. Para determinar esto, se selecciona una muestra aleatoria
de tamaño de 450 personas encontrando que 90 están a favor de su candidatura.
Con un  = 5%, ¿aceptará el señor Juan Pérez participar en la lista?

39. U
na compañía telefónica está tratando de determinar si algunas líneas en una
determinada comunidad deben instalarse subterráneamente. Debido a que se hará

12
un pequeño cargo adicional en las cuentas telefónicas para pagar los costos extras
de la instalación, la compañía ha determinado hacer un estudio entre los clientes y
proceder con la instalación subterránea solo si el estudio indica que más del 60%
de todos los clientes están a favor de la instalación.
a) Defina el parámetro y el error tipo I y error tipo II en términos del problema.
b) Si 118 de 160 clientes entrevistados están a favor de esta instalación a pesar del
cargo adicional, ¿qué debe hacer la compañía? Use un  = 0,01.
c) ¿Cuáles son las conclusiones al respecto?

40. “F
resquito”, es una nueva marca de gaseosas que entró al mercado y logró un nivel
de aceptación del 12% (es decir el 12% de consumidores de gaseosas prefieren
esta marca). Con la finalidad de tener una mayor participación del mercado la
Gerencia de Producción de “Fresquito” decide realizar una agresiva campaña de
publicidad por televisión, radio y medios escritos.
a. Luego de la campaña de publicidad la gerencia desea, como es lógico, evaluar
los resultados de esta campaña de publicidad, para lo cual se toma una
muestra de 450 personas y se fija un nivel de significancia del 5%. Determine
las hipótesis de interés para la gerencia y establezca la regla de decisión
correspondiente, definiendo con claridad el parámetro que se está sometiendo
a prueba.
b. Si luego de la campaña de publicidad, el porcentaje real de consumidores que
prefieren la marca “Fresquito” es del 14%, (pero lógicamente esto no lo sabe el
Gerente de producción). Determine, bajo estas condiciones, la probabilidad de
que el Gerente de Producción, concluya que la campaña no fue efectiva,
cuando utiliza la regla de decisión hallada anteriormente.
PRUEBA DE NORMALIDAD Y ERROR TIPO II

Sesión 1: Prueba de Normalidad y Error tipo II

41. La
cantidad promedio que se coloca en un recipiente en un proceso de llenado se
supone que es 20 onzas. En forma periódica se escogen al azar 25 recipientes y el
contenido de cada uno de ellos se pesa. Se juzga el proceso fuera de control
cuando x́ <19.8 o x́> 20.2 onzas. Se supone que la cantidad que se coloca en cada
recipiente es una variable aleatoria que sigue una distribución normal y una
desviación estándar de 0.5 onzas.

a. Formule H0 y H1 e indique en qué consisten los errores de tipo I y II.


b. Calcule la probabilidad de cometer error tipo I.
c. Para a = 0,05; calcular b cuando m = 20,1.

42. S
e sabe que en una compañía de taxis el gasto diario promedio en combustible por
unidad es igual a 187,6 galones y la desviación estándar es igual a 32,5 galones. El
gerente de operaciones decide incluir un aditivo especial al combustible que le
permitirá un ahorro en ese rubro. Después de incluir el aditivo toma una muestra de

13
seis unidades y encontró los siguientes gastos en combustible expresado en
galones por día:

180,3 179,6 185,7 170,5 158,3 180,6

Además;
Probability Plot of Peso
Normal
99
Mean 175.8
95
StDev 9.900
N 6
90
AD 0.494
80 P-Value 0.126
70
Percent

60
50
40
30
20

10

1
150 160 170 180 190 200
Peso

Figura. Distribución Normal para la variable peso

a. Con un nivel de significancia de 5%, ¿se puede afirmar que los datos de la
variable siguen una distribución normal?
b. Al 5% de significancia, ¿existe evidencia estadística para afirmar que después
de incluir el aditivo, el gasto diario promedio en combustible por unidad se
reducirá?

43. El
gerente de producción de la compañía de cerveza Inca revisa su línea de
producción. El llenado automático debe dar un contenido medio de 320 cm3. Para
el control del llenado promedio se tomó una muestra aleatoria de 36 unidades del
producto y se encontró un contenido medio de 317 cm 3 con una desviación
estándar de 12cm3.
a. ¿Hay suficiente razón para creer que existe una baja en el promedio de los
contenidos? Realice la prueba al nivel de significación del 5%.
b. Calcule la probabilidad de cometer el error tipo II cuando la verdadera media es
de 312cm3.
c. Calcule la potencia de la prueba.

PRUEBA DE HIPÓTESIS DESVIACIÓN PARA LA ESTANDAR


σ 21
POBLACIONAL (σ) Y COCIENTE DE VARIANZAS ( 2 )
σ2

44. El
gerente de ventas de una empresa industrial tiene que decidir si compra o no una

14
nueva máquina para reemplazar la que tienen en uso actualmente en el
departamento de producción. Se sabe que la máquina que está en uso tiene una
varianza, con respecto al tiempo que demora en producir una pieza, de 0,067
minutos2. Al tomar una muestra aleatoria de 20 piezas producidas por la máquina
que se desea comprar se encontró una desviación estándar de 0,15 minutos. Si se
utiliza un 5% de significancia y la decisión estará basada en la menor variabilidad,
¿cuál será la decisión del gerente de ventas?

45. C
on cierto proceso de producción, el cual se utiliza en la actualidad, se tiene que la
utilidad promedio por unidad producida es de 115 soles y la desviación estándar de
10 soles. Se realizan ciertas medidas de reajuste en el proceso de producción de
este artículo, con dos objetivos principalmente, uno es el de mejorar el rendimiento
del proceso, en términos de utilidad, y el otro es hacer que las utilidades sean más
homogéneas. Luego de estas medidas se toma una muestra aleatoria de seis
objetos y se determinó las siguientes utilidades:

115,6 118,5 123,6 119,5 114,2 116,3

Además,
Probability Plot of Utilidad
Normal
99
Mean 117.9
StDev 3.374
95
N 6
90
AD 0.237
80 P-Value 0.639
70
Percent

60
50
40
30
20

10
5

1
110 112 114 116 118 120 122 124 126
Utilidad

a. Con un 5% de significancia, verifique el supuesto de normalidad de los datos.


b. Con un 5% de significancia, ¿se puede concluir que se lograron los dos objetivos
establecidos para mejorar el proceso?

46. El
jefe de ventas de una empresa decidirá que su equipo de vendedores debe ser
recompuesto si la varianza de las ventas en la última semana es mayor a 10,15
dólares al cuadrado. Si para esta semana recolecta datos de una muestra aleatoria
de 25 ventas del equipo y encuentra una varianza de 18,03 dólares 2.

15
a. ¿Indican los resultados que se debe recomponer el equipo de ventas?
Considere a = 0,05
b. ¿Qué valor máximo debe tener la varianza muestral para no rechazar la
hipótesis nula?
c. Si se fija a = 0,05, determine la probabilidad del error de tipo II cuando la
desviación estándar real es de 3,8 dólares.
d. Indique que supuestos fueron necesarios para resolver este problema de
aplicación.

47. E
n un estudio acerca de las economías latinoamericanas, se plantea como hipótesis
principal lo siguiente: "Los países Latinoamericanos se han caracterizado por
presentar economías sumamente inestables productos de las diversas políticas
económicas aplicadas por los distintos gobiernos, este hecho se aprecia por las
fuertes fluctuaciones presentadas en el crecimiento de nivel de PBI de dichos
países, lo cual contrasta con las economías europeas caracterizada por una
estabilidad en el nivel de su PBI". Por estudios anteriores se conoce que la
desviación estándar del crecimiento del PBI generado por los países europeos es
de 2,5235 (en millones de dólares) y que está normalmente distribuido. Si en una
muestra aleatoria de 10 países latinoamericanos se ha obtenido una varianza
muestral de 10,758, ¿se puede afirmar que la hipótesis planteada es correcta?

48. S
e desea evaluar el desempeño del departamento de cobranzas de una sucursal
ubicada en Ica, de una determinada empresa crediticia. Según datos históricos
recopilados por la gerencia que lleva a cabo la investigación, el promedio mensual
de las captaciones por cobros asciende a 15000 millones de soles, con una
desviación estándar de 1540 millones de soles. Para efecto de la evaluación de la
sucursal en Ica se elige las captaciones logradas en año y medio de cobranzas,
obteniendo un promedio de 12000 y desviación estándar de 2500 millones de
soles. Se le pide a Ud., utilizando las herramientas estadísticas adecuadas que
informe a la gerencia sobre el desempeño de la sucursal en Ica, considerando el
nivel promedio de captaciones y sobre la estabilidad de los mismos, asimismo,
señale los supuestos que fueron necesarios para llevar a cabo la evaluación.

49. El
ingreso promedio mensual, en soles, del personal de las compañías A y B se
distribuyen normalmente con medias iguales. Para determinar cuál de las dos
compañías tienen ingresos más homogéneos, se seleccionó muestras aleatorias de
10 y nueve empleados respectivamente de ambas compañías, la cual dio como
resultado las varianzas de 100 y 225 soles 2 respectivamente. ¿Hay razón suficiente
para decir que las varianzas son iguales en ambas compañías? Use α = 0,10.

50. El
jefe de logística de la compañía P&C quiere decidir la adquisición entre dos marcas
A y B de máquinas para su planta de producción. Se le permitió probar ambas

16
máquinas durante un período de prueba para luego escoger 10 tiempos
aleatoriamente para cada una de ellas, resultando los tiempos siguientes:

Máquina A 4 79 4 42 48 38 44 49 5 37
0 7 0
Máquina B 4 41 3 40 38 42 43 37 3 41
0 9 8

Si se sabe que el tiempo de producción en cada una de las máquinas sigue una
distribución normal, ¿se podría concluir que las variabilidades de los tiempos de
producción de A y B son iguales? Considere el nivel de significación del 5%.

51. Al
Señor Juan Pérez le han ofrecido invertir en dos carteras de acciones A y B, las
que prometen ser rentables, pero este señor solo tiene capital para invertir en una
de las carteras y debe decidir en cuál de ellas invertirá. Al investigar en busca de
información encontró que la mayoría de empresarios considera que invertir en la
cartera A implica un menor riesgo, como el Sr. Juan Pérez quiere tener mayor
evidencia que le permita decidir, selecciona una muestra de ocho empresarios que
invirtieron en la cartera A y encontró un promedio de rentabilidad de $1 560 y una
desviación estándar de $180 y en otra muestra independiente de 10 empresarios
que invirtieron en la cartera B encontró una rentabilidad promedio de $1 515 y una
desviación estándar de $263, en ambos casos la rentabilidad tiene una distribución
normal. En base a esta información, con un nivel de significancia del 5% y
considerando que una de las características notables del Sr. Juan Pérez es su
actitud adversa al riesgo, plantee y resuelva adecuadamente y luego indique cual
será la decisión del Sr. Juan Pérez.

PRUEBA DE HIPÓTESIS DE DIFERENCIAS DE MEDIAS POBACIONALES


(µ1 - µ2)

52. S
e piensa que en el espesor de una película de plástico (en mili pulgadas) que se
coloca en un material de sustrato influye la temperatura a la que se aplica el
recubrimiento. Se lleva a cabo un experimento totalmente aleatorizado. Once
sustratos se recubren a 125 °F, dando como resultado un espesor medio muestral
del recubrimiento de 103.5°F y una desviación estándar de 10.2°F. Otros 13
sustratos se recubren a 150°F para los que se observa una media de 99.7°F y una
desviación estándar de 20.1°F. Se creía al principio que con el incremento de la
temperatura del proceso se reducirá el espesor medio del recubrimiento.
a. Defina claramente el o los parámetros que están involucrados en esta prueba.
b. Realice la prueba de hipótesis correspondiente ¿Qué se puede concluir con
respecto al espesor promedio luego de realizada la prueba? Use un  = 0,05.

17
Se considerará válida la solución si se indican claramente las hipótesis y el criterio
de decisión utilizado. Como información adicional para el desarrollo de este
problema se tiene la siguiente corrida del programa MINITAB:

Prueba para la igualdad de varianzas

Prueba F (normal distribution)


Estadístico de prueba = 0,26, p-valor = 0,039

53. El
gerente de marketing de una compañía desea determinar si un nuevo envase
podría aumentar las ventas de su producto. Para probar la factibilidad de la nueva
forma de envase se seleccionó una muestra de 18 tiendas similares y se asignaron,
en forma aleatoria, 10 de ellas como mercado de prueba de la nueva forma de
envase, en tanto que las otras ocho continuarían recibiendo el envase antiguo. Las
ventas semanales durante el tiempo de estudio fueron las siguientes:

Medidas de resumen Envase nuevo Envase antiguo


Tamaño de muestra 10 tiendas 8 tiendas
Venta promedio 130 cajas 118 cajas
Desviación estándar de las ventas 10 cajas 12 cajas

Si se sabe que el nivel de ventas con el envase nuevo y con el envase antiguo se
comporta según una distribución normal y que las muestras tomadas son
independientes. Con un nivel de significancia del 5%, ¿se tiene evidencia de que la
nueva forma de envase dio como resultado un mayor nivel de ventas?

54. C
on la finalidad de comparar los costos promedios de producción de dos artículos A
y B, cuyas distribuciones son normales, se tomaron dos muestras aleatorias
independientes y se procesaron en el programa MINITAB, los resultados obtenidos
se muestran a continuación:

Two-Sample T-Test and CI

Sample N Mean StDev SE Mean


1 10 4,58 1,46 0,46
2 8 5,05 1,32 0,47

Difference = μ (1) - μ (2)


Estimate for difference: -0.470
95% CI for difference: (-1,878; 0,938)
T-Test of difference = 0 (vs ≠): T-Value = -0,71 P-Value = 0,489 DF = 16

18
Con un 5% de significancia, ¿se puede concluir que los costos promedios de
producción de ambos artículos son iguales? Se asume que los costos de
producción siguen una distribución normal y las varianzas son homogéneas.

55. S
e supone que la duración en horas de pilas eléctricas para calculadoras de
escritorio tiene una distribución normal. Un fabricante desea comparar la
durabilidad de las pilas producidas por los proveedores A y B. Para ello prueba una
muestra aleatoria de 14 pilas de cada marca hasta el agotamiento. Los datos
obtenidos fueron procesados con el programa MINITAB, y algunos de los
resultados se muestran en el recuadro adjunto, en base a esta información y
utilizando las pruebas correspondientes responda las siguientes preguntas:

19
a. El gerente de la fábrica B afirma que las pilas que producen tienen un promedio
de duración mayor al de las pilas producidas por la fábrica A. En base a la
información muestral presentada, ¿se puede confirmar la afirmación del
gerente? Utilice α = 5%.

b. El gerente de producción de la fábrica B indica que la desviación estándar de la


duración de las pilas que fabrican supera las 35 horas y por lo tanto se debe
detener el proceso para realizar los reajustes necesarios. Si se utiliza un 5% de
significancia, ¿se puede concluir que el gerente de producción tiene razón, y
que por lo tanto se debe de detener el proceso?
c. Con respecto a las hipótesis planteadas en el inciso b., ¿cuál es la probabilidad
de que se decida no detener el proceso, cuando en realidad la desviación
estándar es de 38.5 horas?

56. La
tabla siguiente resume algunos datos de un experimento realizado para estudiar
varias características de tornillos de anclaje, puesto que la empresa “Ferrito” desea
realizar la compra de un lote de estos tornillos:

Diámetro de Tamaño de la Resistencia promedio Desviación


tornillo muestra (kilo/ libra) Estándar
3/8 15 4.25 1.30
1/2 14 7.14 1.68

a. Un aspecto importante es la homogeneidad en cuanto a la resistencia de estas


dos marcas de tornillos, se puede concluir, en base a la información mostrada:
¿Las resistencias de los tornillos de ambos diámetros son homogéneas? Use
un nivel de significancia  = 0.05
b. Realice una prueba, con un  = 0.05 para decidir si el verdadero promedio de
resistencia para tornillos de media pulgada excede a la resistencia promedio de
los tornillos de 3/8 pulgadas.

57. E
n la siguiente tabla se muestran los datos obtenidos al tomar una muestra de 23
establecimientos y medir el nivel de ventas de dos productos A y B (en miles de
soles por semana) de acuerdo al tipo de establecimiento en el que se expenden
(Botica o Bodega):

Tipo de
Producto A Producto B
establecimiento
Bodega 2.5; 3.0; 4.3; 5.1; 4.5; 3.8; 4,2 3.5; 4.3; 5.3; 7.1; 6.5
Farmacia 4.6; 5.3; 6.7; 8.1; 7.9 5.4; 6.5; 8.1; 6.9; 7.3; 8.6

20
a. ¿Se puede decir que el nivel de ventas promedio del producto B es mayor al
nivel de ventas del producto A? Utilice un nivel de significancia del 5%.
b. Considerando ambos productos, y con un 5% de significancia, ¿se puede
afirmar que el nivel de ventas promedio en bodegas es igual al nivel de ventas
promedio en farmacia?
c. El gerente de producción afirma que el nivel de ventas promedio del producto B
es de 7,5 miles de soles semanales por lo que recomienda tomar las medidas
del caso con la finalidad de incrementar el consumo de dicho producto. Con un
5% de significancia, ¿se puede aceptar la recomendación del gerente de
producción?
d. Si la desviación estándar en el nivel de ventas del producto B es de 4 mil soles
o más se tendrá que tomar las medidas necesarias para homogenizar estos
niveles de venta. Tomando en cuenta los resultados observados en la muestra
y utilizando un 2,5% de significancia. ¿Considera que es necesario tomar
dichas medidas?

58. La
siguiente información representa los datos obtenidos en una muestra aleatoria de
tiempos utilizados en la fabricación de un determinado artículo. La empresa que los
fabrica tiene dos líneas de producción, en dos turnos diferentes (el tiempo está en
minutos). Las muestras del cada uno de los turnos y de cada una de las líneas de
producción fueron extraídas aleatoriamente y en forma independiente.

Turno Línea A Línea B


Mañana 2.5; 3.0; 4.3; 5.1; 4.5 3.5; 4.0; 5.3; 7.1; 6.5
Tarde 4.6; 5.3; 6.7; 8.0 5.0; 6.5; 8.1; 6.9

Plantee las hipótesis correspondientes, responda las siguientes interrogantes:


a. ¿Se puede decir que el promedio de tiempo en el turno de la mañana es
diferente al tiempo promedio en el turno de la tarde? Use un nivel de
significancia del 10%.
b. El gerente de producción afirma que el tiempo promedio de producción en la
Línea A es de 7.5 minutos y por lo tanto se deben realizar reajustes pues es
necesario reducir ese tiempo. Con un 5% de significancia, ¿el gerente tiene la
razón?
c. Si la desviación estándar en el tiempo de producción del proceso B durante el
turno de la mañana es cuatro minutos o más se tendrá que detener el proceso
y reajustar la línea. Con un nivel de significancia de 1%, ¿será necesario el
reajuste?

59. E
n un estudio realizado con la finalidad de explorar la aceptación de una nueva
gaseosa light, según el nivel socioeconómico (NSE) y el grupo de edad del público
consumidor. Se seleccionó una muestra aleatoria de personas mayores de 18 años
y se consultó acerca del gasto mensual aproximado en el consumo de gaseosa, en
soles, de gaseosa tradicional y light. Los resultados obtenidos se muestran en la
siguiente tabla:

21
Cerveza Tradicional
NSE
Jóvenes Adultos
NSE A 50, 64, 56, 52, 65 60, 48, 44, 50
NSE B 40, 48, 43, 40 40, 44, 28

Cerveza Light
NSE
Jóvenes Adultos
NSE A 80, 58, 60 76, 56, 48, 30
NSE B 45, 42, 35 40, 52, 65

En base a esta información responda lo siguiente:


a. Se impulsará una agresiva campaña de publicidad orientada a inducir el
consumo de gaseosa, y esta campaña estará orientada al nivel
socioeconómico (NSE) que muestre un promedio de consumo menor.
Utilizando un 5% de significancia ¿A qué nivel socioeconómico se debería
orientar dicha campaña publicitaria?
b. El gerente de ventas afirma que la nueva gaseosa light ha logrado un buen
nivel de aceptación en el mercado, tanto así que el gasto promedio en este tipo
de gaseosa es igual al gasto promedio en el consumo de la gaseosa
tradicional. Utilizando un nivel de significancia del 5% ¿Qué puede decir con
respecto a la afirmación hecha por el gerente de ventas?
c. En general se puede afirmar que ambos grupos de edad tienen el mismo gasto
promedio en el consumo de gaseosa utilice un 5% de significancia.
d. Lo afirmado en el inciso c) también se cumple cuando se especifica el tipo de
gaseosa, es decir se cumple tanto en el consumo de la gaseosa tradicional
como en el consumo de la gaseosa light. Utilice un 5% de significancia.

PRUEBA DE HIPÓTESIS DE DIFERENCIAS DE MEDIAS POBACIONALES


CON DOS MUESTRAS RELACIONADAS (µ1 - µ2)

60. Lo
s siguientes datos representan las calificaciones obtenidas en los exámenes de
medio semestre y de finales de semestre tomados de una muestra aleatoria de los
exámenes de 11 estudiantes del curso de Estadística II. Ambos exámenes tuvieron
una duración de dos horas y el examen final cubría el material visto después de la

22
aplicación del examen de medio semestre. Se sabe que las notas tienen una
distribución normal.

N° 1 2 3 4 5 6 7 8 9 10 11
8
EP 80 82 47 75 69 83 73 55 70 81
0
8
EF 81 85 40 75 79 91 72 66 76 79
3

¿Existe evidencia de un aumento en el desempeño de los estudiantes en la


segunda mitad del semestre? Utilice un  = 0,05.

61. U
n analista de sistemas está estudiando la posibilidad de usar un nuevo sistema de
cómputo, y decide que cambiará de sistema si tiene evidencia de que el nuevo
sistema utiliza menos tiempo en el procesamiento, para esto toma una muestra de
siete trabajos y se los encarga a siete trabajadores elegidos al azar, estos
trabajadores realizan dicho trabajo utilizando el nuevo sistema y utilizando al
sistema antiguo, los tiempos utilizados (en minutos) en cada caso fueron los
siguientes:

Trabajo 1 2 3 4 5 6 7
Sistema antiguo 8 4 10 9 8 7 12
Sistema nuevo 6 3 7 8 5 8 9

Además, se supone que los tiempos tienen distribución normal y con un nivel de
significancia del 5%. ¿Qué decidirá el analista de sistemas?

62. E
n una empresa de software se está investigando la eficiencia de dos lenguajes
diferentes para mejorar la rapidez de programación, actualmente utiliza el lenguaje
de programación 1. A doce programadores, familiarizados con ambos lenguajes, se
les pide que programen un cierto algoritmo en ambos lenguajes, y se anota el
tiempo que tardan, produciendo los siguientes datos en minutos:

Programador 1 2 3 4 5 6 7 8 9 10 11 12
2
Lenguaje 1 17 16 14 18 24 16 14 21 23 13 18
1
1
Lenguaje 2 18 14 11 23 21 10 13 19 24 15 20
9

Con base en estos datos, y suponiendo que el tiempo de programación en ambos


casos tienen una distribución normal, responda lo siguiente:

23
a. Defina en forma clara los parámetros involucrados en esta prueba.
b. Con un nivel de significancia del 2,5%, ¿cuál será la conclusión en la empresa?
c. Defina en los términos de este problema el Error Tipo I y el Error tipo II.

63. S
e desea determinar si un curso de capacitación a los operarios de cierto tipo de
maquinaria ha permitido que estos logren aumentar el número de unidades
producidas por hora. Para comprobar esto se seleccionaron 12 trabajadores y se
determinó el número de unidades producidas antes del curso y luego del curso de
capacitación, los resultados se muestran en la siguiente tabla.

Vendedor 1 2 3 4 5 6 7 8 9 10 11 12
2
Antes 18 23 20 10 5 30 25 34 40 15 14
7
2
Después 24 28 30 18 15 29 25 35 38 21 25
6

Si se considera que el número de unidades producidas se comporta según una


distribución normal y en base a estos datos, ¿se puede afirmar que el curso de
capacitación fue efectivo, utilizar un nivel de significancia del 5%?

PRUEBA DE HIPÓTESIS DE DIFERENCIAS DE PROPORCIONES


POBLACIONALES ( π 1 - π 2)

64. U
na fábrica produce dos tipos de productos en dos turnos diferentes y se desea
observar el número de productos defectuosos en ambos turnos. Para esto se
toman dos muestras independientes, una de cada turno de trabajo, y se determinó
la cantidad de artículos defectuosos y el tipo de producto producido, los resultados
se muestran en la siguiente tabla:

Producto A Producto B
Turno
Defectuosos Buenos Defectuosos Buenos
Mañana 20 200 50 300
Tarde 5 150 25 200

a. Con un nivel de significancia de 5%, ¿se puede afirmar que en el turno de la


tarde se producen artículos con un menor porcentaje de unidades defectuosas
que en el turno de la mañana?

24
b. Con un nivel de significancia de 5%, ¿se puede afirmar que, en el turno de
tarde, la proporción de productos defectuosos del producto B es mayor que la
proporción de productos defectuosos del turno de la mañana en más de 0.04?

65. E
n la actualidad, la aseguradora de fondo de pensiones AFP “NEPTUNO” cuenta
con afiliados que hacen sus aportaciones con regularidad. En una muestra tomada
de los últimos aportes realizados por 850 afiliados durante el último trimestre, se
obtuvo el promedio de aportaciones trimestrales $480 y una desviación estándar
$225, además se encontró que 600 de los afiliados seleccionados hicieron
aportaciones superiores a los $1 250.

a. Se puede afirmar, con un 5% de significancia, que el promedio de aportaciones


de los afiliados de la AFP Neptuno, es superior a los 465 dólares trimestrales.
b. En un mismo período y basado en una muestra de 1200 afiliados, la
competencia más cercana, AFP Venus indica que 778 afiliados hicieron
aportaciones superiores a los $1250 trimestrales. ¿Esta información evidencia
que, en la AFP Neptuno, el porcentaje de afiliados con aportaciones superiores
a los $1 250 supera los de la AFP Venus en más de 2,5%? Utilice un nivel de
significancia del 8%.

66. Ci
erta compañía comercializa sus productos mediante catálogos y ventas puerta por
puerta. Esta compañía ha decidido comprobar la eficacia de una campaña de TV,
para lo cual selecciona dos territorios semejantes. Uno recibió campaña por TV y
en la otra no. El porcentaje de visitas con éxito en el territorio con campaña fue de
18%, mientras que en el otro territorio (sin campaña) fue 14%. Se hicieron 900
visitas en cada territorio. Para justificar el costo de la campaña se requiere más de
3% de aumento en la proporción de visitas con éxito. ¿Dan estos datos pruebas de
que la campaña por TV se justifica? Utilice un nivel de significancia del 5%.

67. S
e entrevistó a 900 personas y se les preguntó acerca de su preferencia con
respecto a tres tipos de programas de televisión, los entrevistados se clasificaron
de acuerdo al distrito donde residían y de acuerdo al grupo de edad. Los resultados
fueron los siguientes:

Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5

25
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

Se desea lanzar al aire un novedoso programa Cómico, y se realizará este


lanzamiento si:
a. Se tiene evidencia de que, en la población adulta, considerando los tres
distritos en conjunto, el porcentaje de personas que prefieren programas
cómicos es mayor al porcentaje de personas que prefieren un programa
deportivo. Use un α = 0,025 ¿Cuál será la decisión al respecto?
b. Se tiene evidencia de que, en la población adulta, considerando los tres
distritos en conjunto, el porcentaje de personas que prefieren programas
cómicos es mayor al porcentaje de personas que prefieren un programa
musical. Use un α = 0,025 ¿Cuál será la decisión al respecto?

68. El
jefe de ventas de una gran cadena de tiendas debe decidir entre dos cursos
similares de capacitación para sus vendedores. Para esto decide comprobar la
eficacia de los cursos tomando una muestra de 350 vendedores para el curso A y
otra muestra de 400 vendedores para el curso B. Al final de cada curso, el 82% de
los vendedores mejoraron significativamente su desempeño con el curso A,
mientras que; con el curso B, el 74% de los vendedores mejoraron
significativamente su desempeño. Como el curso A es más costoso decidirá enviar
a sus vendedores a dicho curso siempre y cuando el porcentaje de vendedores que
mejoran significativamente su desempeño supere en más de 6% al porcentaje de
vendedores que mejoran significativamente su desempeño y que recibieron el
curso B. Utilizando un  = 0.05, ¿cuál será la decisión del jefe de ventas de esta
cadena de tiendas?

69. U
n funcionario de una universidad quiere comparar la preferencia sobre la modalidad
de estudios en alumnos de postgrado según el ciclo que están cursando. Para ello,
seleccionó dos muestras de alumnos que cursan el primer ciclo y el tercer ciclo A
cada uno de ellos se le preguntó sobre la modalidad que prefieren llevar el ciclo de
estudio. Los resultados se resumieron en la siguiente tabla:

Modalidad de estudio
Ciclo Total
Presencial Virtual
Primer 65 185 250
Tercer 55 125 180

26
a. Con un nivel de significancia de 5%, ¿existe evidencia estadística para concluir que
la proporción de alumnos del primer ciclo que prefieren la modalidad virtual es mayor
a los estudiantes del tercer ciclo que prefieren la modalidad virtual en más de 1.5%?
b. Con un nivel de significancia de 5%, ¿se puede afirmar que la proporción de
alumnos del primer ciclo que prefieren la modalidad virtual es mayor a la proporción
de alumnos del tercer ciclo que prefieren la modalidad virtual?

ANÁLISIS DE VARIANZA PARA UN FACTOR-COMPARACIONES TUKEY

70. C
on la finalidad de comparar los precios del producto “Escaso A1” se llevó a cabo un
experimento en tres zonas de Lima: Cono Sur, Cono Norte y Lima Centro. En cada
una de dichas zonas se tomaron muestras aleatorias de seis tiendas más grandes
y se consultó acerca del precio de dicho producto, los resultados se muestran en la
siguiente tabla:
Precios del Producto escaso “A1”
ZONAS
Lima Centro Cono Norte Cono Sur
32 27 30
31 27 30
33 30 31
30 28 27
30 27 29
30 28 28

a) Al nivel de significación del 5%, ¿existe suficiente evidencia que indique una
diferencia en el precio promedio del producto escaso A1 en las tiendas de las tres
zonas de Lima?
b) Si fuera necesario, realice las comparaciones múltiples de Tukey.

Comparaciones en parejas de Tukey


Agrupar información utilizando el método de Tukey y una confianza
de 95%

Zona N Media Agrupación


Lima centro 6 31,000 A
Cono sur 6 29,167 A B
Cono norte 6 27,833 B

71. El
jefe de producción de una fábrica desea determinar si las cuatro máquinas que
tiene utilizan el mismo tiempo promedio en la fabricación de un artículo. Para esto

27
selecciona muestras aleatorias de cada máquina de tamaños n 1 = 6, n2 = 4, n3 = 4 y
n4 = 6 respectivamente, midiendo el tiempo que utilizan en la fabricación de un
artículo. Debido a un descuido de su ayudante la información obtenida se perdió
parcialmente, encontrándose sola la siguiente tabla incompleta:

Fuente de Grados de Suma de Cuadrados


F
variación libertad cuadrados medios
Factor 152,62
Error
Total 542,92

Con esta información, plantee las hipótesis adecuadas y diga cuál será la
conclusión del jefe de producción, interpretando adecuadamente sus resultados.
Use a = 0,05.
72. E
xisten cuatro estaciones de radio. Cada estación toca música rock durante cierto
número de minutos por hora y se desea determinar si el promedio que cada
estación toca esta música, por hora, es el mismo. Para esto se tomó muestras de
10 horas de cada estación y se encontró los siguientes tiempos promedios en los
cuales se toca música rock (en minutos).

x́ 1=51,43 ; x́2 =44,64 ; x́ 3=47,2; x́ 4 =50,85

Además, se sabe que: SCT = 650,75 (suma de cuadrados del total). Aplique la
técnica estadística adecuada y haga un análisis al respecto.

73. Lo
s miembros de un equipo ciclista se dividen al azar en tres grupos que entrenan
con métodos diferentes. El primer grupo realiza largos recorridos a ritmo pausado,
el segundo grupo realiza series cortas de alta intensidad y el tercero trabaja en el
gimnasio con pesas y se ejercita en el pedaleo de alta frecuencia. Después de un
mes de entrenamiento se realiza un test de rendimiento consistente en un recorrido
cronometrado de nueve km. Los tiempos empleados fueron los siguientes:

Método 1 15 16 14 15 17
Método 2 14 13 15 16 14
Método 3 13 12 11 14 11

Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza


de 99%

Método N Media Agrupación


Método 1 5 15,400 A
Método 2 5 14,400 A B

28
Método 3 5 12,200 B
A un nivel de significación del 1%, ¿se puede considerar que los tres métodos
producen resultados equivalentes? O por el contrario ¿existe algún método
superior a los demás?

74. Lo
s siguientes resultados fueron analizados para los tiempos (en minutos) que tardan
en procesar una pieza de cada una de las cuatro máquinas. El fin del estudio es
determinar si hay diferencia en el tiempo promedio de procesamiento. Se
seleccionaron de forma aleatoria e independiente siete piezas de cada una de las
máquinas; además, el gerente de producción tiene evidencia suficiente para asumir
que los tiempos siguen una distribución normal. Determine si se puede considerar
que los tiempos de procesamiento de utiliza cada máquina no son iguales,
utilizando un nivel de significancia del 5% y además si esto es cierto ¿qué máquina
recomendaría utilizar?

ANOVA unidireccional: Máquina 1; Máquina 2; Máquina 3; Máquina4

Fuente GL SC MC F
Factor 3 12,107 4,036 10,59
Error 24 9,144 0,381
Total 27 21,251

Comparaciones en parejas de Tukey

Nivel N Media Agrupación


Máquina 1 7 4,1429 A
Máquina 2 7 2,4286 B
Máquina 3 7 3,5714 A C
Máquina 4 7 2,8571 B C

75. U
na lista de palabras sin sentido se presenta en la pantalla del ordenador con cuatro
procedimientos diferentes (A, B, C Y D), asignados al azar a un grupo de sujetos.
Posteriormente se les realiza una prueba de recuerdo de dichas palabras,
obteniéndose los siguientes resultados:

A 5 7 6 3 9 7 4
B 9 11 8 7 7 4 4
C 8 6 9 5 7 4 5
D 1 3 4 5 1 2 3

29
Comparaciones en parejas de Tukey

Agrupar información utilizando el método de Tukey y una confianza


de 97.5%

Procedimiento N Media Agrupación


PROC B 7 7,143 A
PROC C 7 6,286 A
PROC A 7 5,857 A B
PROC D 7 2,714 B

a. ¿Qué conclusiones pueden sacarse acerca de las cuatro formas de


presentación, con un nivel de significación del 2,5%?
b. Realice un análisis más extenso con ayuda de la siguiente salida
proporcionada por el MINITAB.

PRUEBA DE INDEPENDENCIA DE DOS VARIABLES CUALITATIVAS

76. U
na socióloga estuvo investigando esta cuestión: ¿existe alguna relación entre el
nivel de Instrucción alcanzado y el nivel de actividad social de una persona?
Decidió manejar tres niveles de Instrucción: primaria, secundaria y universitaria o
más. Cada persona llevó un registro de sus actividades sociales, como jugar
boliche en grupo, asistir a bailes, eventos sociales, ceremonias religiosas, etc. La
socióloga los dividió en actividad social inferior al promedio, actividad social
promedio y actividad social superior al promedio. Los resultados de su muestra se
dan en la siguiente tabla:

Actividad Social
Nivel de
Superior al Inferior al
Educación Promedio
promedio promedio
Universitaria 20 10 10
Secundaria 30 50 80
Primaria 10 60 130

a. ¿Cuál será la conclusión de esta socióloga, en base a esta muestra aleatoria y


un 5% de significación?
b. Calcule e interprete el grado de importancia de la relación encontrada.

77. E
xiste la controversia de que un estudiante universitario de las especialidades de
letras, ingeniería o ciencias básicas logra un mejor rendimiento académico en los
últimos ciclos. Un especialista en educación de una universidad realizó un estudio

30
para verificar la controversia y seleccionó una muestra aleatoria de estudiantes que
cursan los últimos ciclos (del séptimo ciclo a más). Los resultados se muestran en
cuadro adjunto:

Fila: Tipo de especialidad Columna: Rendimiento académico

Bueno Malo Regular Total


Ciencias básicas ___ 95 100 320
Ingeniería 220 ___ 310 630
Letras 150 50 ___ 400
Total 495 245 610 1350

a. Al nivel de significancia del 2,5%, ¿se puede inferir que existe relación entre el
tipo de especialidad y el rendimiento académico en los últimos ciclos?
b. Con lo obtenido en la parte a., ¿se puede afirmar que la relación encontrada
entre ambas variables es fuerte?

78. U
n editor de periódicos trata de determinar las características del mercado de su
periódico. Se pregunta si la costumbre de la gente de la comunidad de leer diarios
está relacionada con el nivel educativo de los lectores. Aplica una encuesta a los
adultos del área referente a su nivel educativo y la frecuencia con que leen el
periódico. Los resultados se muestran en la siguiente tabla:

Fila: Frecuencia con que leen el periódico


Columna: Nivel educativo de los lectores

Frec. Profesional Superior Terminó No terminó


leer o posgrado no Univ. Secundaria Secundaria Total
1 …… 17 11 21 59
2 12 23 ……………… 5 48
3 35 38 16 ……………… 96
4 28 ……………… 6 13 66
Total 85 97 41 46 269

a. Plantee y resuelva las hipótesis correspondientes, indicando claramente cuál


será la conclusión a la que llega el editor de periódicos. Use un nivel de
significación del 5%.
b. Calcule e interprete el grado de importancia de la relación encontrada.

79. S
e entrevistó a 900 personas y se les preguntó acerca de su preferencia con
respecto a tres programas de televisión, los entrevistados se clasificaron de

31
acuerdo al distrito donde residían, de acuerdo al grupo de edad y el tipo de
programa de su preferencia. Los resultados se muestran en la siguiente tabla:

Tipo de Programa
Distrito Grupo de edad
Cómico Deportivo Musical
Adolescentes 40 50 20
Distrito A Jóvenes 45 30 60
Adultos 55 20 15
Adolescentes 35 60 15
Distrito B Jóvenes 30 40 40
Adultos 105 15 5
Adolescentes 25 40 15
Distrito C Jóvenes 25 30 20
Adultos 40 15 10

a. Usando un 5% de significancia se puede decir que el grupo de edad no influye


en el tipo de programa que prefiere la persona.
b. Calcule e interprete el grado de importancia de la relación encontrada.

80. El
rector de una universidad quiere determinar si existe relación entre el área de
interés de cada estudiante y su preferencia por algún sistema de calificación
(Aprobado-reprobado, Sistema vigesimal: 0 – 20, Sistema porcentual: 0% - 100%).
Para ello, realiza una encuesta seleccionando a 500 estudiantes de las tres áreas
de interés. Se preguntó a cada estudiante cuál de los tres sistemas de calificación
prefieren. Los resultados aparecen en la siguiente tabla:

Filas: Área de interés Columnas: Sistema de calificación

Aprobado_ Sistema Sistema


desaprobado porcentual vigesimal Total
Artes y ciencias 24 58 118 200
Bellas artes 26 19 55 100
Ingeniería 20 68 112 200
Total 70 145 285 500

a. ¿Qué prueba de hipótesis realizaría? ¿Por qué?


b. Con un niel de significancia de 0,10, ¿existe relación entre el área de interés de
cada estudiante y su preferencia por algún sistema de calificación?
c. Calcule e interprete el grado de importancia de la relación encontrada.

PRUEBA DE BONDAD DE AJUSTE: DISTRIBUCIÓN DE POISSON

32
81. S
e afirma que el número de errores que comete una secretaria al transcribir un
documento es una variable aleatoria que tiene una distribución de Poisson con
media de tres errores por trascripción. Se revisó 440 transcripciones hechas por
ella y se obtuvo los siguientes resultados: Realice la prueba con un α = 0,01.

N° de errores 0 1 2 3 4 5 6 7 ≥8
Frecuencia 18 53 103 107 82 46 18 10 3

82. El
responsable de servicio de mantenimiento de una empresa de transporte, quien
lleva el control desde los inicios de creación de la empresa, afirma que el número
de vehículos que necesitan reparación en un día, sigue una distribución de
Poisson. Se hace estadísticas de 200 días sobre el número de vehículos que
necesitan reparación, los resultados fueron:

N° de días 54 70 50 21 4 1
N° de vehículos 0 1 2 3 4 5 o más

Realice la prueba necesaria para corroborar esta afirmación. Use un  = 0,1.

83. El
jefe del área de Estadística e Informática de la municipalidad de Lima Metropolitana
cree que el número de accidentes automovilísticos diarios en el cruce de la Av.
Javier Prado y La Molina presenta una distribución de Poisson con un promedio de
un accidente diario. Para ello, seleccionó una muestra de 80 días y se obtuvo los
resultados en el siguiente gráfico de líneas:

Figura. Número de accidentes automovilísticos

Con un 1% de significancia, ¿se puede concluir que la afirmación del jefe del área
de Estadística es correcta?

33
PRUEBA DE BONDAD DE AJUSTE: DISTRIBUCIÓN BINOMIAL

84. La
solicitud de préstamo que presentan los clientes de un banco está compuesta por
cuatro rubros. El gerente de préstamos desea realizar un estudio sobre la
distribución de la cantidad de rubros que son rechazados por cada solicitud, para
esto toma una muestra de 60 solicitudes, obteniéndose los siguientes resultados:

N° de rubros rechazados 0 1 2 3 4
N° de solicitudes 20 15 7 10 8

¿Se puede afirmar que el número de rubros rechazados sigue una distribución
binomial con probabilidad igual a 0,4? Use un  = 0,01.

85. U
n psicólogo clínico visita a ocho pacientes por día. El psicólogo cree que el número
de pacientes atendidos con depresión leve es una variable aleatoria con
distribución binomial y se sabe que el 30% de los pacientes presentan este
problema. Para ello, registra el número de pacientes atendidos con depresión leve
por un periodo de 100 días. Los resultados se muestran en el siguiente gráfico de
líneas:

Figura. Número de pacientes atendidos

Además, la atención de los pacientes se realiza de manera independiente.

34
a. Indique y clasifique la variable de estudio.
b. Con un 1% de significancia, ¿se puede concluir que la afirmación del psicólogo es
correcta?

PRUEBA DE BONDAD DE AJUSTE: OTRAS DISTRIBUCIONES

86. El
área de Matemática, basándose en informaciones de semestres anteriores sabe
que, el 43% de los alumnos aprobaron todas las materias inscritas, un 30% aprobó
la mitad, un 12% reprobó todas las materias y un 15% se retiró. Al final de este
semestre el coordinador selecciono a 400 alumnos y encontró que: 195 aprobaron
todas las asignaturas, 136 aprobaron la mitad, 41 reprobaron todas las asignaturas
y 28 se retiraron. ¿Podemos concluir, a raíz de los resultados, que en el último
semestre varió la estructura de los cursos aprobado y retirados con respecto a los
semestres anteriores? Use un α = 0.05.

87. U
n egresado de la especialidad de Marketing es contratado por una empresa para
evaluar la distribución de ventas de gaseosa en la temporada de invierno. Según
sus estimaciones, considera los principales distritos a los cuales se distribuye la
gaseosa tienen los siguientes porcentajes de ventas:

Distrito A B C D E
Porcentaje 21 18 30 17 14

Usted, quiere verificar estadísticamente ésta afirmación y decide que una forma de
verificar la anterior hipótesis propuesta es seleccionando una muestra de las ventas
realizadas en los últimos tres meses (en miles de unidades) y obtiene lo siguiente:

Distrito A B C D E
Ventas realizadas 54 61 83 46 56

35
¿Qué conclusión obtiene según sus conocimientos de estadística? Use a = 0,025.

88. El
gerente de una planta industrial pretende determinar si el número de empleados
que asisten al consultorio médico de la planta se encuentra distribuido, en forma
equitativa, durante los cinco días de trabajo de la semana. Con base en una
muestra aleatoria de cuatro semanas completas de trabajo, se observó el siguiente
número de consultas:

Lunes Martes Miércoles Jueves Viernes


49 35 32 39 45
Con un nivel de significación del 5%, ¿existe alguna razón para creer que el número
de empleados que asisten al consultorio médico, no se encuentra distribuido en
forma equitativa durante los días de trabajo de la semana?

89. El
gerente de un banco afirma que los motivos de préstamos personales para auto,
casa y viaje están en la relación 4:2:1. Para corroborar su afirmación selecciona
aleatoriamente a 140 clientes que se les otorga un crédito y los clasifica en la
siguiente tabla:

Motivo del préstamo Auto Casa Viaje


Nº de clientes 90 35 15

Estos datos corroboran la afirmación del gerente del banco. Use un  = 0,1.

90. U
na compañía de seguros desea establecer el pago de la prima a cobrar por
asegurar un determinado modelo de auto. La información que tienen y que fue
obtenida en un estudio realizado al año pasado indica que el 30% de clientes
asegurados tienen un accidente, y que cuando este ocurre el accidente puede
considerarse leve el 60% de las veces, se puede considerar que el accidente es de
medianas proporciones el 30% de las veces y un accidente se considera grave el
10% de las veces. Para determinar si los resultados del estudio realizado el año
pasado aún permanecen vigentes se toma una muestra aleatoria de asegurados de
la compañía y se encontró los siguientes resultados:

Accidente de
Condición del No tiene Accidente Accidente
medianas
Asegurado Accidente Leve Grave
proporciones
Número de veces 198 47 37 18

36
Determine si se puede tener en cuenta los resultados del estudio realizados el año
pasado para poder determinar el monto de la prima que debe cobrar. Justifique e
intérprete adecuadamente sus resultados. Utilice un nivel de significación el 2,5%.

91. U
n distribuidor de revistas, que salen semanalmente, ha determinado que el número
de unidades excedentes por cada punto de venta a la semana (es decir el número
de diarios que no logra vender y por lo tanto debe de devolverlos) tiene un
comportamiento aleatorio que puede ser representado por la siguiente función de
probabilidad; donde, x: representa el número de unidades excedentes por cada
punto de venta.
P ( X=x )=k x2 ; x=1,2,3,4,5

Para una nueva temporada que se iniciará en breve, y con la finalidad de planificar
sus pedidos, este comerciante desea determinar si el comportamiento aleatorio de
las unidades excedentes continúa siendo la misma, para lo cual toma una muestra
aleatoria de 900 puntos de venta en la ciudad de Lima y encontró los siguientes
resultados:

Unidades Excedentes 1 2 3 4 5
Puntos de ventas 20 60 150 250 420

Con estos datos y usando un  = 0,05. ¿Se puede concluir que el comportamiento
aleatorio en cuanto a las unidades excedentes aún continúa siendo determinado por
dicha distribución de probabilidad?

92. U
n comerciante vende minicomponentes, luego de una campaña de publicidad, el
comerciante cree que el número de minicomponentes que vende por día es una
variable aleatoria que se comporta según la siguiente función de probabilidad:

3x
P ( X=x )= ; x=0,1,2,3 , …
( 20,086 ) x !

Para comprobar esto, toma una muestra aleatoria de 120 días y observa el número
de minicomponentes vendidos, los resultados se muestran en la siguiente tabla:

N° de minicomponentes vendidos 0 1 2 3 4 ≥5
N° de días 7 12 30 24 26 21

Con un nivel de significancia del 5% ¿A qué conclusiones llega este comerciante?

37
PRUEBA DE BONDAD DE AJUSTE: DISTRIBUCIÓN NORMAL

93. U
n atleta efectúa 150 lanzamientos de disco durante una semana de práctica. En la
siguiente Tabla se muestran las distancias logradas en sus lanzamientos (en pies).

Distancia: X Número de Lanzamientos


x £ 61 18
61 < x £ 63 30
63 < x £ 65 60
65 < x < 67 37
x ³ 67 5

Si se utiliza un nivel de significación del a = 0.01, ¿se puede tener evidencia


suficiente como para afirmar que las distancias a las cuales lanza el disco, se
comportan como una distribución normal con promedio m = 63 pies y desviación
estándar s = 2 pies?

94. El
gerente de un banco efectúa 150 solicitudes de crédito hipotecario durante una
semana. En la siguiente tabla se muestran los montos de los créditos hipotecarios
solicitados (en miles de dólares).

Monto de los créditos


Número de solicitudes
hipotecarios
x £ 75 18
75 < x £ 80 30
80 < x £ 85 60
85 < x < 90 37
x ³ 90 5

Si se utiliza un nivel de significación del a = 0.05, ¿se puede tener evidencia


suficiente como para afirmar que los montos de los créditos hipotecarios, se
comportan como una distribución normal con promedio m = 85 miles de dólares y
desviación estándar s = 5 miles de dólares?

95. E
n la siguiente tabla se presenta la distribución de los datos sobre demanda de
teléfonos celulares (en millones de unidades) en una compañía telefónica durante
60 meses.

38
Demanda de
X< 5 [5 – 9> [9 – 13> [13 – 17> [17 – 21> X ≥ 21
celulares
Número de
4 8 13 21 9 5
meses

Al nivel de 5% de significancia, ¿se puede considerar que la demanda de teléfonos


celulares vendidos se ajusta a una distribución normal, si se sabe que la demanda
promedio y la desviación estándar es 15.5 y 5.2 millones de unidades
respectivamente?

CORRELACIÓN LINEAL

96. El
administrador del área de préstamo de una entidad bancaria quiere determinar la
relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de seis
clientes y se obtuvo los siguientes resultados:

Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0


Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35

a. Defina la variable respuesta y la variable predictora.


b. Realice el diagrama de dispersión, e interprételo.
c. Calcule e interprete la covarianza.
d. Calcule e interprete el coeficiente de correlación de Pearson.

97. E
n ocasiones es conveniente comprar la mayor cantidad posible de ciertos artículos.
Por lo general el precio unitario (en dólares) es menor al adquirir grandes
cantidades. Para contrastar esta teoría se obtuvieron los siguientes datos:

Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25

a. Defina la variable respuesta y la variable predictora.


b. Calcule e interprete la covarianza.

39
c. Calcule e interprete el coeficiente de correlación de Pearson.

98. La
empresa comercializadora de productos agrícolas ECOPA está interesada en
precisar qué relación existe entre la distancia que una carga de fruta es
transportada por tierra y la cantidad en kilogramos de fruta malograda. Se
obtuvieron los siguientes resultados de un estudio de diez despachos de fruta:

10 10 10 10
∑ X i=765 ∑ X 2 =69225
i
∑ Y i =316 ∑ Y i 2=12128
i =1 ; i=1 ; i=1 ; i=1 ;
10
∑ X i Y i =28605
i=1

a. Defina la variable respuesta y la variable predictora.


b. Calcule e interprete la covarianza.
c. Calcule e interprete el coeficiente de correlación de Pearson.

99. El
gerente de la empresa Carro S.A. dedicada a la compra-venta de vehículos
usados, desea verificar si el precio de venta de este tipo de vehículos (miles de
dólares) está relacionado con el recorrido acumulado (decenas de miles de
kilómetros). Con este fin, se hace un estudio basado en una muestra aleatoria de
vehículos vendidos durante el año 2017 y se obtuvo la siguiente información:

9 9 9
x  10.711; y  6.87;  x i2  1033.52;  y i2  424.8009;  xi yi  662.113
i 1 i 1 i 1

a.Defina la variable respuesta y la variable predictora.


b.Calcule e interprete la covarianza.
c. Calcule e interprete el coeficiente de correlación de Pearson.

REGRESIÓN LINEAL SIMPLE

100. El
administrador del área de préstamo de una entidad bancaria quiere determinar la
relación entre los ingresos mensuales en miles de soles; y ahorros mensuales en
miles de soles, de sus clientes. Para esto, seleccionó una muestra aleatoria de
seis clientes y se obtuvo los siguientes resultados:

40
Ingreso mensual 1.0 1.2 1.5 0.8 1.8 2.0
Ahorro mensual 0.20 0.22 0.25 0.18 0.30 0.35

Con la información dada, se pide:

a. Determine la línea de regresión que permita estimar el ahorro mensual en


función del ingreso mensual. Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
c. ¿Qué porcentaje de la variabilidad del ahorro mensual no está explicado por
el ingreso mensual?
d. Utilice el modelo de regresión lineal desarrollado para estimar el ahorro
mensual si el cliente tiene un ingreso mensual igual a 1750 soles.
e. Con un 95% de confianza, estime el ahorro medio mensual si el cliente tiene
un ingreso mensual igual a 1750 soles.

101. A
continuación, se muestran los gastos en publicidad (en ciento de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados
registrados se seleccionaron aleatoriamente en una muestra de diez semanas.

Regression Analysis: Ventas versus Gasto en publicidad

Analysis of Variance
Source DF SC CM Valor F Valor p
Regression 1 185,66 185,658 30,98 0,001
Error 8 47,94 5,993
Total 9 233,60
Model Summary
S R-sq R-sq(adj) R-sq(pred)
2,44802 79,48% 76,91% 71,95%

Coefficients
Term Coef SE Coef T-Value P-Value VIF
Constant 0,78 2,03 0,39 0,709
Gasto en publicidad 0,914 0,164 5,57 0,001 1,00

a. Determine la línea de regresión que permita estimar las ventas en función del
gasto en publicidad.
b. Interprete el coeficiente de regresión estimado.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión lineal es significativo?
d. ¿Qué porcentaje de la variabilidad del gasto de publicidad está explicado por las
ventas?
e. Con un nivel de confianza de 95%, estime el nivel de ventas que se espera
obtener si se realiza un gasto de 17 mil dólares en publicidad.

41
102. E
n ocasiones es conveniente comprar la mayor cantidad posible de ciertos
artículos. Por lo general el precio unitario (en dólares) es menor al adquirir
grandes cantidades. Para contrastar esta teoría se obtuvieron los siguientes
datos:

Número de unidades 1 3 5 10 12 15 24
Costo unitario 55 52 48 36 32 30 25

Los resultados obtenidos con el MINITAB son los siguientes:


Análisis de varianza
Source Gl SC CM F
Regresión 1 753.22 753.22 44.73
Error 5 84.20 16.84
Total 6 837.43

Medidas de resumen

S = 4.104 R-Sq = 89.9% R-Sq(adj) = 87.9%

Coeficiente

Predictor Coef. SE Coef. T


Constante 53.793 2.615 20.57
N_unidades -1.4079 0.2105 -6.69

Estadístico de Durbin-Watson = 1.08349


Se asume que se cumple el supuesto de normalidad.
a. Con un nivel de significancia de 0.05, ¿se puede afirmar que no existe
autocorrelación entre los errores?
b. Determine la ecuación de regresión lineal simple. Interprete el coeficiente de
regresión estimado.
c. ¿Qué % de la variabilidad en el costo no es explicada por la recta de
regresión?
d. ¿Es la pendiente de la recta diferente de cero significativamente? Use un α =
0.05.
e. Estime, mediante un intervalo de confianza del 95%, el costo promedio
unitario cuando se compran 40 unidades.

103. El
gerente de ventas permite que los agentes vendedores que tiene a su cargo
reciban capacitaciones motivacionales que se dan en diferentes horarios y se
tiene absoluta libertad para elegir el horario que crean conveniente. El gerente
cree que las capacitaciones motivacionales influyen en la eficiencia de las ventas.

42
Para verificar esto, se toma una muestra de 10 vendedores y registró el tiempo
acumulado de horas en las que estuvo presente en una o más capacitaciones
durante el último trimestre y la eficiencia de sus ventas (en porcentaje), los datos
encontrados fueron:

Tiempo acumulado en
27 45 41 19 35 39 19 49 15 31
capacitaciones
Eficiencia en las ventas 47 84 80 46 62 72 52 87 37 68

Los resultados obtenidos en con el MINITAB son los siguientes:

Análisis de Varianza

Variación GL SC CM F P-Value
Regresión 1 2520,5 2520,5 86,91 0,000
Error 8 232,0 29,0
Total 9 2752,5

Medidas de resumen

s = 5,385 R-Sq = 91,6% R-Sq(adj) = 90,5%

Coeficiente

Termino Coef SE Coef T-Value P-Value VIF


Constante 18,06 5,16 3,50 0,008
Tiempo capacitación 1,420 0,152 9,32 0,000 1,00

a. Determine el modelo de regresión lineal. Interprete adecuadamente el


coeficiente de regresión.
b. ¿Se puede afirmar que el modelo de regresión es significativo?
c. El gerente afirma que teniendo 60 horas acumuladas de capacitación
motivacional, la eficiencia promedio de los trabajadores en las ventas es por
lo menos 90%. Con un 99% de confianza, ¿se puede concluir que la
afirmación es correcta?
d. Calcule e interprete el coeficiente de determinación.

104. A
continuación, se muestran los gastos en publicidad (en miles de dólares) y sus
ventas (en miles de artículos) que realiza una empresa. Los resultados
registrados se seleccionaron aleatoriamente en una muestra de diez semanas.

43
Gasto en publicidad 9 7 5 14 15 12 6 10 15 21
Ventas 10 6 5 12 10 15 5 12 17 20

a. Determine la línea de regresión que permita estimar el nivel de ventas en base


al gasto en propaganda. Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.05, ¿existe evidencia estadística para afirmar
que el modelo de regresión lineal es significativo?
c. Construya un intervalo de confianza del 95% para el nivel de ventas promedio
cuando se gasta en propaganda 17 mil dólares.
d. ¿Qué porcentaje de la variación total en la venta es explicada por el modelo de
regresión?

105. El
gerente de una empresa seleccionó al azar diez semanas de funcionamiento y
registró el nivel de ventas (en ciento de dólares) y el precio de venta (en dólares).
Los resultados se dan a continuación:

Semana 1 2 3 4 5 6 7 8 9 10
Precio 1.3 2.0 1.7 1.5 1.6 1.2 1.6 1.4 1.0 1.1
Venta 10 6 5 12 10 15 5 12 17 20

a. Estime la línea de regresión del nivel de ventas en base al precio del artículo.
Interprete el coeficiente de regresión estimado.
b. Con un nivel de significancia de 0.01, ¿existe evidencia estadística para
afirmar que el modelo de regresión lineal es significativo?
c. Estime el nivel de ventas que se espera obtener si el precio del artículo es de
$1.8.
d. Construya un intervalo de confianza del 99% para el nivel de ventas promedio
cuando el precio del artículo es de $1.8. Interprete.
e. ¿Qué porcentaje de la variabilidad del nivel de ventas no es explicado por el
modelo de regresión lineal simple?

106. La
empresa comercializadora de productos agrícolas ECOPA está interesada en
precisar qué relación existe entre la distancia que una carga de fruta es
transportada (por tierra) y la cantidad de fruta malograda, medida en kilogramos
(Y) al llegar a su destino. Se obtuvieron los siguientes resultados de un estudio de
diez despachos de fruta:

10 10 10 10
∑ X i=765 ∑ X i2 =69225 ∑ Y i =316 ∑ Y i 2=12128
i =1 ; i=1 ; i=1 ; i=1 ;
10
∑ X i Y i =28605
i=1

44
a. Ajuste una recta de regresión para determinar la cantidad de fruta malograda en
función de la distancia recorrida. Interprete el coeficiente de regresión estimado.
b. ¿Existe evidencia estadística para afirmar que el ajuste de la recta de regresión
es significativo? Use un α = 0.05.
c. Estime un intervalo de confianza para la cantidad de fruta malograda cuando la
distancia recorrida fue de 95 Kilómetros, utilice un 95% de confianza.
d. Calcule e interprete el coeficiente de determinación.

REGRESIÓN LINEAL MÚLTIPLE

107. U
n distribuidor de helado está estudiando el sistema de reparto de su producto.
Específicamente, el distribuidor está interesado en estimar el tiempo de servicio
en minutos, a un expendio al menudeo. El ingeniero industrial a cargo del estudio
ha sugerido que los dos factores más importantes que intervienen en el tiempo de
reparto son el número de cajas de helados que se entregan y la distancia en miles
de kilómetros, que debe recorrer el repartidor. El ingeniero recopiló una muestra
de 15 servicios de reparto y obtuvo los siguientes resultados en minitab:

Regression Analysis: Tiempo versus N_cajas, Distancia

Analysis of Variance

Source DF Adj SS Adj MS F-Value P-Value


Regression 2 331,36 165,679 16,80 0,000
Error 12 118,37 9,865
Total 14 449,73

Model Summary

S R-sq R-sq(adj) R-sq(pred)


3,14079 73,68% 69,29% 58,46%

Coefficients

Term Coef SE Coef T-Value P-Value VIF


Constant 2.31 5.86 0.39 0.700
N_cajas 0.877 0.153 5.73 0.000 1.20
Distancia 0.456 0.147 3.11 0.009 1.20

Regression Equation

Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Durbin-Watson Statistic = 2.61928

45
Prediction for Tiempo

Regression Equation
Tiempo = 2.31 + 0.877 N_cajas + 0.456 Distancia

Variable Setting
N_cajas 18
Distancia 35

Fit SE Fit 95% CI 95% PI


34.0581 1.30884 (31.2064, 36.9098) (26.6445, 41.4717)

a. Verifique los supuestos para un análisis de regresión lineal múltiple y la


multicolinealidad utilizando el Factor de Inflación de la variable (VIF)
b. Indique el modelo de regresión lineal múltiple. Interprete cada uno de los
coeficientes de regresión.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que las variables
independientes son significativas?
d. ¿Se puede afirmar que el modelo de regresión lineal es significativo? Use un
nivel de significancia de 5%.
e. ¿Qué porcentaje de la variación total del tiempo de reparto no es explicada
por el modelo de regresión?
f. Determine el tiempo promedio de entrega del producto cuando se tienen que
entregar 18 cajas, para lo cual se tiene que recorrer una distancia de 35 km.
Use un nivel de confianza de 95%.

108. S
e desea modelar la producción de los trabajadores de una fábrica en función de
una prueba de aptitud y los años de experiencia. Para realizar este estudio se
seleccionó una muestra de 10 colaboradores y se registró el número de unidades
que había producido por hora (Y), el puntaje que obtenido en una prueba de
aptitud (X1) y los años de experiencia del colaborador (X2).

Análisis de regresión: Y vs. X1; X2

Coeficiente
Término Coef SE Coef T P VIF
Constante -13.825 1.795 -7.70 0.004
X1 0.212 0.013 16.76 0.000 2.77
X2 2.000 0.146 13.73 0.000 2.16

Resumen del modelo


S = 1.298 R-cuad. = 98.8% R-cuad.(ajustado) = 98.4%

Análisis de varianza
Fuente GL SC CM F P
Regresión 2 962.71 481.36 285.80 0.000
Error residual 7 11.79 1.68
Total 9 974.50

46
Estadístico de Durbin - Watson: 1.218

a. Verifique la no multicolinealidad y la no autocorrelación en los residuales. Use


un α = 0.05.
b. Indique el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable años de experiencia del colaborador.
c. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que el
modelo con las dos variables es válido?
d. Con un nivel de significancia de 0.05, ¿existe evidencia para afirmar que las
variables independientes son significativas?
e. Determine e interprete el coeficiente de determinación correspondiente para
este análisis.

109. La
compañía Aceros ha estado buscando los factores que influyen en la cantidad de
acero (en millones de toneladas) que es capaz de vender cada año. La
administración sospecha que los siguientes son los factores principales: La tasa
anual de inflación del país, el precio promedio por tonelada en dólares, mediante
el cual el acero importado acota los precios de la compañía y el número de
automóviles en millones que los fabricantes del país están planeando producir en
ese año. Se han recogido los datos correspondientes a los últimos siete años y se
analizó los datos con el MINITAB obteniéndose los siguientes resultados:

Análisis Regresión: Venta versus Inflación, Importación, Producción

Analysis of Variance

Source Gl SC CM F P
Regression 3 1.6098 0.5366 12.93 0.003
Residual Error 3 0.1245 0.0415
Total 6 1.7343

Resumen del modelo

S = 0.2037 R-Sq = 92.82% R-Sq(adj) = 85.6%

Coeficientes
Término Coef. SE Coef. T P VIF
Constante -0.9146 0.8376 -1.09 0.159
Inflación -0.0873 0.0426 -2.05 0.087 1.89
Importación 0.0408 0.0827 0.49 0.598 2.34
Producción 0.8497 0.1421 5.98 0.001 1.12

a. Verifique los supuestos de multicolinealidad y autocorrelación en los errores.


Use un α = 0,05.
b. Determine el modelo de regresión lineal múltiple. Interprete el coeficiente de
regresión para la variable tasa anual de inflación del país.
c. Con un nivel de significancia de 0,05, ¿al menos una de las variables es
significativa?

47
d. Con un nivel de significancia de 0,05, ¿qué variables deben quedarse en el
modelo?
e. Con lo obtenido en d), plantee el nuevo modelo de regresión lineal.
f. Determine e interprete el coeficiente de determinación ajustado.
110. S
e desea estimar la variable Y en función a otras cuatro variables. Al tomar una
muestra de tamaño 10 se encontró los siguientes resultados con el MINITAB:

Regression Analysis: Y versus X1; X2; X3; X4

Analysis of Variance

Source Gl SC CM F P
Regresión 4 963.52 240.88 109.79 0.000
Error 5 10.97 2.19
Total 9 974.49

Resumen del modelo

S = 1.481 R-Sq = 98.9% R-Sq(adj) = 98.0%

Coeficientes

Predictor Coef SE Coef T P


Constant -15.398 3.289 -4.68 0.003
X1 0.2185 0.0181 12.07 0.000
X2 2.0008 0.1739 11.51 0.000
X3 0.0136 0.0223 0.61 0.268
X4 0.0012 0.0346 0.03 0.158

a. Si se supone que no hay problemas de multicolinealidad. Determine el modelo


de regresión lineal múltiple.
b. Con un 5% de significancia, ¿se puede afirmar que el modelo es significativo?
c. Con un nivel de significancia del 0.05, ¿existe evidencia estadística para
afirmar que las variables independientes son significativas? Utilizar un α =
0.05.
d. Asumiendo que todas las variables independientes se quedan en el modelo,
¿qué porcentaje de la variabilidad de Y está explicada por el modelo de
regresión estimado?

111. El
gerente de una empresa inmobiliaria tiene interés en realizar un estudio acerca de
los precios de las viviendas que posee la urbanización “El Sol de las Laderas”,
donde existe un solo centro comercial. La empresa ha decidido incluir en el
análisis las siguientes variables:

Y  Precio de la vivienda en miles de dólares


X1 = Área construida de la vivienda en metros cuadrados
X2 = Distancia al centro comercial en metros
X3 = Antigüedad de la vivienda en años

48
Los resultados obtenidos en 21 viviendas elegidas al azar se muestran a
continuación:

Análisis de regresión: Precio vs. Área, Distancia, Antigüedad

Análisis de varianza

Fuente GL SC CM F P
Regresión 3 52578 17526 76.16 0.000
Error residual 17 3912 230.117
Total 20 56490

Coeficientes

Predictor Coef SE Coef T P VIF


Constante 75.73 16.77 4.52 0.004
Área 0.2849 0.0332 8.58 0.001 1.634
Distancia 0.0092 0.0134 0.69 0.057 1.426
Antigüedad -3.3770 1.4942 -2.26 0.024 2.578

Se asume que los errores siguen una distribución normal y que no existe
autocorrelación entre ellos.

a. Verifique el supuesto de multicolinealidad utilizando el Factor de Inflación de


la variable (VIF)
b. Determine la ecuación de regresión estimada e interprete el coeficiente de la
variable antigüedad.
c. Pruebe si el modelo de regresión múltiple que incluye las tres variables
independientes es significativo. Use un α = 5%
d. Pruebe si las variables independientes son significativas. Use un α = 5%.

112. El
gerente de ventas de un centro comercial quiere conocer si las ventas anuales en
miles de dólares son afectadas por el número de trabajadores en cientos, el
número de acciones en miles ofrecidas por cada empresa y el valor del inventario
al principio del año en miles de dólares. Se selecciona una muestra de 16
empresas hoteleras, los datos recolectados fueron procesados en el software del
MINITAB y se obtuvieron los siguientes resultados:

Análisis de varianza
F. Variación Gl SC CM F P
Regresión 3 1385.1 461.7 9.9 0.000
Error 12 559.4 46.6

49
Total 15 1944.5

Coeficientes
Término Coef SE Coef T P VIF
Constante 733.000 332.100 2.21
Nro_trabajadores 3.110 1.285 2.42 0.005 1.789
Nro_acciones 7.900 10.940 0.72 0.461 1.697
Valor_InvInicial 0.354 0.118 3.00 0.001 1.741

Prueba de Durbin Watson: 1.124

a. Verifique los supuestos de la multicolinealidad y la autocorrelación de los


errores. Use un α = 0.05.
b. Determine la ecuación de regresión lineal múltiple. Interprete el coeficiente de
regresión del número de acciones ofrecidas por cada empresa.
c. ¿El modelo de regresión lineal múltiple es significativo? Use un α = 0.05.
d. ¿Qué variables son significativas en el modelo? Use un α = 0.05.
e. Suponiendo que el modelo con las tres variables es significativo, se desea
saber la venta anual estimada cuando el número de trabajadores fue de
12000 empleados, el número de acciones es de 24000 acciones y el valor del
inventario inicial es de 15000 dólares.

113. El
gerente comercial de una cadena de tiendas desea estimar la Utilidad (UTIL)
mensual de una empresa comercial en miles de dólares, y considera que las
variables que pueden explicar las fluctuaciones de la utilidad son: el Nivel de
ventas (NV) en cientos de unidades mensuales, el Gasto en publicidad (GP) en
miles de soles, el Precio unitario (PU) en soles y el Monto de pago en impuestos
(PI) en cientos de soles. Se tomó una muestra de tamaño 20 y al procesar estos
datos en el programa MINITAB se observaron los siguientes resultados:

Análisis de regresión: UTIL versus PI, PRECIO, NV, GP

Análisis of Varianza

Fuente GL SC CM F P
Regresión 4 292.96 73.24 24.5 0.000
Residual Error 15 38.5 2.57
Total 19 331.460

Coeficientes

Predictor Coef SE Coef T P VIF


Constante -1.826 5.045 -0.36 0.723
PI -0.081 0.1200 -0.68 0.509 2.148
PU -0.258 0.2622 -0.99 0.340 2.135
NV 1.427 0.5597 2.55 0.022 1.269
GP 0.615 0.1750 3.51 0.003 1.364

50
a. Interprete los coeficientes de regresión de las variables nivel de ventas y
gasto en publicidad.
b. Con un nivel de significancia de 5%, ¿existe evidencia estadística para afirmar
que el modelo de regresión es significativo?
c. ¿Se puede afirmar que todas las variables independientes del modelo son
significativas? Use  = 5%. Luego indique que variable o que variables
independientes deben de salir del modelo.
d. De acuerdo a sus resultados obtenidos en la parte c., y con las siguientes
salidas del programa Minitab indique en forma clara el modelo final que le
recomendaría al Gerente Comercial de esta cadena de tiendas:

Análisis de regresión: UTIL versus PI, PRECIO

Predictoras Coef SE Coef T P


Constante 11.823 6.012 1.97 0.066
PI 0.3840 0.1344 2.86 0.011
PRECIO 0.4886 0.2306 2.12 0.049

Resumen del modelo


S = 2.82434 R-Sq = 59.1% R-Sq(adj) = 54.3%

Análisis de regresión: UTIL versus NV, PI, GP

Predictoras Coef SE Coef T P


Constante -0.151 4.746 -0.03 0.975
NV 0.9541 0.2866 3.33 0.004
PI -0.0264 0.1063 -0.25 0.807
GP 0.6728 0.1646 4.09 0.001

Resumen del modelo


S = 1.60059 R-Sq = 87.6% R-Sq(adj) = 85.3%

Análisis de regresión: UTIL versus PRECIO, NV, GP

Predictoras Coef SE Coef T P


Constante 0.095 4.098 0.02 0.982
PRECIO -0.1763 0.2285 -0.77 0.452
NV 1.1750 0.4095 2.87 0.011
GP 0.6155 0.1720 3.58 0.003

Resumen del modelo


S = 1.57465 R-Sq = 88.0% R-Sq(adj) = 85.8%

Análisis de regresión: UTIL versus PRECIO, NV

Predictoras Coef SE Coef T P


Constante -3.992 5.123 -0.78 0.447
PRECIO -0.4841 0.2755 -1.76 0.097
NV 2.1703 0.3913 5.55 0.000

Resumen del modelo


S = 2.04969 R-Sq = 78.5% R-Sq(adj) = 75.9%

51
Análisis de regresión: UTIL versus NV, GP

Predictoras Coef SE Coef T P


Constante 0.424 4.027 0.11 0.917
NV 0.9118 0.2240 4.07 0.001
GP 0.6655 0.1574 4.23 0.001

Resumen del modelo

S = 1.55579 R-Sq = 87.6% R-Sq(adj) = 86.1%

Análisis de regresión: UTIL versus NV, PI

Predictoras Coef SE Coef T P


Constante -2.792 6.521 -0.43 0.674
NV 1.4903 0.3534 4.22 0.001
PI 0.0512 0.1451 0.35 0.729

Resumen del modelo

S = 2.21997 R-Sq = 74.7% R-Sq(adj) = 71.8%

e. Con el modelo obtenido en el inciso d), ¿qué porcentaje de variación de la


utilidad es explicado por el modelo final?

52
REGRESIÓN LINEAL MÚLTIPLE CON VARIABLES INDEPENDIENTES
CUALITATIVAS

114. E
n la liga nacional de fútbol americano de Estados Unidos (NFL) se evalúa a sus
prospectos con una escala que va del 5 al 9. Estas evaluaciones se interpretan
como sigue:
 8 – 9 deberá empezar el año próximo;
 7.0 – 7.9 deberá empezar;
 6.0 – 6.9 servirán de respaldo al equipo, y
 5.0 – 5.9 pueden formar parte del club y contribuir.
En la tabla siguiente se da posición (0: Guardia; 1: Tackle), peso, tiempo en
segundos para correr 40 yardas y la evaluación dada por la NFL a 25 prospectos
(USA Today, 14 de abril de 2000).

Peso Tiempo
Posición Evaluación
(Libras) (segundos)
Guardia 322 5.38 7.4

53
Guardia 303 5.18 7.0
Guardia 317 5.34 6.8
Guardia 330 5.46 6.7
Guardia 334 5.18 6.3
Guardia 308 5.32 6.1
Guardia 310 5.28 6.0
Guardia 318 5.37 6.0
Guardia 321 5.25 6.0
Guardia 295 5.34 5.8
Guardia 328 5.31 5.3
Guardia 320 5.64 5.0
Guardia 304 5.20 5.0
Tackle 325 4.95 8.5
Tackle 361 5.50 8.0
Tackle 315 5.39 7.8
Tackle 307 4.98 7.6
Tackle 326 5.20 7.3
Tackle 320 5.36 7.1
Tackle 287 5.05 6.8
Tackle 332 5.26 6.8
Tackle 334 5.55 6.4

Ingresando los datos y analizando en el minitab se obtuvo los siguientes


resultados:

Regression Analysis: Evaluación versus Posición, Peso, Tiempo


 
Analysis of Variance
 
Source DF Adj SS Adj MS F-Value P-Value
Regression 3 9.156 3.0521 6.35 0.003
Error 21 10.101 0.4810
Total 24 19.258
 
Model Summary
  S R-sq R-sq(adj) R-sq(pred)
0.693554 47.55% 40.05% 28.15%
 
Coefficients
 Term Coef SE Coef T-Value P-Value VIF
Constant 11.22 4.52 2.48 0.022
Posición 0.732 0.289 2.53 0.019 1.09
Peso 0.0222 0.0104 2.14 0.045 1.30
Tiempo -2.278 0.929 -2.45 0.023 1.29 
a. Obtenga una ecuación de regresión estimada que muestre la relación entre la
evaluación y posición, peso y tiempo requerido para correr 40 yardas. Interprete
los coeficientes estimados de Posición y Tiempo.

54
b. Empleando como nivel de significancia 0.05, pruebe si la ecuación de regresión
estimada obtenida en el inciso a. indica que existe una relación significativa
entre las variables independientes y la variable dependiente.
c. ¿Es la posición un factor significativo en la evaluación de los jugadores? Use α
= 0.05. Explique.
d. Suponga que hay un nuevo prospecto de tackle que pesa 300 libras y corre 40
yardas en 5.1 segundos. Utilice la ecuación de regresión estimada obtenida en
el inciso a) para estimar la evaluación de este jugador.
e. ¿Proporciona la ecuación de regresión estimada un buen ajuste a los datos
observados? Justifique su respuesta.

115. Jo
hnson Filtration Inc. da servicio de mantenimiento a los sistemas de filtración en el
sur de Florida. Los clientes solicitan un servicio de mantenimiento para sus
sistemas de filtración de agua y de esta manera, los administradores de Johnson
podrían estimar el tiempo que se requerirá para el servicio y el costo del mismo.
Se cree que el tiempo requerido para una reparación, en días; está relacionado
con dos factores, meses transcurridos desde el último servicio de mantenimiento y
tipo del problema (mecánico o eléctrico).

Tiempo requerido
Solicitud de Meses Tipo de
para la reparación
servicio transcurridos reparación
en horas
1 2 eléctrico 2.9
2 6 mecánico 3
3 8 eléctrico 4.8
4 3 mecánico 1.8
5 2 eléctrico 2.9
6 7 eléctrico 4.9
7 9 mecánico 4.2
8 8 mecánico 4.8
9 4 eléctrico 4.4
10 6 eléctrico 4.5

Donde, la variable X2: Tipo de reparación se codifica como:

55
x2=¿ {0 ,si el tipo de reparación es mecánica¿¿¿¿
Con la información recolecta se ingresó al minitab y se obtuvo los siguientes
resultados:

a. Con el modelo de regresión estimado, interprete el coeficiente de regresión para


meses transcurridos desde la última reparación.
b. Con un nivel de significancia 0.05, pruebe si la ecuación de regresión estimada
obtenida en el inciso a. indica que existe una relación significativa entre las
variables independientes y la variable dependiente.
c. Con un nivel de significancia de 5%, ¿se puede afirmar que tipo de reparación
es una variable significativa?
d. Estime el tiempo necesario de reparación mecánica si han transcurrido 7.5
meses desde la última reparación.

116. D
el problema de la empresa de reparación de filtraciones. Supóngase que además
de la información sobre los meses transcurridos desde el último servicio y de si se
trata de una reparación mecánica o eléctrica, los administradores presentan una
lista con las personas que realizaron las reparaciones. A continuación se
presentan los nuevos datos:

56
Meses Tiempo requerido
Solicitud de Tipo de Persona que realiza la
transcurrido para la reparación
servicio reparación reparación
s en horas

1 2 eléctrico 2.9 Dave Newton


2 6 mecánico 3 Dave Newton
3 8 eléctrico 4.8 Bob Jones
4 3 mecánico 1.8 Dave Newton
5 2 eléctrico 2.9 Dave Newton
6 7 eléctrico 4.9 Bob Jones
7 9 mecánico 4.2 Bob Jones
8 8 mecánico 4.8 Bob Jones
9 4 eléctrico 4.4 Bob Jones
10 6 eléctrico 4.5 Dave Newton

Donde:
X1 = Meses desde el último servicio
X2 = Tipo de reparación → X2 = 0: Tipo mecánico y X2 = 1: Tipo eléctrico
X3 = Persona que realiza la reparación → X3 = 0: Dave Newton y X3 = 1: Bob
Jones

Ingresando los datos y analizando en el minitab se obtuvo los siguientes


resultados:

Regression Analysis: Tiempo versus Meses; Tipo; Persona

Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
Regression 3 9.4305 3.14350 18.04 0.002
Error 6 1.0455 0.17425
Total 9 10.4760

Model Summary
S R-sq R-sq(adj) R-sq(pred)
0.417434 90.02% 85.03% 67.71%

Coefficients
Term Coef SE Coef T-Value P-Value VIF

57
Constant 1.251 0.471 2.66 0.038
Meses 0.2914 0.0836 3.49 0.013 2.43
Tipo 1.102 0.303 3.63 0.011 1.27
Persona 0.609 0.388 1.57 0.167 2.16

Regression Equation
Tiempo = 1.251 + 0.2914 Meses + 1.102 Tipo + 0.609 Persona

a. Obtenga la ecuación de regresión estimada que permita predecir el tiempo


que se requiere para una reparación dados los meses transcurridos desde la
última reparación, el tipo de reparación y la persona que realizó la reparación.
Interprete el coeficiente de regresión para X 1 y X3.
b. Empleando como nivel de significancia 0.05, realice una prueba para ver si la
ecuación de regresión estimada obtenida en el inciso a. representa una
relación significativa entre las variables independientes y la variable
dependiente.
c. ¿Es estadísticamente significativo agregar la variable X 3, la persona que
realizó la reparación? Use α = 0.05. ¿Qué explicación puede dar para los
resultados observados?
Si se asume que todas las variables permanecen en el modelo de regresión:
d. Estime el tiempo que se requiere una reparación si la han pasado 5 meses de
la última reparación, el tipo de reparación es eléctrico y la persona que realizó
la reparación fue Bob Jones.
e. ¿Qué porcentaje de variabilidad del tiempo de reparación está explicada por
el modelo de regresión?

REGRESIÓN LOGÍSTICA BINARIA

117. El
área de admisión en cierta universidad desea predecir el ingreso o no a la
universidad de un alumno recién egresado de la secundaria. Para ello, el
encargado de dicha área tomó una muestra de 30 postulantes los cuales recién
habían terminado la secundaria el año anterior y se registró su nota promedio de
todos sus cinco años de estudios secundarios. Algunos de estos datos son los
siguientes:

Alumn
o Situación Nota promedio
1 1 14.5
2 1 15.8

58
3 1 12.1
4 0 11.1
5 1 16.2
6 0 11.0
: : :

Donde las variables son:


- Situación: 1: Ingresó 2: No ingresó
- Nota promedio

Con la información recolectada se ingresó y analizó en minitab, obteniéndose los


siguientes resultados:

Binary Logistic Regression: Situación versus Nota promedio

Deviance Table

Source DF Adj Dev Adj Mean Chi-Square P-Value


Regression 1 8.660 8.660 8.66 0.003
Error 28 32.795 1.171
Total 29 41.455

Coefficients

Term Coef SE Coef Valor Z P-Value VIF


Constant -11.61 4.77 -2.43 0.015
Nota promedio 0.892 0.362 2.46 0.014 1.00

Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Nota promedio 2.4411 (1.2002, 4.9649)

Regression Equation

P(1) = exp(Y')/(1 + exp(Y'))

Y' = -11.61 + 0.892 Nota promedio

a. Determine el modelo estimado de regresión logística binaria.


b. Interprete el cociente de posibilidades de la variable nota promedio.
c. ¿Se puede afirmar que la probabilidad de que un postulante ingrese a la
universidad con nota promedio de 12.8 es mayor a la probabilidad de que no
ingrese a la universidad?
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión logística estimado es significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que la variable
predictora es significativa?

118. El
director del banco del sur se muestra preocupado por el aumento de clientes

59
morosos en los últimos años. Con objeto de reducir este problema, realiza un
estudio que permita identificar con la mayor precisión posible aquellas solicitudes
de préstamos que probablemente puedan llegar a convertirse en préstamos
morosos en el caso que se concedieran. Después de analizar la documentación
existente en el banco, el investigador solamente puede conseguir la información
de 25 clientes a los que se la ha concedido préstamos en los tres últimos años.
Algunos de estos datos son los siguientes:

N° cliente Tipo de cliente Ingreso mensual


1 1 4450
2 1 3100
3 1 3100
4 1 5200
5 1 4975
6 1 4250
: : :

Donde las variables son:


- Tipo de cliente: 1: cliente moroso 2: cliente cumplido
- Ingreso mensual en miles de soles

a. Determine el modelo estimado de regresión logística binaria.


b. Interprete el cociente de posibilidades de ingreso mensual.
c. ¿Se puede afirmar que la probabilidad de que un cliente moroso con ingresos
de 3250 soles es mayor a un cliente cumplido?
d. Con un nivel de significancia de 5%, ¿se puede afirmar que el modelo de
regresión logística estimado es significativo?
e. Con un nivel de significancia de 5%, ¿se puede afirmar que la variable
predictora es significativa?

Binary Logistic Regression: Tipo_cliente versus Ingreso_mensual

Deviance Table
Source DF Adj Dev Adj Mean Chi-Square P-Value
Regression 1 19.38 19.3817 19.38 0.000
Error 23 15.24 0.6624
Total 24 34.62

Coefficients
Term Coef SE Coef VIF
Constant 6.25 2.48
Ingreso_mensual -0.001915 0.000744 1.00

60
Odds Ratios for Continuous Predictors

Odds Ratio 95% CI


Ingresos 0.9981 (0.9966, 0.9995)

Regression Equation

P(1) = exp(Y')/(1 + exp(Y'))

Y' = 6.25 - 0.001915 Ingreso_mensual

119. C
onsumer Report le realizó una prueba de sabor a 19 marcas de chocolates. En los
datos a continuación se da el precio por porción, en base al tamaño de porción de
la FDAque es de 1.4 onzas, así como una evaluación de la calidad de los 19
chocolates tomados para la prueba (Consumer Report, febrero 2002).

61
Suponga que desea determinar si los productos que son más caros son mejor
evaluados. Para los propósitos de este ejercicio, emplee la siguiente variable
binaria dependiente.
y = 1 si la evaluación de la calidad fue excelente o muy buena, y y = 0 si la
evaluación de la calidad fue buena o regular.

a. Determine el modelo de regresión logística estimado.

62
b. Estime la probabilidad de que la evaluación de un chocolate cuyo precio por
porción es $4.00 sea muy bueno o excelente.
c. Interprete el odds ratio para Precio.
d. Con un 5% de significancia, ¿se puede afirmar que el modelo de regresión
logística es significativo? Y ¿la variable predictora contribuye al modelo de
regresión logística?

120. E
n los últimos años en Lakeland Collage ha aumentado el porcentaje de
estudiantes que abandonan sus estudios después del primer año. El año pasado,
Lakeland Collage inició un programa voluntario de orientación para ayudar a los
estudiantes de primer año a que se adapten a la vida del campus. Si Lakeland
Collage demuestra que ese programa tiene resultados positivos, se considerará la
posibilidad de que el programa sea obligatorio para todos los estudiantes de
primer año. La administración de Lakeland Collage supone que los estudiantes
que tienen GPA bajo son los que tienen mayor probabilidad de abandonar los
estudios al final del primer año. Con objeto de investigar la relación de estas
variables con la permanencia de los estudiantes en la escuela, Lakeland Collage
tomó una muestra aleatoria de 100 estudiantes de primer año.
*La variable dependiente toma el valor y = 1 si el estudiante permanece en la
escuela y y = 0 si no es así. Las dos variables independientes son:

A continuación, se dan los resultados obtenidos usando el paquete estadístico


Minitab:

63
Se pide:
a. Dé la ecuación de regresión logística que relaciona a las variables X1 y X2 con Y.
b. Realice la prueba de significancia global empleando α = 0.05.
c. Empleando α = 0.05, determine si cada una de las variables independientes son
significativas.
d. Use el logit estimado del inciso a) para obtener una estimación de la probabilidad
de que un estudiante cuyo GPA es 2.5 y que no participó en el programa de
orientación permanezca en la escuela.

64
e. Interprete el cociente de posibilidades para el programa de orientación.

121. El
Community Bank desea aumentar la cantidad de clientes a los que les depositan
directamente su nómina. El gerente está considerando una campaña que
requerirá que cada gerente de sucursal llame a cada cliente que no reciba
directamente su nómina. Como incentivo para aceptar recibir directamente su
nómina, se les ofrecerá revisión gratuita de su cuenta durante dos años. Debido al
tiempo y a los costos de esta campaña, el gerente desea que esta campaña se
dirija a aquellos clientes que tengan la mayor probabilidad de aceptar recibir
directamente su nómina. El gerente piensa que el saldo promedio mensual en la
cuenta de cheques del cliente puede ser un predictor útil para determinar si un
cliente aceptará o no recibir directamente su nómina. Para investigar la relación
entre estas dos variables, Community Bank prueba la nueva campaña utilizando
una muestra de cuentas de cheques de 50 clientes que actualmente no reciben
directamente su nómina. En los datos muestrales se presenta el saldo mensual
promedio en la cuenta de cheques (en miles de dólares) y si el cliente aceptó
recibir directamente el depósito de su nómina (1 significa aceptó el depósito
directo de su nómina y 0 significa el cliente no aceptó el depósito directo de su
nómina).

A continuación, se dan los resultados obtenidos usando el paquete estadístico


Minitab:

65
a. Dé la ecuación de regresión logística estimada.
b. Realice una prueba de significancia empleando el estadístico de prueba G. Use α
= 0.05.
c. Estime la probabilidad de que los clientes cuyo saldo mensual promedio sea
$1000 acepten recibir directamente el depósito de su nómina.
d. Supóngase que Community Bank desea contactar únicamente a los clientes para
los que la probabilidad de aceptar recibir directamente su nómina sea de 0.50 o
mayor. ¿Cuál es el saldo promedio requerido para tener esta probabilidad?
e. Dé la estimación del cociente de posibilidades. ¿Cuál es su interpretación?

66

Vous aimerez peut-être aussi