Académique Documents
Professionnel Documents
Culture Documents
Instrucciones generales:
El examen debe resolverse de forma individual, el plagio será sancionado con la pérdida del curso.
El tiempo que dispone para completarlo y subirlo al link en el campus será hasta el Domingo 25
agosto a las 12 MD
Lea con atención cada apartado, todo el examen es de desarrollo, algunas partes serán teóricas y
otras prácticas, las cuales deberá resolver mediante Excel o Minitab. No es necesario el entregar
los archivos donde realizó el procedimiento, pero si deberá explicar cómo llego a ese resultado y
qué conclusiones se obtienen al respecto. Coloque los datos principales de Minitab
Asuma que todos lo niveles de significancia son 0,05 en caso de que se diga lo contrario
Valor del examen: 52 puntos, 25%
I parte: Respuesta breve
1. Se realiza un estudio en el que se obtienen las siguientes mediciones:
Page 1 of 17
a) Si los datos son normales 1Pt
b) ¿Cuál es la probabilidad de que la media tome un valor entre 2,90 y 3,4? 1Pt
Page 2 of 17
c) ¿Cuál es la probabilidad de que la media sea mayor de 3,5? 1Pt
2. ¿Qué es una proporción y para qué sirve una prueba de hipótesis basada en ella? Brinde dos
ejemplos de casos de la industria 2Pt
Relación de correspondencia entre las partes y el todo, o entre varias cosas relacionadas entre si en
cuanto a tamaño, cantidad, dureza, etc.
Una prueba de hipótesis sirve para evaluar las afirmaciones con respecto a una proporción (o
Porcentaje) de población.
Además sirve para evaluar:
A) Un parámetro de población único
B) La igualdad de parámetros de dos poblaciones
C) La igualdad de más de 2 poblaciones
Page 3 of 17
3. Describa el proceso correcto para realizar un análisis estadístico, ¿Qué se debe validar y cómo?
2pts
1) Definir el problema
2) Recolectar los datos del problema
3) Resumir y Organizar los datos
4) Analizar los datos para saber cuál método aplicar
5) Conclusiones del problema
Se debe validar y asegurar que los datos del análisis estadístico sean INA (Independientes, Normales y
Aleatorios) Revisar si esta buena
Para un conteo de eventos igual a 20 (medición = < 1,72) de 30, no se encuentra evidencia de que al
menos un 80% de la muestra tenga una medición significativamente igual o menor a 1,72 metros (p =
0,966)
5. Al realizar 38 pruebas para dos lotes de producción, se determinó que para el lote 1 se tienen 9
defectos, mientras que el lote 2 se tienen 13 defectos. Determine con una prueba de hipótesis que la
proporción de defectos entre ambas muestras no es menor al 5%. 2Pts
Page 4 of 17
Para un total de trials de 38+38 = 76, y un numero de eventos 9+13 = 22, La prueba de
hipotesis para proporciones acepta la hipotesis alternativa, aportando evidencia para la
hipotesis de que la proporcion de defectos entre ambas muestras es significativamente
mayor al 5% (p < 0.0001).
6. ¿Qué es el factor de correlación y para que se utiliza? ¿Qué implica que este sea cero? 2Pts
Es una medida que permite conocer el grado de asociación lineal que existe entre dos variables
cuantitativas X o Y
Al ser cero, esto implica que hay ausencia de correlación.
8. En una prueba Wilcoxon con una significancia del 5%, se determinó que el p-value es de 0,03.
¿Qué se puede concluir de la prueba? 1Pt
Nivel de significancia= 0,05
P-Value= 0,03
p≤α
Se concluye en la prueba que la hipótesis nula se rechaza, es decir la diferencia entre la mediana de
la población y la mediana hipotética es muy significativa.
9. ¿Para que sirve una prueba de bondad de ajuste? Realice una prueba de bondad de ajuste e indique
la mejor distribución de los datos de la siguiente tabla y que no sea la Normal 3Pt
Sirve para probar que tan bien se ajustan los datos observados a una determinada distribución teórica.
Se explora por medio una prueba de bondad de ajuste que distribución se ajusta mejor a los
datos. Se observan los valores p más cercanos a 1, que indicarían una menor diferencia entre la
distribución observada y la teórica. Se omiten las transformaciones de variable. En este caso, con
un valor p = 0,706 los datos presentan menor discrepancia con una distribución exponencial.
Distribution AD P LRT P
Normal 0,504 0,186
Box-Cox Transformation 0,181 0,904
Lognormal 0,955 0,013
3-Parameter Lognormal 0,350 * 0,033
Exponential 0,359 0,706
2-Parameter Exponential 0,377 >0,250 1,000
Weibull 0,327 >0,250
3-Parameter Weibull 0,231 >0,500 1,000
Smallest Extreme Value 0,920 0,018
Largest Extreme Value 0,374 >0,250
Gamma 0,342 >0,250
3-Parameter Gamma 0,254 * 1,000
Logistic 0,497 0,167
Loglogistic 0,661 0,048
3-Parameter Loglogistic 0,406 * 0,284
Page 6 of 17
10. ¿Para que sirve un modelo de regresión y cuál es el supuesto bajo el que trabaja? 1Pt
Se utiliza para resolver problemas que implican conjuntos de variables de las cuales se saben que
tienen alguna relación entre si.
11. En un análisis de regresión se obtuvo el siguiente gráfico de residuos vs. ajustes. ¿Qué se puede
concluir al respecto? 1Pt
12. Al realizar un modelo de regresión se obtuvieron los datos que se muestran a continuación. ¿Qué
implican? 1Pt
Implican que el R cuadrado 84.47% es igual a √84.47% = 0.91, lo cual se argumenta que cuanto más
cercano sea a la unidad (1) sea el valor, mayor será el grado de relación lineal entre las variables
analizadas y entre más cercano sea a 0, menor será esa asociación.
El S se mide en las unidades de la variable de respuesta y representa la distancia que separa a los
valores de los datos de los valores ajustados. Mientras más bajo sea el valor de S, mejor será descrita la
respuesta por el modelo.
R-cuad es el porcentaje de variación en la respuesta que es explicada por el modelo. Al ser mayor que
35% esto implicaría un buen ajuste de los datos al modelo.
Page 7 of 17
R-cuad (ajustado) se utiliza cuando se desea comparar modelos que tengan diferentes números de
predictores.
13. Al realizar una prueba de Tukey en un ANOVA, se obtuvo el grafico de que muestra a
continuación.
a. ¿Cuál de las combinaciones presenta menor variación entre las medias? 1Pt
El estadístico de diferencia de medias con valor más cercano a cero, es decir
Blend3 - Blend1
b. ¿Cuál de las combinaciones presenta mayor variación entre las medias? 1Pt
El estadístico de diferencia de medias en donde su intervalo de confianza no
contiene el valor cero, es decir, Blend4 - Blend2
14. En una bolsa de papel se tienen 200 bolas azules y 88 rojas. ¿Cuál es la proporción de bolas azules
y por qué? 1Pt
La proporción de bolas azules es de 25 por cada 11 rojas, o 0.694 en función de la
totalidad de bolas (n total = 288).
15. Al realizar una ANOVA para experimentar sobre los efectos del tiempo que se tarda al transitar por
cierta zona en relación con la ruta de providencia y la hora del día, se obtuvieron los siguientes
resultados:
Page 8 of 17
16. Cuando en una prueba de regresión con un nivel de significancia de 0.05, el p-value es de 0.02,
¿qué implicaciones tiene respecto a la hipótesis nula y por qué? 2Pt
Un p-valor menor a (< 0.05) implica que se rechaza la hipótesis nula. En otras palabras, un predictor
que tenga un p-valor bajo es probable que tenga una adición significativa a su modelo porque los
cambios en el valor del predictor están relacionados con cambios en la variable de respuesta.
Al rechazar la hipótesis nula y aceptar la hipótesis alternativa, se concluiría que hay regresión.
17. Al realizar un muestreo sobre dos servicios de encuestas se determinó que, para el primero por 230
llamadas, se presentaron 9 quejas, mientras que, para el otro, de 180 llamadas, solo se presentaron
10 quejas. Calcule mediante una hipótesis nula que la proporción de quejas en ambos servicios es
la misma. 2Pts
Con p = 0,483; no se rechaza la hipótesis nula de igualdad entre dos proporciones. Por lo
tanto no se encuentra una diferencia significativa en la proporción de quejas de ambos
servicios muestreados.
Sample X N Sample p
1 9 230 0,039130
2 10 180 0,055556
II Parte. Desarrolle cada pregunta de acuerdo con los ítems que se le solicitan
1. Un equipo de manufactura está probando una serie de aditivos para mejorar la resistencia del
compuesto plástico que utilizan para agregar dureza a este. Para esto escogieron 4 aditivos y
realizaron mediciones a cada uno. Tomando un nivel de significancia del 0,05 calcule de
acuerdo con la tabla siguiente:
Page 9 of 17
12 11,3 2
13 10,2 2
14 11,1 2
15 10,8 2
16 9,60 3
17 7,40 3
18 12,5 2
19 8,20 1
20 11,6 4
21 13,5 4
22 9,30 4
23 10,7 4
24 10,4 1
25 13,1 2
26 11,7 1
27 10,9 2
28 11,7 2
29 12,9 3
30 10,0 3
31 6,80 3
32 13,4 4
33 10 3
34 11,8 3
35 9,5 4
36 12,8 4
37 12,9 4
38 11,6 4
39 14,8 4
40 10,6 3
Page 10 of 17
b) Explique si hay relación en la variable de respuesta y los aditivos 3Pts
Analysis of Variance
Page 11 of 17
Total 39 107,52
Model Summary
S R-sq R-sq(adj) R-sq(pred)
1,56674 17,81% 10,96% 0,00%
Means
lote N Mean StDev 95% CI
1 10 10,667 1,325 ( 9,662; 11,672)
2 10 11,600 0,939 (10,595; 12,605)
3 10 10,290 1,988 ( 9,285; 11,295)
4 10 12,010 1,797 (11,005; 13,015)
c) M
e
d
i
a
n
t
e
u
na prueba de Tukey, explique cuál pareja de aditivos difiere más 1Pts
d) Indique
cuál
aditivo
Page 12 of 17
es mejor y porqué en caso de que sean diferentes y como procedería en el caso
de que fueran iguales 3Pts
La prueba de ANOVA no encontró diferencias significativas entre
los aditivos. En tal situación se recomienda aumentar el tamaño
muestral o colapsar lotes mas o menos homogéneos.
2. Un equipo de diseño esta experimentando sobre la duración de una batería. Para el mismo
experimento realizaron combinaciones respecto a tres factores: Tipo de metal interno, la forma
de cobertura y el tipo de conexión entre los dipolos. Al realizar varias combinaciones, desean
saber cuál es la mejor. De acuerdo con los datos determine:
Tipo de Tipo de
Duración Cobertura
metal conexión
0,91 1 2 1
0,89 1 1 2
1,03 1 2 3
0,97 1 1 1
1,28 2 1 2
1,23 2 2 3
1,42 2 2 1
0,91 3 2 2
0,99 3 2 3
1,08 3 2 1
a) Si los datos son INA. Asegure la normalidad con una prueba sobre los residuos 2Pts
Page 13 of 17
b) ¿
Q
u
é
f
a
c
t
o
r
e
s
afectan y cuales no? ¿Porqué? 2Pts
Analysis of Variance
Source DF Adj SS Adj MS F-Value P-Value
metal 2 0,257659 0,128830 18,72 0,009
cobertura 1 0,000149 0,000149 0,02 0,890
conexion 2 0,015402 0,007701 1,12 0,411
Error 4 0,027525 0,006881
Total 9 0,293890
Page 14 of 17
Grouping Information Using the Tukey Method and 95% Confidence
Model Summary
S R-sq R-sq(adj) R-sq(pred)
0,0829533 90,63% 78,93% 47,36%
e) R
e
a
l
i
c
e
u
n
g
ráfico de interacciones e indique como se comporta cada factor a medida que la
duración se incrementa 3pts
Page 15 of 17
f) U
t
i
l
i
z
a
n
d
o
e
l
m
ó
d
u
l
o “Predecir” del ANOVA, ¿Qué duración aproximada se tendría al utilizar el metal 2
con la cobertura 1 y el tipo de conexión 3? 2Pts
El valor ajustado de duración para un modelo con niveles de factor Metal (2) *
Cobertura (1) * Conexion (3) es de 1,325.
Variable Setting
metal 2
cobertura 1
conexion 3
X denotes an unusual point relative to predictor levels used to fit the model.
Page 16 of 17
Page 17 of 17