Vous êtes sur la page 1sur 40

ESTADÍSTICA I

Tema:
Avance de los deberes parcial III

Integrantes:
 Liliana Albán
 Verónica Cando
 Valeria Sánchez

Curso:
Tercero Petroquímica

2017-2018
ESTADÍSTICA I

EJERCICIO 22.- Una muestra de 64 observaciones se selecciona de una población


normal. La media de la muestra es 215. Y la desviación estándar de la población, 15.
EJERCICIO 1.- Lleve a cabo la prueba de hipótesis, utilice el nivel de significancia 0.03.

Paso 1: establecer hipotesis nula y alternativa.


𝐻𝑜: 𝜇 ≤ 220
𝐻𝑖: 𝜇 > 220
Paso 2: se selecciona el nivel de significancia
∝= 0,03
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 > 1,89 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜
ESTADÍSTICA I

Paso 5: se forma una decisión y se interpreta el resultado.


215 − 220
𝑧=
15
√64
𝑧 = −2,66
Se puede observar el valor de Z, se encuentra dentro de la zona de no rechaza Ho por lo
tanto la hipótesis Ho es aprobado.

EJERCICIO 2.- El fabricante de llantas radiales con cinturón de acero X-15 para
camiones señala que el millaje medio que la llanta recorre antes de que se desgasten las
cuerdas es de 60000 millas.
La desviación estándar del millaje es de 5000 millas. La crosset Truck Company compró
48 llantas y encontró que el millaje medio para sus camiones es de 59500 millas. ¿La
experiencia de Crosset es diferente de lo que afirma el fabricante en el nivel de significancia
de 0.05?

Paso 1: establecer hipótesis nula y alternativa.


𝐻𝑜 = 60000
𝐻𝑖 ≠ 60000
Paso 2: se selecciona el nivel de significancia
∝= 0,05
Paso 3: Se selecciona la estadística de prueba
ESTADÍSTICA I
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
−1,96 < 𝑋 < 1,96 𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜

Paso 5: se forma una decisión y se interpreta el resultado.


59500 − 60000
𝑧=
5000
√48
𝑍 = −0,692 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜
𝑃 = 2(0,5 − 0,2549)
𝑃 = 0,4902
ESTADÍSTICA I
La experiencia de Crosset no es diferente. Si Ho es verdadero, la probabilidad de encontrar
un valor, extremo como este es de 0,4902.

EJERCICIO 3.- La cadena de restaurantes MacBurger afirma que el tiempo de espera


de los clientes es de 8 minutos con una desviación estándar poblacional de 1 minuto. El
departamento de control de calidad halló en una muestra de 50 clientes en Warren Road
MacBurger que el tiempo medio de espera era de 2.75 minutos. Con el nivel de significancia
de 0.05 ¿puede concluir con el tiempo medio de espera sea menor que 3 minutos?

Paso 1: establecer hipótesis nula y alternativa.


𝐻𝑜: 𝜇 < 3
𝐻𝑖: 𝜇 ≥ 3
Paso 2: se selecciona el nivel de significancia
∝= 5%
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 < 1,65 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜
ESTADÍSTICA I

Paso 5: se forma una decisión y se interpreta el resultado.


2,75 − 3
𝑧=
1
√50
2,75 − 3
𝑍=
0,141
𝑍 = −1773
𝑃 = 2(0,5 − 0,4608)
𝑃 = 0,0784
Se acepta Ho hay evidencias que la afirmación de la cadena de restaurantes es verdadera.

EJERCICIO 4.- En el momento en que fue contratada como mesera en el Grumney


Family Restaurant, a Beth Brigden se le dijo:¨ Puedes ganar en promedio más de $80 al día
en propinas¨. Suponga que la desviación estándar de la distribución de población es de
$3,24. Los primeros 35 días de trabajar en el restaurante, la suma media de sus propinas fue
de $84,85. Con el nivel de significancia de 0,01. ¿La señorita Brigden puede concluir que
está ganando un promedio de más $80 en propinas?

Paso 1: establecer hipótesis nula y alternativa.


𝐻𝑜: 𝜇 ≥ 80
𝐻𝑖: 𝜇 > 80
Paso 2: se selecciona el nivel de significancia
∝= 0,01
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 < 2,33 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜
ESTADÍSTICA I

Paso 5: se forma una decisión y se interpreta el resultado.


84,85 − 80
𝑧=
3,24
√35
𝑍 = 8,86
La señorita Brigden con las evidencias puede concluir que gana un promedio de más de
$80 en propinas

EJERCICIO 5.- El cloro líquido que se agrega a las albercas para combatir las algas
tiene una duración relativamente corta en las tiendas antes de que pierda su eficacia. Los
registros indican que la duración media de un frasco de cloro es de 2160 horas (20 días).
Como experimento, se agregó Holdlonger al cloro para saber si este incrementaba la
duración del cloro en las tiendas.
Una muestra de nueve frascos de cloro arrojó los siguientes tiempos de duración (en horas)
en las tiendas:
2159 2170 2180 2179 2160 2167 2171 2181 2185

¿Incremento el Holdlonger la duración del cloro en las tiendas con el nivel de significancia
de 0.05? calcule el valor p.

2159 + 2170 + 2180 + 2179 + 2160 + 2167 + 2171 + 2181 + 2185


𝑥̅ =
9
𝑋̅ = 2172,44
(2159−2172,44)2 + (2170 − 2172,44)2 + (2180 + 2172,44)2 + (2179 − 2172,44)2 + (2160 − 2172,44)2
=
8
ESTADÍSTICA I

Paso 1: establecer hipótesis nula y alternativa.


𝑆 = 9,38
𝐻𝑜: 𝜇 ≤ 2,306
𝐻𝑖: 𝜇 > 2,306
Paso 2: se selecciona el nivel de significancia
∝= 0,025
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑡= 𝑠
√𝑛
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 < 2,30 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜

Paso 5: se forma una decisión y se interpreta el resultado.


2172,44 − 2160
𝑡=
9,38
√9
𝑡 = 3,97
Como t>2 206 se rechaza la hipótesis nula con un nivel de significancia de 0,025.
Holdlonger si incrementa la duración de Cl.
ESTADÍSTICA I

EJERCICIO 6.- El gerente de ventas del distrito de las montañas rocallosas de Rath
Publishing. Inc., editorial de textos universitarios, afirma que los representantes de ventas
realizan en promedio 40 llamadas de ventas a la semana a profesores. Varios representantes
señalan que el cálculo es muy bajo. Una muestra aleatoria de 28 representantes de ventas
revela que la cantidad media de llamadas realizadas la semana pasada fue de 42. La
desviación estándar de muestra es de 2.1 llamadas. Con el nivel de significancia de 0.05,
¿puede concluir que la cantidad media de llamadas semanales por vendedor es de más de
40?
Paso 1: establecer hipótesis nula y alternativa.
𝐻𝑜: 𝜇 ≤ 40
𝐻𝑖: 𝜇 > 40
Paso 2: se selecciona el nivel de significancia
∝= 0,05
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑡= 𝑠
√𝑛
Paso 4: se formula la regla de decisión.
𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 < 1,703 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜

Paso 5: se forma una decisión y se interpreta el resultado.


42 − 40
𝑡=
2,1
√28
𝑡 = 5,039
Al interpretar los resultados se puede deducir que se rechaza la hipótesis nula.
ESTADÍSTICA I

EJERCICIO 7.- La administración de White Industries analiza una nueva técnica para
armar un carro de golf; la técnica actual requiere 42,3 minutos en promedio. El tiempo
medio de montaje de una muestra aleatoria de 24 carros, con la nueva técnica, fue de 40,6
minutos, y la desviación estándar, de 2.7 minutos. Con un nivel de significancia de 0.10.
¿Puede concluir que el tiempo de montaje con la nueva técnica es más breve?
Paso 1: establecer hipótesis nula y alternativa.
𝐻𝑜: 𝜇 = 42,3
𝐻𝑖: 𝜇 < 42,3
Paso 2: se selecciona el nivel de significancia
∝= 0,10
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑡= 𝜎
√𝑛 − 1
Paso 4: se formula la regla de decisión
𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 > −1,29 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜

Paso 5: se forma una decisión y se interpreta el resultado.


40,6 − 42,3
𝑡= = −3,01
2,7
√23
ESTADÍSTICA I
Se rechaza la hipótesis nula entonces se puede concluir que el tiempo de montaje con la
nueva técnica si es más breve al antiguo métodos.
EJERCICIO 8.- En la actualidad. La mayoría de quienes viajan por avión compra sus
boletos por internet. Así, los pasajeros evitan le precaución de cuidar un boleto de papel,
además de que las aerolíneas ahorran. No obstante, en fechas recientes, las aerolíneas han
recibido quejas relacionadas con los boletos, en particular cuando se requiere hacer un
enlace para cambiar de línea. Para analizar el problema, una agencia de investigación
independiente tomó una muestra aleatoria de 20 aeropuertos y recogió información
relacionada con la cantidad de quejas que hubo sobre los boletos durante Marzo. A
continuación se presenta la información.
14 14 16 12 12 14 13 16 15 14
12 15 15 14 13 13 12 13 10 13

¿La agencia de investigación puede concluir que la cantidad media de quejas por aeropuerto
es menor que 15 al mes con un nivel de significancia de 0.05?
a) ¿qué suposición se requiere antes de llevar a cabo una prueba de hipótesis?
b) Ilustre la cantidad de quejas por aeropuerto en una distribución de frecuencias o en
un diagrama de dispersión ¿es razonable concluir que la población se rige por una
distribución normal?
c) Realice una prueba de hipótesis e interprete los resultados.

𝑋̅
14 + 14 + 16 + 12 + 12 + 14 + 13 + 16 + 15 + 14 + 12 + 15 + 15 + 14 + 13 + 13 + 12 + 13 + 1
=
20
𝑋̅ = 13,5
𝑆
√(14 − 13,5)2 + (14 − 13,5)2 + (16 − 13,5)2 + (12 − 13,5)2 + (14 − 13,5)2 + (13 − 13,5)2 + (16 − 13,5)2 + (15 − 13,5)2 + (14 − 13,5)2
=
19

𝑆 = 1,50

Paso 1: establecer hipótesis nula y alternativa.


𝐻𝑜: 𝜇 ≤ 15
ESTADÍSTICA I
𝐻𝑖: 𝜇 < 15

Paso 2: se selecciona el nivel de significancia


∝= 0,05
Paso 3: Se selecciona la estadística de prueba
𝑋̅ − 𝜇
𝑡= 𝜎
√𝑛 − 1
Paso 4: se formula la regla de decisión.

𝐶𝑜𝑛𝑑𝑖𝑐𝑖ó𝑛
𝑥 > −1,729𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝐻𝑜

Paso 5: se forma una decisión y se interpreta el resultado.


13,5 − 15
𝑡=
1,50
√20
𝑡 = −4,47

Se rechaza la hipótesis nula


ESTADÍSTICA I

EJERCICIO 9._Un artículo de USA Today informo que solo hay un trabajo disponible
por cada tres nuevos graduados de universidad. Las principales razones fueron un sobre
población de graduados universitarios y una economía débil. Una encuesta de 200 recién
graduados revelo que 80 estudiantes tenían trabajo. Con un nivel de significancia de 0,02
¿Puede concluir que una proporción mayor de estudiantes de su escuela tienen empelo?
PASO 1._ Establecer las hipótesis nula y alternativa
𝐻𝑜 = 𝜋 ≤ 0,33
𝐻𝑖 = 𝜋 > 0,33
PASO 2._Nivel de significancia
∝= 0,02
PASO 3._ Se selecciona el estadístico de a prueba
𝑝−𝜋
𝑧=
√𝜋(1 − 𝜋)
𝑛
PASO 4._ Se formula la decisión
0,5 − 0,02 = 0,48
𝑧(0,48) = 2,06

𝑧 < 2,06
NO SE RECHAZA

PASO 5._ Se toma decisión e interpreta


ESTADÍSTICA I
𝑝−𝜋 0,40 − 0,33
𝑧= = = 2,12
√𝜋(1 − 𝜋) √0,33(1 − 0,33)
𝑛 200

EJERCICIO 10._Una investigación de la Universidad de Toledo indica que 50% de los


estudiantes cambia de área de estudios después del primer año en un programa. Una muestra
aleatoria de 100 estudiantes de la Facultad de Administración revelo que 48 habían
cambiado de área el primer año es este programa Realice una prueba con un nivel de
significancia de 0,05.
PASO 1._ Establecer las hipótesis nula y alternativa
𝐻𝑜 = 𝜋 ≥ 0,50
𝐻𝑖 = 𝜋 < 0,50
PASO 2._Nivel de significancia
∝= 0,05
PASO 3._ Se selecciona el estadístico de a prueba
𝑝−𝜋
𝑧=
√𝜋(1 − 𝜋)
𝑛
PASO 4._ Se formula la decisión
0,5 − 0,05 = 0,45
𝑧(0,45) = −1,65

𝑧 > −1,65
NO SE RECHAZA
ESTADÍSTICA I
PASO 5._ Se toma decisión e interpreta
𝑥 48
𝑝= =
𝑛 100

𝑝−𝜋 0,48 − 0,5


𝑧= = = −0,40
√𝜋(1 − 𝜋) √0,5(1 − 0,5)
𝑛 100

𝑧𝑡 < 𝑧 = 𝑁𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠


CONCLUSION: No hay evidencia estadísticamente significativa de que hubo una
reducción en la proporción de estudiantes que cambian de área en el primer año en el
programa.

EJERCICIO 11._Las siguientes observaciones muéstrales se seleccionaron de manera


aleatoria.
X: 4 5 3 6 10
Y: 4 6 5 7 7

Determine el coeficiente de correlación y el de determinación. Interprételos.


𝑥 80
𝑝= =
𝑛 200
∑ 𝑥 4 + 5 + 3 + 6 + 10 28
𝑥̅ = = = = 5.6
𝑛 5 5
∑𝑦 4 + 6 + 5 + 7 + 7
𝑦̅ = = = 5,8
𝑛 5
ESTADÍSTICA I
X (𝑥 − 𝑥̅ ) (𝑥 y (𝑦 − 𝑦̅) (𝑦 (𝑥 − 𝑥̅ )2 × (𝑦 − 𝑦)2
− 𝑥̅ )2 − 𝑦)2
4 -1,6 2,56 4 -1,8 3,24 2,88
5 -0,6 0,36 6 0,2 0,04 -0,12
3 -2.6 6,76 5 -0,8 0,64 2,08
6 0,4 0,16 7 1,2 1,44 0,48
10 4,4 19,36 7 1,2 1,44 5,28
29,2 6,76 10,6

∑(𝑥 − 𝑥̅ )2 29,2
𝑆𝑋 = √ =√ = 2,1018
𝑛−1 4

∑(𝑦 − 𝑦)2 6,76


𝑆𝑌 = √ =√ = 1,3
𝑛−1 4

∑(𝑥 − 𝑥̅ ) × (𝑦 − 𝑦) 10,6
𝑟= = = 0,7522
(𝑛 − 1)𝑆𝑋 𝑆𝑦 4(2,1018)(1,3)

CONCLUSION: Por lo cual podemos interpretar que tenemos una correlación


positivamente.
EJERCICIO 12._Las siguientes observaciones muéstrales se seleccionaron de manera
aleatoria.
X: 5 3 6 3 4 4 6 8
Y: 13 15 7 12 13 11 9 5
Determine el coeficiente de correlación y el de determinación. Interprételos.
ESTADÍSTICA I

X (𝑥 − 𝑥̅ ) (𝑥 y (𝑦 − 𝑦̅) (𝑦 (𝑥 − 𝑥̅ )2 × (𝑦 − 𝑦)2
− 𝑥̅ )2 − 𝑦)2
5 012 0,015 13 2,375 5,64 0,296
3 -1,87 3,515 15 4.375 19,14 -8,20
6 1,12 1,265 7 -3,624 13,64 -4,078
4 -1,87 3,515 12 1,375 1,89 -2,078
3 -0.87 0,765 13 2,375 5,64 -0,328
4 -0.87 0,765 11 0,375 0,14 -1,828
4 1,28 1,265 9 -1,625 2,64 -1,828
6 3,25 0,76 5 -5,625 31,64 -1,7378
79,89

∑ 𝑥 39
𝑥̅ = = = 4,875
𝑛 8
∑ 𝑦 85
𝑦̅ = = = 10,628
𝑛 8

∑(𝑥 − 𝑥̅ )2 79,87
𝑆𝑋 = √ =√ = 1,726
𝑛−1 7

∑(𝑦 − 𝑦)2 79,87


𝑆𝑌 = √ =√ = 3,37
𝑛−1 7

∑(𝑥 − 𝑥̅ ) × (𝑦 − 𝑦) −38,37
𝑟= = = −0,899
(𝑛 − 1)𝑆𝑋 𝑆𝑦 7(1,726)(3,37)

EJERCICIO 13._El departamento de producción de Calionics International desea


ESTADÍSTICA I
explorar la relación entre el número de empleados que trabajan en una línea de ensamble
parcial. Su desempeño fue de 15 productos durante un periodo de una hora. El conjunto
completo de observaciones pareadas se muestra a continuación.
Numero de ensambladores Producción en una hora (unidades)
2 15
4 25
1 10
5 40
3 30

La variable dependiente es la producción; es decir, se supone que el nivel de producción


depende del número de empleados.
a) Trace un diagrama de dispersión
b) Con base en el diagrama de dispersión ¿Parece haber alguna relación entre el numero
ensambladores y la producción? Explique.
c) Calcule el coeficiente de correlación.
d) Evalúe la fuerza de la relación calculando el coeficiente de determinación.

X (𝑥 − 𝑥̅ ) (𝑥 y (𝑦 − 𝑦̅) (𝑦 (𝑥 − 𝑥̅ )2 × (𝑦 − 𝑦)2
− 𝑥̅ )2 − 𝑦)2
2 -1 1 1 -9 81 9
4 -1 1 1 1 1 1
1 -2 4 4 -14 196 28
5 2 4 4 16 256 32
3 0 0 0 6 36 0
70
∑ 𝑥 15
𝑥̅ = = =3
𝑛 5
ESTADÍSTICA I
∑ 𝑦 120
𝑦̅ = = = 24
𝑛 5

∑(𝑥 − 𝑥̅ )2 90
𝑆𝑋 = √ = √ = 1,586
𝑛−1 4

∑(𝑦 − 𝑦)2 570


𝑆𝑌 = √ =√ = 11,93
𝑛−1 4
𝑝 − 𝜋} 70
𝑟= = = 0,7
(𝑛 − 1)𝑆𝑋 𝑆𝑦 7(1,726)(3,37)

CONCLUSION: Hay una correlación positiva fuerte entre ambas variable.

EJERCICIO 14.- Las siguientes observaciones muéstrales se seleccionaron al azar


X Y
5 13
3 15
6 7
3 12
4 13
4 11
ESTADÍSTICA I
6 9
8 5

a) Determine la ecuación de regresión

(𝑋 − 𝑋̅)(𝑌
X 𝑋 − 𝑋̅ (𝑋 − 𝑋̅)2 Y 𝑌 − 𝑌̅ (𝑌 − 𝑌̅)2 − 𝑌̅)
5 0,12 0,01 13 2,37 5,62 0,28
3 -1,88 3,53 15 4,37 19,10 -8,22
6 1,12 1,25 7 -3,63 13,18 -4,07
3 -1,88 3,53 12 1,37 1,88 -2,58
4 -0,88 0,77 13 2,37 5,62 -2,09
4 -0,88 0,77 11 0,37 0,14 -0,33
6 1,12 1,25 9 -1,63 2,66 -1,83
8 3,12 9,73 5 -5,63 31,70 -17,57
𝑇𝑂𝑇𝐴𝐿 39 20,88 85 79,88 -36,37

∑ 𝑥 39
𝑋̅ = = = 4.875
𝑛 8

∑ 𝑦 85
𝑌̅ = = = 10.625
𝑛 5

∑(𝑋 − 𝑋̅)2 20.88


𝑆𝑥 = √ =√ = 1.73
𝑛−1 8−1

∑(𝑌 − 𝑌̅)2 79.88


𝑆𝑦 = √ =√ = 3.38
𝑛−1 8−1

∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) −36,37


𝑟= = = −0.891
(𝑛 − 1)(𝑆𝑥 ∗ 𝑆𝑦 ) (8 − 1)(1.73 ∗ 3.38)

𝑅𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌̂ = 𝑏𝑥 + 𝑎
ESTADÍSTICA I

𝑆𝑦 3.38
𝑏=𝑟∗ = −0.891 ∗ = −1.743
𝑆𝑥 1.73

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 10.625 − (−1.743 ∗ 4.875) = 19.12

𝑌̂ = −1.74𝑥 + 19.12

Gráfica de dispersión de Y vs. X


2
15,0

5 1

12,5 4

10,0
Y

7,5 3

8
5,0

3 4 5 6 7 8
X
ESTADÍSTICA I

a) Encuentre el valor 𝑌̂ cuando X es 7

𝑌̂ = −1.74𝑥 + 19.12
𝑌̂ = −1.74(7) + 19.12
𝑌̂ = 6.94

EJERCICIO 15.- El señor James McWhinney, presidente de Daniel-James Financial


Services, considera que hay una relación entre el número de contactos con sus clientes y la
calidad de ventas en dólares. Para documentar esta afirmación, el señor McWhinney reunió
la siguiente información muestral. La columna X indica el número de contactos con sus
clientes el mes anterior, y la columna Y muestra el valor de las ventas (miles $), el mismo
mes por cada cliente muestreado.
ESTADÍSTICA I
Numero de Ventas
contactos (miles de
dólares)
14 24
12 14
20 28
16 30
46 80
23 30
48 90
50 85
55 120
50 110

a) Determine la ecuación de regresión

X 𝑋 − 𝑋̅ (𝑋 − 𝑋̅)2 Y 𝑌 − 𝑌̅ (𝑌 − 𝑌̅)2 (𝑋 − 𝑋̅)(𝑌 − 𝑌̅)


14 -19,40 376,36 24 -37,1 1376,41 719,74
12 -21,40 457,96 14 -47,1 2218,41 1007,94
20 -13,40 179,56 28 -33,1 1095,61 443,54
16 -17,40 302,76 30 -31,1 967,21 541,14
46 12,60 158,76 80 18,9 357,21 238,14
23 -10,40 108,16 30 -31,1 967,21 323,44
48 14,60 213,16 90 28,9 835,21 421,94
50 16,60 275,56 85 23,9 571,21 396,74
55 21,60 466,56 120 58,9 3469,21 1272,24
50 16,60 275,56 110 48,9 2391,21 811,74
334 2814,40 611 14248,90 6176,60
ESTADÍSTICA I

∑ 𝑥 334
𝑋̅ = = = 33.4
𝑛 10

∑ 𝑦 611
𝑌̅ = = = 61.1
𝑛 10

∑(𝑋 − 𝑋̅)2 2814.40


𝑆𝑥 = √ =√ = 17.68
𝑛−1 10 − 1

∑(𝑌 − 𝑌̅)2 14248.90


𝑆𝑦 = √ =√ = 39.78
𝑛−1 10 − 1

∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 6176.60


𝑟= = = 0.975
(𝑛 − 1)(𝑆𝑥 ∗ 𝑆𝑦 ) (10 − 1)(17.68 ∗ 39.78)

𝑅𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌̂ = 𝑏𝑥 + 𝑎

𝑆𝑦 39.78
𝑏=𝑟∗ = 0.975 ∗ = 2.19
𝑆𝑥 17.68

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 61.1 − (∗ 33.4) = −12.20

𝑌̂ = 2.195𝑥 − 12.20

b) Encuentre las ventas estimadas si se hicieron 40 contactos.


ESTADÍSTICA I
𝑌̂ = 2.195𝑥 − 12.20
𝑌̂ = 2.195(40) − 12.20
𝑌̂ = 75.60

Gráfica de dispersión de ventas (miles de vs. Numero de contac

120

100
ventas (miles de dolares)

80

60

40

20

0
10 20 30 40 50 60
Numero de contactos

EJERCICIO 16._ Se realiza un estudio de fondos mutualistas para fines de inversión


en varios fondos. Para este estudio en particular, desean enfocarse en los activos y su
desempeño a cinco años con base en los activos del fondo?. Se selecciona nueve fondos
mutualistas al aza, y sus activos y tasas de recuperación se muestran a continuación.

Fondo Activos Rendimiento


en
millones
$
AARP High Quality 622,2 10,8
Babson Bond L 160,4 11,3
Compass Capital 275,7 11,4
Galxy Bond 433,2 9,1
Keystone Custodian 437,9 9,2
MFS Bond 494,5 11,6
Nichols Income 158,3 9,5
T. Rowe Price 681 8,2
Thompson Income B 241,3 6,8
ESTADÍSTICA I

a) Trace un diagrama de dispersión

Gráfica de dispersión de Rendimiento vs. Activos $


12
6
2 3

11 1

10
Rendimiento

7
45
9

8
8

7 9

100 200 300 400 500 600 700


Activos $

a) Calcule el coeficiente de correlación

X 𝑋 − 𝑋̅ (𝑋 − 𝑋̅)2 Y 𝑌 − 𝑌̅ (𝑌 − 𝑌̅)2 (𝑋 − 𝑋̅)(𝑌 − 𝑌̅)


622,2 232,81 54200,50 10,8 1,03 1,06 239,79
160,4 -228,99 52436,42 11,3 1,53 2,34 -350,35
275,7 -113,69 12925,42 11,4 1,63 2,66 -185,31
433,2 43,81 1919,32 9,1 -0,67 0,45 -29,35
437,9 48,51 2353,22 9,2 -0,57 0,32 -27,65
494,5 105,11 11048,11 11,6 1,83 3,35 192,35
158,3 -231,09 53402,59 9,5 -0,27 0,07 62,39
681 291,61 85036,39 8,2 -1,57 2,46 -457,83
241,3 -148,09 21930,65 6,8 -2,97 8,82 439,83
3504,5 295252,61 87,9 21,54 -116,13
ESTADÍSTICA I
∑ 𝑥 3504.5
𝑋̅ = = = 389.39
𝑛 9

∑ 𝑦 87,9
𝑌̅ = = = 9.77
𝑛 9

∑(𝑋 − 𝑋̅)2 295252.61


𝑆𝑥 = √ =√ = 192.11
𝑛−1 9−1

∑(𝑌 − 𝑌̅)2 21.54


𝑆𝑦 = √ =√ = 1.64
𝑛−1 9−1

∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) −116.13


𝑟= = = −0.046
(𝑛 − 1)(𝑆𝑥 ∗ 𝑆𝑦 ) (9 − 1)(192.11 ∗ 1.64)

b) Determine la ecuación de regresión. Utilice los activos como variable independiente.

𝑅𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌̂ = 𝑏𝑥 + 𝑎
ESTADÍSTICA I
𝑆𝑦 1.64
𝑏=𝑟∗ = −0.046 ∗ = 0.0004
𝑆𝑥 192.11

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 9.77 − (0.0004 ∗ 389.39) = 9.92

𝑌̂ = 0.0004𝑥 + 9.92

c) Para un fondo con $400.0 millones en ventas, determine la tasa de rendimiento a


cinco años en porcentaje.

𝑌̂ = 0.0004𝑥 + 9.92
𝑌̂ = 0.0004(400) + 9.92
𝑌̂ = 10.08
ESTADÍSTICA I

EJERCICIO 17.-Las siguientes observaciones muestrales se seleccionaron al azar

a) Determine el intervalo de confianza 0.95 para la media pronosticada cuando x=7


b) Encuentre el intervalo de predicción 0.95 para una predicción individual cuando
x=7

X: 5 3 6 3 4 4 6 8
Y: 13 15 7 12 13 11 9 5

̅ )(𝒀
(𝑿 − 𝑿 ̂
𝒀−𝒀 (𝒀
X Y ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) (𝑿 − 𝑿 ̅ )𝟐 ̅ )𝟐
(𝒀 − 𝒀
̅) 𝟐
−𝒀 ̂)
−𝒀
5 13 0,125 2,375 0,2969 0,0156 5,6406 2.595 6.734
3 15 -1,875 4,375 -8,2031 3,5156 19,1406 1.079 1.164
6 7 1,125 -3,625 -4,0781 1,2656 13,1406 -1.647 2.712
3 12 -1,875 1,375 -2,5781 3,5156 1,8906 -1.921 3.69
4 13 -0,875 2,375 -2,0781 0,7656 5,6406 0.837 0.7
4 11 -0,875 0,375 -0,3281 0,7656 0,1406 -1.163 1.352
6 9 1,125 -1,625 -1,8281 1,2656 2,6406 0.353 0.1246
8 5 3,125 -5,625 -17,5781 9,7656 31,6406 -0.131 0.017
-36,3750 20,8750 79,8750 16.4936

𝟓+𝟑+𝟔+𝟑+𝟒+𝟒+𝟔+𝟖
𝑋̅ =
𝟖
𝑋̅ = 𝟒, 𝟖𝟕𝟓
ESTADÍSTICA I
𝟏𝟑 + 𝟏𝟓 + 𝟕 + 𝟏𝟐 + 𝟏𝟑 + 𝟏𝟏 + 𝟗 + 𝟓
𝑌̅ =
𝟖
𝑌̅ = 𝟏𝟎, 𝟔𝟐𝟓

𝚺(𝐱 − 𝐱̅)𝟐
𝑺𝒙 = √
(𝒏 − 𝟏)

20,8750
𝑺𝒙 = √
𝟕

𝑺𝒙 = 𝟏, 𝟕𝟐𝟔

𝚺(𝐲 − 𝐲̅)𝟐
𝑺𝒚 = √
(𝒏 − 𝟏)

79,8750
𝑺𝒚 = √
𝟕

𝑺𝒚 = 𝟑, 𝟑𝟕𝟕
𝚺(𝐱 − 𝐱̅)(𝐲 − 𝐲̅)
𝒓=
(𝒏 − 𝟏)𝑺𝒙 𝑺𝒚
−36,3750
𝒓=
(7)(1,726)(3,377)
𝒓 = −𝟎, 𝟖𝟗𝟗
𝑺𝒚
𝒃 = 𝒓( )
𝑺𝒙
3,377
𝑏 = (−0,899) ( )
1,726
𝒃 = −𝟏. 𝟕𝟓𝟖

̅ − 𝒃 ̅𝒙
𝒂=𝒚
𝑎 = 10,625 − (−1.758)(4,875)
𝒂 = 𝟏𝟗, 𝟏𝟗𝟓

̂ = 𝒂 + 𝒃𝒙
𝒀
𝑌̂ = 19,195 + (−1.758)𝑋
Cuando X=7
̂ = 𝒂 + 𝒃𝒙
𝒀
𝑌̂ = 19,195 + (−1,758)(7)
ESTADÍSTICA I
̂ = 𝟔, 𝟖𝟖𝟗
𝒀

𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 𝑛 − 2 = 8 − 2 = 6
𝑡 = 2.447

̂ )𝟐
∑(𝑌 − 𝒀
𝑠𝑦.𝑥 = √
𝑛−2

16.4936
𝑠𝑦.𝑥 = √
6

𝑠𝑦.𝑥 = 1.658

𝟏 ̅)𝟐
(𝒙−𝒙
̂ ± 𝒕𝒔𝒚.𝒙 √ +
a) 𝐼𝑐 = 𝒀 𝒏 ̅)𝟐
∑(𝒙−𝒙

𝟏 𝟒. 𝟓𝟏𝟓𝟔𝟐𝟓
𝐼𝑐 = 6,889 ± (𝟐. 𝟒𝟒𝟕)(𝟏. 𝟔𝟓𝟖)√ +
𝟖 20,8750

𝐼𝑐 = 6,889 ± 𝟐. 𝟑𝟕
𝐼𝑐𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 9.26
𝐼𝑐𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 4.518
b) Intervalo de predicción:

𝟏 ̅)𝟐
(𝒙 − 𝒙
𝐼𝑝 = 𝑌̂ ± 𝒕𝒔𝒚.𝒙 √𝟏 + +
𝒏 ∑(𝒙 − 𝒙 ̅)𝟐

𝟏 𝟒. 𝟓𝟏𝟓𝟔𝟐𝟓
𝐼𝑝 = 6,889 ± (𝟐. 𝟒𝟒𝟕)(𝟏. 𝟔𝟓𝟖)√𝟏 + +
𝟖 20,8750

𝐼𝑝 = 6,889 ± 𝟒. 𝟔𝟗𝟖𝟕𝟕
𝐼𝑐𝑠𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 11.5877
𝐼𝑐𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 2.1902
ESTADÍSTICA I

EJERCICIO 18.- La Bradford Electric Illuminating Company estudia la relación entre


kilowatts-hora (miles) usados y el número de habitaciones en una residencia privada
familiar. Una muestra aleatoria de 10 casas revelo lo siguiente.
Número de Kilowatts-hora
habitaciones (miles)
12 9
9 7
14 10
6 5
10 8
8 6
10 8
10 10
5 4
7 7

a) Determine la ecuación de regresión


X 𝑋 − 𝑋̅ (𝑋 − 𝑋̅)2 Y 𝑌 − 𝑌̅ (𝑌 − 𝑌̅)2 (𝑋 − 𝑋̅)(𝑌 − 𝑌̅)
12 2,9 8,41 9 1,6 2,56 4,64
9 -0,1 0,01 7 -0,4 0,16 0,04
ESTADÍSTICA I
14 4,9 24,01 10 2,6 6,76 12,74
6 -3,1 9,61 5 -2,4 5,76 7,44
10 0,9 0,81 8 0,6 0,36 0,54
8 -1,1 1,21 6 -1,4 1,96 1,54
10 0,9 0,81 8 0,6 0,36 0,54
10 0,9 0,81 10 2,6 6,76 2,34
5 -4,1 16,81 4 -3,4 11,56 13,94
7 -2,1 4,41 7 -0,4 0,16 0,84
91 66,9 74 36,4 44,6

∑ 𝑥 91
𝑋̅ = = = 9.1
𝑛 10

∑ 𝑦 74
𝑌̅ = = = 7.4
𝑛 10

∑(𝑋 − 𝑋̅)2 66,9


𝑆𝑥 = √ =√ = 2.72
𝑛−1 10 − 1

∑(𝑌 − 𝑌̅)2 36.4


𝑆𝑦 = √ =√ = 2.011
𝑛−1 10 − 1

∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 44.6


𝑟= = = 0.904
(𝑛 − 1)(𝑆𝑥 ∗ 𝑆𝑦 ) (10 − 1)(2.011 ∗ 2.72
)

𝑅𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌̂ = 𝑏𝑥 + 𝑎

𝑆𝑦 2.011
𝑏=𝑟∗ = 0.904 ∗ = 0.667
𝑆𝑥 2.72

𝑎 = 𝑌̅ − 𝑏𝑋̅ = 7.4 − (0.667 ∗ 9.1) = 1.33

𝑌̂ = 0.667𝑥 + 1.33
ESTADÍSTICA I

Gráfica de dispersión de Kilowatts-hora ( vs. Número de habita


11

10

9
Kilowatts-hora (miles)

5 6 7 8 9 10 11 12 13 14
Número de habitaciones

b) Encuentre el número de kilowatts-hora, en miles, para una casa de seis habitaciones.


𝑌̂ = 0.667𝑥 + 1.33
𝑌̂ = 0.667(6) + 1.33
𝑌̂ = 5.33
c) Determine el error estándar de estimación
𝑋 𝑌 𝑌̂ 𝑌 − 𝑌̂ (𝑌 − 𝑌̂)2
ESTADÍSTICA I
12 9 9,337 -0,33700 0,114
9 7 7,333 -0,33300 0,111
14 10 10,668 -0,66800 0,446
6 5 5,332 -0,33200 0,110
10 8 8,000 0,00000 0,000
8 6 6,666 -0,66600 0,444
10 8 8,000 0,00000 0,000
10 10 8,000 2,00000 4,000
5 4 4,665 -0,66500 0,442
7 7 5,999 1,00100 1,002
0,00000 6,669

∑(𝑌 − 𝑌̂)2 6.669


𝑆𝑦∗𝑥 = √ =√ = 0.9130
𝑛−2 10 − 2

d) Suponga que se selecciona una muestra grande (en lugar de solo diez). Entre que
valores estará aproximadamente 95% de los pronósticos de los kilowatts-hora?
En este caso se tomara 20 datos para realizar el cálculo

X 𝑋 − 𝑋̅ (𝑋 − 𝑋̅)2 Y 𝑌 − 𝑌̅ (𝑌 − 𝑌̅)2 (𝑋 − 𝑋̅)(𝑌 − 𝑌̅)


12 2,9 8,41 9 1,6 2,56 4,64
9 -0,1 0,01 7 -0,4 0,16 0,04
14 4,9 24,01 10 2,6 6,76 12,74
6 -3,1 9,61 5 -2,4 5,76 7,44
10 0,9 0,81 8 0,6 0,36 0,54
8 -1,1 1,21 6 -1,4 1,96 1,54
10 0,9 0,81 8 0,6 0,36 0,54
10 0,9 0,81 10 2,6 6,76 2,34
14 4,9 24,01 4 -3,4 11,56 -16,66
13 3,9 15,21 7 -0,4 0,16 -1,56
10 0,9 0,81 5 -2,4 5,76 -2,16
ESTADÍSTICA I
14 4,9 24,01 7 -0,4 0,16 -1,96
12 2,9 8,41 8 0,6 0,36 1,74
11 1,9 3,61 5 -2,4 5,76 -4,56
10 0,9 0,81 7 -0,4 0,16 -0,36
12 2,9 8,41 8 0,6 0,36 1,74
6 -3,1 9,61 4 -3,4 11,56 10,54
9 -0,1 0,01 8 0,6 0,36 -0,06
10 0,9 0,81 7 -0,4 0,16 -0,36
12 2,9 8,41 6 -1,4 1,96 -4,06
212 149,8 139 63 12,1

∑ 𝑥 212
𝑋̅ = = = 10.6
𝑛 20

∑ 𝑦 139
𝑌̅ = = = 6.95
𝑛 20

∑(𝑋 − 𝑋̅)2 149.8


𝑆𝑥 = √ =√ = 2.348
𝑛−1 20 − 1

∑(𝑌 − 𝑌̅)2 63
𝑆𝑦 = √ =√ = 1.76
𝑛−1 20 − 1

∑(𝑋 − 𝑋̅)(𝑌 − 𝑌̅) 12.1


𝑟= = = 0.326
(𝑛 − 1)(𝑆𝑥 ∗ 𝑆𝑦 ) (20 − 1)(2.348 ∗ 1.76)

𝑅𝑒𝑔𝑟𝑒𝑠𝑖𝑜𝑛 𝑙𝑖𝑛𝑒𝑎𝑙 𝑌̂ = 𝑏𝑥 + 𝑎

𝑆𝑦 1.76
𝑏=𝑟∗ = 0.326 ∗ = 0.244
𝑆𝑥 2.348
ESTADÍSTICA I
𝑎 = 𝑌̅ − 𝑏𝑋̅ = 6.95 − (0.244 ∗ 10.6) = 0.244

𝑌̂ = 0.244𝑥 + 4.36

Gráfica de dispersión de Kilowatts-hora vs. Número de habitaciones

10

8
Kilowatts-hora

5 6 7 8 9 10 11 12 13 14
Número de habitaciones

X Y 𝑌̂ 𝑌 − 𝑌̂ (𝑌 − 𝑌̂)2
12 9 7,29 1,71200 2,931
9 7 6,56 0,44400 0,197
14 10 7,78 2,22400 4,946
6 5 5,82 -0,82400 0,679
10 8 6,80 1,20000 1,440
ESTADÍSTICA I
8 6 6,31 -0,31200 0,097
10 8 6,80 1,20000 1,440
10 10 6,80 3,20000 10,240
14 4 7,78 -3,77600 14,258
13 7 7,53 -0,53200 0,283
10 5 6,80 -1,80000 3,240
14 7 7,78 -0,77600 0,602
12 8 7,29 0,71200 0,507
11 5 7,04 -2,04400 4,178
10 7 6,80 0,20000 0,040
12 8 7,29 0,71200 0,507
6 4 5,82 -1,82400 3,327
9 8 6,56 1,44400 2,085
10 7 6,80 0,20000 0,040
12 6 7,29 -1,28800 1,659
212 0,07200 52,697

∑(𝑌 − 𝑌̂)2 52.697


𝑆𝑦∗𝑥 = √ =√ = 1.71
𝑛−2 20 − 2

𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 𝑝𝑎𝑟𝑎 𝑙𝑎 𝑚𝑒𝑑𝑖𝑎 𝑑𝑒 𝑦, 𝑑𝑎𝑑𝑎 𝑒𝑛 𝑥

+ 1 (𝑋 − 𝑋̅)2
𝑌̂ 𝑡 (𝑆𝑥∗𝑦 )√ +
− 𝑛 ∑(𝑋 − 𝑋̅)2

𝑛 = 20
𝑆𝑦∗𝑥 = 1.71
𝑋=6
95% 𝑦 𝑛 − 2 = 20 − 2 = 18 → 𝑡 = 2.101
ESTADÍSTICA I
𝑌̂ = 0.244𝑥 + 4.36
𝑌̂ = 0.244(6) + 4.36
𝑌̂ = 5.8240
𝑋 212
𝑋̅ = = = 10.60
𝑛 20

+ 1 (6 − 10.60)2
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 5.8240 2.101 ∗ (1.71)√ + =
− 20 149,8
+
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎 = 5.8240 1.5712

𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑆𝑢𝑝𝑒𝑟𝑖𝑜𝑟 = 7.3952
𝐼𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑖𝑛𝑓𝑒𝑟𝑖𝑜𝑟 = 4.2528
Se puede concluir que el consumos en kilowatts-hora de esta muestra (habitaciones),
varie entre 5.8240 a 4.2528

Gráfica de distribución
T; df=20

0,4

0,3
Densidad

0,2

0,1

0,02426 0,02426
0,0
-2,101 0 2,101
X
ESTADÍSTICA I

Gráfica de distribución con 10 datos


T; df=8
0,4

0,3
Densidad

0,2

0,1

0,02500 0,02500
0,0
-2,306 0 2,306
X