Vous êtes sur la page 1sur 16

PROYECTO DE AULA

NATALIA EGEA TERRAZA


JOHANA ALEJANDRA TANGARIFE RUIZ

DIANA GUZMÁN

ESTADÍSTICA APLICADA

UNIVERSIDAD DE MEDELLÍN
FACULTAD DE INGENIERÍAS
INGENIERÍA FINANCIERA
2020
PARTE I
1. Suponga que se puede asegurar que los rendimientos de cada activo financiero tienen una distribución
normal, con las medias y las desviaciones estándar muéstrales respectivas. Suponga además que los
rendimientos son estadísticamente independientes.
a. Calcule e interprete un intervalo de confianza del 97% para la rentabilidad promedio diaria de
las 3 acciones, ¿Qué ocurre si incrementa el nivel de confianza en un 2%? ¿qué puede decir al
respecto?

Hay suficiente evidencia estadística para afirmar que


con un nivel de confianza del 97%, la rentabilidad promedio de las acciones de Grupo Sura se encuentra en un
intervalo entre (-0.0001872; 0.0006165), y con un nivel de confianza del 99% la rentabilidad promedio de las
acciones se encuentra en un intervalo de (-0.0007840; 0.001213).

Para Bancolombia podemos afirmar que con un nivel de confianza del 97% la rentabilidad promedio de las
acciones se encuentran en un intervalo entre (-0.001217; -0.0001833), y con un nivel de confianza del 99%
las rentabilidades de las acciones se encuentran en un intervalo de (-0.001985; 0.0005849).

Por último, para Nutresa podemos afirmar que con un nivel de confianza del 97% la rentabilidad promedio de
las acciones se encuentran en un intervalo entre (-0.0004147; 0.0002895), y con un nivel de confianza del
99% las rentabilidades de las acciones se encuentran en un intervalo de (-0.0009377; 2.5757).

Teniendo en cuenta la información anterior, podemos afirmar que a medida que el nivel de confianza
aumenta, también aumenta la amplitud y por consiguiente se tienen en cuenta más datos en el intervalo, esto
puede indicar que hay un acercamiento estadístico a encontrar parámetros poblacionales.

b. ¿Existe alguna diferencia estadísticamente significativa entre los rendimientos promedio diario
de las acciones? Realice el análisis por pares de acciones.
Realizando la prueba de hipótesis por pares de
acciones (Sura- Bancolombia, Nutresa-
Bancolombia y Sura-Nutresa) observamos que en los tres grupos de análisis el z Calculado no entra en la región
de rechazo, por lo tanto, Ho no se rechaza, lo que nos lleva a decir que tiene una alta probabilidad a que los
comportamientos de los rendimientos de las acciones sean iguales.

c. ¿Existe alguna diferencia estadísticamente significativa entre las volatilidades diarias de los
rendimientos de las acciones? Realice el análisis por pares de acciones.
Nivel de significancia (α) 0,3
Estadistico de prueba (F) 1,302619
α/2 0,15
F(α/2,n1-1,n2-1) 1,08
Ho: σ1 = σ2
Ha: σ1 ≠ σ 2

Nivel de significancia (α) 0,3


Estadistico de prueba (F) 0,463398
α/2 0,15
F(α/2,n1-1,n2-1) 1,08
Ho: σ1 = σ2
Ha: σ1 ≠ σ 2

Para analizar si existe alguna divergencia entre las volatilidades diarias de los rendimientos de las acciones, se
realizó una prueba de hipótesis por pares de (Sura-Bancolombia, Nutresa-Bancolombia y Sura-Nutresa). En
base a esto se puede decir que, el F Calculado entra en la región de rechazo en uno de los casos (Sura-Nutresa)
por lo tanto la hipótesis nula (Ho) se rechaza, esto quiere decir que las volatilidades diarias de los
rendimientos de estas dos acciones son diferentes, para el caso de los otros dos pares de acciones el F Calculado
no entra en la región de rechazo, por lo tanto la hipótesis nula (Ho) no se rechaza, esto quiere decir que las
volatilidades diarias de los rendimientos de estas acciones son iguales.

d. ¿La correlación entre los rendimientos diarios de las acciones es estadísticamente significativa?
Realice el análisis por pares de acciones.
CORRELACION GRUPO SURA BANCOLOMBIA NUTRESA
GRUPO SURA 1 0,338771 0,188488
BANCOLOMBIA 0,338771 1 0,174838
NUTRESA 0,188488 0,174838 1

Nivel de significancia (α) 0,3


t(α,n-2) 1,0372
Estadistico de pruba (T) 5,157111
Ho: P1 = 0
Ha: P1 ≠ 0

En cada par de acciones se observa que el estadístico de prueba cae en la región de rechazo, además el T Calculado es
mayor al valor crítico con esto se rechaza Ho, por lo tanto se puede explicar que la correlación de cada par de acciones
es lineal
2. ¿El supuesto de que el rendimiento diario de las acciones de cada compañía sigue una distribución normal es
adecuado? Utilice la prueba de normalidad Anderson Darling formulada de manera manual en Excel.

GRUPO SURA BANCOLOMBIA NUTRESA


MEDIA 0,000214651 MEDIA -0,00070052 MEDIA -0,000062626
DESVIACION 0,010432411 DESVIACION 0,013427614 DESVIACION 0,009140626
SUMA S -725,861243 SUMA S -724,0085186 SUMA S -727,435571570
A2 2,861 A2 1,009 A2 4,436

La hipótesis para la prueba de normalidad ANDERSON DARLING:


Ho: Los datos siguen una distribución normal
Ha: Los datos no siguen una distribución normal

Con una confianza del 97%, si A2 < 0.870, podemos afirmar que las rentabilidades diarias de los activos se
ajustan a una distribución normal, y como podemos observar en los tres activos selecciónalos, esta relación
no se cumple en ningún caso, por lo que podemos deducir que en esta prueba los datos no se ajustan a una
distribución normal.
3. Encuentre la distribución de probabilidad a la que se ajusta el rendimiento diario de cada una de las acciones
usando @risk. Con base en la(s) distribución(es) encontrada(s), halle el rendimiento diario de cada una de las
acciones, los percentiles del 10% y del 95% e interprete cada resultado.

Grupo sura:
Ho: Los datos siguen una distribución normal
Ha: Los datos no siguen una distribución normal
Nivel de significancia: 3%
Histogram of y

250
Frequency

100
0
-0.04 -0.02 0.00 0.02 0.04

Normal Q-Q Plot

Sample Quantiles

0.02
-0.02

-3 -2 -1 0 1 2 3

Theoretical Quantiles

BANCOLOMBIA:

Ho: Los datos siguen una distribución normal


Ha: Los datos no siguen una distribución normal
Nivel de significancia: 3%

Histogram of y
200
Frequency

100
0

-0.04 -0.02 0.00 0.02 0.04 0.06 0.08

Normal Q-Q Plot


Sample Quantiles

0.02
-0.04

-3 -2 -1 0 1 2 3

Theoretical Quantiles

La prueba de distribución a la que más se ajusta para los rendimientos de Bancolombia es la


LILLIEFORST TEST, la cual arroja un valor P de 0.1036, por lo tanto podemos decir que el valor p> α
(0.1036 > 0.03), lo cual no indica que No se rechaza Ho.

NUTRESA:

Ho: Los datos siguen una distribución normal


Ha: Los datos no siguen una distribución normal
Nivel de significancia: 3%
Histogram of y

200
Frequency

100
0
-0.04 -0.02 0.00 0.02

Normal Q-Q Plot


Sample Quantiles

0.00
-0.04

-3 -2 -1 0 1 2 3

Theoretical Quantiles
PARTE II
Considerando la misma base anterior y suponiendo la existencia de una relación lineal entre
el índice COLCAP y los activos escogidos (grupo sura, Bancolombia preferencial y grupo
Nutresa) llegamos a las siguientes conclusiones.
2.1 Estime la ecuación de regresión para cada uno de los activos. Para cada una de ellas
interprete cada uno de los términos de las expresiones halladas.
GRUPO SURA BANCOLOMBIA PF

Ri , t=  - 0,000232954 +0,06662169    X 1 Ri , t=  0,000678414  + 0,080476148    X 2

Estadísticas de la regresión
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,0457739759730751
Coeficiente de correlación múltiple 0,04295918
Coeficiente de determinación R^2 0,00209525687638366
Coeficiente de determinación R^2 0,001845491
R^2 ajustado 0,00071120036719695
R^2 ajustado 0,000461088
Error típico 0,0104287002526668
Error típico 0,013424518
Observaciones 723
Observaciones 723

β0= -0, 000232954, será el nivel base para cada cambio en los β0= 0.000678414, será el nivel base para cada cambio en los
rendimientos diarios del Grupo Sura que se verán en un rendimientos diarios del Grupo Sura que se verán en un
incremento de β1= 0.06662169, la sensibilidad de la variable incremento de β1=0.080476148, la sensibilidad de la variable
dependiente respecto a la variable independiente dependiente respecto a la variable independiente

El coeficiente de correlación es de 0.04577, este determina El coeficiente de correlación es de 0.04296, este determina
GRUPO
que los rendimientos NUTRESA
diarios de Sura no son sensibles a los que los rendimientos diarios de Sura no son sensibles a los
cambiosR en= 
el 5,77954E-05
rendimiento del COLCAP
 +0, 017583332   X cambios en el rendimiento del COLCAP
i,t 3

El R2 es de 0.002095 es el porcentaje de variabilidad El R2 es de 0.0004611 es el porcentaje de variabilidad


Estadísticas de la regresión
considerando como variable independiente
de correlación el índice COLCAP. considerando como variable independiente el índice COLCAP.
Coeficiente múltiple 0,013788368
Coeficiente de determinación R^2 0,000190119
R^2 ajustado -0,00119658
Error típico 0,009146094
Observaciones 723
β0= 5.7795E-05, será el nivel base para cada cambio en los DONDE X ES LA RENTABILIDAD DEL
rendimientos diarios del Grupo Sura que se verán en un INDICE, Y ES LA RENTABILIDAD DEL
incremento de β1= 0.01758, la sensibilidad de la variable ACTIVO.
dependiente respecto a la variable independiente
INTERCEPTO β0, ES EL VALOR BASE
El coeficiente de correlación es de 0.013788, este determina que DE NUESTRO MODELO DE
los rendimientos diarios de Sura no son sensibles a los cambios REGRESION QUE MUESTRA EL
en el rendimiento del COLCAP RENDIMIENTO DIARIO DE CADA
UNA
El R2 es de 0.0001901 es el porcentaje de variabilidad
considerando como variable independiente el índice COLCAP.
2.2 Verifique el cumplimiento de los supuestos del modelo de regresión lineal simple para cada una
de las ecuaciones obtenidas.

SURA, se puede evidenciar que X si explica a Y de BANCOLOMBIA, se puede evidenciar que X si explica a
forma lineal Y en forma lineal

2.3 Determine un valor y NUTRESA, se puede evidenciar que X si explica a Y, en


construya
intervalos de confianza forma lineal para la predicción
individual y esperada para cada uno de los
modelos.
Con un intervalo de confianza del 99% se espera que para los rendimientos puntuales tomados el precio este
entre {100482 y -100482} para grupo sura, {72777 y -72777} para Bancolombia preferencial y {62698 y
-62698} para grupo Nutresa.
n 723
INTERVALO DE CONFIANZA PARA LA PREDICCION
1-α 99%
GRUPO SURA 100482,6945 -100482,6946 α 1%
BANCOLOMBIA PF 72777,59003 -72777,58896 α/2 0,005
GRUPO NUTRESA 62698,3729 -62698,24081 tα/2,n-2 2,582646

Con un intervalo de confianza del 99% se espera que el precio promedio este entre {} para grupo sura, {}
para Bancolombia preferencial y {} para grupo Nutresa

INTERVALO DE CONFIANZA PARA LA ESPERANZA

GRUPO SURA 3734,409834 -3734,409984


BANCOLOMBIA PF 2704,758348 -2704,757277
GRUPO NUTRESA 2330,230267 -2330,09818
2.4 Pruebe si el parámetro  de cada uno de los modelos es estadísticamente igual a uno e interprete (use
α =0.05 )

grupo sura bancolombia grupo nutresa


n 723
ࡴ૙ ǣࢼ૚ ൌ
૚ ࡴ૙ ǣࢼ૚ ൌ
૚ ࡴ૙ ǣࢼ૚ ൌ
૚ α 0,05
ࡴࢇ ǣࢼ૚ ് ૚ ࡴࢇ ǣࢼ૚ ് ૚ ࡴࢇ ǣࢼ૚ ് ૚
α/2 0,025
|T|>tα/2,n-2 |T|>tα/2,n-2 |T|>tα/2,n-2 tα/2,n-2 1,95996398

No Rechaza H0 No Rechaza H0 No Rechaza H0

En los tres casos se puede evidenciar que no se rechaza la hipótesis esto dado a que β1 es
igual a uno y ninguno es mayor a t (α/2, n-2).
Para el grupo sura el valor absoluto de T es 1.230386927, es decir, menor a 1.95996398, lo
mismo sucede con los otros dos activos los cuales el valor absoluto de T es 1.154581874
para Bancolombia y 0.37027278 para grupo Nutresa, ambos menores a 1.95996398, por lo
cual no se rechaza la hipótesis.

2.5 Si alguno de los  es estadísticamente diferente de uno, pruebe si es mayor o menor que uno e interprete
el resultado, ¿Cuál o cuáles acciones son más sensibles a los cambios en los rendimientos de mercado y por lo
tanto más riesgosas? (use α =0.05 )

grupo nutresa Como se había mencionado en el punto anterior, aunque para el


grupo sura β1 es menor a 1 no se rechaza la hipótesis dado a que el
ࡴ૙ ǣࢼ૚ ൑ ૚ valor de T (0.37027278) es menor al valor de t (α/2, n-2) que es
ࡴࢇ ǣࢼ૚ ൐ ૚ 1.95996398

T>tα,n-2

No se rechaza la H0 2.6 Construya un portafolio compuesto por los tres activos, invirtiendo según sus
preferencias como inversionista. Encuentre el beta del portafolio estimando la
regresión R portafolio ,t =α + β RCOLCAP , t +e t . Interprete el valor de la beta del
portafolio. Determine qué porcentaje de riesgo total del portafolio es no diversificarle, que porcentaje de
riesgo total es diversificarle.

Ri , t=  0,000171461  +0,058608275    RCOLCAP


En este caso tendremos un perfil de inversionista adverso al riesgo dada la coyuntura
económica actual, los cálculos nos muestran que la beta del portafolio es de 0.059, esto
indica que es un portafolio con poca volatilidad, de esta manera el riesgo que se está
asumiendo no es alto, de hecho el riesgo total es de 0,27% lo que indica que incurre en que
el riesgo de no diversificación sea realmente alto (99.73%), lo más recomendable es este
caso es que el inversionista tome más activos o se distribuya entre otras industrias, sean
extranjeras o nacionales.
Paso 4

Paso 2
Derivar parcialmente β0: FINALMENTE

Paso 3
Derivamos parcialmente β1:
PARTE III
3.1 Calcule los estadísticos muéstrales que considere pertinentes para analizar el tiempo que tarda cada línea
en producir las láminas. ¿Identifica algún tiempo atípico? Analice e interprete

Para analizar el tiempo en centiminutos


LINEA 1 LINEA 2
necesarios para la producción de
Promedio 25,31 24,94 láminas metálicas para escritorios, se
Desviación estándar 1,832 0,623 analizaron diferentes estadísticos
varianza muestral 3,357 0,389 muéstrales, los cuales nos ayudarán a
n 98 98 interpretar su comportamiento.
Máximo 30,56 26,54 Podemos observar que, en el tiempo
Mínimo 22,23 23,58 promedio, la varianza y el rango son
Rango 8,33 2,96 mayores en la línea uno que en la línea
dos lo que permite deducir que esta es
más ineficiente.
3.2 De acuerdo con los datos suministrados, ¿considera que es necesario tomar más tiempos?
Analice e interprete.
Para el análisis de este punto se decidió tomar en cuenta que se espera una precisión menor al 3%
referente a un intervalo de confianza del 97%, del total de muestras (98) se tomó una porción de 90
y 93 para la línea uno y dos respectivamente, en base a esta información pudimos concluir que se
necesitarían tomar 392 muestras para la línea uno y 253 muestras para la línea dos

LINEA 1 LINEA 2

1-α 0,97 1-α 0,97


α 0,03 α 0,03
α/2 0,015 α/2 0,015
n 98 n 98
Z(α/2) 2,17 Z(α/2) 2,17
muestras tomadas 90 muestras tomadas 93
proporcion tomada 0,91836735 proporcion tomada 0,94897959
minimo de muestras 392 minimo de muestras 253

Es evidente que el tamaño de muestras que se tomaron no es suficiente, aunque


teóricamente se identifican como grandes debido a que son mayores a 30, se puede
evidenciar que la línea uno necesita más muestras, esto se podría ver explicado por la
desviación estándar que es un poco alta, además de que en sus gráficos se evidencia que su
distribución no sigue un comportamiento normal, en cambio la línea dos basándonos en sus
gráficos podemos decir que sigue una distribución normal.
3.3 De acuerdo con los datos suministrados, calcule e interprete

Se puede analizar que con un


intervalo de confianza del 97% el

INFERIOR SUPERIOR INFERIOR SUPERIOR


24,910 25,713 24,804 25,077
tiempo promedio de las láminas de la línea 1 oscila entre {24,910 – 25,713} minutos, para
la línea dos este intervalo se sitúa entre {24,804 – 25,007}. Con estos datos se puede
concluir que la producción de la lámina dos es más eficiente que la producción de la lámina
uno, es decir, está más cerca de los estándares de calidad, mientras que la línea uno es más
demorado.

En la tabla anterior se puede


evidenciar que con intervalo de
confianza del 97% el tiempo de
INFERIOR SUPERIOR INFERIOR SUPERIOR producción de las lamina uno está
1,585 2,168 0,539 0,738 entre {1,585 – 2,168} y la de la
lámina dos está entre {0,539 –
0,738}. De estos resultados se puede concluir que la producción más eficiente es la dos
debido a que su rango de desviación es mucho inferior que la de la línea uno, por lo cual se
recomienda utilizar más la línea dos.

Con un intervalo de confianza del 97%


se puede evidenciar que la razón de las
varianzas esta entre {5,542 – 13,458}
minutos, como este intervalo no
contiene a uno es razonable suponer que
las varianzas son diferentes, por lo tanto,
el tiempo de producción tiene un riesgo diferente en el tiempo del mismo.
3.4 Analice la normalidad del tiempo de producción por unidad en cada una de las líneas, usando la prueba chi
cuadrad o formulada de manera manual en Excel.

LINEA 1 LINEA 2 Con un nivel de


significancia del 3% (α =
H0 0.003) se identifica que las
Ha muestras de la línea uno y de
chi cuadrado calculado 131,959 36,733 la línea dos no siguen una
chi cuadrado (1-a,v) 4,709 4,709 distribución normal ya que
α 0,03 0,03 valor-p es mayor a nivel de
cantidad de parametros 1 1 significancia, además con
grados de libertad 6 6 una prueba de r se identificó
probabilidad 4,97026E-26 1,9847E-06 que no sigue una distribución
normal (ver anexo)
3.5 El proveedor de las líneas de producción indica que una pieza debe ser producida entre 25 ± 0.05
minutos ¿Cuál de las líneas se ajusta mejor al tiempo que indica el proveedor? Explique analíticamente su

ESPECIFICACIONES

INFERIOR SUPERIOR
24,95 25,05
¿CUMPLE? CONTEO L1 ¿CUMPLE? CONTEO L2
VERDADERO 2 VERDADERO 11
FALSO 96 FALSO 87
TOTAL 98 TOTAL 98
respuesta

En los cuadros anteriores se puede evidenciar que se ajusta mejor la línea dos esto dado a
que su nivel de acierto en el tiempo esperado (25 ± 0.05) es mayor al de la línea dos

3.6 ¿Cuál de las dos líneas es más productiva?


Dados los análisis anteriores se puede evidenciar que la línea dos es más productiva que la línea uno,
esto se demuestra en su mayoría en el tiempo promedio que tarda en producir una lámina y en la
cantidad de aciertos que tiene en el tiempo esperado de producción.

PARTE IV
El área de mercadeo de una empresa desea estudiar si hay alguna relación entre los ingresos per cápita
familiares (ingresos familiares mensuales promedio dividido entre el número de personas que conforman el
núcleo familiar) y el consumo de bebidas gaseosas por persona (en litros promedio al mes por persona), con
el propósito de diseñar alguna estrategia que permita llegar a todo su público objetivo. De esta manera
realizó un estudio riguroso durante el año 2019 y recolectó los datos que se encuentran en el archivo adjunto
llamado BD2.
1. Calcule los ingresos per cápita familiares mensuales promedio del año 2019 y construya un modelo de
regresión lineal simple entre las dos variables de interés en Excel.
El modelo de regresión lineal simple será:
Y =−9 E - 06 X + 9.2239+ Ɛ

2. Interprete el resumen, el análisis de varianza, la tabla de coeficientes y el análisis de residuales que arroja
Excel.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,778109578
Coeficiente de determinación R^2 0,605454516
R^2 ajustado 0,602166637
Error típico 1,229891736
Observaciones 122
Analizando la tabla de resumen de regresión arrojada por excel

Analizando el análisis de varianza podemos observar que el SSR: 278,5476, por lo tanto en base a esto

podemos decir que X (Ingreso per cápita familiares) ayuda a explicar de mejor manera Y (Litro de bebidas
gaseosas-promedio mensual) ya que el SSR es grande.

El SSE: 181,5160, esta suma de los cuadrados de los errores nos ayuda a medir cuan bien la línea se ajusta a
los datos, por lo cual podemos decir que se ajusta bien ya que este dato es pequeño, y entre más pequeño
mejor.

3. Valide TODOS los supuestos del modelo de regresión lineal simple.


4. Calcule e los intervalos de predicción promedio e individual para los siguientes valores de ingresos per
cápita familiares y grafique las bandas de los intervalos. Interprete.
320.000 420.000 520.000 620.000 720.000 820.000 920.000 1.020.000

Vous aimerez peut-être aussi