Académique Documents
Professionnel Documents
Culture Documents
INTRODUCCIÓN
estimación de un modelo de regresión lineal simple, el cual permite obtener una aproximación al
valor que pueda tomar una variable (dependiente) en el futuro o pasado. Para esto es necesario,
tomará como base para realizar el pronóstico (variable independiente). Seguido de esto es
necesario realizar la observación de los datos y organizarlos por medio de tablas para luego poder
representarlos de manera gráfica y por último se realiza la estimación del modelo lineal de la
medición. De este modo será necesario conocer los valores β 0 y β 1 para poder determinar cuál
Pronosticar mediante la aplicación del modelo de regresión lineal simple el precio de las
motos Auteco Bajaj línea pulsar 180 GT para el mes de Diciembre del 2019.
Evaluar el modelo diseñado para visualizar la viabilidad del mismo bajo métodos como el
coeficiente de correlación, ANOVA y t de student.
Donde los valores de la variable independiente fueron asignados de una forma determinística,
mediante la numeración de los meses iniciando en 0, como se puede evidenciar en la tabla 1.
Ahora bien, proseguimos a la recopilación y observación de los datos usando como fuente la
“revista motora” en sus diferentes ediciones desde enero del 2005 hasta febrero del 2019. Como
se muestra a continuación:
Seguido de esto se realiza la representación de los datos por medio de una gráfica:
$6,000,000
$5,000,000
$4,000,000
$3,000,000
$2,000,000
$1,000,000
$-
0 20 40 60 80 100 120 140 160 180
Como se puede apreciar en la tabla 1 se calcularon los valores x 2i y x i y i , con los cuales
realizaremos una sumatoria, además de los valores de la variable tanto independiente como
dependiente de la siguiente manera:
170 170
∑ y i=952.471.000 ; ∑ x i=14.535
i=1 i=1
x 2i =¿ 1.623.245 170
∑¿
170
; ∑ x i yi =79.542.572 .000
i=1
i =1
x yi
i
170 170 170
∑ ¿−(∑ xi )(∑ y i )
i=1 i=1 i=1
¿
n¿
^β =¿
1
170 170
∑ yi ∑ xi 952.471.000 14.535
^β 0= i=1
− ^β1 i =0 = −(−2299.027241 ) =5799337,417
n n 170 170
Y así obtenemos la estimación del modelo de regresión lineal simple, que para este caso será:
^y i=5799337,417−2299,03 x i
Y su respectiva gráfica:
Gráfica de Regresión Lineal del precio de las motos con respecto a los últimos años
$7,000,000
$6,000,000
f(x) = - 2299.03x + 5799337.42
$5,000,000 R² = 0.09
$4,000,000
$3,000,000
$2,000,000
$1,000,000
$-
0 20 40 60 80 100 120 140 160 180
Con este modelo podremos predecir el precio de una motocicleta Pulsar 180 GT, tan solo con el
número correspondiente al mes que deseamos predecir; por ejemplo, si deseo predecir el precio
de la moto en diciembre de 2019, remplazo la variable independiente por 179, que sería el
número asignado a este mes:
De esta manera estimamos que para diciembre de 2019 una motocicleta pulsar 180 GT costara
$5.385.512.
∑ ( ^y i− ý)2 2163907662401,3
R2= i=1
170
= =0.0874949
24731814052941,2
∑ ( y i− ý)2
i=1
Continuamos ahora con la ANOVA del modelo de regresión simple que planteamos, a cuál tendrá
la siguiente forma:
Tomando como hipótesis nula de que la pendiente de la recta es cero, es decir, que no existe
relación o dependencia lineal entre las dos variables; así:
H 0 : β1=0
H 1: β1≠ 0
De este modo teniendo en cuenta el valor F encontrado en la tabla ANOVA, y contrastándolo con
el valor F a 1 y 168 grados de libertad con 0.95% de significancia, se rechaza H 0 .
Continuamos ahora con la prueba de T DE STUDENT del modelo de regresión simple que
planteamos, a cuál tendrá la siguiente forma:
Tomando como hipótesis nula de que la pendiente de la recta es cero, es decir, que no existe
relación o dependencia lineal entre las dos variables; así:
H 0 : β1=0
H 1: β1≠ 0
De este modo teniendo en cuenta el valor T encontrado en la tabla, y contrastándolo con el valor
T 168 grados de libertad con 0.95% de significancia, se rechaza H 0 .
CORRECCIÓN:
1- En primer lugar, tomaremos los datos del 1 al 35 y realizaremos la estimación del modelo:
2
35 35 x i =¿ 14.910 35
∑ y i=205.750.000 ; ∑ x i=630 ; 35
∑¿
; ∑ x i yi =3783200000
i=1 i=1 i=1
i=1
$5,800,000.00
PRECIO
$5,600,000.00
$5,400,000.00
$5,200,000.00
$5,000,000.00
0 5 10 15 20 25 30 35 40
MES
∑ ( ^y i− ý)2 1779296923232,49
R2= i=1
35
= =0.91554
1943428571428,57
∑ ( y i− ý)2
i=1
Por lo tanto, se rechaza H 0 , lo que indica que la pendiente de la recta no es cero, es decir,
existe dependencia lineal entre las dos variables, precio y mes.
H 0 : β1=0
H 1: β1≠ 0
De este modo teniendo en cuenta el valor T encontrado en la tabla, y contrastándolo con el valor
T 33 grados de libertad con 0.95% de significancia, se rechaza H 0 .
2- En segundo lugar, tomaremos los datos del 61 al 120 y realizaremos la estimación del modelo:
∑¿
; ∑ x i y i=¿ 28.520 .300.000
i=61 i=61 i=61
i=61
4000000
3000000
2000000
1000000
0
50 60 70 80 90 100 110 120 130
Por lo tanto, se rechaza H 0 , lo que indica que la pendiente de la recta no es cero, es decir,
existe dependencia lineal entre las dos variables, precio y mes.
Tomando como hipótesis nula de que la pendiente de la recta es cero, es decir, que no existe
relación o dependencia lineal entre las dos variables; así:
H 0 : β1=0
H 1: β1≠ 0
De este modo teniendo en cuenta el valor T encontrado en la tabla, y contrastándolo con el valor
T 58 grados de libertad con 0.95% de significancia, se rechaza H 0 .
4. ANÁLISIS
tendencia más óptima que siguen los puntos de dispersión graficados, donde se tuvieron en
del año de forma numérica y y i como variable dependiente representando el precio de la línea
de motos pulsar 180 GT de la marca Auteco Bajaj, como ecuación estimada de esta recta se
que indica claramente que la inclinación de la línea de tendencia es negativa y por ende
descendente así que entre mayor sea el tiempo en meses de la venta de las motos, el precio será
significativamente menor por lo que se establece una relación inversa, luego se procede a
reemplazar xi con el número de mes propuesto (170 Diciembre) para poder hallar el precio
y i y así realizar el pronóstico del mismo y cuyo valor esperado fue de $5.385.512.
BIBLIOGRAFÍA
Andrews, S. Fastqc, (2010). A quality control tool for high throughput sequence data.
Augen, J. (2004). Bioinformatics in the post-genomic era: Genome, transcriptome, proteome, and
information-based medicine. Addison-Wesley Professional.
Blankenberg, D., Kuster, G. V., Coraor, N., Ananda, G., Lazarus, R., Mangan, M., ... & Taylor, J.
(2010). Galaxy: a web‐based genome analysis tool for experimentalists. Current protocols
in molecular biology, 19-10.
Bolger, A., & Giorgi, F. Trimmomatic: A Flexible Read Trimming Tool for Illumina NGS Data.
URL http://www. usadellab. org/cms/index. php.
Giardine, B., Riemer, C., Hardison, R. C., Burhans, R., Elnitski, L., Shah, P., ... & Nekrutenko, A.
(2005). Galaxy: a platform for interactive large-scale genome analysis. Genome research,
15(10), 1451-1455.