Académique Documents
Professionnel Documents
Culture Documents
Un modelo de regresión es un modelo que permite describir cómo influye una variable X sobre
otra variable Y.
Regresión lineal simple. Tiene como objeto estudiar cómo los cambios en una variable, no
aleatoria, afectan a una variable aleatoria, en el caso de existir una relación funcional entre ambas
variables que puede ser establecida por una expresión lineal, es decir, su representación gráfica
es una línea recta. Cuando la relación lineal concierne al valor medio o esperado de la variable
aleatoria, estamos ante un modelo de regresión lineal simple. La respuesta aleatoria al valor x de
la variable controlada se designa por Yx y, según lo establecido, se tendrá
De manera equivalente, otra formulación del modelo de regresión lineal simple sería: si xi es un
valor de la variable predictora e Yi la variable respuesta que le corresponde, entonces
Y = a + bX
Y = + X
0 representa la ordenada en el origen, esto es, el punto donde la recta corta el eje Y.
1 representa la pendiente, esto es, el cambio esperado en Y por cada incremento unitario
en X.
PRUEBAS DE HIPOTESIS EN LA REGRESION LINEAL SIMPLE
PARA LA ORDENADA EN EL ORIGEN
H 0 : 0 0,0
H a : 0 0,0
ˆ 0 0,0
t0
1 X 2
MSE
n Sxx
Donde:
MSE es la media de los cuadrados del error o bien, el estimador de la varianza del modelo:
SSE
2 MSE
n2
En este caso SSE es la suma de los cuadrados del error y n – 2 son los grados de libertad
del error.
i 1 n
H 0 : 0 0,0
H a : 0 0,0
ˆ 0 0,0
t0
1 X 2
MSE
n Sxx
1 X 2
En el estadístico de prueba vemos que MSE representa la desviación estándar
n Sxx
para 0.
Si el valor absoluto del estadístico de prueba es mayor que el valor de tablas, t /2, n – 2,
entonces rechazaremos la hipótesis nula; aceptaremos la alternativa concluyendo que la
ordenada en el origen es diferente al valor con el cual la estamos comparando.
PARA LA PENDIENTE
Algo semejante realizaremos para la pendiente. Partimos de la hipótesis nula afirmando
que la pendiente es igual a un valor determinado (siempre que dicho valor sea diferente de
cero), contra la alternativa apropiada, por ejemplo que sea diferente a dicho valor:
H 0 : 1 1,0
H a : 1 1,0
ˆ 1 1,0
t0
MSE
Sxx
Este estadístico también sigue una distribución t-student con v = n – 2 grados de libertad.
MSE
Del mismo modo, la expresión representa la desviación estándar para 1.
Sxx
Si el valor absoluto del estadístico de prueba es mayor que el valor de tablas, t/2, n – 2,
entonces se rechaza la hipótesis nula y se acepta la alternativa: la pendiente es diferente
al valor representado por 1,0.
Un caso especial para la pendiente sería probar la hipótesis nula afirmando que la pendiente
es igual a cero contra la alternativa que sea diferente de cero.
También conocido como Prueba de Significancia, nos ayuda a determinar si la variable
independiente tiene o no efecto significativo sobre la variable dependiente.
Para realizar este procedimiento de prueba de hipótesis, descomponemos la suma total de
cuadrados en dos partes: la suma de cuadrados de la regresión y la suma de los cuadrados
del error.
Entonces:
H 0 : 1 0
H a : 1 0
1 X 2 1 X 2
ˆ 0 t ,n 2
MSE 0
ˆ 0 t ,n 2 MSE
2 n Sxx 2 n Sxx
Aquí, como 0 representa solamente una posición, no debe existir problema alguno en
cuanto a la conclusión de los resultados obtenidos.
MSE MSE
ˆ 1 t ,n 2
1 ˆ 1 t ,n 2
2 Sxx 2 Sxx
En este caso la conclusión si depende del resultado obtenido, veamos los casos posibles:
Puede que el intervalo resulte en a 1 b ; la conclusión apropiada será que por cada
incremento en X, Y, disminuirá, en promedio, por lo menos b y a lo mucho a veces.
Otro resultado posible para el intervalo sería a 1 b ; la conclusión será, en este caso,
que por cada incremento en X, Y se incrementará, en promedio, por lo menos a y a lo
mucho b veces.
Yˆ ˆ 0 ˆ 1 X 0
1 X 0 X 2 1 X 0 X 2
Yˆ0 t ,n 2
MSE y Y0 t ,n 2 MSE
ˆ
2
n Sxx 2
n Sxx
1 X 0 X2 1 X 0 X2
ˆ 0 t
Y MSE1 ˆ 0 t
Y0 Y MSE1
,n 2 ,n 2
2
n Sxx 2
n Sxx
1 1 X 0 X 2 1 1 X 0 X 2
Yˆ0 t ,n 2
MSE Y0 Y0 t ,n 2 MSE
ˆ
2
k n Sxx 2
k n Sxx
EJERCICIO
Para ejemplificar lo visto anteriormente, resolveremos el siguiente ejercicio utilizando las
fórmulas encontradas.
X Y
1.0 101.4
1.5 117.4
1.5 117.1
1.5 106.2
2.0 131.9
2.0 146.9
2.2 146.8
2.4 133.9
2.5 111.3
2.5 123.0
2.8 125.1
2.8 145.2
3.0 134.3
3.0 144.5
3.2 143.7
3.3 146.9
n= 16
X = 37.2
X2 = 93.66
Y = 2075.6
Y2 = 272908.02
XY = 4937.97
Con los valores anteriores, calcularemos las expresiones Sxx, Sxy que nos permitirán
determinar los estimadores de los parámetros del modelo solicitado en el inciso 1 del
ejercicio.
X Y
Sxy XY
n
Sxy 4937.97
37.2 2075.6
16
Sxy 112.2
X 2
Sxx X 2
n
Sxx 93.66
37.2
2
16
Sxx 7.17
Sxy
ˆ 1
Sxx
112.2
ˆ 1
7.17
1 15.6485
ˆ
ˆ 0 Y 1 X
ˆ 0 129.725 15.64852.325
ˆ 0 93.3422
El primer inciso nos pide ajustar un modelo de regresión lineal simple a los datos:
Yˆ 93.3422 15.6485 X
De aquí concluimos lo siguiente:
Enseguida calcularemos los valores de Syy, SSR y SSE que nos permitirán realizar la
prueba de significancia del modelo.
Y 2
Syy Y
2
Syy 272908.02
2075.6
2
16
Syy 3650.81
SSR ˆ 1 Sxy
SSR 15.6485112.2
SSR 1755.7617
H 0 1 0
H a 1 0
F0
SSR1
SSE n 2
1755.76171
F0
1895.048314
1755.7617
F0
135.3605
F0 12.9710