Académique Documents
Professionnel Documents
Culture Documents
En este caso la variable dependiente se ve afectada por los cambios que se le hagan a las variables
independientes en conjunto.
La relacin entre las variables regresoras y la variable dependiente se establece mediante el modelo
general de regresin lineal mltiple:
Y 0 1 X 1 2 X 2 3 X 3 k X k
donde 0, 1, 2, ..., k son los parmetros del modelo ( se tienen k variables independientes y p
parmetros ).
En este caso 0 representa la ordenada en el origen, es decir, el punto donde el hiperplano corta al
eje Y (al haber ms de dos variables independientes la relacin queda representada por medio de un
hiperplano).
Por comodidad en la simplicidad de las operaciones, emplearemos en esta ocasin slo dos
variables independientes. Quedar al estudiante utilizar ms de dos variables independientes para
futuras aplicaciones.
Al utilizar dos variables independientes, el modelo general de regresin lineal mltiple queda
representado por:
Y 0 1 X 1 2 X 2
donde:
0 representa el punto donde el plano corta al eje Y (ahora la relacin entre las dos variables
independientes y Y est representada por un plano).
Y 0 1 X 1 2 X 2
X2
X1
ESTIMACIN DE PARMETROS
Para encontrar los estimadores de los parmetros del modelo, partiremos de una muestra aleatoria
de tamao n para valores de X1, X2 y Y:
X1i X2i Yi
X11 X21 Y1
X12 X22 Y2
X13 X23 Y3
. . .
. . .
. . .
X1n X2n Yn
Al utilizar una muestra aleatoria para estimar los parmetros, incurriremos en un error en la
estimacin. Debemos agregar dicho error al modelo de regresin lineal mltiple:
Y 0 1 X 1 2 X 2
Yi 0 1 X 1i 2 X 2i i
Y X
donde:
Y1 1 X11 X 21 1
Y 1 X X 22
2 12 0 2
. . . . .
Y X 1
. . . . .
2
. . . . .
Yn 1 X1n X 2n n
La funcin de mnimos cuadrados est dada por la letra L y es igual a la suma de todos los errores
elevados al cuadrado:
n
L i2
i 1
Si multiplicamos la transpuesta del vector por el mismo vector obtendremos la suma de los
errores elevados al cuadrado:
n
i2
i 1
ahora bien, si de la ecuacin vectorial del modelo de regresin anterior despejamos el error:
Y X
sustituyndolo en L:
L Y X Y X
L Y Y 2X Y X X 2
L
X Y X X
0
despejando :
X X 1 X Y
donde:
n n
n
n X 1i X 2i Yi
0 n i1
n n
i1
n i1
1 X X X1i X 2
X1i X 2i X Y X1i Yi
i1 1i
i1
2 n n
i1 i1
n n
X 2i X 1i X 2i X 2i
2
X 2i Yi
i1 i1 i1 i1
De esta manera, el modelo de regresin lineal mltiple ajustado queda definido por:
Y 0
1 X1
2 X2
Prueba de significancia
La prueba de significancia del modelo nos permite determinar estadsticamente si las variables
independientes (en conjunto) tienen efecto o no sobre la variable dependiente.
Para realizar esta prueba se requiere descomponer la suma total de cuadrados, representada por
Syy, en dos componentes: SSR y SSE
Syy = SSR + SSE
Donde:
Syy es la suma total de cuadrados
SSR es la suma de cuadrados de la regresin
SSE es la suma de cuadrados del error
2
n
n
Yi
Syy Yi i1
2
i 1 n
2
n
Yi
SSR X Y i1
n
H 0 : 1 2 0
Ha : i 0
Utilizamos la tabla de anlisis de varianza:
Fuente de Suma de Grados Media de Estadstico de
Variacin cuadrados de libertad cuadrados prueba
SSR
Regresin SSR k MSR
k MSR
F0
SSE MSE
Error SSE np MSE
np
Total Syy n1
Se pueden realizar pruebas individuales para analizar la relacin entre la variable dependiente y
cada una de las variables independientes.
H0 : j 0
para j = 1, 2, ..., k
Ha : j 0
j
t0
MSE C jj
1
n n
n X 1i X 2i
n i1
n n
i1
C 00 C 01 C 02
X X 1 X1i X 2
X1i X 2i C10 C11 C12
i1 i1
1i
i1
n n n C 20 C 21 C 22
X 2 i X X 1i 2i 2
X 2i
i1 i 1 i1
El estadstico de prueba t0 anterior sigue una distribucin t-student con v = n p grados de libertad.
Entonces, si el valor absoluto del estadstico de prueba es mayor que el valor de tablas t , n p, se
rechaza la hiptesis nula. Como conclusin diremos que la variable independiente Y s est
relacionada con la variable independiente Xj.
Se pueden tambin estimar los parmetros del modelo mediante intervalos de confianza.
Para cualquier parmetro, el intervalo de confianza de (1 ) 100% est dado por la siguiente
expresin:
j t ,n p MSE C jj j j t ,n p MSE C jj
para j = 0, 1, 2, ..., k
En cuanto a las conclusiones de los resultados obtenidos en los intervalos de confianza se aplica un
criterio semejante al empleado en la regresin lineal simple.
Como 0 indica un punto donde el plano cortar al eje Y, la conclusin del intervalo
correspondiente no debe presentar problema alguno a la hora del planteamiento.
Algo diferente resulta a la hora de concluir los intervalos de confianza para los dems parmetros:
Como vimos anteriormente, el modelo de regresin lineal mltiple nos permite establecer la
relacin entre la variable dependiente (Y) con ms de una variables independientes (X 1, X2, ..., Xk).
Tambin podemos utilizar el modelo de regresin para encontrar el valor estimado de Y cuando X 1
= X1,0 y X2 = X2,0 (cuando hay dos variables independientes en el modelo). Basta introducir los
valores correspondientes de las variables independientes en el modelo:
0
Y 1 X1, 0
0 2 X 2 ,0
En forma matricial:
0 X !0
Y
donde
1
X 0 X1,0
X 2 , 0
Entonces, el intervalo de confianza de (1 ) 100% para el valor esperado de Y est dado por la
expresin:
Y0 t ,n p MSE X !0 X X X 0 Y Y0 t ,n p MSE X !0 X X X 0
1 1
El intervalo de confianza de (1 a) 100% para una observacin futura de Y est dado por:
Y0 t , n p MSE 1 X !0 X X X 0 Y0 Y0 t , n p MSE 1 X !0 X X X 0
1 1
Coeficiente de determinacin mltiple
SSR
R2
Syy