Académique Documents
Professionnel Documents
Culture Documents
Cristbal Moya
Universidad de Chile
Diplomado en anlisis multivariable aplicada a la investigacin social
Regresin lineal mltiple Interpretacin, interacciones y
supuestos
Contenidos
a. Repaso
b. Variables independientes dicotmicas
c. Probar supuestos del modelo
d. Interaccin entre variables
= + 11 + 22
Educacin
(aos)
Ingreso
Edad
= + 1 + 2
Constante o intercepto ()
Coeficientes de regresin ()
Cambio en Y por cada aumento en una unidad de X, controlando por las dems
variables en el modelo
Coeficiente de determinacin R2
Igual que en el caso de la regresin lineal simple, pero evaluando si una variable tiene
un efecto significativo una vez que controlamos por las dems variables en el modelo:
Donde
n= tamao de la muestra
Interpretacin de valor p:
Supuestos
Actividad 1
Actividad 1: Resultados
9
Ecuacin de regresin:
Constante
Aos de escolaridad
Edad
Coeficiente
Error
estndar
Sig.
Intervalo de confianza
(95%)
-126304,0
12396,6
-10,189
<0,01
-150601,3
-102006,7
46416,1
596,1
77,870
<0,01
45247,8
47584,4
1973,9
171,7
11,498
<0,01
1637,4
2310,3
Actividad 1: Resultados
10
Educacin
Este efecto es significativo al 99% de confianza, por lo que podemos inferir que la
escolaridad se asocia a los ingresos autnomos en la poblacin de jefes/as de hogar
chilenos/as.
Constante
Aos de escolaridad
Edad
Coeficiente
Error
estndar
Sig.
Intervalo de confianza
(95%)
-126304,0
12396,6
-10,189
<0,01
-150601,3
-102006,7
46416,1
596,1
77,870
<0,01
45247,8
47584,4
1973,9
171,7
11,498
<0,01
1637,4
2310,3
Actividad 1: Resultados
11
Edad
Por cada diez aos adicionales en edad, el valor esperado de ingreso autnomo aumenta
en (10*1973,9)=19.739 pesos, controlando por nivel educacional
Con un 95% de confianza, por cada diez aos adicionales en edad, el valor esperado de
ingreso autnomo aumenta entre 16.374 y 23.103 pesos, controlando por nivel educacional
Este efecto es significativo al 99% de confianza, por lo que podemos inferir que la edad se
asocia a los ingresos autnomos en la poblacin de jefes/as de hogar chilenos/as.
Formato APA abreviado: La edad de las personas tiene un efecto positivo y significativo en
el ingreso de los jefes de hogar, controlando por los aos de escolaridad ( = 1.973,9; <
0,01).
Constante
Aos de escolaridad
Edad
Coeficiente
Error
estndar
Sig.
Intervalo de confianza
(95%)
-126304,0
12396,6
-10,189
<0,01
-150601,3
-102006,7
46416,1
596,1
77,870
<0,01
45247,8
47584,4
1973,9
171,7
11,498
<0,01
1637,4
2310,3
Actividad 1: Resultados
12
R cuadrado
R2: 0,098
Constante
Aos de escolaridad
Edad
Coeficiente
Error
estndar
Sig.
Intervalo de confianza
(95%)
-126304,0
12396,6
-10,189
<0,01
-150601,3
-102006,7
46416,1
596,1
77,870
<0,01
45247,8
47584,4
1973,9
171,7
11,498
<0,01
1637,4
2310,3
Contenidos
a. Repaso
b. Variables independientes dicotmicas
c. Probar supuestos del modelo
d. Interaccin entre variables
En otros casos podemos utilizar 0 para la ausencia de algn atributo y 1 para la presencia
de algn atributo
Introducimos la variable dummy (ej. 2 ) al modelo al igual que las dems variables:
= + 11 + 22
Ejemplo:
Las mujeres jefe de hogar tienen un ingreso inferior en 160.546 pesos al de los
hombres jefe de hogar, controlando por nivel educacional y edad
Error
estndar
Sig.
-113569,3
12315,7
-9,221
<0,01
-137708,1
-89430,4
Aos de escolaridad
46531,4
591,8
78,622
<0,01
45371,4
47691,4
Edad
2528,6
171,5
14,748
<0,01
2192,6
2864,7
-160546,0
5363,3
-29,934
<0,01
-171058,0
-150034,0
Constante
Intervalo de confianza
(95%)
Actividad 2
17
Variables:
Total Ingreso Autnomo (ING_AUT_SB)
Escolaridad en aos (ESCO)
Sexo (SEXO)
1. Recodifica la variable sexo como dummy para evaluar el efecto de ser mujer
2. Cul es el efecto de ser mujer sobre el ingreso autnomo, una vez que
controlamos por aos de escolaridad?
Obtn los resultados del modelo de regresin en SPSS e interpreta los
coeficientes b, su significacin, as como el R cuadrado del modelo
Escribe la ecuacin del modelo de regresin
Obtn un grfico de valores estimados para hombres y mujeres para perfiles de
8, 12, 16 y 20 aos de educacin
Actividad 2: Resultados
18
Ecuacin de regresin:
Coeficiente
Error estndar
(Constante)
-81034
10754
-7,535
< 0,01
Mujer
-223463
8391
-26,633
< 0,01
63975
894
71,537
< 0,01
Aos de
escolaridad
Actividad 2: Resultados
19
Sexo
Las mujeres tienen un ingreso autnomo inferior en 223.463 pesos que los hombres,
controlando por escolaridad
Este efecto es significativo al 99% de confianza, por lo que podemos inferir que el sexo
se asocia a los ingresos en la poblacin de jefes de hogar
Coeficiente
Error estndar
(Constante)
-81034
10754
-7,535
< 0,01
Mujer
-223463
8391
-26,633
< 0,01
63975
894
71,537
< 0,01
Aos de
escolaridad
Actividad 2: Resultados
20
Escolaridad
Este efecto es significativo al 99% de confianza, por lo que podemos inferir que la
escolaridad se asocia a los ingresos en la poblacin de jefes de hogar
Coeficiente
Error estndar
(Constante)
-81034
10754
-7,535
< 0,01
Mujer
-223463
8391
-26,633
< 0,01
63975
894
71,537
< 0,01
Aos de
escolaridad
Actividad 2: Resultados
21
R cuadrado
R2: 0,154
Coeficiente
Error estndar
(Constante)
-81034
10754
-7,535
< 0,01
Mujer
-223463
8391
-26,633
< 0,01
63975
894
71,537
< 0,01
Aos de
escolaridad
Actividad 2: Resultados
22
Actividad 2: Resultados
23
Contenidos
a. Repaso
b. Variables independientes dicotmicas
c. Probar supuestos del modelo
d. Interaccin entre variables
Una correlacin alta entre las variables es indicacin de que la relacin es lineal.
2. Casos atpicos:
En este caso, vemos que el error de prediccin mnimo (-1,377) no es menor a -2. Sin
embargo, el error de prediccin mximo (42,024) es mayor a 2
Para evaluar cules son los casos con altos errores de prediccin, vamos a la base
Se cre una variable nueva con los errores de prediccin para cada caso. En base a
esto podramos correr el modelo nuevamente excluyendo casos con residuos mayores
a 2.
En estas situaciones resulta difcil estimar cul de las dos variables es la que explica
la variable dependiente, generando errores estndar altos y baja precisin de los
coeficientes calculados.
Para identificar esta situacin, hay que revisar la matriz de correlacin entre las
variables y detectar correlaciones de 0,8 o ms. Si este es el caso, es
recomendable eliminar una de las dos variables del modelo.
3. Multicolinealidad
Actividad 3
30
Variables:
Actividad 3: Resultados
31
1. Linealidad
Actividad 3: Resultados
32
2. Casos atpicos
Actividad 3: Resultados
33
2. Casos atpicos
Podramos correr el anlisis eliminando estos casos y ver qu ocurre. (No lo vamos
a hacer por ahora)
Actividad 3: Resultados
34
3. Multicolinealidad
Evidentemente hay que correr el modelo eliminando una de las dos variables
Esto quiere decir que el modelo es igualmente apropiado para predecir valores
bajos (por ejemplo, bajos ingresos) y altos de la variable dependiente (por
ejemplo, altos ingresos).
El contrario es heterocedasticidad
A su vez, son cada vez menos los errores de prediccin a medida que estos
valores son mayores en trminos absolutos.
4. Homocedasticidad:
4. Homocedasticidad:
5. Normalidad de los
errores de prediccin:
Si errores de prediccin
se distribuyen
aproximadamente de
manera normal, este
supuesto se cumple.
Actividad 4
39
Variables:
Actividad 4: Resultados
40
4. Homocedasticidad
Actividad 4: Resultados
41
Contenidos
a. Repaso
b. Variables independientes dicotmicas
c. Probar supuestos del modelo
d. Interaccin entre variables
Por ejemplo:
Tienen los aos de escolaridad el mismo efecto en el ingreso para jefes de hogar
hombres y jefas de hogar mujeres?
= + 1 + 2 + 3
2
Cuando sexo=1 (mujeres), el efecto de escolaridad es 2 + 3
Cuando sexo=0 (hombres), el efecto de escolaridad es
Coeficiente
Error estndar
Sig.
Constante
-7038,14
5987,21
-1,18
,240
Aos de escolaridad
49408,77
629,00
78,55
<0,01
33410,72
10738,38
3,11
<0,01
Sexo * escolaridad
-22855,89
1149,59
-19,88
<0,01
Actividad 5
Datos de la Encuesta Suplementaria de Ingresos 2015 para jefes de hogar
(n=33.425)
Base de datos: ESI_2015_Personas reducida (jefes de hogar).sav
Variables:
Total Ingreso Autnomo (ING_AUT_SB)
Escolaridad en aos (ESCO)
Mujer (sexo_dummy)
Tiene la escolaridad un efecto distinto en el ingreso autnomo de las personas
segn si estas son hombres o mujeres?
Calcula un efecto de interaccin entre escolaridad y sexo generando una nueva variable que
sea el producto entre ambas variables
Lleva a cabo un modelo de regresin en SPSS utilizando ingreso autnomo como variable
dependiente y escolaridad, sexo y la interaccin entre escolaridad y sexo como variables
independientes.
Pega los resultados en una planilla Excel y genera valores estimados de ingreso para perfiles
con 8, 12, 16 y 20 aos de escolaridad por separado para hombres y mujeres
Genera un grfico de valores estimados con una recta para hombres y una recta para
mujeres. Qu observas?
Actividad 5: Resultados
47
Ecuacin de regresin:
(Constante)
Mujer * Aos
escolaridad
Mujer
Aos de
escolaridad
Coeficiente
Error estndar
-236032
13088
-18,035
< 0,01
-37353
1820
-20,519
< 0,01
159141
20426
7,791
< 0,01
78621
1140
68,974
< 0,01
Actividad 5: Resultados
48
Actividad 5: Resultados
49