Vous êtes sur la page 1sur 23

TEMA 5

Variables ficticias

Cmo describir informacin cualitativa


Muchas veces en el modelo de regresin aparecen factores cualitativos
(sexo, raza, estado civil,.). En estos casos la informacin relevante se
puede representar con la ayuda de variables ficticias.
Las variables ficticias son variables binarias que toman valor 0,1.
Al definir una variable ficticia debemos decidir a qu acontecimiento se le
asigna el valor 1, y a cul el 0.
Ejemplo: la variable sexo es cualitativa. Para incluirla en un modelo de
regresin hay que crear una variable ficticia que informe del sexo del
individuo:
1 si es mujer
mujer =
0 si es hombre
Utilizamos los valores 0 y 1 para describir informacin cualitativa porque
ello conduce a modelos de regresin en los que los parmetros se prestan
a interpretaciones muy naturales.
Alfonso J. Quesada

Variables ficticias aditivas y multiplicativas


Consideremos la siguiente ecuacin de salarios:

sal = 0 + 1ne +
Si queremos tener en cuenta el sexo para explicar el salario, tenemos que
introducir variables ficticias.

Ficticias aditivas:
Recogen un cambio en el trmino constante entre la ecuacin de los
hombres y la de las mujeres.
Ecuacin hombres:

sal = H0 + 1ne +

Ecuacin mujeres:

sal = M0 + 1ne +

Alfonso J. Quesada

Grficamente:
12

10

8
Salario 6
SALARIO

Recta de regresin hombres


Recta de regresin mujeres

0
0

12

16

20

EDUC

NE

La diferencia salarial entre hombres y mujeres no depende del nivel de


estudios. El modelo refleja slo que los hombres ganan un salario diferente,
en una cuanta fija, al de las mujeres.

Alfonso J. Quesada

Cmo introducir ficticias aditivas?


Hay que definir una variable binaria (0,1) que informe sobre el sexo de los
individuos. Si escogemos a los hombres como categora de referencia,
definimos la variable ficticia:
1 si es mujer
mujer =
0 si es hombre

El modelo con la ficticia aditiva es:

sal = 0 + 0mujer + 1ne +


Para hombres el modelo es: sal = 0 + 1ne +
Para mujeres el modelo es: sal = (0 + 0 ) + 1ne +
0 : diferencial lineal entre el salario de una mujer y un hombre,
independiente del nivel de educacin. Si hay discriminacin salarial a
favor del hombre 0 < 0 .

Alfonso J. Quesada

En lugar de introducir la variable ficticia mujer se puede introducir la variable


ficticia hombre:
1 si es hombre
hombre =
0 si es mujer

El modelo con la ficticia aditiva es:

sal = 0 + 0 hombre + 1ne +


En este caso, la categora de referencia son las mujeres. Si hay
discriminacin salarial a favor del hombre 0 > 0.
No importa si se escoge hombre o mujer como categora de referencia, lo
importante es saber cul es el grupo de referencia para interpretar bien los
parmetros:
0 : ordenada en el origen para el grupo de referencia.
0 : diferencial lineal con respecto al grupo de referencia.

Alfonso J. Quesada

Se pueden incluir ambas variables a la vez en la ecuacin?

sal = 0 + H0 hombre + M0 mujer + 1ne +


NO, porque la ecuacin presentara multicolinealidad perfecta (Trampa de
las variables ficticias).
S se pueden incluir las dos ficticias si se elimina el trmino constante:

sal = H0 hombre + M0 mujer + 1ne +


H0 : ordenada en el origen para los hombres.

M0 : ordenada en el origen para las mujeres.

Alfonso J. Quesada

Cmo contrastar si existe discriminacin salarial?


Depende del modelo:
(a) sal = 0 + 0mujer + 1ne +

H0 : 0 = 0
El contraste es:
HA : 0 0
(b) sal = H0 hombre + M
0 mujer + 1ne +

El contraste es:

Alfonso J. Quesada

H0 : H0 = M0

H
M

H
:
0
A 0

Cmo se interpretan los coeficientes de las ficticias si la variable dependiente


est en logaritmos?

log(sal) = 0 + 0mujer + 1ne +


1000 : diferencial salarial porcentual entre hombres y mujeres con el mismo
nivel de educacin.

Existencia de otras variables explicativas en el modelo:


Indica la interpretacin de 0 en los dos modelos siguientes y compara su
significado:

log(sal) = 0 + 0mujer +
log(sal) = 0 + 0mujer + 1ne + 2 exp er +

Alfonso J. Quesada

Podemos incluir varias variables ficticias en la misma ecuacin. Por ejemplo,


en la ecuacin de salarios podemos incluir tambin el hecho de si el individuo
trabaja en el sur o no:

log(sal) = 0 + 0mujer + 1sur + 1ne +


1 si trabaja en el sur
sur =
0 si no trabaja en el sur
1000: diferencia salarial porcentual entre mujeres y hombres, manteniendo
fijos el lugar de trabajo y la educacin.
1001: diferencia salarial porcentual entre los individuos que trabajan en el sur y
los que no, manteniendo fijos el sexo y la educacin.

Alfonso J. Quesada

10

Ficticias multiplicativas:
Recogen un cambio en la pendiente entre la ecuacin de los hombres y la de
las mujeres.
Ecuacin hombres:

sal = 0 + 1Hne +

Ecuacin mujeres:

sal = 0 + 1Mne +

Grficamente:
14
12
10
8

SALARIO
SALARIO

Recta de regresin hombres


Recta de regresin mujeres

6
4
2
0

12

16

20

La diferencia salarial entre


hombres y mujeres
depende del nivel de
estudios. Los
rendimientos de la
educacin de los hombres
son diferentes a los de las
mujeres.

NE
EDUC

Alfonso J. Quesada

11

Cmo introducir ficticias multiplicativas?


Hay que multiplicar la variable ficticia correspondiente al sexo por la variable
nivel de estudios. Considerando a los hombres como grupo de referencia:
ne si es mujer
mujer ne =
0 si es hombre

El modelo con la ficticia multiplicativa es:

sal = 0 + 1ne + 1mujer ne +


Para hombres el modelo es: sal = 0 + 1ne +
Para mujeres el modelo es: sal = 0 + (1 + 1 )ne +

1 : diferencial proporcional al nivel de estudios entre el salario de una


mujer y un hombre. Diferencia en la rentabilidad de la educacin entre
mujeres y hombres. Si la rentabilidad de la educacin es menor para las
mujeres 1 < 0.

Alfonso J. Quesada

12

En lugar de introducir la variable ficticia mujerne se puede introducir la variable


ficticia hombrene :
ne si es hombre
hombre ne =
0 si es mujer

El modelo con la ficticia multiplicativa es:

sal = 0 + 1ne + 1 hombre ne +


En este caso, la categora de referencia son las mujeres. Si la rentabilidad de
1 >
la educacin es menor para las mujeres
. 0
No importa si se escoge hombre o mujer como categora de referencia, lo
importante es saber cul es el grupo de referencia para interpretar bien los
parmetros:

1 : pendiente (rendimientos de la educacin) para el grupo de referencia.


1 : diferencia en la pendiente con respecto al grupo de referencia.
Alfonso J. Quesada

13

Se pueden incluir ambas variables a la vez en la ecuacin?

sal = 0 + 1ne + 1Hhombre ne + 1Mmujer ne +


NO, porque la ecuacin presentara multicolinealidad perfecta (Trampa de las
variables ficticias).
S se pueden incluir las dos ficticias si se elimina la variable ne:

sal = 0 + 1Hhombre ne + 1Mmujer ne +


1H : pendiente para los hombres.

1M : pendiente para las mujeres.


Cmo contrastara la existencia de discriminacin salarial en los dos modelos
siguientes?

sal = 0 + 1ne + 1 hombre ne +

sal = 0 + 1Hhombre ne + 1Mmujer ne +

Alfonso J. Quesada

14

Ficticias aditivas y multiplicativas:


Recogen un cambio en la constante y en la pendiente entre la ecuacin de
los hombres y la de las mujeres.
Ecuacin hombres:

sal = H0 + 1Hne +

Ecuacin mujeres:

sal = M0 + 1Mne +

Grficamente:
14

12

10

8
Recta de regresin hombres
Recta de regresin mujeres

SALARIO 6

0
0

12

16

20

NE
EDUC

Alfonso J. Quesada

15

El modelo con la ficticias aditivas y multiplicativas es:

sal = 0 + 0mujer + 1ne + 1mujer ne +


Para hombres el modelo es: sal = 0 + 1ne +
Para mujeres el modelo es: sal = (0 + 0 ) + (1 + 1 )ne +

0 : diferencial lineal entre el salario de una mujer y un hombre,


independiente del nivel de educacin.

1 : diferencial en la rentabilidad de la educacin entre mujeres y


hombres.

Plantee una especificacin alternativa al modelo anterior e interprete los


coeficientes. Explique cmo contrastar la existencia de discriminacin
salarial en la especificacin propuesta.

Alfonso J. Quesada

16

Variables ficticias para categoras mltiples


Si la variable cualitativa tiene g categoras hay que incluir g-1 variables
ficticias en el modelo.
Ejemplo: si queremos incluir en la ecuacin de salarios el estado civil,
tenemos que definir 3 variables ficticias en el modelo con trmino constante
(categora de referencia = casados):
1 si es soltero
soltero =
0 si no es soltero

1 si es divorciado
divorciado =
0 si no es divorciado

1 si es viudo
viudo =
0 si no es viudo

log(sal) = 0 + 0mujer + 1soltero + 2 divorciado + 3 viudo + 1ne +


El trmino constante del modelo es la constante para el grupo de
referencia (hombres casados).
El coeficiente de la variable ficticia para un grupo particular representa la
diferencia estimada entre el trmino constante de ese grupo y el grupo de
referencia.
Alfonso J. Quesada

17

Incorporar informacin ordinal:


Las variables ficticias permiten introducir en el modelo variables ordinales
que toman un reducido nmero de valores.
Ejemplo: Supongamos que no conocemos los aos exactos de educacin
sino solamente el grado que el estudiante ha alcanzado:

0
1

ne = 2
3

Alfonso J. Quesada

sin estudios
primaria
secundaria
diplomatura
licenciatura

18

Definiendo variables ficticias para cada nivel de estudios (categora de


referencia = sin estudios), tenemos:
1 si educ = 1
pri =
0 resto

1 si educ = 3
dip =
0 resto

1 si educ = 2
sec =
0 resto

1 si educ = 4
lic =
0 resto

log(sal) = 0 + 0mujer + 1prim + 2 sec + 3 dip + 4lic +

(1)

Este modelo permite que el salto de un ciclo de estudios a otro pueda tener
un efecto diferente, por lo que es mucho ms flexible que:

log(sal) = 0 + 0mujer + 1ne +

(2)

Demuestre que cuando el salto de un ciclo de estudios a otro tiene un efecto


constante en el salario, el modelo (1) se puede escribir como el modelo (2).

Alfonso J. Quesada

19

Efectos de interaccin
Si hay interaccin entre dos o ms variables ficticias, el efecto de una ellas
depende del valor que tomen las otras y viceversa.

Modelo sin efectos de interaccin:


Modelo de salarios con educacin (ordinal) y sexo (categora de referencia
= hombre sin estudios):

log(sal) = 0 + 0mujer + 1prim + 2 sec + 3 dip + 4lic +


Como no hay efectos de interaccin, el efecto del sexo no depende del
nivel de estudios y el efecto del nivel de estudios es el mismo para
hombres y mujeres.
Veamos a continuacin una tabla que clarifica la interpretacin de los
coeficientes, donde se representa el trmino constante del modelo en los
diferentes grupos.
Alfonso J. Quesada

20

Sin
estudios
Hombre
Mujer

Prim.

Sec.

Dip.

Lic.

0 + 1

0 + 2

0 + 3

0 + 4

0 + 0

0 + 0 + 1

0 + 0 + 2

0 + 0 + 3

0 + 0 + 4

Es un modelo muy restringido porque la diferencia salarial entre hombres y


mujeres del mismo nivel educativo es siempre 0 .

Cul es la diferencia salarial entre un hombre diplomado y un hombre licenciado?

Cul es la diferencia salarial entre una mujer diplomada y una mujer licenciada?

Alfonso J. Quesada

21

Modelo con efectos de interaccin:


Permite que la diferencia salarial entre hombres y mujeres dependa del
nivel de estudios:

log(sal) = 0 + 0mujer + 1prim + 2 sec + 3 dip + 4lic +


+1mujer prim + 2mujer sec + 3mujer dip + 4mujer lic +
Sin
estudios
Hombre
Mujer

Prim.

Sec.

Dip.

Lic.

0 + 1

0 + 2

0 + 3

0 + 4

0 + 0

0 + 0 + 1 + 1

0 + 0 + 2 + 2

0 + 0 + 3 + 3

0 + 0 + 4 + 4

La diferencia salarial entre hombres y mujeres es:


Sin estudios: 0

Secundaria: 0 + 2

Primaria: 0 + 1

Diplomatura: 0 + 3

Alfonso J. Quesada

Licenciatura: 0 + 4

22

Cul es la diferencia salarial entre un hombre diplomado y un hombre


licenciado?
Cul es la diferencia salarial entre una mujer diplomada y una mujer
licenciada?
Cmo contrastara si la discriminacin salarial en funcin del sexo depende
del nivel de estudios?

Alfonso J. Quesada

23