Vous êtes sur la page 1sur 19

18:28:36

Modelos de eleccion discreta

Econometra II

Grado en Economa
Universidad de Granada

Econometra II Modelos de eleccion discreta 1 / 37

18:28:36

Contenidos

Contenidos Introduccion
Introduccion
Modelos de eleccion binaria
Modelos de eleccion
binaria
Modelo Lineal de Probabilidad
Modelo Lineal de
Probabilidad El modelo Logit y Probit
El modelo Logit y Probit
Inferencia en los modelos de eleccion discreta
Inferencia en los
modelos de eleccion Interpretacion de los coeficientes
discreta

Interpretacion de los Bondad de ajuste


coecientes
Contrastacion de hipotesis
Bondad de ajuste

Contrastacion de Modelos de alternativas multiples


hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 2 / 37


18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Introduccion
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 3 / 37

18:28:36

Introduccion

Contenidos Hasta el momento se ha trabajado con variables cualitativas incluyendolas dentro


Introduccion del grupo de variables independientes, pero puede la variable dependiente ser
Modelos de eleccion de naturaleza cualitativa? que ocurre en tal caso? sigue siendo valido el
binaria modelo lineal y su estimacion por Mnimos Cuadrados?
Modelo Lineal de En ocasiones, analizamos datos donde la variable dependiente de interes toma
Probabilidad
valores discretos:
El modelo Logit y Probit
Variables dependientes binarias (ej: comprar o no comprar, conceder o no un
Inferencia en los
modelos de eleccion prestamo, tener o no una enfermedad).
discreta Variables discretas sin ordenacion (ej: tren, autobus...).
Interpretacion de los Variables discretas con orden (ej: calicacion o rating nanciero).
coecientes

Bondad de ajuste Un modelo de regresion lineal puede no ser lo mas adecuado en estos casos porque:
Contrastacion de los resultados son difciles de interpretar: no se puede hablar de cambio continuo.
hipotesis

Modelos de alternativas la variable dependiente solo admite valores discretos, y puede que solo no-
multiples
negativos.
podemos estar interesados en estimar la probabilidad de la ocurrencia de los dis-
tintos valores de la variable dependiente y no tanto en el valor esperado predicho.
A continuacion analizaremos con algo mas de profundidad los problemas que
surgen al considerar un modelo de regresion lineal clasico en el que la variable de-
pendiente es cualitativa (mas concretamente, binaria) y se plantearan las dos princi-
pales alternativas que se tienen en este caso: los modelos logit y probit.

Econometra II Modelos de eleccion discreta 4 / 37


18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Modelos de eleccion binaria
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 5 / 37

18:28:36

Modelos de eleccion binaria

Contenidos De los ejemplos considerados anteriormente, este captulo se centra fundamental-


Introduccion mente en el caso en el que la variable dependdiente es una variable binaria (di-
Modelos de eleccion cotomica). Es decir, supondremos que la variable dependiente Y solo puede tomar
binaria dos valores: n
Modelo Lineal de 1 , con probabilidad p
Y = , (1)
Probabilidad 0 , con probabilidad 1 p
El modelo Logit y Probit
donde el valor 1 denota que el individuo ha tomado alguna accion. La variable Y , por
Inferencia en los tanto, sigue una distribucion de Bernoulli:
modelos de eleccion
discreta
Pr(Y = y) = py (1 p)1y , (2)
Interpretacion de los
coecientes E(Y ) = p,
Bondad de ajuste V ar(Y ) = p(1 p).
Contrastacion de
hipotesis En tal caso, se estara interesado en analizar cual es la probabilidad de que el
individuo i, dadas sus caractersticas (es decir, valores de las variables independien-
Modelos de alternativas
multiples tes, Xi ), tome una accion (es decir, Yi = 1).

Econometra II Modelos de eleccion discreta 6 / 37


18:28:36

Modelos de eleccion binaria: ejemplo

Contenidos A lo largo del presente captulo desarrollaremos el siguiente ejemplo:


Introduccion

Modelos de eleccion En numerosas ocasiones los docentes nos hemos preguntado por los factores
binaria que influyen en que un estudiante apruebe o no las asignaturas que impartimos.
Modelo Lineal de Esta cuestion es aun mas interesante desde el punto de vista del alumno. Por tanto,
Probabilidad
sera deseable poder proporcionar a los mismos una orientacion sobre factores que
El modelo Logit y Probit les puedan ayudar a obtener un mayor desempeno en la asignatura.
Inferencia en los
modelos de eleccion
discreta
Para analizar que factores influyen (positiva o negativamente) en el desempeno
(rendimiento) academico de los alumnos se propone realizar una regresion logstica
Interpretacion de los
coecientes donde la variable dependiente es codificada como 1 para aquellos alumnos con una
Bondad de ajuste
calificacion final de 5 o superior y como 0 en caso contrario. Es decir, el desempeno
se mide como una variable binaria que considera los valores de aprobado (exito) o
Contrastacion de
hipotesis
suspenso (fracaso). Por tanto, el modelo econometrico planteado estima la probabili-
dad que tiene un alumno de superar la asignatura. Como variables independientes se
Modelos de alternativas
multiples consideran la realizacion de ejercicios en pizarra, EP , en ordenador, EO, y exame-
nes tipo test, T T , sobre cada tema.

Econometra II Modelos de eleccion discreta 7 / 37

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad
Inconvenientes

El modelo Logit y Probit

Inferencia en los
Modelo Lineal de Probabilidad
modelos de eleccion
discreta

Interpretacion de los
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 8 / 37


18:28:36

Modelo Lineal de Probabilidad

Contenidos El Modelo Lineal de Probabilidad consiste simplemente en considerar un modelo


Introduccion de regresion lineal en el que la variable dependiente es binaria, es decir:
Modelos de eleccion
binaria Yi = 1 + 2 X2i + + k Xki + ui , i = 1, . . . , n, (3)
Modelo Lineal de con u N (0, 2 ) e Yi de la forma dada en (1). En este caso, dados los valores
Probabilidad
Modelo Lineal de x2 , ..., xk de las variables independientes, se verica que:
Probabilidad
Inconvenientes E(Yi |X = x) = Pr(Yi = 1|X = x) 1 + Pr(Yi = 0|X = x) 0
El modelo Logit y Probit = Pr(Yi = 1|X = x),
Inferencia en los E(Yi |X = x) = E(0 + 1 X2i + + k Xki + ui |X = x)
modelos de eleccion
discreta = 1 + 2 x2i + + k xki .
Interpretacion de los
coecientes Es decir, la parte derecha de la ecuacion (3) debe ser interpretada como la probabi-
lidad de que la variable dependiente sea igual a la unidad:
Bondad de ajuste

Contrastacion de pi = Pr(Yi = 1|X = x) = 1 + 2 x2i + + k xki . (4)


hipotesis
Y, por tanto, i es la variacion de la probabilidad de que Yi = 1 asociada con una
Modelos de alternativas
multiples variacion unitaria en Xi , manteniendo constantes las otras variables explicativas
(con i = 1, . . . , k).

Todo lo que conocido sobre el modelo de regresion lineal se puede aplicar


directamente: estimacion, contraste de hipotesis, interpretacion de los parametros,
etc. Solo debemos recordar que la esperanza condicional es, en este caso, una pro-
babilidad, por lo que 0 E(Yi |X = x) 1.

Econometra II Modelos de eleccion discreta 9 / 37

18:28:36

Inconvenientes del Modelo Lineal de Probabilidad

Contenidos La distribucion de la muestra en este tipo de modelos se caracteriza por una nube de
Introduccion puntos de tal manera que las observaciones muestrales se dividen en dos subgrupos:
Modelos de eleccion uno formado por las observaciones en las que ocurrio el acontecimiento objeto de
binaria estudio (Yi = 1), y otro, por los puntos muestrales en los que no ocurrio (Yi = 0).
Modelo Lineal de
Probabilidad
Modelo Lineal de Y con respecto a X (con ajuste mnimocuadrtico)
Probabilidad 1.4
Y = 2.29 + 0.0544X
Inconvenientes
1.2
El modelo Logit y Probit
1
Inferencia en los
modelos de eleccion
discreta 0.8

Interpretacion de los 0.6


Y

coecientes

Bondad de ajuste 0.4

Contrastacion de 0.2
hipotesis

Modelos de alternativas 0
multiples
0.2
40 45 50 55 60 65
X

Por tanto, el coeciente de determinacion R2 no es particularmente util porque no


es posible que todos los datos se encuentren exactamente en la recta de regresion
(R2 = 1).

Econometra II Modelos de eleccion discreta 10 / 37


18:28:36

Inconvenientes del Modelo Lineal de Probabilidad

Contenidos Otros inconvenientes importantes son:


Introduccion
Puesto que la variable dependiente solo toma valores 0 o 1, el supuesto de nor-
Modelos de eleccion
binaria malidad de las perturbaciones no se cumple ya que siguen la distribucion de
Modelo Lineal de
Bernoulli:
Probabilidad
Modelo Lineal de
Probabilidad ei = Yi Yi Probabilidad
Inconvenientes
Yi = 1 1 1 2 X2i k Xki p
El modelo Logit y Probit Yi = 0 1 2 X2i k Xki 1p
Inferencia en los
modelos de eleccion Perturbaciones heteroscedasticas (incumplimiento de la hipotesis de homoce-
discreta
dasticidad) ya que su varianza depende de las variables independientes:
Interpretacion de los
coecientes V ar(ei ) = E(ei E(ei ))2 = E(ei )2
Bondad de ajuste
= (1 1 2 X2i k Xki )2 p
Contrastacion de
hipotesis + (1 2 X2i k Xki )2 (1 p).
Modelos de alternativas
multiples
Las predicciones de la variable dependiente pueden estar fuera del rango [0, 1].
El modelo lineal de probabilidad implica que el efecto marginal de cada una de las
variables explicativas es constante. Este supuesto no es muy razonable ya que
es esperable que las variaciones en la probabilidad sean distintos en los valores
centrales de las variables dependientes a las producidas en sus extremos.

Econometra II Modelos de eleccion discreta 11 / 37

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit


Modelo Logit
Modelo Probit
Comparacion modelos
Logit y Probit El modelo Logit y Probit
Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 12 / 37


18:28:36

El modelo Logit y Probit

Contenidos Como se ha puesto de relevancia, el modelo lineal de probabilidad presenta impor-


Introduccion tantes inconvenientes que desaconsejan su uso ante variables dependientes binarias
Modelos de eleccion y crea la necesidad de recurrir a otros tipos de modelos.
binaria Las regresiones Probit y Logit son modelos de regresion no lineales disenados
Modelo Lineal de especcamente para variables dependientes binarias. Se trata de adoptar una for-
Probabilidad
mulacion no lineal que obligue a que los valores estimados esten entre 0 y 1 ya que,
El modelo Logit y Probit como hemos visto, la regresion con una variable binaria dependiente Y modeliza la
Modelo Logit
probabilidad de que Y = 1.
Modelo Probit
Comparacion modelos
La regresion Logit utiliza una funcion de distribucion logstica, mientras que la
Logit y Probit regresion Probit utiliza una funcion de distribucion normal estandar. Ambas funcio-
Inferencia en los nes de distribucion de probabilidad dan lugar a probabilidades ente 0 y 1, y presentan
modelos de eleccion un crecimiento no lineal (con mayores incrementos en la parte central). De esta forma
discreta
se resuelven dos de los problemas anteriormente senalados.
Interpretacion de los
coecientes 1 1

0.9 0.9

Bondad de ajuste 0.8 0.8

0.7 0.7

Contrastacion de
0.6 0.6

hipotesis
0.5 0.5

Modelos de alternativas 0.4 0.4

multiples 0.3 0.3

0.2 0.2

0.1 0.1

0 0
5 4 3 2 1 0 1 2 3 4 5 5 4 3 2 1 0 1 2 3 4 5

Figura 1: Representacion graca de la funcion logstica (izquierda) y de la


probabilidad acumulada de una normal (derecha)
Econometra II Modelos de eleccion discreta 13 / 37

18:28:36

Modelo Logit

Contenidos El modelo de regresion Logit se basa en la funcion logstica:


Introduccion
1 1 ez
Modelos de eleccion f (z) = = = ,
binaria 1 + ez 1 + e1z 1 + ez
Modelo Lineal de
Probabilidad la cual esta acotada entre 0 y 1 ya que:
El modelo Logit y Probit lm f (z) = 0, lm f (z) = 1,
Modelo Logit z z
Modelo Probit
Comparacion modelos y, como se muestra en la Figura 1, presenta una forma de S que se ajusta al creci-
Logit y Probit miento no lineal deseado (leves incrementos en los extremos y mayores en la parte
Inferencia en los central).
modelos de eleccion
discreta
El modelo de regresion Logit sera de la forma:
Interpretacion de los Yi = f (Zi ) + ui , = 1, . . . , n, (5)
coecientes

Bondad de ajuste donde Zi = 1 + 2 X2i + + k Xki y, dados los valores de las variables indepen-
dientes x2 , ..., xk , las probabilidades de que la variable dependiente tome los valores
Contrastacion de
hipotesis 1 y 0 son:
Modelos de alternativas ezi
multiples Pr(Y = 1|x2 , ..., xk ) = E(Yi |X = x) = ,
1 + ezi
ezi 1
Pr(Y = 0|x2 , ..., xk ) = 1 = ,
1 + ezi 1 + ezi
con zi = 1 + 2 x2i + + k xki .

Econometra II Modelos de eleccion discreta 14 / 37


18:28:36

Modelo Probit

Contenidos El modelo de regresion Probit se basa en la distribucion de probabilidad acumulada


Introduccion de una normal tipicada:
Modelos de eleccion Z z
binaria 1 s2
(z) = Pr(Z z) = e 2 ds,
Modelo Lineal de 2
Probabilidad

El modelo Logit y Probit donde Z N (0, 1) y es tal que, dados los valores x2 , ..., xk de las variables inde-
Modelo Logit pendientes, se verica que:
Modelo Probit
Comparacion modelos Pr(Y = 1|x2 , ..., xk ) = (zi ),
Logit y Probit

Inferencia en los
con zi = 1 + 2 x2i + + k xki tal que:
modelos de eleccion n
discreta 1 si zi > 0
Y = .
Interpretacion de los 0 si zi < 0
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 15 / 37

18:28:36

Comparacion modelos Logit y Probit

Contenidos Los modelos logit y probit comparten practicamente las mismas carectersticas: son
Introduccion modelos no lineales que son estimados por los metodos estudiados en el tema ante-
Modelos de eleccion rior (mnimos cuadrados no lineales o maxima verosimilitud), donde la interpretacion
binaria de los coecientes no es tan inmediata como en el modelo lineal de probabilidad.
Modelo Lineal de Ademas, en ambos casos hay que buscar una medida alternativa al coeciente de
Probabilidad
determinacion para medir la bondad del ajuste realizado.
El modelo Logit y Probit La unica diferencia entre ambos modelos es que la funcion logstica (curva azul)
Modelo Logit
tiene colas mas anchas, por lo que la probabilidad de exito sera mayor en los extre-
Modelo Probit
Comparacion modelos
mos cuando se use el modelo logit.
Logit y Probit
1
Inferencia en los
modelos de eleccion 0.9
discreta
0.8
Interpretacion de los
coecientes 0.7

Bondad de ajuste 0.6

Contrastacion de
0.5
hipotesis
0.4
Modelos de alternativas
multiples
0.3

0.2

0.1

0
5 4 3 2 1 0 1 2 3 4 5

Econometra II Modelos de eleccion discreta 16 / 37


18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta
Metodo de MV
Inferencia en los modelos de eleccion discreta
Interpretacion de los
coecientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 17 / 37

18:28:36

Metodo de Maxima Verosimilitud

Contenidos Como la relacion entre la variable dependiente y las explicativas es no lineal no se


Introduccion puede aplicar el metodo de MCO.
Modelos de eleccion Si se usa el metodo de maxima verosimilitud, a partir de (2) y (4) se obtiene la
binaria funcion de densidad conjunta:
Modelo Lineal de
Probabilidad
n
Y y
El modelo Logit y Probit L= pi i (1 pi )1yi ,
Inferencia en los i=1
modelos de eleccion
discreta la cual, al considerar logaritmos neperianos queda:
Metodo de MV
n  
Interpretacion de los
X
coecientes ln L = yi ln(pi ) + (1 yi ) ln(1 pi )
Bondad de ajuste i=1
n  
Contrastacion de X
hipotesis
= yi ln(pi ) yi ln(1 pi ) + ln(1 pi )
Modelos de alternativas
multiples i=1
Xn   n
X n
X n
X
pi
= yi ln + ln(1 pi ) = yi z i ln(1 + ezi ),
1 pi
i=1 i=1 i=1 i=1
! pi

donde se ha llamado zi = ln 1pi
.

Econometra II Modelos de eleccion discreta 18 / 37


18:28:36

Metodo de Maxima Verosimilitud

Contenidos Teniendo en cuenta que pi = 1 + 2 x2i + + k xki , derivar la expresion anterior


Introduccion con respecto a cada coeciente conduce a:
Modelos de eleccion n n  
binaria ln L X X ezi
Modelo Lineal de
= yi ,
Probabilidad
1 1 + ezi
i=1 i=1
n n  
El modelo Logit y Probit
ln L X X ezi
Inferencia en los = yi xji xji , j = 2, . . . , k.
modelos de eleccion j 1 + ezi
discreta i=1 i=1
Metodo de MV

Interpretacion de los
Al igualar a cero las derivadas anteriores se obtiene el siguiente sistema de ecua-
coecientes ciones normales no lineal que tendra que ser resuelto mediante un algoritmo de
Bondad de ajuste
optimizacion:
n n  
Contrastacion de X X ezi
hipotesis
yi = 0.
Modelos de alternativas 1 + ezi
multiples i=1 i=1
Xn
X
n
ezi

yi xji xji = 0, j = 2, . . . , k.
1 + ezi
i=1 i=1

Bajo supuestos generales, los estimadores as obtenidos son consistentes, asintoti-


camente eficientes y con distribucion asintotica normal.
Ademas, aplicando este metodo de estimacion se solventa el problema de hete-
roscedasticidad anteriormente comentado.
Econometra II Modelos de eleccion discreta 19 / 37

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Interpretacion de los coeficientes
coeficientes
Efecto marginal
Odd ratio

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 20 / 37


18:28:36

Efecto marginal

Contenidos En los modelos lineales (como el modelo lineal de probabilidad) la derivada parcial
Introduccion de la variable dependiente, Y , con respecto a cada una de las variables explicativas,
Modelos de eleccion Xj , j = 1, . . . , p, es la constante j , y se interpreta como el cambio producido en
binaria Y cuando Xj aumenta una unidad. Puesto que los modelos logit y probit son no
Modelo Lineal de lineales, esta interpretacion no es correcta.
Probabilidad
En el modelo Logit, partiendo de (5), la derivada parcial anterior es:
El modelo Logit y Probit
Yi eZi
Inferencia en los = j , j = 1, . . . , k,
modelos de eleccion
discreta
Xji (1 + eZi )2
Interpretacion de los mientras que en el probit
coeficientes
Efecto marginal Yi
Odd ratio
= (zi )j , j = 1, . . . , k,
Xji
Bondad de ajuste
siendo la funcion de densidad de la distrbucion normal tipificada.
Contrastacion de
hipotesis Por tanto, el efecto marginal en ambos modelos depende de los valores que
Modelos de alternativas
toman las variables explicativas (ya no es constante: uno de los objetivos persegui-
multiples dos por estos modelos). Pueden, por tanto, calcularse los efectos marginales para
cada observacion de la muestra (alternativamente, los efectos marginales pueden
evaluarse para el valor medio de las variables explicativas).

Puesto que la exponencial y la funcion de densidad son siempre positivas, queda


claro que el signo de los coeficientes indica la direccion del efecto marginal.
Es decir, un signo positivo indicara una relacion directa, mientras que uno negativo
inversa.
Econometra II Modelos de eleccion discreta 21 / 37

18:28:36

Efecto marginal: ejemplo

Contenidos Para el ejemplo planteado, considerando un modelo de regresion logstica de la for-


Introduccion ma dada en (5) con Zi = 1 + 2 EPt + 3 EOt + 4 T Tt , se obtiene la siguiente
Modelos de eleccion estimacion:
binaria
Modelo Lineal de
b1 = 3.3537,
b2 = 0.1535,
b3 = 0.2529,
b4 = 4.6931.

Probabilidad
Puesto que todas las estimaciones de los coeficientes de las variables inde-
El modelo Logit y Probit
pendientes tienen signo positivo, se tiene que el efecto marginal de estas variables
Inferencia en los sera positivo. Es decir, incrementos en estas variables significaran (siempre que se
modelos de eleccion
discreta rechaze la hipotesis nula en los contrastes de significacion individual) un aumento
Interpretacion de los
en la probabilidad de aprobar.
coeficientes
Efecto marginal Cuanto aumenta la probabilidad de aprobar si, para la misma calificacion en los
Odd ratio ejercicios en la pizarra y mismo porcentaje de preguntas correctas en los tipo test,
Bondad de ajuste se pasa de obtener una calificacion de 3 en el examen de ordenador a 4?
Contrastacion de
Considerando, por ejemplo, fijos los valores EP = 5 y T T = 0.6, se tiene que:
hipotesis
Pr(Y = 1|EP = 5, EO = 3, T T = 0.6) = 0.7287639,
Modelos de alternativas
multiples Pr(Y = 1|EP = 5, EO = 4, T T = 0.6) = 0.7757833,
es decir, el incremento de la probabilidad es 0.0470194.

Es este incremento constante?

Econometra II Modelos de eleccion discreta 22 / 37


18:28:36

Efecto marginal: ejemplo

Contenidos
EP EO TT Pr(Y = 1) Incremento
Introduccion 5 0 0.6 0.5571640
Modelos de eleccion 5 1 0.6 0.6183522 0.0611882
binaria
5 2 0.6 0.6760023 0.0576501
Modelo Lineal de 5 3 0.6 0.7287639 0.0527616
Probabilidad
5 4 0.6 0.7757833 0.0470194
El modelo Logit y Probit
5 5 0.6 0.8167018 0.0409185
Inferencia en los 5 6 0.6 0.8515816 0.0348798
modelos de eleccion
discreta 5 7 0.6 0.8807929 0.0292113
Interpretacion de los
5 8 0.6 0.9048969 0.024104
coeficientes 5 9 0.6 0.9245446 0.0196477
Efecto marginal 5 10 0.6 0.9404006 0.015856
Odd ratio

Bondad de ajuste Tal y como se observa en la tabla, para los valores constantes de calificacion en
Contrastacion de
pizarra de 5 y de un 60 % de preguntas correctas en los examenes tipo test, el cambio
hipotesis en la probabilidad de aprobar a medida que cambia la calificacion en el examen de
Modelos de alternativas ordenador no es constante.
multiples Cada una de las probabilidades anteriores se obtiene sustituyendo el correspon-
diente valor de EP , EO y T T en la siguiente expresion:
bi
eZ
,
bi
1 + eZ
bi = b1 + b2 EPt + b3 EOt + b4 T Tt .
donde Z

Econometra II Modelos de eleccion discreta 23 / 37

18:28:36

Efecto marginal: ejemplo

Contenidos Si se hubiese considerado un modelo Probit, las probabilidades de exito anteriores


Introduccion se hubiesen obtenido a partir de la siguiente expresion:
Modelos de eleccion
binaria Pr(Y = 1|EP = ep, EO = eo, T T = tt) = (b
zi ) = Pr(Z b
zi ),
Modelo Lineal de
Probabilidad donde b
zi = b1 + b2 ep + b3 eo + b4 tt y Z N (0, 1).
El modelo Logit y Probit
En el ejemplo que nos ocupa:
Inferencia en los Pr(Y = 1|EP = 5, EO = 3, T T = 0.6) = Pr(Z 0.98836) 0.8389,
modelos de eleccion
discreta Pr(Y = 1|EP = 5, EO = 4, T T = 0.6) = Pr(Z 1.24126) 0.8925,
Interpretacion de los
coeficientes y entonces el incremento de la probabilidad es de 0.0536.
Efecto marginal
Odd ratio

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 24 / 37


18:28:36

Odd ratio

Contenidos En la practica, en el modelo logit, lo que se suele hacer es calcular la razon entre
Introduccion ambas probabilidades, cociente denominado odd-ratio, es decir:
Modelos de eleccion ezi
binaria pi 1+ezi
Modelo Lineal de
= 1
= ezi ,
Probabilidad
1 pi 1+ezi
El modelo Logit y Probit con zi = 1 + 2 x2i + + k xki .
Inferencia en los
modelos de eleccion
discreta
Por tanto, el odd ratio es el numero de veces que es mas probable que ocurra el
fenomeno o suceso frente a que no ocurra.
Interpretacion de los
coeficientes El odd-ratio asociado a un cambio de xjh a xjl , h 6= l, h, l = 1, . . . , n en la va-
Efecto marginal riable Xj , j = 1, . . . , k, supuesto que el resto de variables permanecen constantes,
Odd ratio viene dado por:
ezh
Bondad de ajuste
= ej (xjh xjl ) .
Contrastacion de ezl
hipotesis En tal caso:
Modelos de alternativas
multiples Si no existe relacion entre la variable dependiente y la variable en estudio el odd-
ratio toma el valor uno.
Si la variable dependiente incrementa la probabilidad sobre la variable explica-
da el odd-ratio sera superior a uno tanto mayor cuanto mas elevada sea esta
relacion.
Si la variable dependiente disminuye la probabilidad de la variable explicada el
odd-ratio sera menor que uno.

Econometra II Modelos de eleccion discreta 25 / 37

18:28:36

Odd ratio: ejemplo

Contenidos Los odd-ratios asociados a un cambio unitario en las variables del ejemplo conside-
Introduccion rado se recogen en la siguiente tabla:
Modelos de eleccion
binaria Variables EP EO TT
Modelo Lineal de Odd-ratio 1.1659 1.2878 109.1859
Probabilidad

El modelo Logit y Probit bj , con


Adviertase que dichos valores se han obtenido a partir de la expresion e
Inferencia en los j = 2, 3, 4. Los odd-ratios asociados a un cambio de 5 unidades en cada una de las
modelos de eleccion
discreta
bj .
variables sera obtenido a partir de e5
Interpretacion de los As, por ejemplo, para un alumno que tiene una calificacion en ordenador un
coeficientes punto superior a otro es 1.2878 veces mas probable que apruebe. Un alumno que
Efecto marginal
tiene una calificacion 5 veces superior a otro es 3.541322 veces mas probable que
Odd ratio
apruebe.
Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 26 / 37


18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Bondad de ajuste
coeficientes

Bondad de ajuste
Coeficiente de
McFadden y proporcion
de aciertos

Contrastacion de
hipotesis

Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 27 / 37

18:28:36

Coeficiente de McFadden y proporcion de aciertos

Contenidos En los modelos logit y probit, debido a que el metodo de estimacion no es el de MCO
Introduccion sino el de MV, no podemos utilizar el coeficiente de determinacion clasico para medir
Modelos de eleccion la bondad del ajuste. Recordemos que este era uno de los problemas que surgan en
binaria el modelo lineal de probabilidad. En su lugar, se utiliza el pseudo R2 de McFadden:
Modelo Lineal de
Probabilidad ln L
R2 = 1 ,
El modelo Logit y Probit ln Lr
Inferencia en los donde ln L es el logaritmo neperiano de la funcion de verosimilitud del modelo sin
modelos de eleccion
discreta restricciones (el modelo con todas las variables explicativas) y ln Lr es el logarit-
Interpretacion de los mo neperiano de la funcion de verosimilitud del modelo restringido (solo incluye el
coeficientes termino independiente del modelo).
Bondad de ajuste Otra opcion para analizar la bondad del modelo es contabilizar el porcentaje de
Coeficiente de aciertos del modelo teniendo en cuenta que, por ejemplo, las probabilidades predi-
McFadden y proporcion
de aciertos
chas por encima de 0.5 contabilizan como Yi = 1 y menores que 0.5 estiman Yi = 0:
Contrastacion de
hipotesis
Yi = 1 Yi = 0
Yi = 1 A B
Modelos de alternativas
multiples Yi = 0 C D
En los casos A y D se habra predicho correctamente el valor de Y , por tanto, la
proporcion de aciertos vendra dada por el cociente A+Dn
.
Si se desea ser exigente con el modelo (lo recomendado), en lugar de usar el
umbral del 0.5 se debe usar la proporcion de exitos (de unos) que hay en la variable
dependiente.

Econometra II Modelos de eleccion discreta 28 / 37


18:28:36

Proporcion de aciertos: ejemplo

Contenidos
Observados - Predichos Suspensos Aprobados Total Porcentaje
Introduccion Suspensos 14 6 20 70 %
Modelos de eleccion Aprobados 22 83 105 79.04 %
binaria
Total 36 89 125 77.6 %
Modelo Lineal de
Probabilidad
En la tabla anterior se cruzan las observaciones disponibles sobre el numero de sus-
El modelo Logit y Probit
pensos y aprobados con las predicciones realizadas por el modelo. Recordemos que
Inferencia en los el modelo logstico proporciona la probabilidad de aprobar, por tanto, es necesario
modelos de eleccion
discreta
establecer un umbral para clasificar dicha probabilidad como aprobada o suspen-
Interpretacion de los
sa. En este caso, puesto que en la muestra se tiene un 84 % de aprobados se ha
coeficientes decidido que una probabilidad por debajo de 0.84 sea clasificada como suspenso y
Bondad de ajuste
por encima como aprobado (se puede apreciar por tanto que se ha establecido un
Coeficiente de umbral bastante exigente).
McFadden y proporcion Con esta premisa se tiene que de los 20 suspensos clasifica bien a 14 (un 70 %),
de aciertos
mientras que de los 105 aprobados clasifica correctamente a 83 (un 79.04 %). Final-
Contrastacion de
hipotesis
mente, el modelo ajustado clasifica adecuadamente un 77.6 % de los datos (97 de
125), una cifra mas que aceptable si se tiene en cuenta las exigencias establecidas.
Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 29 / 37

18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Contrastacion de hipotesis
coeficientes

Bondad de ajuste

Contrastacion de
hipotesis
Significacion individual
de los coeficientes
Significacion conjunta
de los coeficientes
Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 30 / 37


18:28:36

Significacion individual de los coeficientes

Contenidos Para realizar contrastes de significacion individual sobre los coeficientes:


Introduccion o
H0 : j = 0
Modelos de eleccion ,
binaria H1 : j 6= 0
Modelo Lineal de
Probabilidad
nos basaremos en que los estimadores siguen uns distribucion normal:
El modelo Logit y Probit j N (j , Var(j )).
Inferencia en los
modelos de eleccion Por tanto, para tomar una decision en el contraste utilizamos la siguiente regla de
discreta decision:

Interpretacion de los

coeficientes
j Z
Bondad de ajuste
Se rechaza H0 si p 1/2 ,
Var(j )
Contrastacion de
hipotesis
Significacion individual
donde P [Z < Z1/2 ] = 1 /2 con Z N (0, 1).
de los coeficientes
Significacion conjunta
de los coeficientes
Adviertase que la obtencion de la matriz de varianzas-covarianzas de los coeficien-
tes, j , no es una tarea facil. Por suerte todos los programas informaticos lo realizan
Modelos de alternativas
multiples automaticamente, por lo que se puede realizar inferencia en la forma habitual.

Econometra II Modelos de eleccion discreta 31 / 37

18:28:36

Significacion conjunta de los coeficientes

Contenidos Para realizar contrastes de significacion conjunta sobre todos los coeficientes (o un
Introduccion subconjunto), se puede utilizar el contraste de la razon de verosimilitudes:
Modelos de eleccion o
binaria H0 : 2 = 3 = ... = k = 0
.
Modelo Lineal de
H1 : en caso contrario
Probabilidad
El estadstico de contraste es:
El modelo Logit y Probit
L(r )
Inferencia en los
modelos de eleccion
2 ln 2q ,
discreta L()
Interpretacion de los
coeficientes
donde L(r ) es la verosimilitud del modelo restringido, es decir, del modelo en el
Bondad de ajuste
que se impone la H0 , L() es la verosimilitud del modelo sin restricciones y q es el
numero de restricciones.
Contrastacion de
hipotesis
Significacion individual
de los coeficientes
Significacion conjunta
de los coeficientes
Modelos de alternativas
multiples

Econometra II Modelos de eleccion discreta 32 / 37


18:28:36

Contenidos

Introduccion

Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad

El modelo Logit y Probit

Inferencia en los
modelos de eleccion
discreta

Interpretacion de los
Modelos de alternativas multiples
coeficientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples
Modelos de
alternativas multiples
Ejemplo

Econometra II Modelos de eleccion discreta 33 / 37

18:28:36

Modelos de alternativas multiples

Contenidos Los modelos de alternativas multiples o multinomiales generalizan a los estudiados


Introduccion hasta el momento para problemas donde la variable dependiente es nominal, es
Modelos de eleccion decir, cuando existen mas de dos posibles resultados discretos.
binaria Algunos ejemplos pueden ser:
Modelo Lineal de
Probabilidad Eleccion de la universidad en la que estudiar basandose en las calificaciones del
El modelo Logit y Probit estudiante, sus gustos, medios economicos, etc.
Que candidato recibira el voto de una persona a partir de caractersticas de-
Inferencia en los
modelos de eleccion mograficas o socio-culturales.
discreta Posibles ocupaciones profesionales de una persona en funcion de los trabajos
Interpretacion de los de los padres, nivel de educacion, etc.
coeficientes

Bondad de ajuste

Contrastacion de
hipotesis

Modelos de alternativas
multiples
Modelos de
alternativas multiples
Ejemplo

Econometra II Modelos de eleccion discreta 34 / 37


18:28:36

Modelos de alternativas multiples: ejemplo

Contenidos Supongamos que disponemos de informacion sobre la demanda de un determinado


Introduccion producto fabricado por tres marcas: A, B y C. Queremos estudiar el efecto que tiene
Modelos de eleccion la variable edad de cada individuo (xi ) sobre la eleccion de cada marca. La variable
binaria dependiente yij mide la eleccion (yij = 1) o no (yij = 0) de la marca j-esima
Modelo Lineal de realizada por el individuo i:
Probabilidad

El modelo Logit y Probit n


1 marca A,
Inferencia en los yiA =
modelos de eleccion
0 otra marca
discreta n
1 marca B,
Interpretacion de los yiB =
coeficientes
0 otra marca
n
Bondad de ajuste 1 marca C,
yiC =
Contrastacion de
0 otra marca
hipotesis
El modelo quedara:
Modelos de alternativas
multiples
yij = 1 + 2 xi + ij , i = 1, ..., n; j = A, B, C.
Modelos de
alternativas multiples
La probabilidad de que cada individuo elija una determinada marca es:
Ejemplo
piA = 11 + 21 xi ,
piB = 12 + 22 xi ,
piC = 13 + 23 xi ,
donde se ha de cumplir que la suma de las probabilidades es igual a la unidad.

Econometra II Modelos de eleccion discreta 35 / 37

18:28:36

Modelos de alternativas multiples: ejemplo

Contenidos En el caso del modelo logit multinomial, la probabilidad de escoger una de las alter-
Introduccion nativas es:
Modelos de eleccion
e1j +2j xi
binaria
pij = P3 , i = 1, ..., n; j = A, B, C.
Modelo Lineal de
j=1
e1j +2j xi
Probabilidad

El modelo Logit y Probit Una de las alternativas es la de referencia:


Inferencia en los e11 +21 xi 1
modelos de eleccion pi1 = P3 1j +2j xi
= P3
discreta
j=1
e 1+ j=2
e1j +2j xi
Interpretacion de los
coeficientes
y el resto:
Bondad de ajuste
e1j +2j xi
Contrastacion de pij = P3 , j = B, C.
hipotesis
1+ j=2
e1j +2j xi
Modelos de alternativas
multiples
Los odds ratio se obtienen como el cociente entre probabilidades:
Modelos de
alternativas multiples pij
Ejemplo = e1j +2j xi , j = B, C,
pi1
y el logaritmo del odd ratio:
p 
ij
ln = 1j + 2j xi , j = B, C.
pi1

Econometra II Modelos de eleccion discreta 36 / 37


18:28:36

Modelos de alternativas multiples: ejemplo

Contenidos Tambien se pueden comparar entre las alternativas 2 y 3:


Introduccion
pi2 12 + 22 xi
Modelos de eleccion = = e12 13 +(22 23 )xi .
binaria pi3 13 + 23 xi
Modelo Lineal de
Probabilidad
Para estimar los parametros, utilizaremos el metodo de maxima verosimilitud. En
este ejemplo, la funcion de verosimilitud es:
El modelo Logit y Probit
n
Inferencia en los Y 1
modelos de eleccion L = P3
discreta
1+ j=2
e1j +2j xi
Interpretacion de los
i=1
n
coeficientes
Y e12 +22 xi
Bondad de ajuste P3
Contrastacion de 1+ j=2
e1j +2j xi
i=1
hipotesis
Yn
Modelos de alternativas e13 +23 xi
multiples P3 .
Modelos de 1+ j=2
e1j +2j xi
alternativas multiples i=1
Ejemplo

Econometra II Modelos de eleccion discreta 37 / 37

Vous aimerez peut-être aussi