Académique Documents
Professionnel Documents
Culture Documents
Econometra II
Grado en Economa
Universidad de Granada
18:28:36
Contenidos
Contenidos Introduccion
Introduccion
Modelos de eleccion binaria
Modelos de eleccion
binaria
Modelo Lineal de Probabilidad
Modelo Lineal de
Probabilidad El modelo Logit y Probit
El modelo Logit y Probit
Inferencia en los modelos de eleccion discreta
Inferencia en los
modelos de eleccion Interpretacion de los coeficientes
discreta
Modelos de alternativas
multiples
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Introduccion
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Introduccion
Bondad de ajuste Un modelo de regresion lineal puede no ser lo mas adecuado en estos casos porque:
Contrastacion de los resultados son difciles de interpretar: no se puede hablar de cambio continuo.
hipotesis
Modelos de alternativas la variable dependiente solo admite valores discretos, y puede que solo no-
multiples
negativos.
podemos estar interesados en estimar la probabilidad de la ocurrencia de los dis-
tintos valores de la variable dependiente y no tanto en el valor esperado predicho.
A continuacion analizaremos con algo mas de profundidad los problemas que
surgen al considerar un modelo de regresion lineal clasico en el que la variable de-
pendiente es cualitativa (mas concretamente, binaria) y se plantearan las dos princi-
pales alternativas que se tienen en este caso: los modelos logit y probit.
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Modelos de eleccion binaria
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Modelos de eleccion En numerosas ocasiones los docentes nos hemos preguntado por los factores
binaria que influyen en que un estudiante apruebe o no las asignaturas que impartimos.
Modelo Lineal de Esta cuestion es aun mas interesante desde el punto de vista del alumno. Por tanto,
Probabilidad
sera deseable poder proporcionar a los mismos una orientacion sobre factores que
El modelo Logit y Probit les puedan ayudar a obtener un mayor desempeno en la asignatura.
Inferencia en los
modelos de eleccion
discreta
Para analizar que factores influyen (positiva o negativamente) en el desempeno
(rendimiento) academico de los alumnos se propone realizar una regresion logstica
Interpretacion de los
coecientes donde la variable dependiente es codificada como 1 para aquellos alumnos con una
Bondad de ajuste
calificacion final de 5 o superior y como 0 en caso contrario. Es decir, el desempeno
se mide como una variable binaria que considera los valores de aprobado (exito) o
Contrastacion de
hipotesis
suspenso (fracaso). Por tanto, el modelo econometrico planteado estima la probabili-
dad que tiene un alumno de superar la asignatura. Como variables independientes se
Modelos de alternativas
multiples consideran la realizacion de ejercicios en pizarra, EP , en ordenador, EO, y exame-
nes tipo test, T T , sobre cada tema.
18:28:36
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Modelo Lineal de
Probabilidad
Inconvenientes
Inferencia en los
Modelo Lineal de Probabilidad
modelos de eleccion
discreta
Interpretacion de los
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Contenidos La distribucion de la muestra en este tipo de modelos se caracteriza por una nube de
Introduccion puntos de tal manera que las observaciones muestrales se dividen en dos subgrupos:
Modelos de eleccion uno formado por las observaciones en las que ocurrio el acontecimiento objeto de
binaria estudio (Yi = 1), y otro, por los puntos muestrales en los que no ocurrio (Yi = 0).
Modelo Lineal de
Probabilidad
Modelo Lineal de Y con respecto a X (con ajuste mnimocuadrtico)
Probabilidad 1.4
Y = 2.29 + 0.0544X
Inconvenientes
1.2
El modelo Logit y Probit
1
Inferencia en los
modelos de eleccion
discreta 0.8
coecientes
Contrastacion de 0.2
hipotesis
Modelos de alternativas 0
multiples
0.2
40 45 50 55 60 65
X
18:28:36
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Interpretacion de los
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
0.9 0.9
0.7 0.7
Contrastacion de
0.6 0.6
hipotesis
0.5 0.5
0.2 0.2
0.1 0.1
0 0
5 4 3 2 1 0 1 2 3 4 5 5 4 3 2 1 0 1 2 3 4 5
18:28:36
Modelo Logit
Bondad de ajuste donde Zi = 1 + 2 X2i + + k Xki y, dados los valores de las variables indepen-
dientes x2 , ..., xk , las probabilidades de que la variable dependiente tome los valores
Contrastacion de
hipotesis 1 y 0 son:
Modelos de alternativas ezi
multiples Pr(Y = 1|x2 , ..., xk ) = E(Yi |X = x) = ,
1 + ezi
ezi 1
Pr(Y = 0|x2 , ..., xk ) = 1 = ,
1 + ezi 1 + ezi
con zi = 1 + 2 x2i + + k xki .
Modelo Probit
El modelo Logit y Probit donde Z N (0, 1) y es tal que, dados los valores x2 , ..., xk de las variables inde-
Modelo Logit pendientes, se verica que:
Modelo Probit
Comparacion modelos Pr(Y = 1|x2 , ..., xk ) = (zi ),
Logit y Probit
Inferencia en los
con zi = 1 + 2 x2i + + k xki tal que:
modelos de eleccion n
discreta 1 si zi > 0
Y = .
Interpretacion de los 0 si zi < 0
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Contenidos Los modelos logit y probit comparten practicamente las mismas carectersticas: son
Introduccion modelos no lineales que son estimados por los metodos estudiados en el tema ante-
Modelos de eleccion rior (mnimos cuadrados no lineales o maxima verosimilitud), donde la interpretacion
binaria de los coecientes no es tan inmediata como en el modelo lineal de probabilidad.
Modelo Lineal de Ademas, en ambos casos hay que buscar una medida alternativa al coeciente de
Probabilidad
determinacion para medir la bondad del ajuste realizado.
El modelo Logit y Probit La unica diferencia entre ambos modelos es que la funcion logstica (curva azul)
Modelo Logit
tiene colas mas anchas, por lo que la probabilidad de exito sera mayor en los extre-
Modelo Probit
Comparacion modelos
mos cuando se use el modelo logit.
Logit y Probit
1
Inferencia en los
modelos de eleccion 0.9
discreta
0.8
Interpretacion de los
coecientes 0.7
Contrastacion de
0.5
hipotesis
0.4
Modelos de alternativas
multiples
0.3
0.2
0.1
0
5 4 3 2 1 0 1 2 3 4 5
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Metodo de MV
Inferencia en los modelos de eleccion discreta
Interpretacion de los
coecientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Interpretacion de los
Al igualar a cero las derivadas anteriores se obtiene el siguiente sistema de ecua-
coecientes ciones normales no lineal que tendra que ser resuelto mediante un algoritmo de
Bondad de ajuste
optimizacion:
n n
Contrastacion de X X ezi
hipotesis
yi = 0.
Modelos de alternativas 1 + ezi
multiples i=1 i=1
Xn
X
n
ezi
yi xji xji = 0, j = 2, . . . , k.
1 + ezi
i=1 i=1
18:28:36
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Interpretacion de los coeficientes
coeficientes
Efecto marginal
Odd ratio
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
Efecto marginal
Contenidos En los modelos lineales (como el modelo lineal de probabilidad) la derivada parcial
Introduccion de la variable dependiente, Y , con respecto a cada una de las variables explicativas,
Modelos de eleccion Xj , j = 1, . . . , p, es la constante j , y se interpreta como el cambio producido en
binaria Y cuando Xj aumenta una unidad. Puesto que los modelos logit y probit son no
Modelo Lineal de lineales, esta interpretacion no es correcta.
Probabilidad
En el modelo Logit, partiendo de (5), la derivada parcial anterior es:
El modelo Logit y Probit
Yi eZi
Inferencia en los = j , j = 1, . . . , k,
modelos de eleccion
discreta
Xji (1 + eZi )2
Interpretacion de los mientras que en el probit
coeficientes
Efecto marginal Yi
Odd ratio
= (zi )j , j = 1, . . . , k,
Xji
Bondad de ajuste
siendo la funcion de densidad de la distrbucion normal tipificada.
Contrastacion de
hipotesis Por tanto, el efecto marginal en ambos modelos depende de los valores que
Modelos de alternativas
toman las variables explicativas (ya no es constante: uno de los objetivos persegui-
multiples dos por estos modelos). Pueden, por tanto, calcularse los efectos marginales para
cada observacion de la muestra (alternativamente, los efectos marginales pueden
evaluarse para el valor medio de las variables explicativas).
18:28:36
Contenidos
EP EO TT Pr(Y = 1) Incremento
Introduccion 5 0 0.6 0.5571640
Modelos de eleccion 5 1 0.6 0.6183522 0.0611882
binaria
5 2 0.6 0.6760023 0.0576501
Modelo Lineal de 5 3 0.6 0.7287639 0.0527616
Probabilidad
5 4 0.6 0.7757833 0.0470194
El modelo Logit y Probit
5 5 0.6 0.8167018 0.0409185
Inferencia en los 5 6 0.6 0.8515816 0.0348798
modelos de eleccion
discreta 5 7 0.6 0.8807929 0.0292113
Interpretacion de los
5 8 0.6 0.9048969 0.024104
coeficientes 5 9 0.6 0.9245446 0.0196477
Efecto marginal 5 10 0.6 0.9404006 0.015856
Odd ratio
Bondad de ajuste Tal y como se observa en la tabla, para los valores constantes de calificacion en
Contrastacion de
pizarra de 5 y de un 60 % de preguntas correctas en los examenes tipo test, el cambio
hipotesis en la probabilidad de aprobar a medida que cambia la calificacion en el examen de
Modelos de alternativas ordenador no es constante.
multiples Cada una de las probabilidades anteriores se obtiene sustituyendo el correspon-
diente valor de EP , EO y T T en la siguiente expresion:
bi
eZ
,
bi
1 + eZ
bi = b1 + b2 EPt + b3 EOt + b4 T Tt .
donde Z
18:28:36
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
Odd ratio
Contenidos En la practica, en el modelo logit, lo que se suele hacer es calcular la razon entre
Introduccion ambas probabilidades, cociente denominado odd-ratio, es decir:
Modelos de eleccion ezi
binaria pi 1+ezi
Modelo Lineal de
= 1
= ezi ,
Probabilidad
1 pi 1+ezi
El modelo Logit y Probit con zi = 1 + 2 x2i + + k xki .
Inferencia en los
modelos de eleccion
discreta
Por tanto, el odd ratio es el numero de veces que es mas probable que ocurra el
fenomeno o suceso frente a que no ocurra.
Interpretacion de los
coeficientes El odd-ratio asociado a un cambio de xjh a xjl , h 6= l, h, l = 1, . . . , n en la va-
Efecto marginal riable Xj , j = 1, . . . , k, supuesto que el resto de variables permanecen constantes,
Odd ratio viene dado por:
ezh
Bondad de ajuste
= ej (xjh xjl ) .
Contrastacion de ezl
hipotesis En tal caso:
Modelos de alternativas
multiples Si no existe relacion entre la variable dependiente y la variable en estudio el odd-
ratio toma el valor uno.
Si la variable dependiente incrementa la probabilidad sobre la variable explica-
da el odd-ratio sera superior a uno tanto mayor cuanto mas elevada sea esta
relacion.
Si la variable dependiente disminuye la probabilidad de la variable explicada el
odd-ratio sera menor que uno.
18:28:36
Contenidos Los odd-ratios asociados a un cambio unitario en las variables del ejemplo conside-
Introduccion rado se recogen en la siguiente tabla:
Modelos de eleccion
binaria Variables EP EO TT
Modelo Lineal de Odd-ratio 1.1659 1.2878 109.1859
Probabilidad
Contrastacion de
hipotesis
Modelos de alternativas
multiples
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Bondad de ajuste
coeficientes
Bondad de ajuste
Coeficiente de
McFadden y proporcion
de aciertos
Contrastacion de
hipotesis
Modelos de alternativas
multiples
18:28:36
Contenidos En los modelos logit y probit, debido a que el metodo de estimacion no es el de MCO
Introduccion sino el de MV, no podemos utilizar el coeficiente de determinacion clasico para medir
Modelos de eleccion la bondad del ajuste. Recordemos que este era uno de los problemas que surgan en
binaria el modelo lineal de probabilidad. En su lugar, se utiliza el pseudo R2 de McFadden:
Modelo Lineal de
Probabilidad ln L
R2 = 1 ,
El modelo Logit y Probit ln Lr
Inferencia en los donde ln L es el logaritmo neperiano de la funcion de verosimilitud del modelo sin
modelos de eleccion
discreta restricciones (el modelo con todas las variables explicativas) y ln Lr es el logarit-
Interpretacion de los mo neperiano de la funcion de verosimilitud del modelo restringido (solo incluye el
coeficientes termino independiente del modelo).
Bondad de ajuste Otra opcion para analizar la bondad del modelo es contabilizar el porcentaje de
Coeficiente de aciertos del modelo teniendo en cuenta que, por ejemplo, las probabilidades predi-
McFadden y proporcion
de aciertos
chas por encima de 0.5 contabilizan como Yi = 1 y menores que 0.5 estiman Yi = 0:
Contrastacion de
hipotesis
Yi = 1 Yi = 0
Yi = 1 A B
Modelos de alternativas
multiples Yi = 0 C D
En los casos A y D se habra predicho correctamente el valor de Y , por tanto, la
proporcion de aciertos vendra dada por el cociente A+Dn
.
Si se desea ser exigente con el modelo (lo recomendado), en lugar de usar el
umbral del 0.5 se debe usar la proporcion de exitos (de unos) que hay en la variable
dependiente.
Contenidos
Observados - Predichos Suspensos Aprobados Total Porcentaje
Introduccion Suspensos 14 6 20 70 %
Modelos de eleccion Aprobados 22 83 105 79.04 %
binaria
Total 36 89 125 77.6 %
Modelo Lineal de
Probabilidad
En la tabla anterior se cruzan las observaciones disponibles sobre el numero de sus-
El modelo Logit y Probit
pensos y aprobados con las predicciones realizadas por el modelo. Recordemos que
Inferencia en los el modelo logstico proporciona la probabilidad de aprobar, por tanto, es necesario
modelos de eleccion
discreta
establecer un umbral para clasificar dicha probabilidad como aprobada o suspen-
Interpretacion de los
sa. En este caso, puesto que en la muestra se tiene un 84 % de aprobados se ha
coeficientes decidido que una probabilidad por debajo de 0.84 sea clasificada como suspenso y
Bondad de ajuste
por encima como aprobado (se puede apreciar por tanto que se ha establecido un
Coeficiente de umbral bastante exigente).
McFadden y proporcion Con esta premisa se tiene que de los 20 suspensos clasifica bien a 14 (un 70 %),
de aciertos
mientras que de los 105 aprobados clasifica correctamente a 83 (un 79.04 %). Final-
Contrastacion de
hipotesis
mente, el modelo ajustado clasifica adecuadamente un 77.6 % de los datos (97 de
125), una cifra mas que aceptable si se tiene en cuenta las exigencias establecidas.
Modelos de alternativas
multiples
18:28:36
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Contrastacion de hipotesis
coeficientes
Bondad de ajuste
Contrastacion de
hipotesis
Significacion individual
de los coeficientes
Significacion conjunta
de los coeficientes
Modelos de alternativas
multiples
18:28:36
Contenidos Para realizar contrastes de significacion conjunta sobre todos los coeficientes (o un
Introduccion subconjunto), se puede utilizar el contraste de la razon de verosimilitudes:
Modelos de eleccion o
binaria H0 : 2 = 3 = ... = k = 0
.
Modelo Lineal de
H1 : en caso contrario
Probabilidad
El estadstico de contraste es:
El modelo Logit y Probit
L(r )
Inferencia en los
modelos de eleccion
2 ln 2q ,
discreta L()
Interpretacion de los
coeficientes
donde L(r ) es la verosimilitud del modelo restringido, es decir, del modelo en el
Bondad de ajuste
que se impone la H0 , L() es la verosimilitud del modelo sin restricciones y q es el
numero de restricciones.
Contrastacion de
hipotesis
Significacion individual
de los coeficientes
Significacion conjunta
de los coeficientes
Modelos de alternativas
multiples
Contenidos
Introduccion
Modelos de eleccion
binaria
Modelo Lineal de
Probabilidad
Inferencia en los
modelos de eleccion
discreta
Interpretacion de los
Modelos de alternativas multiples
coeficientes
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
Modelos de
alternativas multiples
Ejemplo
18:28:36
Bondad de ajuste
Contrastacion de
hipotesis
Modelos de alternativas
multiples
Modelos de
alternativas multiples
Ejemplo
18:28:36
Contenidos En el caso del modelo logit multinomial, la probabilidad de escoger una de las alter-
Introduccion nativas es:
Modelos de eleccion
e1j +2j xi
binaria
pij = P3 , i = 1, ..., n; j = A, B, C.
Modelo Lineal de
j=1
e1j +2j xi
Probabilidad