Vous êtes sur la page 1sur 29

CURSO DE ECONOMETRA II

TEMA:MODELOS

CON
VARIABLES
DEPENDIENTES CUALITATIVAS
Y LIMITADAS

Profesor : Mag. Cornelio Ticse Nez

MODELOS DE REGRESION CUALITATIVA


En un modelo en donde Yt es cuantitativa, el objetivo
consiste en estimar su valor esperado, o media esperada.
En modelos donde Yt es cualitativa, el objetivo es
encontrar la probabilidad de que un acontecimiento
suceda, como por ejemplo: enviar a los hijos a la escuela
pblica, poseer una casa propia, pertenecer o no a un
sindicato, o practicar algn deporte, etc. Por tanto, los
modelos de regresin con respuestas cualitativas a
menudo se les conoce como modelos de probabilidad que
pueden ser discretas o continuas.

Al respecto se plantean las siguientes preguntas:


1.- Cmo

se estiman los modelos de regresin con

respuestas cualitativas?, se puede simplemente


estimarlos con los procedimientos usuales de los MCO?
2.Se presentan problemas de inferencia especiales? En
otras palabras, el procedimiento de pruebas de
hiptesis se diferencia de aquellos modelos de regresin
con variable de medicin cuantitativa?
3. Si la variable regresada es cualitativa, cmo se mide la
bondad de ajuste en dicho modelo?, Las pruebas de
inferencia usuales tienen vigencia?

4.-

Cmo se elaboran los modelos para fenmenos

como el nmero de visitas al mdico en un ao, la


cantidad de patentes que registra una empresa en
un perodo determinado, el nmero de artculos
publicados por un profesor universitario durante
un quinquenio, el nmero de llamadas telefnicas
recibidas en el lapso de cinco minutos?
Dichos fenmenos, llamados datos de conteo, o
eventos raros, son un ejemplo del proceso (de
probabilidad) de Poisson.

Se comienza el estudio de modelos con respuesta


cualitativa considerando en primer lugar el modelo de
regresin con respuesta binaria. Hay tres mtodos
para desarrollar un modelo de probabilidad con
variable de respuesta binaria:
1.

El modelo Lineal de Probabilidad (MLP)

2.

El modelo Logit

3.

El modelo Probit

En vista de su simplicidad relativa y debido a que


puede estimarse mediante MCG, se estudia primero el
MLP, dejando los otros dos modelos para una
presentacin posterior.

MODELO LINEAL DE PROBABILIDAD (MLP)


Para fijar las ideas, considrese el modelo simple:
Yi = 1+ 2 Xi + i (*)
dondeXi = el ingreso familiar
Yi = 1 si la familia posee una casa
= 0 si la familia no posee una casa

Modelos tales como (*), que se asemeja a un


modelo de regresin lineal, se denomina Modelo Lineal
de Probabilidad (MLP) ya que la variable regresada es
dictoma. Por tanto E(Yi/Xi) expresa la esperanza
condicional de Yi dado Xi. ; es decir la probabilidad
condicional de que el evento suceda dado Xi.

As, en el caso anterior, E(Yi/Xi) da la probabilidad


de que una familia posea una casa y tenga un
ingreso de una cierta cantidad . La justificacin del
nombre MLP para modelos como (*) puede ser la
siguiente.

E(Yi/Xi)=1 + 2Xi

Asumiendo que Pi = probabilidad de que Yi= 1 (es


decir, de que el evento ocurra) y (1 Pi
)=
probabilidad de que Yi=0 (es decir, de que el evento
no ocurra), la variable Y tiene la distribucin de
probabilidad de Bernoulli.

El MLP plantea diversos problemas a saber:


El supuesto de normalidad para ui ya no se
mantiene en los MLP porque, al igual que Yi,ui
solamente toma dos valores; es decir, tambin
sigue la distribucin de Bernoulli. Para ver esto, se
escribe como:
La probabilidad de distribucin de ui es
ui
Cuando Yi = 1

1-1-2Xi

Cuando Yi = 0

-1-2Xi

Probabilidad
Pi
(1- Pi)

Obviamente, no puede suponerse que est


normalmente distribuida; en realidad sta sigue la
distribucin de Bernoulli
Por consiguiente, en muestras grandes, la
inferencia estadstica del MLP seguir el
procedimiento MCO usual bajo el supuesto de
normalidad.
La varianza del error es heteroscedstica.
Para la distribucin del trmino de error dado, por
definicin de varianza, se tiene que :
var (ui) = Pi(1- Pi)
que sigue la distribucin de Bernoulli

Es decir, la varianza del trmino de error en el MLP


es heteroscedstica. Puesto que , la varianza de
depende, al final de cuentas, de los valores de X y por
lo tanto no es homoscedstica.

Puesto que la varianza de depende de


una
forma de resolver el problema de heteroscedasticidad
es transformar el modelo dividiendo ambos lados del
modelo por
Como se puede verificar con relativa facilidad, que el
trmino de error transformado por sqr(wi) es
homocedstico. Por consiguiente el modelo inicial
ahora se puede estimar por MCO, el cual no es otra
cosa que la aplicacin de mnimos cuadrados
ponderados (MCP), donde wi son las ponderaciones.

ALTERNATIVAS AL MLP
Como se ha visto, el MLP tiene infinidad de
problemas, tales como 1) la no normalidad de los ,
2) la heteroscedasticidad de , 3) la posibilidad de
que se encuentre fuera del rango [0,1] y 4) los
valores generalmente bajos de R2. Pero estos
problemas se pueden resolver. Por ejemplo, se
puede utilizar el MCP para resolverle problema de
heteroscedasticidad o incrementar el tamao de la
muestra y minimizar as el problema de la no
normalidad. Recurriendo a las tcnicas de mnimos
cuadrados
restringidos
o
de
programacin
matemtica, es posible hacer que las probabilidades
estimadas se encuentren dentro del intervalo [0,1]

El sigmoide o curva en forma de S, se parece


mucho a la funcin de distribucin acumulativa
de una variable aleatoria (FDA). Por consiguiente
se puede utilizar fcilmente la FDA en
regresiones de modelos en los cuales la variable
de respuesta es dictoma, adquiriendo valores 01. La pregunta prctica ahora es, cul FDA?
Puesto que aunque todas las FDA tienen la forma
de S, para cada variable aleatoria hay una FDA
nica. Por razones histricas la igual que
prcticas, las FDA comnmente seleccionadas
para representar los modelos de respuesta 0-1
son: 1) la logstica y 2) la normal; la primera da
lugar al modelo logit y la segunda, al modelo
probit (o normit).

Pero
considrese
ahora
la
siguiente
representacin de la propiedad de vivienda:

Para facilidad de la exposicin, se escribe


como:

La ecuacin representa lo que se conoce como


funcin de distribucin logstica (acumulativa).

Es facil verificar que a medida que Zi

se encuentra

dentro de un rango de (- a +), Pi se encuentra en el


rango [0,1] y que Pi no est linealmente relacionado con
Zi

(es

decir,

requerimientos

con

Xi),

satisfaciendo

considerados

as

los

anteriormente.

dos
Sin

embargo al satisfacer estos requerimientos, se crea un


problema de estimacin porque Pi es no lineal no
solamente en X sino tambin en los . Esto significa que
no se puede utilizar el procedimiento clsico de MCO
para estimar los parmetros. Por tanto es necesario
linealizar el modelo que presenta distribucin logstica.

Ya linealizado el modelo
caractersticas siguientes:

pueden

observarse

las

1. A medida que P va de 0 a 1 (es decir, a medida que


Z vara de - a + , el logit L vara de - a + . Es
decir, aunque las probabilidades (por necesidad) se
encuentra entre 0 y 1, los logit no estn acotados en
esa forma.
2. Aunque L es lineal en X, las probabilidades en s
mismas no lo son. Esta propiedad contrasta con el
modelo MLP en donde las probabilidades aumentan
linealmente con X.
3. Aunque en el modelo anterior se ha incluido slo
una variable X, o regresora aadir tantas regresoras
como lo indique la teora subyacente.

1. Si L, el logit, es positivo, significa que cuando el


valor de la(s) regresora(s) se incrementa, aumentan las
posibilidades de que las regresadas sean igual a 1 (lo
cual indica que suceder algo de inters). Si L es
negativo, las posibilidades de que la regresada iguale a 1
disminuyen conforme el valor de X se incrementa.
2. De manera ms formal, la interpretacin del modelo
dado en es la siguiente: , la pendiente, mide el cambio
en L ocasionado por un cambio unitario en X, es decir,
dice cmo el logaritmo de las probabilidades a favor de
poseer una casa cambia a medida que el ingreso cambia
en una unidad, por ejemplo US$ 1000. La interseccin
es el valor del logaritmo de las probabilidades en favor
de poseer una casa si el ingreso es cero. Al igual que la
mayora de las interpretaciones de intersecciones, esta
interpretacin puede no tener significado.

ESTIMACIN DEL MODELO LOGITZ


Para fines de estimacin,
siguiente manera:

se

escribe

de

la

En breve, se analizarn las propiedades del trmino


de perturbacin estocstica, ui.
Para estimar .., adems de Xi, se necesitan los
valores de la regresada o del logit Li. Esto depende
del tipo de datos que se est analizando. Estos se
clasifican en dos categoras: 1) datos a nivel
individual o micro, y 2) datos agrupados o
replicados.

Informacin del nivel individual


Si existe informacin disponible sobre familias
individuales, como en la tabla 15.1, no es factible la
estimacin MCO de (15.6.1), lo cual es fcil de ver. En
trminos de los datos proporcionados en la tabla 15.1.,
Pi = si una familia es duea de una casa y Pi = 0 si no
posee una casa.

En ambos estas expresiones no tienen sentido y, para


este tipo de informacin se recurre al mtodo mxima
verosimilitud (MV) para estimar los parmetros.

Datos agrupados o replicados


Supongamos que se proporciona datos agrupados
o replicados (observaciones repetidas) sobre diversas
familias, de acuerdo con el nivel de ingreso y el nmero
de familias que poseen una casa para cada nivel de
ingreso. Correspondiente a cada nivel de ingreso Xi, hay
Ni familias, de las cuales ni poseen casa (ni < Ni). Por
consiguiente, si ahora se calcula:
Es decir, la frecuencia relativa, se puede utilizar ste
como una estimacin del verdadero Pi correspondiente a
cada Xi. Si Ni es relativamente grande, ser una
estimacin razonablemente buena de Pi. Utilizando el Pi

lo cual ser una estimacin relativamente buena del


verdadero logit Li, si el nmero de observaciones Ni a
cada nivel Xi es razonablemente grande. Puede
entonces aplicarse MCO a y estimar los parmetros
en la forma usual? La respuesta es, an no, ya que
hasta el momento no se ha dicho nada sobre las
propiedades del trmino de perturbacin estocstico.
Puede demostrarse que si Ni es relativamente grande
y si cada observacin en una clase de ingreso dado Xi
est distribuida en forma independiente como una
variable binomial, entonces

es decir, ui sigue una distribucin normal con media


cero y varianza igual a .
Por consiguiente, como en el caso del MLP, el
trmino de perturbacin en el modelo logit es
heteroscedstico. As, en lugar MCO se debern
utilizar mnimos cuadrados ponderados (MCP). Para
fines empricos, sin embargo, se reemplazar la Pi
desconocida por y se utilizar.

como estimador de

error transformado. Ahora se describen los diversos


pasos en la estimacin de la regresin logit
1.
Para cada nivel de ingresos Xi, calcule la
probabilidad estimada de poseer una casa como .
2. Por cada Xi, obtenga el logit mediante

3. Para resolver el problema de heteroscedaticidad, se


transforma de la siguiente manera:

El cual se estima por Mnimos Cuadrados Ordinarios.

MODELO PROBIT
En algunas aplicaciones, la FDA normal se ha
encontrado til. El modelo de estimacin que surge de
una FDA normal, es comnmente conocido como el
modelo probit, aunque algunas veces tambin es
conocido como el modelo normit. En principio, se
puede sustituir la FDA normal por la FDA logstica y
proceder como en el modelo Logit. Pero en lugar de
seguir este camino, se presentar el modelo probit
basado en la teora de la utilidad, o de la perspectiva
de seleccin racional con base en el comportamiento,
segn el modelo desarrollado por McFadden.

Se expresa el ndice Ii como:

donde Xi, es el ingreso de la i-sima familia.

Cmo se relaciona el Ii (no observable) con la decisin


real de poseer una casa? Igual que antes, sea Y = 1 si la
familia posee una casa y Y = 0 si no lo posee. Ahora
bien, es razonable suponer que para cada familia hay
un nivel crtico o umbral del ndice (Ii*) , tal que si Ii
excede a Ii*, la familia poseer casa propia, de lo
contrario no posee casa propia.

Dado el supuesto de normalidad, la probabilidad


de que Ii* sea menor o igual que Ii puede ser calculada
a partir de la FDA normal estandarizado como:

La probabilidad de poseer casa propia se mide por el rea de la curva


normal estandar de - a Ii como se presenta en figura de la lmina
siguiente. Ii llamado ndice de utilidad se calcula tomando la inversa de
la FDA normal estandar segn:

Ii = F-1 (Ii) = F-1 (Pi) = 1 + 2Xi

Donde F-1 es la inversa de la FDA normal. Esto se explica con lo


grficos que aparecen ms adelante . Cmo se obtiene el ndice I i
As como las estimaciones de 1 y 2? La respuesta depender si se
tienen datos agrupados e individuales.

ESTIMACION PROBIT CON DATOS AGRUPADOS Y NO


AGRUPADOS
Se utilizan los mismos datos que se usaron para estimar el
modelo Logit, por tanto ya se tienen las Pi relativas de poseer
casa propia para niveles de ingresos, stos valores se
pueden utilizar para obtener Ii de la FDA normal como se
muestra en la lmina del siguiente panel.
Una vez obtenidos los Ii, se procede a la estimacin de 1 y 2
mediante tcnicas no lineales ya estudiados basados en el
mtodo de maximaverosimilitud como el mtodo de Newton.
En el modelo Probit el ndice de utilidad no observable I i se
conoce como desviacin equivalente normal (d.e.n) y es
negativa si Pi < 0.5
en la prctica se aade el n 5 a la d.e.n. y dicho resultado se
denomina Probit. Ver lmina siguiente:

Vous aimerez peut-être aussi