Académique Documents
Professionnel Documents
Culture Documents
Rafael de Arce
rafael.dearce@uam.es
Con este documento se pretende ilustrar de un modo aplicado cómo debe realizarse el
análisis de un modelo uniecuacional a partir de los contenidos aprendidos en la
asignatura Econometría I (obviándose el análisis de cumplimiento de hipótesis básicas
sobre las perturbaciones aleatorias, que forma parte de la asignatura Econometría II).
Para ello, se ha descrito un modelo imaginario de una compañía discográfica sobre la
que se hará el análisis correspondiente.
El workfile de datos de e-views con el que se realiza el análisis de este modelo esta
disponible en la hoja web de docencia (http://www.uam.es/rafael.dearce) en el
apartado de “docencia – econometría I – Documentos de apoyo”, donde también está
colgado este documento.
Una discográfica quiere estimar cuál podría ser el número de discos que venderá en
quince países en los que todavía no ha salido al mercado. Para ello, cuenta con
información sobre los resultados de ventas del nuevo disco (DISCO2) y otras variables
de interés en cada país para un total de 37 observaciones donde el disco ya está en
circulación.
Después de haber realizado un profuso estudio sobre las características del mercado y
a partir de su propia experiencia, decide especificar un modelo econométrico del
siguiente tipo:
1 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
Observations 37 37 37 37 37
2 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
26
24
22
2 20
1 18
-1
-2
5 10 15 20 25 30 35
3 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
El modelo que se propone se puede asociar a cualquier teoría clásica con un enfoque
de demanda microeconómica de un producto, que vendría entonces definida por las
siguientes variables: precio del bien (relación inversa), precio de los sustitutos (relación
directa), precio de los complementarios (relación directa), renta (relación directa),
moda (relación directa) y tecnología (relación directa).
Entre las variables de nuestro modelo, existen varias relacionadas con estos
conceptos:
1
A pesar de que en los manuales econométricos se incluye en esta fase el análisis de la cuantía de los
parámetros, personalmente entiendo que esta no debería realizarse hasta el final de la modelización,
momento en el que no se variará más la especificación del modelo y tendrá sentido hablar de análisis
estructurales .
2
En cualquier caso, algunas variables pueden tener interpretaciones distintas sobre el signo (ser positivo
o negativo en función de un período concreto, de un objetivo concreto – por ejemplo, el grupo los “Peter
Sellers”, más espectáculo que calidad, vende más discos cuando no hace conciertos que cuando sí los
hace - ).
4 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
Para ello, la salida de la regresión nos muestra (en la columna marcada como “Prob.-
ability-”) la “probabilidad de rechazar la hipótesis nula del contraste cuando esta es
cierta”. Estadísticamente, es común dar por bueno un resultado cuando puedo
rechazar la hipótesis nula con un 95% de confianza o más.
En el modelo expuesto, los valores de “Prob.” para la “T-Statistic” son todos inferiores
a 0,05. Es decir, en todos los casos puedo decir que la probabilidad de equivocarme
cuando rechazo la hipótesis nula (el verdadero parámetro es cero) es de menos del
5%. En definitiva, acepto la validez de todas las variables especificadas para definir la
evolución de la endógena.
[ ]
Pr βˆ j − t εn−/k2 * S ( βˆ j ) < β j < βˆ j + t nε −/k2 * S ( βˆ j ) = 1 − ε
En nuestro caso, los grados de libertad son 32 (37-5). Buscando en las tablas de la t-
student el valor de la misma para un nivel de confianza del 95% ( ε = 0,05 ),
obtenemos: 2,042. Aplicando la formula anterior, los intervalos de confianza para cada
parámetro son:
Comparando los valores extremos de los intervalos calculados con los parámetros
estimados, parece que el más ajustado de todos ellos sería el de “conciertos”: cada
concierto realizado daría lugar a un incremento de las ventas del disco2 en de entre
0,57 y 0,92 millones. El resto de los intervalos, a mi juicio; sería bastante amplio,
5 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
En el caso de nuestro ejemplo, podemos decir que somos capaces de recoger más de
un 80% de la variación de las ventas a partir de la especificación suministrada,
quedando el resto del porcentaje en elementos que no podemos explicar con este
modelo.
3
Por supuesto, esta valoración es subjetiva, y estará condicionada por el grado de precisión que uno
quiera conseguir del modelo porque, en cualquier caso, las variables elegidas han resultado ser
significativas.
6 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
i) Análisis gráfico
26
24
22
2 20
1 18
-1
-2
5 10 15 20 25 30 35
Los primeros análisis del error son muy intuitivos y poco exactos. Los contrastes
gráficos tanto del ajuste entre real (actual) y estimada (fitted) pueden darnos ciertas
pistas sobre la bondad del modelo practicado, pero difícilmente serán concluyentes.
En nuestro caso, de las treinta y siete observaciones con las que cuenta nuestro
modelo podemos señalar algunos ajustes imprecisos en unos siete puntos (marcados
arriba con flechas de colores); aunque, a la vista del gráfico, el modelo es bastante
razonable, recogiendo adecuadamente la evolución de la endógena real (sin desfases
observacionales o grandes puntos de error).
En cuanto al gráfico del error, hay que precisar que no se puede observar ningún
patrón claro de comportamientos sistemáticos (gráfico con ondas suaves o en dientes
de sierra; o con tendencia claramente creciente o decreciente; o con separación clara
de zonas de valores positivos y negativos;…). En definitiva no parece que presente
problemas evidentes. Tampoco los errores transciende de la banda representada por
más menos dos veces la desviación típica de los mismos (zona en la que estarían con
un 95% de probabilidades los valores de una variable que se distribuye como una
normal). Tan solo el punto siete quizá represente un valor algo elevado del error, y se
podría hacer alguna consideración especial sobre él en un análisis más detallado de
los datos de ese país en una fase posterior del estudio.
Los ratios habitualmente propuestos son la raíz cuadrada del error cuadrático medio
ECM, para comparar entre especificaciones distintas de modelos con el mismo
número de explicativas (k); el error absoluto medio (medida muy imprecisa) y el
porcentaje de error absoluto medio (PEAM), que siempre debe utilizarse sobre valores
en niveles.
Dicho lo anterior, solo haré algún comentario sobre el valor obtenido en el PEAM: un
2,35% en el modelo que nos ocupa (abajo los valores de la salida de e-views). No hay
4
En el programa e-views, pulsando el botón “forecast” que aparece en la salida de la regresión, se
obtienen, entre otros, los siguientes resultados
7 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
mucho que decir al afirmar que este porcentaje es más que razonable y el modelo
estaría produciendo un ajuste extraordinario.
% Errores tipo II (suma errores tipo II entre suma total cambios en la real): 4/22=18,2%
8 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
% Errores tipo I (suma errores tipo I entre suma total cambios en la estimada): 3/23=
13%.
En nuestro caso, no podemos calcular las series de crecimiento y que solo tenemos un
momento temporal para cada observación (el modelo es de corte transversal). Aún así,
y para ilustrar como se haría con un modelo de corte temporal, único en el que
verdaderamente tiene sentido este tipo de contraste, lo ejecutamos suponiendo las
tasas tal y como las puede calcular el e-views con este tipo de datos: calculando los
crecimientos que se producen de una observación a otra (de un país en referencia al
que tiene colocado inmediatamente antes en el workfile, aunque esta sea una medida
matemáticamente correcta pero sin ningún sentido económico ya que la ordenación de
los países es arbitraria).
Para hacer el gráfico cruzado, se abren las dos series en tasas de crecimiento a la vez
(se marcan y se abren “as group”) y, posteriormente, en la opción view se marca
“Graphics – Scatter (donde se pueden pintar a mano, con word, las líneas de los ejes y
la de predicción perfecta):
El resultado es el siguiente:
0.3
0.2
@PCH(DISCO2F)
0.1
0.0
-0.1
-0.2
-0.2 -0.1 0.0 0.1 0.2 0.3
@PCH(DISCO2)
5
También en la opción “forecast” de la salida de la regresión de e-views se calculan automáticamente los
valores de la U-Theil (total y descompuesta en sesgo, dispersión y correlación).
9 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
En cuanto a los valores de la U de Theil, el valor global del ratio arroja un 0,014577,
claramente próximo al cero, donde las tasas de crecimiento coincidirían en signo y
cuantía, por lo que se podría hablar de un buen modelo. Analizando someramente su
descomposición, no aparece ningún sesgo sistemático hacia la sobrevaloración o la
infravaloración (Bias proportion 0.000) 6; así como tampoco una dispersión
significativamente distinta comparando las tasas de crecimiento de la estimada y la
real (Variance Proportion 0.053105). En cuanto a la componente de correlación
(Covariance proportion 0.946895), el valor cercano a uno indicaría un valor de
correlación elevada, pero de sentido contrario – negativa - entre las tasas reales y las
estimadas (Covariance Proportion 0.946895).
Comenzando por “muestra pequeña”, en nuestro caso contamos con treinta y siete
observaciones (n) y con cinco variables explicativas (k), con lo que los grados de
libertad son 32. Habitualmente, se considera que son suficientes 15 ó más grados de
libertad para poder realizar contrastes estadísticos de cierta calidad, por lo que nuestro
modelo no presenta este problema de muestra pequeña.
6
Diferencia de medias de tasas de crecimiento entre real y estimada
7
Pulido, A. y Pérez, J. (2002): Modelos Econométricos. Editorial Pirámide. Página 417
10 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
11 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
12 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
=
(e' e − e e )/ n
'
(e e )/ (n − k )
1 1 2
Fn2 ;n1 − k '
1 1 1
Donde la submuestra más grande (n1 tendría treinta y una observaciones y la otra, n2,
seis).
8
Como es sabido, en la realidad el contraste de estructura debe hacerse posteriormente al de
heterocedasticidad, ya que la presencia de ésta podría parecer un falso cambio de estructura. Por
necesidades del programa teórico de Econometría I, aquí se acomete este contraste sin haber visto antes
si hay o no problemas en la varianza de las perturbaciones aleatorias.
13 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
20
10
-10
-20
10 15 20 25 30 35
CUSUM 5% Significance
14 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
0,1251
J= = 0,2760
0,4531
Es decir,
Pr 22,062 − 2,042 * 0,6930 * 1 + 137 < Yn+1 < 22,062 + 2,042 * 0,6930 * 1 + 137 = 1 − 0,05
Luego, con un 95% de confianza, podré afirmar que el valor de la venta de disco2 en
un país distinto a los que utilizo para la estimación estará entre (20,63 ; 23,49).
Finalmente, y una vez comprobadas las características del modelo, cabe utilizarlo. En
los libros de econometría figuran cuatro grandes utilidades básicas:
a) Simulación
b) Predicción
c) Análisis estructural
d) Comprobación o refutación de teorías
15 / 16
Apuntes de clase Econometría I Prof. Rafael de Arce
Sobre las dos primeras, bastaría con dar valor a las exógenas para calcular los
resultados de predicción o simulación sobre las posibles ventas del disco 2 en algún
otro país no empleado para realizar la estimación. Ya disponemos de los parámetros,
con las máximas calidades estadísticas, para poder realizar este fácil cálculo:
En cuanto al análisis estructural, para poder medir la importancia relativa de cada una
de las variables para explicar a la endógena, deberíamos estandarizar los parámetros,
ya que inicialmente estos serán mayores o menores no solo por su grado de
importancia, sino también por el rango de valores de la variable a la que multiplican.
Para estandarizar los parámetros:
SXj
βˆ jS tan dard = βˆ j *
SY
En definitiva, la variable más relevante para definir la venta de discos parece ser el
PRECIO. De un modo similar influirían las ventas del disco anterior y la competencia y,
ligeramente menos peso tendría CONCIERTOS.
Respecto a la última “utilidad” del modelo, este nos confirma el supuesto inicial de que
estas son las variables que influyen a la hora de determinar la venta de disco2, aunque
en las fases de contrastación podríamos haber suprimido alguna si no hubiera sido
significativa, poniendo en entredicho nuestra elección inicial de las variables relevantes
(aunque no es el caso de este ejercicio). Quizá esta utilidad tenga mayor relevancia
cuando planteamos un modelo teórico inicial de un carácter más académico.
16 / 16