Vous êtes sur la page 1sur 18

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Notas de Clases Practicas #2:


ASPECTOS PRELIMINARES PARA EL CURSO
DE ECONOMETRIA.
El objetivo de estas notas es realizar un breve repaso de los
conceptos minimos de estadistica necesarios para el curso de
Econometria, expuestos de manera intuitiva. De ninguna manera
reemplaza a los capitulos basicos de un libro de econometria, sino
debe ser entendido como una lista de chequeo para evaluar si
los conocimientos previos son adecuados o no.

Indice:
Relaciones entre dos variables.
Regresion simple
Inferencia: intervalos de confianza y test de hipotesis en regresion simple

Relaciones entre dos variables.


En econometria nos dedicaremos a anzalizar la relacion entre
variables en fenomenos economicos. Las observaciones que realizamos
sobre distintas variables (PBI, desempleo, riesgo pais, indices bursatiles,
ventas de algun producto, etc) las interpretaremos como muestras
provenientes de una poblacion con caracteristicas inobservables. Nuestro
objetivo sera, a traves de la muestra tratar de entender los mecanismos que
estan detras de la generacion de las series estadisticas. Para ello debemos
tener siempre en cuenta el concepto de muestra y poblacion.
En este capitulo nos concentraremos entre relaciones entre dos
variables, y avanzaremos desde el concepto de correlacion y covarianza
hasta el de regresion simple. Es muy importante que al terminar de leer este
instructivo, advierta la interrelacion entre estos conceptos, pero sepa
identificar las diferencias.

Para motivar la discusion utilizaremos datos entre el primer trimestre


de 1994 y el tercero del 2000 de la tasa de crecimiento de la economia y un

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

indicador de riesgo pais.1 Aqui la relacion entre dos variables se observa en


el tiempo, en un mismo lugar (Argentina), a este tipo de set de datos se los
conoce como series de tiempo de las variables. Si, tuvieramos datos para un
momento del tiempo en distintos lugares (ej. Argentina, Brasil, etc),
tendriamos lo que se llama datos de corte transversal2. En general, cuando
trabajamos con una serie de tiempo X, cada una de las observaciones se la
denota Xt (ej. una serie de PBI en Brasil desde 1940 hasta el 2000, la tasa
de desempleo local en los ultimos 5 aos, etc) , mientras que si fuera de
corte transversal se las denota Xi( ej. las exportaciones de todos los paises
de America en 2000, el ingreso de una muestra de familias encuestadas ,
etc).
El primer punto importante para analizar series es la inspeccion visual de
las mismas, para despues porder interpretar los resultados cuantitativos que
calculemos (covarianzas, correlacion, etc)
El grafico 1 muestra las variables mencionadas contra el tiempo, a veces
llamado un time series plot o grafico de las variables contra el tiempo.
Permite advertir la evolucion en el tiempo de las variables y su asociacion a
la vez.

Mas detalles sobre la construccion y fuentes de las series son irrelevantes para estas notas. Si esta
interesado, puede obtener informacion a traves del autor.
2
Para los curiosos, hay otros tipos de bases de datos, como datos de panel, pero no vamos a usar este tipo
de datos em el curso.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Crecimiento y Riesgo Pais


20%
Crecimiento
Riesgo Pais
15%

10%

5%

2000.1

1999.1

1998.1

1997.1

1996.1

1995.1

-5%

1994.1

0%

-10%

GRAFICO 1

Otra forma de inspeccion grafica es lo que se conoce como Scatter plot o


Cross Plot, en donde las observaciones de las dos series se interpretan
como coordenadas en R2. Note que este tipo de grafico enfatiza la relacion
de las variables (positiva, negativa) asi como tambien la forma ( si parece
ser lineal o no) y la fuerza(si la relacion parece sistematica o no hay un
patron claro de relacion), pero pierde la dimension del tiempo: es decir, de
este grafico no podemos saber como fue la evolucion en el tiempo de las
series.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Crecimiento y Riesgo Pais


10%
8%

Crecimiento

6%
4%
2%
0%
0%

2%

4%

6%

8%

10%

12%

14%

16%

-2%
-4%
-6%
Riesgo Pais

GRAFICO 2
Si el interes es en analizar una serie de datos (digamos la variable X),
definamos
sx=raiz cuadrada[ (xt2)/n]
como una medida de dispersion de los X alrededor de su media. Notar que
sx esta construido con los datos de la muestra y, ademas que esta en las
mismas unidades que esta medida X.

Si nosotros estamos interesados en cuantificar una relacion entre dos


variables X e Y, y nos enfocamos solo en el grado de asociacion LINEAL ,
entonces hay dos estadisticos utiles.
Escribamos a las series en forma de desvios :
xt=(Xt-media(X)), yt=(Yt-media(Y))
donde las medias son las muestrales. El grafico 3 muestra un cross plot de
los desvios respecto del crecimiento versus los del raiesgo pais. Que nos
dice este grafico? Que cuando el riesgo pais esta por encima de su media
(riesgo pais alto) el crecimiento esta debajo de su media (la economia crece

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

poco). Comparando el grafico 2 con el 3 vemos que ni la forma de la


relacion ni la dispersion cambio, solo cambia la media de las series. Es
interesante notar que del grafico 2 al 3 es como si hubieramos hecho pasar
el eje de coordenadas por la media de X e Y en vez de hacerlo pasar por el
(0,0). Esto es lo unico que cambia al tomar los datos en forma de desvios.

Desvios del Riesgo Pais y del Crecimiento respecto a su media


8%
6%

Desvio Crecimiento

4%
2%
0%
-6%

-4%

-2%

-2%

0%

2%

4%

6%

8%

10%

-4%
-6%
-8%
-10%
Desvio Riesgo Pais

GRAFICO 3
Uno de los estadisticos utilizados es la covarianza entre X e Y, que
se calcula como la suma de los productos xt*yt (es decir el producto de los
desvios de X e Y respecto a su media) dividido el total de observaciones.
Cov(x,y)=[xtyt]/n

Es importante notar que la covarianza esta expresada en unidades de


x por unidades de y, es decir que si multiplicamos X por 2, la covarianza se
duplicara. En el caso de los datos de riesgo pais y crecimeinto, pueden ver
en la hoja de Excel Adjunta que la covarianza resulta ser 0.00081. Es
chica? Bueno, precisamente depende de las unidades de X e Y, que son
porcentajes con cifras menores al 10%: al ser numeros chicos la covarianza
va a ser chica en general.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Otra medida de relacion LINEAL entre las variables es el coeficiente


de correlacion simple.
rxy =[(xt/sX)*(yt/sy)]/n = [xt yt]/[n sx sy ] = Cov(X, Y)/(sx sy).
Notar que r es simplemente la covarianza dividida por el producto de
los desvios de X e Y. De esta manera r pierde las unidades que tiene la
covarianza y queda libre de unidades. Notar que el signo de la covarianza
es el signo de r. En el caso de los datos de riesgo pais y crecimiento
r=-0.635
Es importante notar que, sin embargo, mientras que la covarianza
NO esta acotada, r si lo esta. Se puede demostrar (se usaba la llamada
desigualdad de Cauchy-Schwartz) que el coeficiente de correlacion
satisface -1=<r<=1.
Noten ademas que con la ultima expresion para r despejamos
Cov(X,Y)=rxy Sx Sy
Es decir, que , si como en nuestro caso la escala de los datos es
relativamente pequea ( el desvio standard del crecimiento es menor al 5%
y el del riesgo pais apenas excede el 2.6%), las covarianzas pueden ser
chicas y el coeficiente de correlacion puede ser relativamente grande
(aunque acotado)
Es importante recordar una vez mas que tanto la covarianza como la
correlacion miden el grado de asociacion LINEAL entre X e Y. En el
grafico 4 se muestra un cross plot entre X e Y donde si bien r=0, hay una
relacion (obviamente no lineal) entre X e Y. Por eso siempre es util una
inspeccion visual a los datos.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Un r cercano a cero no implica que no haya relacion entre X e Y


1.2
1
0.8

r=0

0.6
0.4
0.2
0
-1.5

-1

-0.5

0.5

1.5

GRAFICO 4
Es importante recordar que la existencia de relacion lineal no implica
que X este causando lo que le pasa a Y, solo que sus movimientos estan
asociados LINEALMENTE. Asociacion y causalidad son cosas bien
distintas, y en este curso solo hablaremos de asociacion, sin que ello
implique causalidad. Es decir, que variable asignamos al eje X y al Y NO
implica que X este causando lo que pasa en Y. Por ello, en regresion simple
usamos los terminos variable explicada y explicativa en vez de dependiente
e independiente o endogena y exogena.

Regresion Simple
Como se dijo previamente, detras de todo el curso de econometria va
a estar detras el concepto poblacion-muestra.
Supongamos que en la poblacion tiene lugar una relacion lineal (aunque no
perfecta) entre dos variables X e Y.
Yt=+Xt+ut

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

donde y son parametros que caracterizan la relacion y ut es un error


(disturbance) que indica que aun en la poblacion la relacion deja de ser
perfecta. ut es una variable aleatoria , que sigue una cierta distribucion con
media 0 y varianza finita. Este es el mecanismo que genera las muestras,
las cuales nosotros analizamos.
El objetivo de utilizar la muestra es , como dijimos, entender que tipo
de relacion esta detras de estas variables X e Y. Con la muestra
intentaremos decir algo sobre la poblacion de la cual sacamos la muestra.
Para ello, nos vamos a valer de estimadores, que son funciones de las
variables aleatorias observadas en la muestra. Como tales, los estimadores
son variables aleatorias. Cuando tomamos una muestra y reemplazamos los
mismos en la formula del estimador obtenemos un numero, llamado
estimacion. Notar la diferencia estimador, estimacion.

Los estimadores pueden tener ciertas propiedades. Un estimador (recordar


que es una variable aleatoria) se dice insesgado si es cieto que el valor
esperado del mismo coincide con el valor poblacional. Asi, la media
muestral es un estimador insesgado de la media poblacional, es decir,
puede demostrarse que
E[media muestral] = ,
donde seria la hipotetica media poblacional.
Si ademas de ser insesgado tiene la minima varianza (esta mas concetrado
sobre el verdadero valor que otros estimadores) se dice que es eficiente.

Ahora vamos concretamente a un caso.Tenemos datos (en millones de $)


de una firma a traves del tiempo, y queremos indagar sobre la relacion
publicidad y ventas. Una primera vista a los datos indica que hay una
posible asociacion entre publicidad y ventas: mayor inversion en publicidad
esta asociada con mayores ventas.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Ventas vs. Publicidad


600

Ventas (mill$)

500
400
300
200
100
0
0

10

20

30

40

50

60

Publicidad (mill$)

GRAFICO 5
Como podriamos cuantificar esta relacion? Uno podria conjeturar
que la muestra se extrajo de una poblacion en donde hay una relacion
(LINEAL) ventas y publicidad:
Ventast=+Publicidadt+ut
Aqui nos interesaria saber que valores tienen y . Ello nos
permitiria saber por ejemplo, cuantas ventas espero si la publicidad alcanza
una determinada cifra, o cuanto aumentarian las ventas esperadas si la
compania decide invertir $1 millon mas en campaas de publicidad.
Lamentablemente no tenemos la poblacion sino solo una muestra de
tamao n. Sin embargo podemos decir algo se tenemos estimadores que
aproximen valores de y . Hay distintos metodos que nos permiten
obtener estimadores, el que utilizaremos es el de minimos cuadrados, que
intentan calcular la pendiente y ordenada al origen de la recta que mejor
ajusta en el cross plot de publicidad y ventas.
Con los datos muestrales, el modelo sera
Ventast=a+b Publicidadt+et

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

donde a y b seran los parametros de la relacion empirica y et se llaman


residuos (son el paralelo de los errores en la regresion muestral, pero no
deben confundirse con aquellos).

El problema es encontrar la recta que minimice la suma la distancia


de los puntos de la recta. Nosotros ya planteamos el problema de
minimizacion y de el salen dos CPO (como de todo problema de
minimizacion que estamos acostumbrados a resolver). Como hay dos
incognitas a (ordenada) y b(pendiente), tenemos un sistema de 2 ecuaciones
(las dos derivadas de la funcion objetivo (ut2) respecto a y ) conocido
como ecuaciones normales3. De ellas obtenemos dos condiciones: et=0 y
Xtet=0. La recta que minimice la distancia de los puntos a dicha recta
debe satisfacer que los residuos se cancelen entre si (sumen 0) y que el la
suma del producto de los Xt y los et sea 0. De esta ultima condicion Xtet=0
se puede demostrar que implica Cov(X,e)=0, indicando que en la recta de
regresion los residuos y los X no deben tener relacion lineal: a los residuos
va todo lo que X no puede explicar linealmente de Y.
En la hoja de trabajo de regresion simple (regresion simple.xls)
mostramos en las columnas los valores originales de las series (los X e Y),
los datos en forma de desvios (comprueben con al menos una fila que esto
es asi) asi como tambien los promedios y sumas de los valores que estan en
las columnas.
De las ecuaciones normales se puede despejar que
b=(xtyt)/(xt2) = rxy sy/sx = Cov(X,Y)/sx2 (verificar)

Esto indica que el b, el coeficiente de correlacion simple y la covarianza


tienen relacion entre si. De alguna manera, el concepto de covarianza es el
centro del modelo de regresion lineal simple. Es importante notar que esta
relacion vale solo para regresion con solo una variable explicativa y la
constante.
En nuestro caso (ver la hoja regresion simple.xls) (xtyt)=13450 y
xt2=1563, por lo que b=8.6. Un ejercicio recomendable es que calculen
3

Para los curiosos, no tiene que ver con distribuacion normal ni por el termino normal sino por la
interpretacion geometrica de las ecuaciones.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Cov(X,Y), sx sy y rxy que en la hoja que les envio resultan (aprox.) 538, 7.9,
84.5 y 0.8 respectivamente.
De esta manera, b=8.6 se puede interpretar que un aumento en la
publicidad de $1 millon estaria asociado a un aumento en las ventas de $8.6
millones (verificar).

El valor de a puede calcularse como


a=media(y) b media(x),
que en nuestro caso resulta ser 85 (verificar).

Test de Hipotesis e intervalos de confianza en un


contexto de regresion simple.
Uno quisiera a veces decir algo de la poblacion de la cual extrajo la
muestra. Por ejemplo, en Economia tenemos ideas economicas que
quisieramos testear. Como solo tenemos muestras de datos, queremos
saber si la informacion que tenemos en estas muestras nos dan seguridad
para decir que tal teoria o hipotesis es rechazada o incompatible con
los datos, o si bien los datos dicen que esa teoria puede ser una buena
descripcion de la realidad. Para ello necesitaremos tener nociones basicas
de inferencia estadistica, es decir, tener criterios rigurosos que nos permitan
inferir algo a partir de una muestra.
Sobre la base de la inferencia estadistica hay algunas distribuciones
frecuentemente utilizadas, a las cuales hacemos rapida referencia:
Distribucion normal: Una variable aleatoria con distribucion normal esta
caracterizada por dos parametros: media() y varianza(2).
X ~ N(,2) se lee X se distribuye Normal con media() y varianza(2).
Recordar que la distribucion tiene una forma acampanada y es simetrica
respecto de la media. Ademas sabemos que si sacamos una muestra de una
observacion de una normal hay un 95% de probabilidades que el valor
caiga en el intervalo [-1.96,+1.96] y un 68% de probabildiades que
caiga en el intervalo [-,+].

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Variable Normal Estandarizada:


X ~ N(,2), entonces se puede definir el estadistico
z=(x-)/ donde z~N(0,1). Se dice que z sigue una distribucion normal
standard.
Distribucion 2
Consideremos n variables aleatorias normales standard independientes. La
suma del cuadrado de las mismas sera una variable aleatoria llamada 2 con
n grados de libertad.
En notacion,
z2 ~ 2(n)
Recordar la esperanza de una distribucion 2(n) es n y su varianza es 2n.
La distribucion 2 toma valores positivos y tiene un sesgo hacia la derecha.
Distribucion t:
Si z es una variable aleatoria normal standard (z~N(0,1)) y C es una
variable aleatoria que sigue una distribucion 2(n) ( c~ 2(n)), entonces
tn =

z
c
n

seguira una distribucion t de Student con n grados de libertad. La


distribucion t es parecida a una normal standard con mayor densidad en
los extremos (colas mas gruesas), y a medida que n crece, la distribucion
se parece cada vez a una normal standard. De ahi, que como la normal
standard tiene desvio 1, como regla a ojo (rule of thumb) se dice que hay
un 95% de probabilidades que una muestra de una observacion de una
variable t este en el intervalo [-2,2]. Esto es solo una aproximacion,
aunque buena para variables t con mas de 30 grados de libertad. Por
ejemplo, si n (grados de libertad) es 30, un chequeo a la tabla nos dice que
el intervalo es [-2.042,2.042].

Construccion de Intervalos de Confianza.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

Supongamos que sabemos que una muestra de un cierto tamao de una


poblacion donde es valido que Yt=+Xt+ut, el estimador de , es decir b
sigue una distribucion tal que la variable aleatoria
t=

b
sb

sigue efectivamente una distribucion t. sb es una medida de la precision


con la que estimamos b y se puede calcular con los datos de la muestra. De
esta manera, sabriamos que si bien no es conocido, hay valores de b mas
probables y menos probables. Intuitivamente, si es un valor positivo, uno
esperaria que haya una alta probabilidad que b sea positivo, especialmente
si b es un estimador insesgado.
Sabiendo que la variable aleatoria t sigue una distribucion conocida,
entonces, podemos calcular la probabilidad que el estadistico t caiga en
un intervalo del tipo [-t/2, t/2], donde 1- seria dicha probabilidad.

Definido hay una probabilidad

de 1-
que la variable aleatoria "t" caiga
/2,-t
/2]
en el intervalo [-t

-t/2

t/2

GRAFICO 6
Por ejemplo, si t tiene 30 grados de libertad y =0.05 ya dijimos que el
intervalo [-t/2, t/2] seria [-2.042 , 2.042], es decir habria un 95% (1-) de
probabilidades que la variable y definida como

Econometria

Notas de Clases Practicas 2

t=

Guillermo Bozzoli

b
sb

tome un valor mayor a 2.042 pero inferior a 2.042.


Entonces esto se escribe
prob [-t/2 <= (b-)/sb <= -t/2] = 1
despejando se llega a que
prob [b-t/2sb <= <= b-t/2sb] =1-.
Esta ultima ecuacion nos dice que, pese a que tenemos una muestra
podemos decir algo sobre cuales serian los valores mas probables del
coeficiente , habiendo con los datos muestrales calculado b y sb.
Test de hipotesis
Otra forma de mirar lo mismo es el conocido Test de Hipotesis.
El hecho que t tenga una distribucion nos dice que ciertos valores de son
mas probables que otros. Ahora, podriamos dar vuelta la implicacion y
decir: si en la poblacion fuera cierto que tienene un cierto valor, digamos
0, cuan posible es que obtenga yo un b como el que calcule?4
Entonces, si fuera cierto que =0, puedo usar una de las ecuaciones de
arriba y escribirla como:
prob [-t/2 <= (b-0)/sb <= -t/2] = 1
Esto se lee: si fuera cierto que =0, entonces t deberia tomar con
probabilidad 1- valores en el intervalo [-t/2, t/2]. Por ejemplo, si los
grados de libertad de la t fueran 30, sabemos que con =0.05 el intervalo
es [-2.042,2.042]: es decir, habria un 95% (1-) de posibilidades que si es
cierto que =0 el valor (tc) que calculamos al realizar
tc =
4

b 0
sb

Por ahora la palabra probable es una forma dehacer mas intuitiva la pregunta. Correctamente hablando
la pregunta no tiene mucho sentido. Para los curiosos, como la distribucion de t es continua, la densidad
de un punto es 0.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

tome valores entre (aproximadamente) 2 y 2.


Como =0 es una hipotesis5, si t toma valores fuera del intervalo, uno
estaria tentado a pensar que es poco posible que la hipotesis sea cierta.
Para ello miren de vuelta la ecuacion de tc: es un cociente entre la distancia
de b a su hipotetico valor poblacional 0, dividido por la precision (sb) con
la que estimamos b. Es decir, si estoy seguro que mi estimacion de b es
buena (sb es chico, indicando alta precision) entonces incluso pequeas
diferencias entre b y 0 haran que tc sea, en valor absoluto alto y , por lo
tanto me llevaran a desconfiar de mi hipotesis =0.
Dicho de otra manera , tc mide la distancia entre la muestra (algunos
dirian la realidad) y la hipotesis. Si esta es grande, entonces los datos
no avalan la hipotesis, hay una diferencia entre lo que pensamos (la
hipotesis) y lo que observamos (la muestra).
Por supuesto, como una distribucion t toma valores desde menos a mas
infinito, es cierto que obtengamos un tc de digamos, 5, y en el modelo
teorico =0. Pero la posibilidad de ello es extremadamente baja. Por
ello, cuando calculamos el tc tenemos que decidir que valores de tc no son
compatibles con la hipotesis (seran los valores muy negativos o muy
positivos) y cuales pueden ser aceptables. Tengo que decidir hasta donde
tolero que sea la distancia entre la muestra y la hipotesis. Tengo que
decidir un valor de corte para tc.
Noten que la distancia entre la muestra y la hipotesis puede ocurrir porque
precisamente como tengo una muestra, tengo un margen de error. Por ello,
no quisiera rechazar valores de tc chicos, ya que bien podria ocurrir que
en realidad la hipotesis =0 fuera cierta y que la distancia entre b y 0,
medida a traves de tc se deba al error muestral. Sin embargo es muy poco
posible grandes distancias entre b y 0 se deban solo a error muestral.
Lo mas probable es que la hipotesis =0 sea falsa, aunque siempre tendre
incertidumbre sobre si realmente mi opinion sobre la validez o no de la
hipotesis fue acertada.
Precisamente, para medir esta posibilidad de equivocarme, tengo un
parametro que me indica cual es la probabilidad que, al elegir el punto de
corte t/2 y considere a valores de tc fuera del intervalo [-t/2, t/2] como
5

En la terminologia de test de hipotesis esta seria la hipotesis que se desea testear o hipotesis nula.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

evidencia en CONTRA de la hipotesis (=0) me equivoca. Me da la


probabilidad de rechazar la hipotesis cuando en realidad esta era cierta.
Este error se conoce como error tipo I, y es elegido de antemano para
decidir que valores de tc son compatibles con la hipotesis (valores
cercanos a 0 en este caso y que estan en la region de aceptacion) y cuales
no( es decir caen en la llamada region de rechazo) . El valor se conoce
como nivel de significacion. Usualmente se usa =0.05, con lo cual la
region de aceptacion esta entre 2 y 2. Esto quiere decir que si tc esta en
este segmento, interpretaremos que los datos son compatibles o no nos
permiten rechazar la hipotesis =0, mientras que si toma valores fuera de
este segmento, es decir en la region de rechazo interpretaremos a la
hipotesis como incompatible con los datos.

Ejemplo: para una t con mas


de 30 grados de libertad la
zona de aceptacion con un
=0.05 seria
aproximadamente el intervalo
[-2,2]

ZONA DE
RECHAZO

-t/2

Zona de aceptacion:
No puedo rechazar la
hipotesis que estoy
evaluando si el valor de
t cae en esta region

Si la hipotesis = 0 fuera valida,


100*(1-
)% de las veces el valor
de
tc caeria en la "zona de
aceptacion", decir en el intervalo
/2,-t
/2].
[-t

ZONA DE
RECHAZO

t/2

GRAFICO 7

Algunos paquetes estadisticos, como el que usaremos nos indican el


conocido p-value. Este valor es muy importante, ya que nos dice cual es la
probabilidad de haber obtenido un b que diste mas de la hipotesis =0 (o ,
mas incompatible con =0) que el obtenido. Un p-value o p-valor menor
al escogido nos indica que el valor tc cae en la zona de rechazo (es muy
poco probable que la muestra de la que calcule el b venga de una
poblacion donde =0 ). Asi, un valor p de 0.01 indica que solo hay un 1%
(una chance en 100) que si fuera cierto que =0 yo hubiera obtenido un

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli

valor de b como el que calcule.6 Dicho en otras palabras, es el minimo nivel


de significacion a partir del cual se puede rechazar la hipotesis (nula).

En realidad indica que hay una posibilidad en 100 que obtenga un valor de b tanto o mas incompatible
con =0 como el que obtuve.

Econometria

Notas de Clases Practicas 2

Guillermo Bozzoli