Vous êtes sur la page 1sur 15

Salidas de STATA

Gabriel Moraga
Moaraga.gabriel@gmail.com
Regresin Lineal

La regresin lineal es una tcnica estadstica que permite


determinar la relacin existente entre una variable
dependiente con una o ms variables independientes.
Permite: 1) Describir y cuantificar las relaciones entre las
variables y 2) Predecir valores para la variable
independiente.
La regresin
Y lineal se basa en la ecuacin de la recta: Y = n
+ mX Y=n+
mX
Y2

Y1
n

X
X X
2
1 2
Regresin Lineal

La
errormejor forma de aproximar esta recta es reduciendo el
de estimacin entre los valores predichos y los valores
observados. Por lo cual, la recta que vamos a elegir es
aquella que minimice las distancias verticales entre las
observaciones y el valor predicho.

La forma utilizada para determinar la posicin de la recta es


reduciendo la siguiente funcin:

Este mtodo se denomina Mnimos Cuadrados Ordinarios


(MCO)

3
16
14 Ingresos y aos escolaridad jefes de hogar en santiago


12


10

0 5 10 15 20
escolaridad

lnyopraj Fitted values

4
Regresin Lineal: Interpretacin de los estimadores
MCO

En el anlisis de regresin podemos utilizar una variable


explicativa, lo cual se conoce como una regresin simple o
podemos utilizar un modelo con ms variables lo cual
denominaremos regresin mltiple.

Regresin simple:

Regresin mltiple:

5
Ejemplo de regresin lineal en STATA

En Stata utilizamos el comando regress


. gen lnyopraj=ln(yopraj)
(160916 missing values generated)
. reg lnyopraj esc if comuna==13101 & pco1==1

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468


_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

6
Ejemplo de regresin lineal en STATA

En Stata utilizamos el comando regress


. gen lnyopraj=ln(yopraj)
(160916 missing values generated) AJUSTE DEL
TABLA ANOVA
. reg lnyopraj esc if comuna==13101 & pco1==1 MODELO

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
ESTIMACIN DE Adj R-squared = 0.3041
Total 96.9154433 143 PARMETROS
.677730373 Root MSE = .68675

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468


_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

7
Descripcin de los componentes de la salida en
STATA
.Anlisis de Varianza
reg lnyopraj (ANOVA) & pco1==1
esc if comuna==13101

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675

Source (Fuente):
lnyopraj Coef.Corresponde
Std. Err. a t las P>|t|
fuentes [95%
en Conf.
queInterval]
se
descompone la varianza total del modelo para la variable
esc .1271122 .0159522 7.97 0.000 .0955777 .1586468
dependiente.
_cons
La varianza
11.29522
total se
.2107556
divide
53.59
en la varianza
0.000
que
10.87859
puede
11.71184
ser explicada por las variables independientes (Modelo) y la
varianza no explicada, atribuible al termino de error o residuo.

8
Descripcin de los componentes de la salida en
STATA

.Anlisis de Varianza
reg lnyopraj (ANOVA) & pco1==1
esc if comuna==13101

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675

SS lnyopraj
(SC): son las sumas
Coef. de
Std.cuadrados
Err. tde cada
P>|t| fuente
[95%que explica
Conf. Interval]
la varianza total:
esc .1271122 .0159522 7.97 0.000 .0955777 .1586468
_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184
SS-Total = SS-Modelo + SS-Residual

9
Descripcin de los componentes de la salida en
STATA
.Anlisis de Varianza
reg lnyopraj (ANOVA) & pco1==1
esc if comuna==13101

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675

df lnyopraj
(gl): son los Coef.
gradosStd.
de Err.
libertad. t ParaP>|t|
la varianza totalInterval]
[95% Conf. los
grados de libertad son N-1. Para el caso de la varianza del modelo
esc .1271122 .0159522 7.97 0.000 .0955777 .1586468
los grados
_cons
de libertad
11.29522
son iguales
.2107556
el
53.59
nmero
0.000
de parmetros
10.87859 11.71184
estimados 2 (incluido el intercepto) menos 1 (k-1). Finalmente los
grados de libertad de la varianza del residuo se obtiene restando
los gl totales menos gl del modelo (N-1)-(k-1)= (N-k)-2
Donde N es el nmero de observaciones y k el nmero de
parmetros estimado.

10
Descripcin de los componentes de la salida en
STATA
.Anlisis de Varianza
reg lnyopraj (ANOVA) & pco1==1
esc if comuna==13101

Source SS df MS Number of obs = 144


F( 1, 142) = 63.49
Model 29.9451652 1 29.9451652 Prob > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675

MS:lnyopraj
Es la desviacin
Coef.media, y se obtiene
Std. Err. t dividiendo
P>|t| LaConf.
[95% suma de
Interval]
los cuadrados por sus grados de libertad (SS/df).
esc .1271122 .0159522 7.97 0.000 .0955777 .1586468
_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184
MS-Modelo: SS-Modelo/(k-1)
MS-Residual: SS-Residual/(N-k-2)
MS-Total: SS-Total/(N-1)

11
Ejemplo de regresin lineal en STATA

Medidas de ajuste del modelo


Number of obs = 144
F( 1, 142) = 63.49
Prob > F = 0.0000
R-squared = 0.3090
Adj R-squared = 0.3041
Root MSE = .68675
F(1, 142): Este es el estadstico F de Fisher y corresponde al MS
explicado dividido por el MS del residuo (MS-modelo/MS-Residual).
P>|t| [95% Conf. Interval]
En parntesis aparecen los gl del ANOVA asociados a la varianza
del modelo y la varianza del residuo. Este estadstico permite
0.000 .0955777 .1586468
testear la significancia conjunta del modelo. Cuando un modelo
0.000est 10.87859 11.71184
muy mal especificado el modelo podra resultar no
significativo.
Prob > F: Este es el valor p asociado al estadstico F. Sirve para
testear la hiptesis nula de que todos los parmetros del modelo
(coeficientes) son iguales a cero.
12
Ejemplo de regresin lineal en STATA

Medidas de ajuste del modelo


Number of obs = 144
F( 1, 142) = 63.49
Prob > F = 0.0000
R-squared = 0.3090
Adj R-squared = 0.3041
Root MSE = .68675
R-squared (R cuadrado): Mide la bondad de ajuste del modelo,
varia entre 0 y 1. Donde cero es la ausencia de ajuste y 1 ajuste
P>|t| [95% Conf. Interval]
perfecto de la recta estimada. Se computa como la proporcin de
la varianza explicada por el modelo sobre la varianza total. La
0.000 .0955777 .1586468
formula es la siguiente: (SS-Modelo/SS-Total)
0.000 10.87859 11.71184
Este valor aumenta a medida que se incluyen ms variables en el
modelo.

13
Ejemplo de regresin lineal en STATA

Medidas de ajuste del modelo


Number of obs = 144
F( 1, 142) = 63.49
Prob > F = 0.0000
R-squared = 0.3090
Adj R-squared = 0.3041
Root MSE = .68675
Adj R-squared (R cuadrado ajustado): Este estimador es un
estimador del ajuste del modelo que penaliza la inclusion de
P>|t| [95% Conf. Interval]
nuevos regresores, es decir, no aumenta necesariamente e incluso
podra disminuir. De este modo este R cuadrado ajustado busca
0.000 .0955777
dar una medida .1586468
de la bondad de ajuste para obtener como
0.000resultado
10.87859
un modelo11.71184
parsimonioso. La forma en que se computa
este estadstico es como el cuociente entre la variacin media del
modelo y la variacin media total: (MS-Modelo/Ms-Total)
Root MSE (Raz del ECM): Es la raz del Error Cuadrtico Medio,
representa la desviacin estndar del trmino de erro o residuo, y
se obtiene como la raiz cuadrada del MS-Residual. 14
Source SS df MS Number of obs = 144
F( 1, 142) = 63.49
Model Ejemplo
29.9451652de regresin
1 29.9451652 lineal en STATAProb > F = 0.0000
Residual 66.9702781 142 .471621676 R-squared = 0.3090
Adj R-squared = 0.3041
Total 96.9154433 143 .677730373 Root MSE = .68675
Estimacin de parmetros

lnyopraj Coef. Std. Err. t P>|t| [95% Conf. Interval]

esc .1271122 .0159522 7.97 0.000 .0955777 .1586468


_cons 11.29522 .2107556 53.59 0.000 10.87859 11.71184

La primera fila/columna aparece la variable dependiente.

Coef: corresponde a los coeficientes estimados beta para la


variable aos de educacin y alpha para la constante.
Std. Err.: Corresponde al Error Estndar del Coeficiente.
T: Estadstico t para la hiptesis nula de coeficiente igual a cero.
P>|t|: el p-value asociado al test

15

Vous aimerez peut-être aussi