Vous êtes sur la page 1sur 31

everton.silva@ufsc.

br
copyright
Mayo 2013
1
Ejercicio
Anlisis de Regresin Simple
Everton da Silva
everton.silva@ufsc.br
Cuenca - Ecuador
17 de mayo de 2013
everton.silva@ufsc.br
copyright
Mayo 2013
2
Los Datos
Tabla de datos de Terrenos Baldos - Grandes
Dato Precio rea (ha)
1 30,00 5,0
2 20,00 10,0
3 10,00 20,0
4 10,00 18,0
5 30,00 6,0
6 22,00 15,0
7 31,00 4,0
8 28,00 8,0
9 12,00 17,0
10 4,00 23,0
11 16,00 12,0
12 5,00 0,2
everton.silva@ufsc.br
copyright
Mayo 2013
3
Paso 1
Vamos a los anlisis!
Hacer un Grfico de Dispersin entre X e Y
Objetivos:
- Evaluar la relacin entre las variables (forma de la ecuacin);
- Evaluar la presencia de datos atpicos (outliers)
everton.silva@ufsc.br
copyright
Mayo 2013
4
Paso 2
Calcular el coeficiente de correlacin
Objetivo:
- Evaluar el grado de asociacin entre las variables.
Las Asociaciones
everton.silva@ufsc.br
copyright
Mayo 2013
5
Paso 3
Calcular los estimadores de los parmetros de la regresin
(coeficientes de regresin) Mtodo de los Mnimos Cuadrados.
Objetivo:
- Definir la ecuacin de regresin.
La Ecuacin
everton.silva@ufsc.br
copyright
Mayo 2013
6
Paso 4
Calcular la bondad de ajuste del modelo (coeficiente de
determinacin r
2
).
Objetivo:
- Evaluar el poder de explicacin de la ecuacin.
La Bondad del Ajuste
- Elaborar la tabla ANOVA
- Calcular r
2
y r
2
ajustado
everton.silva@ufsc.br
copyright
Mayo 2013
7
Paso 5
Hacer el anlisis de la significancia global del modelo F
snedecor, considerando el nivel de significancia de 5%.
Objetivo:
- Verificar si el modelo es adecuado para producir estimativas del
mercado inmobiliario.
Las Significancias
everton.silva@ufsc.br
copyright
Mayo 2013
8
Paso 6
Hacer el anlisis de la significancia del coeficiente de regresin t
student, considerando el nivel de significancia de 5%.
Objetivo:
- Verificar si la variable independiente es importante en la formacin del
modelo de valuacin.
Las Significancias
everton.silva@ufsc.br
copyright
Mayo 2013
9
Paso 7
Evaluar si los residuos tienen distribucin normal.
Objetivo:
- Verificar el cumplimiento del supuesto de la normalidad de los residuos.
Los Anlisis de Residuos
- Calcular los valores estimados de precios con la ecuacin de
regresin ajustada;
- Calcular los residuos;
- Calcular los residuos estandarizados;
- Hacer un histograma a partir de los residuos estandarizados.
everton.silva@ufsc.br
copyright
Mayo 2013
10
Paso 8
Hacer un grfico de dispersin considerando los residuos
estandarizados (ordenada) y los valores estimados del precio
(abscisa).
Objetivo:
- Evaluar si los residuos tienen varianza constante, o sea, se son
homocedasticos;
- Verificar si existen casos atpicos (outliers).
Los Anlisis de Residuos
everton.silva@ufsc.br
copyright
Mayo 2013
11
Paso 9
Calcular el intervalo de confianza al nivel de 80% alrededor del
dato 9 de la tabla.
Objetivo:
- Definir el intervalo de juicio del valuador.
El Intervalo de Confianza
everton.silva@ufsc.br
copyright
Mayo 2013
12
Resolucin del Ejercicio
Vamos a los resultados!
everton.silva@ufsc.br
copyright
Mayo 2013
13
Paso 1: Hacer un Grfico de Dispersin entre X e Y
Los Anlisis
everton.silva@ufsc.br
copyright
Mayo 2013
14
Nuevamente - Los Datos sin Outlier
Tabla de datos de Terrenos Baldos - Grandes
Dato Precio rea (ha)
1 30,00 5,0
2 20,00 10,0
3 10,00 20,0
4 10,00 18,0
5 30,00 6,0
6 22,00 15,0
7 31,00 4,0
8 28,00 8,0
9 12,00 17,0
10 4,00 23,0
11 16,00 12,0
everton.silva@ufsc.br
copyright
Mayo 2013
15
Paso 2: Calcular el coeficiente de correlacin
Las Asociaciones
Dato Precio rea (Xi - X
media
) (Yi - Y
media
)
(Xi - Xmedia) * (Yi - Ymedia)
Yi Xi Xi - X
Media Yi - Y
Media *
1 30.00 5.00 -7.55 10.64 56.93 113.13 -80.26
2 20.00 10.00 -2.55 0.64 6.48 0.40 -1.62
3 10.00 20.00 7.45 -9.36 55.57 87.68 -69.80
4 10.00 18.00 5.45 -9.36 29.75 87.68 -51.07
5 30.00 6.00 -6.55 10.64 42.84 113.13 -69.62
6 22.00 15.00 2.45 2.64 6.02 6.95 6.47
7 31.00 4.00 -8.55 11.64 73.02 135.40 -99.44
8 28.00 8.00 -4.55 8.64 20.66 74.59 -39.26
9 12.00 17.00 4.45 -7.36 19.84 54.22 -32.80
10 4.00 23.00 10.45 -15.36 109.30 236.04 -160.62
11 16.00 12.00 -0.55 -3.36 0.30 11.31 1.83
Total 213.00 138.00 420.73 920.55 -596.18
Media 19.36 12.55
everton.silva@ufsc.br
copyright
Mayo 2013
16
Paso 2: Calcular el coeficiente de correlacin
Las Asociaciones
1 n
) y y (
1 n
) x x (
1 n
) y y )( x x (
r
n
1 i
2
i
n
1 i
2
i
n
1 i
i i


=
= =
=
everton.silva@ufsc.br
copyright
Mayo 2013
17
Paso 2: Calcular el coeficiente de correlacin
Las Asociaciones
958 , 0
24 , 62
62 , 59
) 59 , 9 ( ) 49 , 6 (
62 , 59
1 11
55 , 920
1 11
73 , 420
1 11
18 , 596
=

=
x
r
everton.silva@ufsc.br
copyright
Mayo 2013
18
Paso 3: Calcular los estimadores de los parmetros de la regresin
(coeficientes de regresin) Mtodo de los Mnimos Cuadrados.
La Ecuacin de Regresin
2
i
n
1 i
i i
n
1 i
1
) X X (
) Y Y )( X X (
b

=
=
=
y X b Y b
1 0
=
42 , 1
73 , 420
18 , 596
1
=

= b
15 , 37 )) 55 , 12 ( ) 42 , 1 (( 36 , 19
0
= = x b
i i
X Y * 42 , 1 15 , 37

=
y
everton.silva@ufsc.br
copyright
Mayo 2013
19
Paso 3: Calcular los estimadores de los parmetros de la regresin
(coeficientes de regresin) Mtodo de los Mnimos Cuadrados.
La Ecuacin
y = 37.14 - 1.42 X
i

R = 0.92
0.00
5.00
10.00
15.00
20.00
25.00
30.00
35.00
40.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00
P
R
E
C
I
O







O
B
S
E
R
V
A
D
O

REA
Yi Precio Estimado
everton.silva@ufsc.br
copyright
Mayo 2013
20
Paso 4: Calcular la bondad de ajuste del modelo (coeficiente
de determinacin r
2
).
La Bondad del Ajuste
Fuente de
Variacin
Sumas de
Cuadrados
Grados de
Libertad
Media
Cuadrtica
Regresin
SSR

k

Residuo
SSE

n - k - 1

Total
SST

n - 1



=
n
1 i
2
i
) Y Y


=
n
1 i
2
i i
) Y Y


=
n
1 i
2
i
) Y Y (
k
SSR
MSR=
) 1 k n (
SSE
MSE

=
everton.silva@ufsc.br
copyright
Mayo 2013
21
Paso 4: Calcular la bondad de ajuste del modelo (coeficiente
de determinacin r
2
).
La Bondad del Ajuste
Dato Precio rea (-Y
media
)
2
(-Y
i
)
2
(Y
i
-Y
media
)
2

Y
i (observada)
X
i

(calculada)
(-Y
media
) (-Y
i
)
1 30.00 5.00 30.05 10.69 0.05 114.20 0.00 113.13
2 20.00 10.00 22.95 3.59 2.95 12.86 8.70 0.40
3 10.00 20.00 8.75 -10.61 -1.25 112.65 1.56 87.68
4 10.00 18.00 11.59 -7.77 1.59 60.43 2.53 87.68
5 30.00 6.00 28.63 9.27 -1.37 85.87 1.88 113.13
6 22.00 15.00 15.85 -3.51 -6.15 12.35 37.82 6.95
7 31.00 4.00 31.47 12.11 0.47 146.56 0.22 135.40
8 28.00 8.00 25.79 6.43 -2.21 41.30 4.88 74.59
9 12.00 17.00 13.01 -6.35 1.01 40.37 1.02 54.22
10 4.00 23.00 4.49 -14.87 0.49 221.23 0.24 236.04
11 16.00 12.00 20.11 0.75 4.11 0.56 16.89 11.31
Total 213.00 138.00 848.36 75.75 920.55
Media 19.36 12.55
everton.silva@ufsc.br
copyright
Mayo 2013
22
Paso 4: Calcular la bondad de ajuste del modelo (coeficiente
de determinacin r
2
).
La Bondad del Ajuste
Fuente de
Variacin
Sumas de
Cuadrados
Grados de
Libertad
Media
Cuadrtica
Regresin
SSR

1

Residuo
SSE

9

Total
SST

10



36 , 848
75 , 75
55 , 920
4 , 848 MSR=
42 , 8 MSE=
everton.silva@ufsc.br
copyright
Mayo 2013
23
Paso 4: Calcular la bondad de ajuste del modelo (coeficiente
de determinacin r
2
).
La Bondad del Ajuste
92 , 0
55 , 920
36 , 848
2
= = =
SST
SSR
r
( )
( )
(

=
(

=
9
10
) 92 , 0 1 ( 1
1
1
) 1 ( 1
2 2
k n
n
r r
a
91 , 0
2
=
a
r
Paso 4a: Calcular el r ajustado del modelo (coeficiente de
determinacin ajustado ).
2
a
r
everton.silva@ufsc.br
copyright
Mayo 2013
24
Paso 5: Hacer el anlisis de la significancia global del modelo
F snedecor, considerando el nivel de significancia de 5%.
Las Significancias
76 , 100
42 , 8
4 , 848
MSE
MSR
F
calc
= = =
12 , 5 F F
;9) 1 ;( 5 , 0 1) - k - n ; k ;(
=
o
) 12 , 5 ( F ) 76 , 100 ( F
critico calc
>
Conclusin: el modelo es significante al nivel de 5%.
everton.silva@ufsc.br
copyright
Mayo 2013
25
Paso 6: Hacer el anlisis de la significancia del coeficiente de regresin t
student, considerando el nivel de significancia de 5%.
Las Significancias
) b ( s
b
t
1
1
1
= Donde

=
n / ) X ( X
MSE
) b ( s
2
i
2
i
1
14 , 0
51 , 20
9 , 2
3 , 1731 0 , 2152
42 , 8
) b ( s
1
= =

=
14 , 0
42 , 1
t
1

=
14 , 10 t
1
= 262 , 2 t t
9 ; 975 , 0 1 - k - n ; 2 / 1
=
o
) 262 , 2 ( t ) 14 , 10 ( t
9 ; 975 , 0 1
>
Conclusin: el coeficiente de regresin correspondiente a la
variable rea es significante al nivel de 5%.
everton.silva@ufsc.br
copyright
Mayo 2013
26
Paso 7: Evaluar si los residuos tienen distribucin normal.
Los Anlisis de Residuos
Dato Precio rea (-Y
i
)/s
Yi Xi (-Y
i
) /s
1 30.00 5.00 30.05 0.05 0.02
2 20.00 10.00 22.95 2.95 1.12
3 10.00 20.00 8.75 -1.25 -0.48
4 10.00 18.00 11.59 1.59 0.61
5 30.00 6.00 28.63 -1.37 -0.52
6 22.00 15.00 15.85 -6.15 -2.34
7 31.00 4.00 31.47 0.47 0.18
8 28.00 8.00 25.79 -2.21 -0.84
9 12.00 17.00 13.01 1.01 0.38
10 4.00 23.00 4.49 0.49 0.19
11 16.00 12.00 20.11 4.11 1.57
Total 213.00 138.00
Media 19.36 12.55
Desviacin Estndar (s)
2.62
everton.silva@ufsc.br
copyright
Mayo 2013
27
Paso 7: Evaluar si los residuos tienen distribucin normal.
Los Anlisis de Residuos
0.00%
20.00%
40.00%
60.00%
80.00%
100.00%
120.00%
0
1
2
3
4
5
6
0.262949631 y mayor... -2.343681496 -1.040365933
F
r
e
c
u
e
n
c
i
a

Clase
Histograma
Frecuencia
% acumulado
everton.silva@ufsc.br
copyright
Mayo 2013
28
Paso 8: Hacer un grfico de dispersin considerando los residuos
estandarizados (ordenada) y los valores estimados del precio (abscisa).
Los Anlisis de Residuos
-3.00
-2.50
-2.00
-1.50
-1.00
-0.50
0.00
0.50
1.00
1.50
2.00
0.00 5.00 10.00 15.00 20.00 25.00 30.00 35.00
R
e
s
i
d
u
o
s








E
s
t
a
n
d
a
r
i
z
a
d
o
s


Y Calculado o Estimado
/s
everton.silva@ufsc.br
copyright
Mayo 2013
29
Paso 9: Ejemplo: Calcular el intervalo de confianza al nivel de 80%
alrededor del dato 9 de la tabla de Datos.
El Intervalo de Confianza

) (
) ( 1
Y

I
2
2
9
1 - k - n ; 2 / 1 9

+ =

X X
X X
n
s t
i
e o
donde
1
)

(
2


=

k n
Y Y
s
i
e
9 , 2
9
75 , 75
= =
e
s

73 , 420
) 5 , 12 17 (
11
1
9 , 2 383 , 1 13,01 I
2

+ =
48 , 1 13,01 I =
49 , 14 max Y

,53 1 1 min Y

9
9
=
=
everton.silva@ufsc.br
copyright
Mayo 2013
30
everton.silva@ufsc.br
copyright
Mayo 2013
31
Everton da Silva
Ingeniero Agrimensor
Profesor de la Universidade Federal de Santa Catarina
Departamento de Geociencias
Centro de Filosofa y Ciencias Humanas CFH
everton.silva@ufsc.br
Contacto