Académique Documents
Professionnel Documents
Culture Documents
Estadstica. UV
Regresin lineal
Regresin a la media
Conclusin: los padres muy altos tienen tendencia a tener hijos que
heredan parte de esta altura, aunque tienen tendencia a acercarse
(regresar) a la media. Lo mismo puede decirse de los padres muy
bajos.
Francis Galton
Primo de Darwin
Estadstico y aventurero
Fundador (con otros) de
la estadstica moderna
para explicar las teoras
de Darwin.
Qu vamos a estudiar
Altura
en cm.
Peso
en Kg.
162
61
154
60
180
78
158
62
171
66
169
60
166
54
176
84
163
68
...
...
Pesa 50 kg.
Mide 161 cm.
Pesa 76 kg.
ue
q
ce
e
r
Pa
s
e
p
el
nta
e
um
a
o
la
n
co
a
r
u
t
al
10 kg.
10 cm.
Incorrelacin
280
230
180
130
80
30
140
150
160
170
180
190
200
Para
380
320
340
360
400
420
r= 0.415
r^2 = 0.172
150
160
170
180
La distribucin de Y,
independientemente del valor de X, se
denomina distribucin marginal.
190
370
380
390
r= 0.984
r^2 = 0.969
360
350
9
150
160
170
180
190
Incorreladas: Sxy =0
10
S xy
SxS y
11
Propiedades de r
Es adimensional
Slo toma valores en [-1,1]
Las variables son incorreladas r=0
Relacin lineal perfecta entre dos variables r=+1 o r=-1
-1
Bioestadstica. U. Mlaga.
Variables
incorreladas
Relacin
directa
casi
perfecta
+1
Tema 3: Estadstica bivariante
12
13
14
15
Preguntas frecuentes
16
Regresin
= Variable dependiente
predicha
explicada
= Variable independiente
predictora
explicativa
Es
Y = f(X) + error
Regresin
= mX + n
b1 (pendiente de la recta)
b0 (ordenada en el origen, constante)
= mX + n
m=0,5
n=85 cm
21
m=0,5
n=85 cm
22
i ei2
S XY
m 2
Sx
n y b1 x
Bioestadstica. U. Mlaga.
23
24
Cometi un error
de -30 en su
ltima prediccin
25
26
Interpretacin de la variabilidad en Y
En primer lugar olvidemos que existe la
variable X. Veamos cul es la variabilidad
en el eje Y.
27
28
Bondad de un ajuste
Resumiendo:
Cuanto
S
R 1
S
2
2
e
2
Y
2
e
S
29
2
Y
30
por qu?
por qu?
32
Modelos de regresin
1 variable explicativa
Simple
Lineal
No lineal
2+ variables explicativas
Mltiple
Lineal
No lineal
33
16
12
14
10
12
8
10
8
6
4
4
Desv. tp. = 8,64
Media = 173,3
N = 59,00
0
155,0
165,0
160,0
175,0
170,0
185,0
180,0
195,0
190,0
Media = 170,8
N = 59,00
0
160,0
165,0
162,5
170,0
167,5
175,0
172,5
180,0
177,5
182,5
34
180
190
170
b0=89,985
b1=0,466
Aprecias regresin a la media?
150
150
160
170
180
190
Eso significa que el 57% de las predicciones del modelo son correctas?
CmoCorrelaciones
lo interpretas?
Correlacin de Pearson
Altura del
Padre
,759
1,000
160
R
,759a
R cuadrado
,577
R cuadrado
corregida
,569
Error tp. de la
estimacin
3,480
Coeficientesa
Coeficientes no
estandarizados
Modelo
1
(Constante)
Altura del Padre
B
89,985
,466
Error tp.
9,180
,053
35
200
Qu hemos visto?
Ordenada en el origen
Pendiente
Residuo, error
Bondad del ajuste, coef. determinacin