Académique Documents
Professionnel Documents
Culture Documents
PRESENTADO:
Y=A+BX
inteligencia
Y Y
n
Rendimiento (Y)
'
i i sea mínimo
i 1
Inteligencia (X)
Cálculo de la ecuación de regresión lineal (de Y sobre X)
11
10
5
RENDIM
3
80 90 100 110 120 130
INTELIG
Cálculo de la ecuación de regresión lineal (de Y sobre X)
i i
n
Y Y '
es mínimo
i 1
Observa....
Ordtienada
origen A Y BX
B
XY nXY
X nX
Pendiente 2 2
X Y XY X2
suj1 120 10 1200 14400
suj2 100 9 900 10000
suj3 90 4 360 8100
suj4 110 6 660 12100
4 SUMA SUMA
3120 44600
PROMEDIO PROMEDIO
105 7.25
N
4
b
xy IMPORTANTE: B=b
Pendiente
x 2 Es decir, la pendiente en puntuaciones
diferenciales es la MISMA que en
puntuaciones directas
Sabemos que
Bb
xy
x 2
Y por el tema de
variabilidad sx2
x 2
xy
Bb
xy
n sxy rxy sx s y r s y
Se deduce que
x x 2 2 xy
sx2 sx2 sx
n
Cálculo de la ecuación de regresión lineal (de Y sobre X)
En definitiva, sy
B b rxy
sx
sy 1
b rxy rxy rxy
sx 1
y
sy
A Y rxy X
sx
Puntuaciones observadas Yi
Puntuaciones predichas Yi
Error de predicción
con la recta de Yi Yi
regresión de Y sobre X
s y2
(Y Y ) 2
n
Los errores de predicción en la recta de regresión de Y sobre X
(Y Y ) 2
es mínimo
s y2
(Y Y ) 2
n
Los errores de predicción en la recta de regresión de Y sobre X
s y2. x
i i
(Y Y
) 2
n
Esta es la varianza de Y no explicada por X
s y2. x
Que despejando sale rxy2 1
s y2
¿Cuán buena es la predicción de la recta de regresión? El coeficiente de
determinación como índice de la bondad de ajuste de nuestro modelo (la
recta de regresión)
s y2. x
Acabamos de mostrar que
rxy2 1
s y2
2
r xy
Es el llamado coeficiente de determinación y permite conocer cuán bueno
es el ajuste de la recta de regresión (o en general del modelo lineal). Está
acotado entre 0 y 1.
Si todos los puntos del diagrama de dispersión están sobre la recta (con pendiente
diferente de 0), s y2. xserá 0, y el coeficiente de determinación será 1
entonces
Cuanto más se alejen los puntos de la recta de regresión, mayor será el valor de
s y2del
el valor . x coeficiente de determinación será menor y menor.
El coeficiente de determinación y la proporción de varianza
asociada/explicada/común (1)
Empecemos con una tautología
Se puede demostrar que las puntuaciones predichas y los errores de predicción son
independientes, con lo que podemos señalar
s y2 s y2' s y2.x
2
s y Varianza total de Y
s y2. x
Y sabíamos que rxy2 1
s y2
s y2 s y2. x s y2´
luego rxy2 2
s y s y2
Hemos visto el caso de un predictor (X) y una variable predicha (Y), y obtenido la recta
de regresión de Y sobre X por el procedimiento de mínimos cuadrados.
Es importante que os deis cuenta que las ponderaciones B2, B3, ..., son
análogas a las que vimos en el caso de la recta de regresión.
s1.3
X1 ' A B2 X 2 B3 X 3 ... Bk X k Por ejemplo B2 r12.3
s2.3
X1 ' A B2 X 2 B3 X 3 ... Bk X k
x1 ' b2 x2 b3 x3 ... bk xk
Y aplicando la misma lógica, el valor de los pesos es el mismo que el que
teníamos en puntuaciones directas
b2 B2 b3 B3 etcétera
Introducción a la regresión lineal múltiple (4)
Datos (N=5)
R1.23 0'904
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
1 .904 a .817 .634 1.744
a. Variables predictoras : (Constante), NEURO, ANSIE
Y A BX (Y Y ')
Y A BX e
Observado = Predicho + Error estimación
en términos generales Y B0 B1 X1 e
El modelo lineal general (3)
La expresión general es
Y B0 B1 X1 ... Bk X k e
Y: Variable dependiente
X1, X2, ..., variables independientes (predictoras de Y)
e: error aleatorio
B1, B2, ..., son los pesos que determinan la contribución de cada variable
independiente.