Académique Documents
Professionnel Documents
Culture Documents
REGRESIÓN LINEAL
PRESENTADO:
OCAÑA
2019
ESTADISTICA TALLER UNIDAD 5
REGRESIÓN LINEAL
Ejercicio 1. Una determinada empresa de productos básicos muestra los datos del último año de ventas (en
millones de pesos) y al gasto en publicidad (en millones de pesos). La tabla siguientes muestra estas dos
variables X e Y.
X Y
181 16
176 17
174 15
196 21
200 19
188 17
184 18
193 20
190 21
199 22
170 15
184 17
Ejercicio 2. Para una muestra de 10 personas disponemos de información respecto a su grado de extroversión, y
se desea evaluar su posible relación lineal con la dimensión de personalidad estabilidad emocional. Ambas
variables se han medido con un test y se han obtenido las puntuaciones para cada sujeto en una escala de 0 a 10.
Los valores obtenidos se presentan en la siguiente tabla:
Sujetos X: Grado de Y: Estabilidad
Extroversión Emocional
1 5 6
2 10 6
3 4 3
4 7 8
5 6 6
6 5 3
7 4 5
8 4 9
9 4 10
10 3 9
a. Calcule el valor de la covarianza
b. Grafique la nube de puntos
c. Determine el tipo de correlación hallando el coeficiente de correlación
d. Halle la recta de regresión
e. Determine la estabilidad emocional para un grado de extroversión de 2
Desarrollo
Correlación: 87%
PRESENTADO:
Y=A+BX
inteligencia
Y Y
n
Rendimiento (Y)
'
i i sea mínimo
i 1
Inteligencia (X)
Cálculo de la ecuación de regresión lineal (de Y sobre X)
11
10
5
RENDIM
3
80 90 100 110 120 130
INTELIG
Cálculo de la ecuación de regresión lineal (de Y sobre X)
i i
n
Y Y '
es mínimo
i 1
Observa....
Ordtienada
origen A Y BX
B
XY nXY
X nX
Pendiente 2 2
X Y XY X2
suj1 120 10 1200 14400
suj2 100 9 900 10000
suj3 90 4 360 8100
suj4 110 6 660 12100
4 SUMA SUMA
3120 44600
PROMEDIO PROMEDIO
105 7.25
N
4
b
xy IMPORTANTE: B=b
Pendiente
x 2 Es decir, la pendiente en puntuaciones
diferenciales es la MISMA que en
puntuaciones directas
Sabemos que
Bb
xy
x 2
Y por el tema de
variabilidad sx2
x 2
xy
Bb
xy n sxy rxy sx s y r s y
Se deduce que
x x 2 2 xy
sx2 sx2 sx
n
Cálculo de la ecuación de regresión lineal (de Y sobre X)
En definitiva, sy
B b rxy
sx
sy 1
b rxy rxy rxy
sx 1
y
sy
A Y rxy X
sx
Puntuaciones observadas Yi
Puntuaciones predichas Yi
Error de predicción
con la recta de Yi Yi
regresión de Y sobre X
s y2
(Y Y ) 2
n
Los errores de predicción en la recta de regresión de Y sobre X
(Y Y ) 2
es mínimo
s y2
(Y Y ) 2
n
Los errores de predicción en la recta de regresión de Y sobre X
s y2. x
i i
(Y Y
) 2
n
Esta es la varianza de Y no explicada por X
s y2. x
Que despejando sale rxy2 1
s y2
¿Cuán buena es la predicción de la recta de regresión? El coeficiente de
determinación como índice de la bondad de ajuste de nuestro modelo (la
recta de regresión)
s y2. x
Acabamos de mostrar que
rxy2 1
s y2
Si todos los puntos del diagrama de dispersión están sobre la recta (con pendiente
diferente de 0), sy2.xserá 0, y el coeficiente de determinación será 1
entonces
Cuanto más se alejen los puntos de la recta de regresión, mayor será el valor de
sy2del
el valor . x coeficiente de determinación será menor y menor.
El coeficiente de determinación y la proporción de varianza
asociada/explicada/común (1)
Empecemos con una tautología
Yi Yi (Yi Yi )
Esta expresión indica que la puntuación observada por el sujeto i-ésimo es igual a la
puntuación predicha para dicho sujeto más un error de predicción.
Se puede demostrar que las puntuaciones predichas y los errores de predicción son
independientes, con lo que podemos señalar
2
s y Varianza total de Y
s y2. x
Y sabíamos que rxy2 1
s y2
s y2 s y2. x s y2´
luego rxy2 2
s y s y2
Hemos visto el caso de un predictor (X) y una variable predicha (Y), y obtenido la recta
de regresión de Y sobre X por el procedimiento de mínimos cuadrados.
Es importante que os deis cuenta que las ponderaciones B2, B3, ..., son
análogas a las que vimos en el caso de la recta de regresión.
s1.3
X 1 ' A B2 X 2 B3 X 3 ... Bk X k Por ejemplo B2 r12.3
s2.3
X 1 ' A B2 X 2 B3 X 3 ... Bk X k
x1 ' b2 x2 b3 x3 ... bk xk
Y aplicando la misma lógica, el valor de los pesos es el mismo que el que
teníamos en puntuaciones directas
b2 B2 b3 B3 etcétera
Introducción a la regresión lineal múltiple (4)
Datos (N=5)
R1.23 0 '904
R cuadrado Error típ. de la
Modelo R R cuadrado corregida estimación
1 .904 a .817 .634 1.744
a. Variables predictoras: (Constante), NEURO, ANSIE
Y A BX (Y Y ')
Y A BX e
en términos generales Y B0 B1 X 1 e
El modelo lineal general (3)
La expresión general es
Y B0 B1 X 1 ... Bk X k e
Y: Variable dependiente
X1, X2, ..., variables independientes (predictoras de Y)
e: error aleatorio
B1, B2, ..., son los pesos que determinan la contribución de cada variable
independiente.