Vous êtes sur la page 1sur 32

Regresión múltiple

Regresión lineal y Correlación


Diseño de Experimentos

Carlos N. Lozano

Septiembre 23, 2014

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Introducción
Técnica que permite estimar, proyectar o describir el comportamien-
to de una variable dependiente cuantitativa en función de otras
independientes, generalmente también cuantitativas, que se pre-
sume inciden o modican el comportamiento de esta. Y puede ser
modelada como una línea recta.

y = βo + β1 x (1)

400
50
20000
200

0 10000
0

0
−50 −200

−50 0 50 500 1000 1500 0 20 40

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

¾Para qué usarla?

Hay tres usos principales en ciencias biológicas:


Probar hipótesis de relaciones causa y efecto.
Probar hipótesis de asociación entre las variables, pero, sin
inferir necesariamente relación causa - efecto.
Predecir: Estimar el valor de una variable correspondiente a un
valor particular de la otra.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Correlación

Es una medidad cuantitativa de la fuerza de la relación lineal entre


dos variables.

n 
1
 
X xi − x̄ yi − ȳ
ρ=r =
n−1 sx sy
i=1

Donde x̄ , ȳ , sx , y sy son las medias muestrales y las desviaciones


estándares de cada variable.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Interpretando el coeciente de correlación

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Interpretando el coeciente de correlación

Varía entre -1 a 1 .
Valores cercanos a -1 indican relación lineal fuerte negativa.
Valores cercanos a 1 indican relación lineal fuerte positiva.
Valores cercanos a 0 no hay relación.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Interpretando el coeciente de correlación, Ho : ρ = 0

En algunas investigaciones, no es una conclusión inevitable que exis-


te alguna relación entre X e Y. Puede ser relevante considerar la
posibilidad que cualquier tendencia aparente en los datos sea iluso-
ria y sólo reeja la variabilidad del muestreo. En esta situación es
naturalformular la hipótesis nula:

Ho : ρ = 0 (2)
Ha : ρ 6= 0 (3)

Ho se pone a prueba:
n−2
r
ts = r
1 − r2
Los valores críticos son obtenidos de una distribucion t Student, con
n - 2 gl

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Regresión lineal simple

A diferencia del análisis de correlación, en Regresión, una


variable es considerada independiente (x) y la otra dependiente
(Y).
Las dos variables en cuestión deben ser cuantitativas o
numéricas.

Relación entre x y y se describe como una función lineal.


Cambios en y son asumidos como causado por cambios en x

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Modelo de regresión

Se denomina modelo de regresión, a la ecuación que describe


cómo y está relacionada con x y el término de error.

y =
|{z} β
|o +
{zβ1x} + 
|{z}
VD Componente lineal Erroraleatorio

β0 y β1 son llamados parámetros del modelo.


 término de error.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Modelo de regresión estimado

yb = βbo + βb1x + 
Interpretación
βb1 : Cuánto se espera que cambie la variable dependiente
(respuesta) por unidad de cambio en Xi.
βbo : Intercepto con y.
yb: es el valor estimado de y dado un valor de x.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Proceso de estimación

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Estimación de βi por mínimos cuadrados

(yi − ybi )2
X
min
Donde,
yi = Valor observado de variable dependiente para la ith
observación
ybi = valor estimado de la variable dependiente para la ith
observación

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Estimación de βi por mínimos cuadrados

(yi − ybi )2
X
min
Donde,
yi = Valor observado de variable dependiente para la ith
observación
ybi = valor estimado de la variable dependiente para la ith
observación
Estimación β1
P P P
x y − ( xi y )/n
βb1 = Pi i 2 P 2 i
xi − ( x2 ) /n

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Estimación de βi por mínimos cuadrados

(yi − ybi )2
X
min
Donde,
yi = Valor observado de variable dependiente para la ith
observación
ybi = valor estimado de la variable dependiente para la ith
observación
Estimación β1
P P P
x y − ( xi y )/n
βb1 = Pi i 2 P 2 i
xi − ( x2 ) /n

Estimación β0
βb0 = yb − βb1 x̄
Carlos N. Lozano Regresión lineal y Correlación
Regresión múltiple

Explicación de las variaciones

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Explicación de las variaciones

SST
|{z} = SSR
|{z} + PSSE
|{z}
P P
(y −ȳ )2 y −ȳ )2
(b (y −b
y )2

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Explicación de las variaciones

SST
|{z} = SSR
|{z} + PSSE
|{z}
P P
(y −ȳ )2 y −ȳ )2
(b (y −b
y )2

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Coeciente de determinación R 2

El Coeciente de determinación (R 2 ) es la proporción de la variación


total en la variable dependiente, que es explicada por la variación la
variable independiente.

SSR
R2 =
SST
Donde,

0 ≤ R2 ≤ 1

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Coeciente de correlación


r = (signo deβ1 ) R 2
Donde,

−1 ≤ r ≤ 1

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Supuestos

1 El error () es una variable aleatoria con media cero.


2 La varianza de , σ 2 , es la misma para todos los valores de x.
3 Los valores de  son independientes.
4 El error  está normalmente distribuido.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Inferencia basada en β1

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Inferencia basada en β1

Para poner a prueba la signicancia de la relación entre x y y, some-


temos a evaluación la hipótesis nula β1 = 0.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Inferencia basada en β1

Para poner a prueba la signicancia de la relación entre x y y, some-


temos a evaluación la hipótesis nula β1 = 0.
Hipótesis
H0 : β1 = 0

Ha : β1 6= 0

Comúnmente se usa:

Intervalos de conanza
Valores P

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Intervalos de conanza

Hipótesis
H0 : β1 = 0

Ha : β1 6= 0

βb1 ± tα/2 s.e.(β1 )

Se concluye basándose si el intevalo obtendio contiene o


no el cero.

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Prueba F

Hipótesis
H0 : β1 = 0

Ha : β1 6= 0

Fuente de variación SS GL MS Fcalc P


Regresión SSR 1 MSR MSR
MSE P(Fc > Ft )
Error SSE N-K-1 MSE
Total SST N-1

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Regresión múltiple

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Modelo matemático

y = βo + β1x1 + β2x2 + βk xk + i

yb = βbo + βb1x + βb1x1 + βb2x2 + βbk xk + 

Carlos N. Lozano Regresión lineal y Correlación


Regresión múltiple

Prueba de hipótesis basado en βk

Hipótesis
H0 : β1 = β2 = ..βk = 0

Ha : βi 6= 0

Carlos N. Lozano Regresión lineal y Correlación

Vous aimerez peut-être aussi