Académique Documents
Professionnel Documents
Culture Documents
INFERENCIA
MVH-2012-1
REGRESION LINEAL
1
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Los coeficientes "0 , "1 ,...., "k en (2) son los parámetros del modelo.
Estos denotan la magnitud del efecto que las variables explicativas
x1 ,x# ,...,xk tienen sobre la variable Y.
2
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
En el caso del modelo de regresión lineal simple (1), sean (xi ,yi ) ,
i=1,...,n, n pares de puntos recogidos de algún experimento o estudio. Si
el gráfico de estos puntos (diagrama de dispersión ) amerita una
regresión lineal, entonces podemos pensar que si se tomaran muestras
adicionales utilizando los mismos valores de x, se debe esperar que los
valores de y varíen, de aquí que el valor yi en el par (xi , yi ) es el valor
observado de una variable aleatoria Yi . Así la variable aleatoria Yi para el
valor fijo x=xi , tiene una distribución de probabilidad (condicional a
x=xi ) con media E(Yi ) = "0 +"1 xi .
Si se postula que todas las medias E(Yi ) = E(Y/xi ) caen sobre una linea
recta, cada Yi puede describirse por el modelo de regresión lineal simple
3
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
La ecuación (3) puede ser considerada como el modelo para una sola
observación yi .
s 0 +"
yi = " s 1 x i + ei Í s 0 +"
yi ( " s 1 x i ) = yi s
y i = ei
SCE =! (yi s
yi )2 = ! yi ( " s 1 x i ) ‘2 = Suma Cuadrado del
n n
s 0 +"
i=1 i=1
Error
s0 y "
Si SCE posee un mínimo éste ocurre para los valores " s 1 que
satisface:
4
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
œ ! ssi ! xi yi = "
s 0 !x i + "
s 1 !x2i
n n n
$ SCE
$"s1
i=1 i=1 i=1
!xi yi nx !(xi
n n
y x ) Ðyi
y)
s0 = s 1 Sxy
!x2i nx !(xi
s1 = i=1 i=1
" y " x ; " n = n =
2 Sxx
x )2
i=1 i=1
Sxx = !(xi
i=1
n
x )2
Syy = !(yi
i=1
n
y )2.
i=1
i=0 i=1
! ! ! x i ei = 0 , ! s
n n n n
3.- yi = s yi Ê
y = s
y 4.- y i ei = 0
i=0 i=0 i=0 i=0
,
5.- La recta estimada contiene al punto (x y ).
5
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
= ! y#i !yis
yi = ! y#i !yi ( "
n n n n
s 0 +"
s1 x i )
i=1 i=1 i=1 i=1
= ! y#i !yi (
n n
s 1
y " s1 x i )
x +"
i=1 i=1
= ! y#i n s 1 !yi x i
n n
s 1
y #n" x
y +"
s 1 ( !yi x i n
i=1 i=1
n
=Syy " xy)
i=1
s 1 Sxy .
= Syy "
6
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Horas de Calificación
Estudio en la prueba
x y
4 31
9 58
10 65
14 73
4 37
7 44
12 60
22 91
1 21
17 84
DIAGRAMA DE DISPERSION
100
80
60
Nota
40
20
0
0 10 20 30
Horas de estudio
7
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
Sxx = !(xi
n
x ) 2 = 1376 10(10)2 = 376
Sxy = ! xi yi nx
i=1
y = 6945 10Ð10Ñ(56.4) =1305.
s0 =
" s 1
y " x = 56.4 3.471(10)=21.69
Con esta ecuación podemos predecir por ejemplo, cuál será la calificación
promedio que obtiene una persona que estudia 14 horas para el examen.
8
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
!(xi !((xi
n n
x ) Ð Yi Y ) x )Yi (xi
x )Y )
!(xi !(xi
s 1 = i=1
Como vimos " = i=1
n n
x )2 x )2
i=1 i=1
!(xi
n
= " +i Yi
x )Yi
i=1 (xi
x)
= , con +i =
Sxx Sxx
s 1 ) =! +i E(Yi )
E( "
!(xi
n
!(xi
n = "1 .
2
x)
s 1 )= Var(! +i E(Yi ))
i=1
Además, Var ( "
!(xi
n
= ! +i2 Var(Yi ) =
x)
1
!(xi !(xi
i=1
x )2‘
n 52 = n 52
2
x )2
i=1 i=1
9
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
!Yi
n
s0 =
Ahora como " s 1
Y " x= i=1 s 1
" x,
n
!Yi
x ! +i Yi )
n
s 0 ) =Var ( i=1
Var( "
œ Var ( ! Yi (
n
"
+i
x )Ñ
= !(
n
"
n +i
x )2 5 2
!x2i
n
n !(xi
i=1
= n 5#
x )2
!x2i 5 #
i=1
n
s 0 µ N(" 0 , i=1
así, " )
n Sxx
10
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
!(yi s !e2i
n n
yi )#
i=1 i=1 SCE
S2/ œ = = .
n2 n2 n2
!( yi
n
y )2
Antes siempre habíamos utilizado Y como estimador de . y S2 = i=1 n"
como estimador de 5 # .
SCE (n 2)S/2 # #
s
Ahora = µ ; (n 2). Además, S / y " i , i=0,1 son
52 52
independientes.
s 52 (n 2)S2/
Como " 1 µ N ( "1 , ) y 2
µ ;# (n 2), tenemos que el
Sxx 5
estadístico:
11
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Ú H1 : "1 " !
versus Û H1 : "1 "1!
1
Ü H1 : "1 Á "1!
H0 : "1 = "1!
Ú tc t1! (n 2)
Se rechaza H0 si Û tc t1! (n 2)
Ü ¸tc ¸ t1!Î# (n 2)
12
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
PREDICCION
s 0 +"
y= "
La ecuación s s 1 x puede utilizarse para:
s 0 +"
s0 = "
El estimador puntual de E(Y/x0 ) en x=x0 es: Y s 1 x0
Tenemos
s 0 )+x0 E( "
s 0 ) = E( "
E( Y s 1 ) ="0 +"1 x0
s 0 )= Var( "
Var ( Y s 0 +"
s 1 x0 )
s s s
=Var (Y " 1 x +" 1 x0 ) =Var (Y " 1 (x0 x ))
s
=Var (Y )+ (x0 s 1 ), pues Cov( (Y
x )2 Var(" , " 1 ) =0
5 2
(x0 x) 5 2 2
= +
n Sxx
2
# " (x0 x )
=5 Ð + )
n Sxx
2
s s s # " (x0 x )
Así Y0 = " 0 +" 1 x0 µ N ("0 +"1 x0 , 5 Ð + )
n Sxx
s 0 Ð "0 +"1 x0 Ñ
Y
S/ É "n + (x0Sxxx )
T= 2
µ t(n 2)
13
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
y0 „ t1!/2 S/ Ë +
" (x0
x )2
(s Ñ
n Sxx
y0 = 21.69+3.471(14) =70.284 ¸ 70
s
(70 „ 2.31(5.2866) É 10
2
" (1410)
+ 376 Ñ = (70 „ 4.61) =(65.918, 74.082)
Al repetir los cálculos anteriores para cada uno de los valores diferentes
de x0 se pueden obtener los correspondientes límites de confianza para
cada E(Y/x0 )=E(Y0 ). Estos límites constituyen la denominada banda de
s 0 +"
confianza, ya que éstas encierran a la recta ajustada sy = " s 1 x.
s 0 +"
s 0 Y0 ) = E( "
E( Y s 1 x0 Ð "0 +"1 x0 %0 Ñ) =0
14
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
y varianza
s 0 +"
s 0 Y0 ) = Var( "
Var( Y s 1 x0 Ð "0 +"1 x0 ) %0 )
s 0 +"
=Var( " s 1 x 0 %0 )
s s
=Var(Y " 1 x +" 1 x 0 % 0 )
5 (x0
#
x )2 5 # #
= Ð + +5 )
n Sxx
s 0 Y0
Y
El intervalo se obtiene a partir del pivote : T= µ t(n 2)
S/ Ê1+ n" +
(x0
x )2
Sxx
y0 „ t1!/2 S/ Ë1+ +
" (x0
x )2
y está dado por: ( s Ñ
n Sxx
Solución.
(70 „ 2.31(5.2866) É1+ 10
2
" (1410)
+ 376 Ñ = (56.95, 83.05)
15
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
s 1 Sxy =SCE
Syy "
s 1 Sxy SCE
Syy = "
s 1 = Sxy Ê "
Ahora " s 1 Sxx =Sxy
Sxx
!
n
s s # s 1
s 1 xi "
Ê " 1 Sxy = ( " 1 ) Sxx = ( " x )2
!
i=1
n _
s s
= Ð Y " 1 x " 1 xi Y)2
!
i=1
n _
s s
= Ð " 0 " 1 xi Y)2
!
i=1
n _
s
= (Yi Y)2 =SCR
!(Yi Y) =!(Y
s i Y) + !(Yi Y
i=1
n _ n _ n
2 2 s i )2
i=1 i=1 i=1
SCT = SCR + SCE
16
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
SCR SCE
2
y 2
son variables independientes, cada una con distribución ;2
5 5
con 1 y n 2 grados de libertad respectivamente. De donde
TABLA ANOVA
Fuente de variación g.l. SC CM F
Regresión 1 SCR CMR=SCR/1
CMR/CME
Error n2 SCE CME=SCE/(n 2)
Total n1 SCT
17
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
TABLA ANOVA
Fuente de variación g.l. SC CM F v-p
Regresión 1 4529.321809 4529.321809
162.42 0.000
Error 8 223.0781915 27.88472
Total 9 4752.4
s " ÈSxx
n2
"
É SCE
Ahora al probar H0 : "1 =0 versus H1 : "1 Á 0, el estadístico es t=
n2
y la hipótesis bajo consideración es idéntica a la que se prueba en la tabla
ANOVA. es decir, la hipótesis nula establece que la variación en la
respuesta se debe unicamente al azar. El análisis de varianza utiliza la
distribución F en lugar de la distribución t para una hipótesis alternativa
de dos colas, los dos procedimientos son idénticos, ya que
Z Z2 /1 ;2 /1
È ;2 / /
T= Ê 2 = 2 =F(1,/ ) y
; // ; //
#
s
" 1 Wxx s
" 1 Wxy SCR
#
T = SCE
= SCE = SCE = F
n-2 n-2 n-2
18
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
EL COEFICIENTE DE DETERMINACION
19
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
EJEMPLO 1 ( EXCEL)
20
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Horas de Calificación
Estudio en la prueba
x y
4 31
9 58
10 65
14 73
4 37
7 44
12 60 120
22 91
1 21 100
17 84
80
Calificación
60
40
20
0
0 5 10 15 20 25
Horas de estudio
21
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Resumen
Estadísticas de la regresión
Coef. correlación
0,97624786
Coef. determinación
0,95305989
R^2
R^2 ajustado 0,94719237
Error típico 5,28060356
Observaciones 10
ANÁLISIS DE VARIANZA
G.L S.C. CM F V. crítico F
Regresión 1 4529,32181 4529,32181 162,429927 1,3532E-06
Residuos 8 223,078191 27,8847739
Total 9 4752,4
TRANSFORMACIONES DE DATOS
Yi = "0 +"1 xi +%i , i=1, 2, ....., n o E(Y/xi ) = E(Yi )= "0 +"1 xi , i=1, 2, ....., n
22
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
V cm3 50 60 70 90 100
P kg/cm$ 64.7 51.3 40.5 25.9 7.8
Las leyes de los gases ideales está dada pro la forma funcional PV! œ c,
donde ! y c son constantes. Estime las constantes anteriores.
ln Pi = ln c !ln Vi +ln %i
23
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Pi Vi ln Pi ln Vi s Pi
ln s
Pi ei =Pi s
Pi
64.7 50 4.16976 3.91202 4.37853 79.7 15.0
51.3 60 3.93769 4.09434 3.81474 49.1 2.2
40.5 70 3.70130 4.24850 3.48571 32.6 7.9
25.9 90 3.25424 4.49981 2.81885 16.8 9.1
7.8 100 2.05412 4.60517 2.53928 12.7 4.9
s ! = ln
Intercepto: " s c =14,7589739 Ê sc =2568862,88.
s =!
Pendiente: : " s = 2,65347221.
1
24
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Costo de
40 25 20 30 50 40 20 50 40 25 50 20
publicidad ($)
Ventas ($) 450 395 390 470 495 490 420 523 519 450 510 400
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,885
Coeficiente de determinación R2 0,783
R# ajustado 0,761
Error típico 24,060
Observaciones 12
ANALISIS DE VARIANZA
G.L. Suma cuadrados Promedio cuadrados F Valor crítico de F
Regresión 1 20905,626 20905,626 36,112 0,00013
Residuos 10 5789,040 578,904
Total 11 26694,667
25
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
Solución
26
DEPARTAMENTO DE ESTADISTICA
INFERENCIA
MVH-2012-1
=%*(Þ*'* „ 57.6564
Ð%40.3126 à &55.6254Ñ.
27