Vous êtes sur la page 1sur 16

Slide 1

Captulo 10

Slide 2

Correlacin y Regresin
10-1 Panorama general
10-2 Correlacin
10-3 Regresin
10-4 Intervalos de variacin y prediccin
10-5 Regresin mltiple

10-6 Modelamiento
Esther Flores U.

ESTADSTICA II

Slide 3

SEMANA 14

Esther Flores Ugarte

ESTADSTICA II

Slide 4

Seccin 9-5
Regresin Mltiple
Created by Erin Hodgess, Houston, Texas

Esther Flores U.

ESTADSTICA II

Regresin Mltiple
Definicin
Ecuacin Mltiple de Regresin
Una relacin lineal entre una variable
dependiente y y dos o ms variables
independientes (x1, x2, x3 . . . , xk)

y = b0 + b1x1 + b2x2 + . . . + bkxk


Esther Flores U.

ESTADSTICA II

Slide 5

Notacin

Slide 6

y = b0 + b1 x1+ b2 x2+ b3 x3 +. . .+ bk xk
^
(Forma general de la ecuacin estimada de regresin
mltiple)

n = tamao muestral

k = Nmero de variables independientes


y^ = valor predicho de la variable
dependiente y
x1, x2, x3 . . . , xk son variables
independientes

Esther Flores U.

ESTADSTICA II

Notacin

Slide 7

0 = intercepto

b0 = estimado de 0 basado en data muestral


1, 2, 3 . . . , k son los coeficientes de las
variables independintes x1, x2, x3 . . . , xk

b1, b2, b3 . . . , bk son estimados muestrales de


los coeficientes 1, 2, 3 . . . , k

Esther Flores U.

ESTADSTICA II

Ejemplo:

Slide 8

Utilice los datos muestrales de la siguiente tabla y calcule


la ecuacin de regresin mltiple en la que la variable de
respuesta (Y) es el intervalo posterior a una erupcin y
las variables de prediccin (X) son la duracin y la altura
de la erupcin

ERUPCIONES DEL GISNER OLD FAITHFUL


DURACIN
240
120
INTEVALO
PREVIO
98
90
INTERVALO
POSTERIOR
92
65
ALTURA
140
110

178

234

235

269

255

220

92

98

93

105

81

108

72
125

94
120

83
140

94
120

101
125

87
150

Esther Flores U.

ESTADSTICA II

Slide 9

Resumen
Estadsticas de la regresin
Coeficiente de
correlacin mltiple
Coeficiente de
determinacin R^2
R^2 ajustado
Error tpico
Observaciones

0.93086
0.866501
0.813101
5.259374
8

ANLISIS DE VARIANZA

Regresin
Residuos
Total

Grados de
libertad
2
5
7

Promedio
Suma de
de los
cuadrados
cuadrados
897.69494 448.84747
138.30506 27.661012
1036

Intercepcin
DURACIN
ALTURA

Coeficient
es
45.10493
0.244636
-0.09825

Estadstico Probabilid
Error tpico
t
ad
19.4114879 2.3236205 0.067747
0.04486225 5.4530572 0.002819
0.16232211 -0.6052798 0.571412

Anlisis de los residuales

Observacin
1
2
3
4
5
6
7
8

Pronstic
o
INTERVAL
O
POSTERIO
R
90.06263
63.65377
76.36893
90.55982
88.83945
99.12209
95.20593
84.1874

Valor
crtico de
F
F
16.22672 0.006512

Inferior
95%
-4.79389
0.129314
-0.51551

Superior
95%
95.00375
0.359958
0.319012

Inferior
95.0%
-4.79389
0.129314
-0.51551

Superior
95.0%
95.00375
0.359958
0.319012

Resultados de datos de probabilidad

Residuos
1.93737164
1.34623229
-4.3689252
3.44018411
-5.8394463
-5.1220904
5.79407092
2.81260292

Residuos
estndares
0.4358559
0.3028656
-0.9828893
0.7739478
-1.3137165
-1.1523309
1.3035083
0.6327591

Esther Flores U.

Percentil
6.25
18.75
31.25
43.75
56.25
68.75
81.25
93.75

INTERVAL
O
POSTERIO
R
65
72
83
87
92
94
94
101

ESTADSTICA II

Slide 10

Ecuacin de regresin

MODELO DE REGRESIN
Y^ = 45.105 + 2.245 DURACIN -0.09825 ALTURA
OTRA NOTACIN SERA
Y^ = 45.105 + 2.245 X1 -0.09825 X2

Esther Flores U.

ESTADSTICA II

EJEMPLO: Osos

Esther Flores U.

ESTADSTICA II

Slide 11

EJEMPLO: Osos

Esther Flores U.

ESTADSTICA II

Slide 12

EJEMPLO: Osos

Slide 13

La ecuacin de regresin es:


WEIGHT = 374 + 18.8 HEADLEN + 5.87 LENGTH

y = 374 + 18.8x3 + 5.87x6

Esther Flores U.

ESTADSTICA II

R Ajustado

Slide 14

Definiciones
El coeficiente de determinacin mltiple R es
2

una medida de cuan bien la ecuacin de


regresin mltiple se ajusta a los datos
muestrales.
The Coeficiente de determinacin ajustado
2

R es modificado para contar el nmero de


variables y el tamao de la muestra.
Esther Flores U.

ESTADSTICA II

R Ajustado

Slide 15

(n 1)

R ajustado = 1
(1 R )
[
n

(k
+
1)
]

Frmula 10-6
Donde: n = tamao muestral

k = nmero de variables independientes


(x)
Esther Flores U.

ESTADSTICA II

Finding the Best Multiple


Regression Equation

Slide 16

1. Use common sense and practical considerations to include or


exclude variables.
2. Instead of including almost every available variable, include
relatively few independent (x) variables, weeding out
independent variables that dont have an effect on the
dependent variable.
2

3. Select an equation having a value of adjusted R with this


property: If an additional independent variable is included,
2
the value of adjusted R does not increase by a substantial
amount.
4. For a given number of independent (x) variables, select the
2
equation with the largest value of adjusted R .
5. Select an equation having overall significance, as determined
by the P-value in the computer display.
Esther Flores U.

ESTADSTICA II

Vous aimerez peut-être aussi