Académique Documents
Professionnel Documents
Culture Documents
Simple y Múltiple
15-1
Se ha visto el tema del análisis de regresión simple:
Antigüedad
Número de baños
Etc.
15-2
Para tratar este tipo de problemas se requiere
expandir el análisis de regresión:
15-3
y = β0 + β 1 x 1 + ε
15-4
Objetivos
15-5
Objetivos
(continuación)
15-6
Modelo de Regresión Múltiple
Objetivo: Examinar la relación lineal entre
una variable dependiente (y) y
dos o más variables independientes (xi)
Modelo poblacional:
Y-intercepto Pendientes Error aleatorio
y β0 β1x1 β2 x 2 βk xk ε
Modelo de regresión múltiple muestral:
yi b0 b1x1i b 2 x 2i b k x ki ei
15-7
Modelo de Regresión Múltiple
Objetivo: Examinar la relación lineal entre
una variable dependiente (y) y
dos o más variables independientes (xi)
Modelo poblacional:
Y-intercepto Pendientes Error aleatorio
y β0 β1x1 β2 x 2 βk xk ε
Modelo de regresión múltiple estimado:
ŷ b0 b1x1 b2 x 2 bk xk
15-8
Modelo de Regresión Múltiple
Modelo de dos variables:
y
ŷ b0 b1x1 b2 x 2
x2
x1
15-9
Modelo de Regresión Múltiple
(continuación)
Modelo de dos variables:
y Observación
yi
<
muestral ŷ b0 b1x1 b2 x 2
yi
<
e = (y – y)
x2i
x2
15-11
Conceptos Básicos
para la
Construcción de Modelos
15-12
Conceptos Básicos para la
Construcción de Modelos
Los modelos son usados para evaluar cambios
sin implementarlos en el sistema real.
dependientes e independientes.
Ajuste del modelo a la data. Estimación de la ecuación de regresión
múltiple.
a la data.
Verificación de los supuestos de regresión múltiple.
15-14
Especificación del Modelo
15-15
Construcción del Modelo
Es el proceso de contruir la ecuación para los
datos.
15-16
Diagnóstico del Modelo
Analizar la calidad del modelo (efectuar las pruebas de
diagnóstico).
15-17
Ejemplo
15-18
Diagramas de Dispersión
15-19
Ejemplo:Especificación del Modelo
15-20
Ejemplo: Construcción o Formulación del Modelo
15-21
Interpretación de los
Coeficientes Estimados
Pendientes (bi)
Estiman el cambio en el valor promedio de “y” como bi unidades
y-intercepto (b0)
Estima el valor promedio de y cuando todas las variables xi
15-22
Formulación del Modelo
15-23
Formulación del Modelo
Sema- Venta Precio Publicidad
na de pies ($) ($100s)
Modelo de Regresión Múltiple:
1 350 5.50 3.3
2 460 7.50 3.3
3 350 8.00 3.0 Ventas = b0 + b1 (Precio)
4 430 8.00 4.5
5 350 6.80 3.0 + b2 (Publicidad)
6 380 7.50 4.0
7 430 4.50 3.0
8 470 6.40 3.7 Matriz de correlación:
9 450 7.00 3.5
Venta de
10 490 5.00 4.0 pies Precio Publicidad
11 340 7.20 3.5 Venta de Pies 1
12 300 7.90 3.2 Precio -0.44327 1
13 440 5.90 4.0 Publicidad 0.55632 0.03044 1
14 450 5.00 3.5
15 300 7.00 2.7
15-24
Matriz de Correlación
15-25
Matriz de Correlación:
Ventas de Pies
Ventas de
pies Precio Publicidad
Ventas de pies 1
Precio -0.44327 1
Publicidad 0.55632 0.03044 1
15-26
Estimación de la Ecuación de
Regresión Lineal Múltiple
Programas estadísticos (computadora) son
generalmente usados para generar estimados
de los coeficientes y medidas de bondad de
ajuste de la regresión múltiple
Excel:
Datos / Análisis de datos / Regresión
15-27
Estimación de la Ecuación de
Regresión Lineal Multiple
(continuación)
Excel:
Datos / Análisis de datos / Regresión
15-28
Regresión Múltiple: Excel
(Resultado)
Ventas 306.526 - 24.975(Precio) 74.131(Pub licidad)
15-29
Regresión Múltiple: Excel
(Resultado)
(continuación)
Ecuación estimada de regresión múltiple:
15-30
Usando el Modelo para hacer
Predicciones
Predecir las ventas de una semana en la cual
el precio es $5.50 y la publicidad es $350.
Nota: La publicidad
La venta pre- está en $100’s,
decida es entonces x2 = 3.5
significa $350
428.62 pies
15-31
Coeficiente de Determinación
Múltiple (R2)
Reporta la proporción de la variación total en y
que es explicada por todas las variables (juntas)
x consideradas en el modelo
15-32
Coeficiente de Determinación
Múltiple (R2)
(continuación)
SSR 29460.0
R
2
0.52148
SST 56493.3
El 52.1% de la variación en las
ventas es explicada por la va-
riación en los precios y la publi-
cidad
15-33
R2 Ajustado
R2 nunca decrece cuando una nueva variable x
es añadida al modelo
Esto puede ser una desventaja cuando se
compara modelos
¿Cuál es el efecto neto de agregar una nueva
variable?
Se pierde un grado de libertad cuando una
n 1
R 1 (1 R )
2 2
n k 1
A
15-35
Coeficiente de Determinación
Múltiple: Excel (Resultado)
R 2A 0.44172
El 44.2% de la variación en las ventas es
explicada por la variación en los precios y
la publicidad, tomando en cuenta la
relación entre el tamaño de muestra y el
número de variables independientes
15-36
Diagnóstico del Modelo: Prueba F
(Significancia General)
Prueba F para la significancia del modelo (general)
Muestra si hay una relación lineal entre todas las
variables x (consideradas en forma conjunta) e y
Usa el estadístico de prueba F
Hipótesis:
H0: β1 = β2 = … = βk = 0 (No hay relación lineal)
HA: Al menos un βi ≠ 0 (Existe relación lineal entre (y)
y al menos un xi)
15-37
Diagnóstico del Modelo: Prueba F
(Significancia General)
(continuación)
Estadístico de prueba:
SSR
k MSR
F
SSE MSE
n k 1
MSR 14730.0
F 6.5386
MSE 2252.8
Con 2 y 12 grados de Valor P para
libertad la prueba
15-39
Diagnóstico del Modelo: Prueba F
(Significancia General)
(continuación)
H0: β1 = β2 = 0; HA: β1 o β2 es diferente de cero
0 No rechazar H0 Rechazar H0 F
Estadístico de prueba:
MSR
F 6.5386
MSE
Decisión: Como F = 6.53 > 3.89 = F0.05 , entonces se rechaza H0
15-41
Diagnóstico del Modelo:
¿Las Variables Individuales son Significativas?
(continuación)
Estadístico de prueba:
bi 0 (gl = n – k – 1)
t
sb i
15-42
Diagnóstico del Modelo:
¿Las Variables Individuales son Significativas?
(continuación)
15-43
Diagnóstico del Modelo:
¿Las Variables Individuales son Significativas?
(continuación)
H0: βi = 0; HA: βi 0
/2=0.025 /2=0.025
g.l. = 15-2-1 = 12
= 0.05
t/2 = 2.1788 Rechazar H0 No rechazar H0 Rechazar H0
-tα/2 tα/2
0
-2.1788 2.1788
Excel (Resultado):
Coeficientes Error típico Estadístico t Valor p
Precio -24.97509 10.83213 -2.30565 0.03979
Publicidad 74.13096 25.96732 2.85478 0.01449
SSE
se MSE
n k 1
¿Este valor es grande o pequeño? Para evaluarlo
se debe comparar con el promedio de y
15-46
Desviación Estándar del Modelo
de Regresión
(continuación)
15-47
Desviación Estándar del Modelo
de Regresión
(continuación)
15-48
Diagnóstico del Modelo:
Multicolinealidad
15-49
Diagnóstico del Modelo:
Multicolinealidad (continuación)
Incluir dos variables independientes altamente
correlacionadas puede afectar adversamente los
resultados de regresión:
15-50
Problemas e Indicios de
Multicolinealidad Severa
Signos incorrectos en los coeficientes.
Cambio grande en el valor de un coeficiente como
resultado de agregar una nueva variable al modelo.
Una variable anteriormente significativa se vuelve no
significativa cuando una nueva variable independiente
es agregada.
El estimado de la desviación estándar del modelo se
incrementa cuando una variable es agregada al
modelo.
15-51
Detección de Multicolinealidad
(Factor de Inflación de Varianza)
VIFj es usado para medir la colinealidad:
1
VIFj
1 Rj
2
Variables Dummy
15-53
Variables Dummies
15-54
Variables Dummies
El número de variables dummies requerido es
(categorías – 1) por cada variable cualitativa.
15-55
Variable Dummy (Dos Niveles) en
un Modelo de Regresión: Ejemplo
Sea:
ŷ = Ventas de pies ŷ b0 b1x1 b2 x 2
x1 = Precio
x2 = Feriado (X2 = 1 si hay feriado en una semana)
(X2 = 0 si no hay feriado en una semana)
15-56
Variable Dummy (Dos Niveles) en
un Modelo de Regresión: Ejemplo
(continuación)
Interceptos Misma
diferentes pendiente
y (Ventas)
Si H0: β2 = 0 es
b0 + b2 rechazada, entonces
b0 Feriado tiene un
efecto significativo
sobre las ventas
x1 (Precio)
15-57
Regresión, Variable Dummy (Dos
Niveles): Interpretación de Coeficientes
Ejemplo: Ventas 300 - 30(Precio) 15(Feriado )
Ventas: Número de pies vendidos por semana
Precio: Precio del pie en dólares
1 Si hay feriado en una semana
Feriado:
0 Si no hay feriado en una semana
ŷ b0 b1x1 b2 x 2 b3 x 3
b2 muestra el impacto sobre el precio si el estilo de
la casa es rancho, comparado a un condominio
b3 muestra el impacto sobre el precio si el estilo de
la casa es dos niveles, comparado a un condominio
15-60
Regresión, Variables Dummies (Más de Dos
Niveles): Interpretación de Coeficientes
Supongamos que la ecuación estimada es:
ŷ 20.43 0.045x1 23.53x 2 18.84x 3
Para un condominio: x2 = x3 = 0
Con la misma área, se estima
ŷ 20.43 0.045x1 que un rancho tendrá un
precio promedio de $23.53
Para un rancho: x3 = 0 (miles) más que un
condominio.
ŷ 20.43 0.045x1 23.53
Con la misma área, se estima
Para un dos niveles: x2 = 0 que un dos niveles tendrá un
precio promedio de $18.84
ŷ 20.43 0.045x1 18.84 (miles) más que un
condominio.
15-61
APLICACIÓN
Ver en Groebner, Cap.15, el desarrollo del caso First City, a lo largo
de todo el capítulo.
15-62
APLICACIÓN: Algunas Sugerencias Básicas
15-63