Académique Documents
Professionnel Documents
Culture Documents
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
23 de marzo de 2015
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Introduccin
Vector Aleatorio
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Vector aleatorio:
Un vector aleatorio es aquel cuyas componentes son variables
aleatorias. Similarmente, una matriz aleatoria es aquella cuyas
entradas son variables aleatorias.
El vector,
y1
y2
Y =.
..
yn n1
es un vector aleatorio si cada una de sus componentes Yi0 s son
variables aleatorias.
Ingeniera Industrial
logo
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Sea Y: un vector aleatorio, entonces el valor-esperado o esperanza de Y, denotado por E[Y ], se define como:
E[y1 ]
1
E[y2 ] 2
E[Y ] = . = .
.
. ..
E[yn ]
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Matriz de Varianzas-Covarianzas
Sea Y : un vector aleatorio, entonces la matriz de varianzascovarianzas de Y, denotada por Y = Cov (Y ), se define como:
Var (y1 )
Cov (y2 , y1 )
.
Cov (yn , y1 )
Cov (y1 , y2 )
Var (y2 )
.
.
.
Cov (yn , y2 )
...
...
.
.
.
...
Cov (y1 , yn )
Cov (y2 , yn )
.
Var (yn )
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
logo
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
y1
1 x11 . . . x1,p1
0
1
y2 1 x21 . . . x2,p1 1 2
.. = ..
.. .. + ..
..
..
. .
.
.
.
. .
yn
1 xn1 . . . xn,p1
p1
n
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
n
X
2i
i=1
n
X
(yi yi )2
i=1
)T (Y Y
)
= (Y Y
T (Y X)
= (Y X)
= (Y T T XT )(Y X)
= Y T Y Y T X T XT Y + T XT X
= Y T Y 2T XT Y + T XT X
Ingeniera Industrial
logo
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Q()
= 2XT Y + 2XT X = 0,
de donde,
XT X = XT Y ,
y si el rango de XT X es igual a p, es decir, es invertible, entonces
el vector estimado mediante mnimos cuadrados para es:
= (XT X)1 XT Y .
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Residuales
i . Por lo tanto, el vector
Los residuales corresponden a i = Yi Y
de residuales es:
1
2
i =
i = Y i Y
..
.
n
n1
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Residuales
El vector de valores ajustados y el vector de residuales pueden
ser tambin expresados en trminos de la matriz H = X(XT X)1 XT
conocida como la matriz hat o matriz sombrero, la cual es una
matriz (n n) es simtrica1 e idempotente2 , a veces tambin
llamada matriz de proyeccin, asigna el vector de valores observados para el vector de valores ajustados.
logo
Anxn = Atnxn
2
A = A2
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
logo
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
Mas propiedades
La suma cuadrtica de errores SCE se puede expresar de la
siguiente forma:
)T (Y Y
)
SCE = (Y Y
= (Y HY )T (Y HY )
= [(I H)Y ]T [(I H)Y ]
= Y T (I H)T (I H)Y
= Y T (I H)Y ,
pues I H tambin es simtrica e idempotente.
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
P 2
P
pero
yi = Y T Y y ( yi )2 = Y T JY , con J: matrix n n de
unos, luego se tiene que:
1
SCT = Y T Y Y T JY
n
1
T
=Y I
J Y.
n
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
SCR = T XT Y
Ingeniera Industrial
logo
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
G.L
p-1
n-p
n-1
SS
SCR
SCE
SCT
MS
CMR
CME
CMT
Fc =
Est. F
F(p1,np)
CMR
CME
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Contenido
1
Introduccin
Vector Aleatorio
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
NORMALIDAD
El perfil de la distribucin de los datos se corresponde con una
distribucin normal. Si la variacin respecto de la distribucin
normal es amplia, los tests estadsticos resultantes no son vlidos, dado que se requiere la normalidad para el uso de los estadsticos de la t y de la F. La normalidad univariante ayuda a
obtener normalidad multivariante, pero no la garantiza. La normalidad multivariante implica que las variables individuales son
normales. Cmo evaluarla?
1. Grfico de probabilidad normal de los residuos
2. Test de Shapiro sobre los residuos estandarizados
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
NORMALIDAD
El perfil de la distribucin de los datos se corresponde con una
distribucin normal. Si la variacin respecto de la distribucin
normal es amplia, los tests estadsticos resultantes no son vlidos, dado que se requiere la normalidad para el uso de los estadsticos de la t y de la F. La normalidad univariante ayuda a
obtener normalidad multivariante, pero no la garantiza. La normalidad multivariante implica que las variables individuales son
normales. Cmo evaluarla?
1. Grfico de probabilidad normal de los residuos
2. Test de Shapiro sobre los residuos estandarizados
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Contenido
1
Introduccin
Vector Aleatorio
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
LINEALIDAD
Supuesto implcito en todas las tcnicas multivariantes basadas
en medidas de correlacin. Resulta necesario identificar cualquier
desplazamiento de la linealidad que pueda impactar la correlacin.
Cmo evaluarla? Examen visual de los residuos y Grfico de
regresin parcial.
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Contenido
1
Introduccin
Vector Aleatorio
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
HOMOSCEDASTICIDAD
Varianza constante del trmino de error. Se refiere al supuesto
de que las variables dependientes exhiban iguales niveles de
varianza a lo largo del rango de los valores de las variables independientes. Cmo evaluarla?
1. Examen visual de los residuos .
2. Test de Barlett.
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
HOMOSCEDASTICIDAD
Varianza constante del trmino de error. Se refiere al supuesto
de que las variables dependientes exhiban iguales niveles de
varianza a lo largo del rango de los valores de las variables independientes. Cmo evaluarla?
1. Examen visual de los residuos .
2. Test de Barlett.
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Contenido
1
Introduccin
Vector Aleatorio
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Situacin ideal: Tener una cantidad de variables independientes
altamente correlacionadas con la variable dependiente, pero con
poca correlacin entre s.
Multicolinealidad: correlacin entre tres o ms variables independientes, sus efectos son:
La multicolinealidad reduce el poder predictivo de cualquier variable independiente individual, en la medida en que est asociado con las otras variables independientes.
A mayor colinealidad, la varianza nica explicada por cada variable independiente se reduce y el porcentaje de prediccin compartida aumenta.
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
logo
Ingeniera Industrial
Introduccin
Vector Aleatorio
Regresin Lineal Mltiple
SUPUESTOS EN LA REGRESIN MLTIPLE
NORMALIDAD
LINEALIDAD
HOMOSCEDASTICIDAD
EVALUACIN DE LA MULTICOLINEALIDAD
Referencias
Probabilidad y estadstica (para ingeniera y ciencias). Lay l. Devore, 2008, 7 Edition.
Montgomery D.C. Design and Analysis of Experiment. Limusa
Wiley, 2001, 5 Edition.
Montgomery D.C y Runger G.C. Probabilidad y Estadstica Aplicadas a la Ingeniera. 2003, tercera edicin.
logo
Ingeniera Industrial