Académique Documents
Professionnel Documents
Culture Documents
= ()
Dado un valor particular de x, la funcin matemtica () indicara el valor correspondiente de y.
MODELO DE REGRESIN
= 0 + 1 +
Donde:
=
0 1 ,
METODO DE MINIMOS CUADRADOS
= 0 + 1 +
= = (0 + 1 )
= ( 0 1 )
=1
=1
()
= 2 ( 0 1 ) = 0
0
=1
()
= 2 ( 0 1 ) = 0
1
=1
2 ( 0 1 ) = 0
=1
( 0 1 ) = 0
=1
0 1 = 0
=1
=1
0 1
=1
0 =
=1
Donde:
2 ( 0 1 ) = 0
=1
( 0 1 ) = 0
=1
( 0 1 2 ) = 0
=1
0 1 2 = 0
=1
=1
=1
Sustituyendo 0
=1
=1
=1
[
1
] 1 2 = 0
( )( )
( )2
1
] 1 2 = 0
( )( )
( )2
+ 1
1 2 = 0
1 2 1
( )2
( )( )
=
( )2
( )( )
] =
( )( )
1 =
( )2
2
1 [ 2
( )2
=
( )( )
0 = 1
1 =
( )
= = ( )2
= =
Pero como nos interesa la no explicada para estimar 2
2 =
( )2
=
2
2
Suma de
cuadrados
error
Suma de
cuadrados
total
1
Suma de
cuadrados
regresin
0 0
0
[0 /2,2 0 0 0 + /2,2 0 ] = 1
1
2
20 = 2 [ +
]
(RESPUESTA DE CAMBIO)
INTERVALO DE CONFIANZA PARA
[/2,2 /2,2 ] = 1
=
1 1
1
[1 /2,2 1 1 1 + /2,2 1 ] = 1
21 =
ARA
PRUEBA DE HIPOTESIS
y
0 0
=
0
1 1
1
0 : 1 = 0
1 : 1 0
INTERVALO DE CONFIANZA PARA LA ECUACIN DE REGRESIN
() = /
1
= 2 [ +
)2
=2
()
[ () /2,2 / + () /2,2 ] = 1
= 0 + 1
a) INTERVALO PARA PRONOSTICO O PREDICCIN
Este intervalo es para una observacin aislada en especfico.
1
( )2
() = 2 [1 + +
[ ( ) /2,2 / + ( ) /2,2 ] = 1
Grados de
libertad
k-1
Suma de cuadrados
Error
n-k
= 1
Total corregida
n-1
Cuadrado medio
( 1)
( )
( )2
= () = 2
0 : 1 = 0
1 : 1 0
=
12 2
=
22 2
,(1),()
Rechazar 0 cuando:
> ,(1),()
2 =
= 2 1 1
Nos indica el grado de relacin lineal que hay entre las dos variables.
Si se acerca a -1 o 1 hay un alto grado de relacin entre las dos variables.
=
ESTANDARIZACIN DE RESIDUALES
En ocasiones en el anlisis de residuales es conveniente hacer un anlisis de los residuales
estandarizando, puesto que la desviacin estndar del error es y es estimada por ,
definiremos el residual estandarizado como sigue:
=
= ( )
=1 =1
= = ( )
=1
Fuentes de
variacin
Grados de
libertad
Suma de cuadrados
Cuadrado medio
Regresin
k-1
Error aleatorio
n-k
Carencia de ajuste
m-2
Error puro
n-m
( )
=1 =1
Total
n-1
( )2
m = es el nmero de niveles de x
= ( ) 1
=1
TRANSFORMACIONES
Cuando el modelo de lnea recta no se ajusta tenemos que hacer transformaciones.
Original = 0 1 y x
Transformado log = log 0 + log 1
a) Funcin exponencial
= 0 1
= ln
ln = ln 0 + 1
Transformacin en y y no en x.
b) Funcin de potencia
= ln
= 0 1
= log
= 0 + 1 2
Transformacin en x y y
= 2
c) Funcin reciproca
1
= ( )
= 0 + 1 ( )
Transformacin en x no en y
d) Funcin hiperblica
0 + 1
= 0 + 1 2
=
= 2
= 0 + 1
La velocidad de la maquina
La experiencia del operario
La calidad de la materia prima
El turno de trabajo
1 , 2, 3 ,, = 0 + 1 1 + 2 2 + 3 3 + +
Es la verdadera ecuacin de regresin mltiple.
= 0 + 1 1 + 2 2 + 3 3 + + +
Estimacin de la ecuacin de regresin a travs de una muestra
Suponga que el experimentador tiene k variables independientes y n observaciones, cada una de
las cuales se puede expresar por la ecuacin:
= 0 + 1 1 + 2 2 + 3 3 + + +
= 1, 2, 3,
= 1, 2, 3,
Donde n es el nmero de observaciones de la muestra y k es el nmero de variables, 11 es el
valor de 1 en la primera observacin de la muestra, 12 es el valor de 2 en la primera observacin
de la muestra.
Planteamiento del problema:
1) 1 = 0 + 1 11 + 2 12 + 3 13 + + 1 + 1
2) 2 = 0 + 1 21 + 2 22 + 3 23 + + 2 + 2
3) 3 = 0 + 1 31 + 2 32 + 3 33 + + 3 + 3
20) = 0 + 1 1 + 2 2 + 3 3 + + +
El mtodo que utilizamos para resolver las ecuaciones es el mtodo de mnimos cuadrados que es
minimizar la suma de los cuadrados de los errores.
1 = 1 0 1 11 2 12 3 13 1
2 = 2 0 1 21 2 22 3 23 2
3 = 3 0 1 31 2 32 3 33 3
Hasta:
= 0 1 1 2 2 3 3
ESTIMACIN DE LOS PARAMETROS POR MINIMOS CUADRADOS
( )
(1)
1
2
3
)
(( + 1))
1 11 12
1 21 22
= 1 31 32
(
1
2
1
2
3
=
4
( )
13
23
33
1
2
3
=
4
( )
(1)1
(1)
= +
(1) [( + 1)] [(1)1 ](1)
Donde:
() = 0
2
()
= 2
() =
Y la matriz de varianza- covarianza de y
2
()
= 2
( ) =
Donde denota el vector de coeficientes de regresin estimados.
Los estimadores de mnimos cuadrados son:
La matriz ( ) es:
= ( )1
1
1
1
11 21 31
( ) = 12 22 32
13
23
33
[ 1 2 3
) =
1
1 11 12
1
1 21 22
2
3 1 31 32
[
1
1
2
]
2
1
1 2
2
2
13
23
33
1
2
3
2 3
1 2 1 3
2 3
2
1
1 2 1 3
4
1 4
( ) = 2
1 2
2
2
2 3
2 4
1 3
2 3
2
3
3 4
[ 4
1 4
2 4 3 4
2
4
]
1
1
= 2
3
[ 4 ]
= [1 ] = ( )1
2
Entonces:
( ) = 1
[
12
1 2
1 2
22
= 1
[ 2 ]
2 = =
0 :
1 = 2 = = = 0
1 :
0 "j"
.
El rechazo de 0 implica que a menos una de las variables de regresin 1 , 2 , tiene una
contribucin significativa en el modelo.
En la prueba de significancia la suma total de cuadrados se divide en la suma de cuadrados debida
a la regresin y la suma de cuadrados debida al error digamos:
= +
Debe rechazarse 0 si el valor calculado del estadstico de prueba es mayor que ,1() . El
procedimiento se puede resumir en la tabla de anlisis de varianza.
Fuentes de
variacin
Grados de
libertad
Regresin
k-1
Error
Total
SS
MS
n-k
( )2
n-1
( )2
= ( )2 = 2
()2
()2
=
= ( )
Como:
=
Entonces:
=
( )2
( )2
= [ ( )
]
= ( )
( )2
0 2 1
Un valor grande de 2 no necesariamente implica que el modelo de regresin sea bueno. La adicin
de una variable al modelo siempre aumenta de 2 , sin importar si la variable es o no estadsticamente
significativa. Es as como los modelos tienen valores de 2 grandes pueden proporcionar
predicciones pobres de nuevas observaciones.
Coeficiente de correlacin mltiple 1 1
Es una medida de la oscilacin lineal existente entre y y 1 , 2 , .
INFERENCIAS PARA LOS PARAMETROS DE REGRESIN
Para poder hacer inferencias acerca de los parmetros de regresin primeramente debemos estimar
la varianza de las esta se expresa en trminos de los elementos de la inversa de la matriz . La
inversa de multiplicada por la constante 2 representa la matriz varianza-covarianza o matriz de
covarianza (varianza conjunta de dos variables) de los coeficientes de regresin . Los elementos
de la diagonal de 2 ()1 son las varianzas de 0 , 1 , mientras que los elementos que estn
fuera de la diagonal de esta matriz son las covarianzas.
MATRIZ DE COVARIANZA
2 (0 )
2 (
0 , 1 )
2 (0 , 1 )
2 (1 )
2 ( ) =
[ 2 (0 , ) 2 (1 , )
2 (0 , )
2 (1 , )
2 ( ) ]
2 () = 2 ( )1 = ( )1
INTERVALO DE CONFIANZA PARA
[ 2,() 2 ( ) ( ) + 2,()2( ) ] = 1
Donde ( ) es la raz cuadrada de los valores de la diagonal de la matriz de varianza-covarianza.
*si ningn parmetro pasa por cero quiere decir que son variables importantes.
PRUEBA DE HIPOTESIS SOBRE LOS COEFICIENTES INDIVIDUALES DE REGRESIN
Son tiles para valorar cada variable de regresin en el modelo.
A menudo se tiene inters en hacer pruebas de hiptesis sobre los coeficientes de regresin. Tales
pruebas son tiles para determinar el valor potencial de cada una de las variables de regresin del
modelo de regresin. Por ejemplo el modelo puede ser eficaz con la inclusin de variables
adicionales, o quiz con la eliminacin de uno o mas regresores presentes en el modelo.
La adicin de una variable al modelo siempre hace que SSR aumente y que la SSE es
suficientemente grande como para justificar el uso de una variable mas en el modelo. Por otra parte
la adicin de una variable sin importancia puede aumentar MSE, lo que contribuye un indicador de
que tal variable disminuye la calidad con la que el modelo ajusta a los datos.
Las hiptesis para la prueba de significancia de cualquier coeficiente de regresin individual seran:
1.
0 : = 0
1 : 0
2. Se realiza la prueba con un nivel de significancia
3. El estadstico de prueba para esta hiptesis es:
=
()
Ntese que () es el error estndar del coeficiente de regresin el cual se obtiene de la matriz
varianza-covarianza en la diagonal.
4. Se rechaza la hiptesis nula si > 2,
< 2,
5. Si no se rechaza la hiptesis 0 : = 0, entonces esto indica que el regresor puede
eliminarse del modelo.
A esta prueba se le conoce como PRUEBA PARCIAL O MARGINAL.
[ ]
= [1
1
1
][ 2 ( )] 2
[ ]
Son los valores para las xs para cada experimento para cada serie de valores.
[ 2,() ( ) ( ) + 2,() ( )] = 1
Un intervalo de pronstico o prediccin del 100(1) para esta observacin futura es:
[ 2,() ( ) + 2,() ( )] = 1
( ) = 2 [1 + ()1 ] = 2 + 2 ( ) = + 2 ( )
() = 0 + 1 1 + 2 2 + +
() 0 + 1 1 + 2 2 + +
Fuentes de
variacin
Grados de
libertad
Regresin
p-1
Carencia de ajuste
m-p
SS
Error puro
n-m
( )
( )
=1 =1
Error
n-p
Total
n-1
( )2
MS