Vous êtes sur la page 1sur 66

Modulo 4

Anlisis de Regresin
Explica el comportamiento de una variable dependiente Y (variable
de respuesta) con base a los valores que toma una variable
independiente ( o variable regresora) X o n variables independientes
El comportamiento de la variable Y respecto a X se puede estudiar
mediante un modelo de regresin, que consiste en ajustar un modelo
matemtico de la forma:

a n parejas de puntos. Dado un valor para cada variable
independiente se puede predecir un valor promedio de Y.
Las variables independientes no son necesariamente aleatorias, en
algunas ocasiones el investigador fija sus valores, la variable
dependiente Y siempre es aleatoria.
Anlisis de Regresin
) (
i
X f Y =
Anlisis de Regresin y Correlacin
(ARC)
Indican como determinar tanto la naturaleza como
la fuerza de una relacin entre dos variables
En el anlisis de regresin se
desarrolla una ecuacin de
estimacin, esto es, una
frmula matemtica que
relaciona las variables
conocidas con la variable
desconocida
Una vez que se conoce el patrn de la
relacin, se aplica el anlisis de
correlacin para determinar el grado en
el que estn relacionadas las variables.
Este anlisis permite conocer que tan
bien la ecuacin de estimacin
realmente describe la relacin
Anlisis de Regresin(AR) Anlisis de Correlacin (AC)
Variable aleatoria: toma valores diferentes como
resultado de un experimento aleatorio
Es una especie de valor o magnitud que cambia de
una ocurrencia a otra sin seguir una secuencia
posible
Variable dependiente:
Es la que se trata de predecir
En la ecuacin de estimacin
solo se puede tener una
variable dependiente

Variable Independiente
Se puede usar ms de una
variable independiente
Son las variables conocidas
Relaciones entre las variables:
Directas ( pendiente positiva)
Inversas (pendiente negativa)
Las relaciones encontradas por la
regresin son relaciones de asociacin
pero no necesariamente son relaciones de
causa y efecto.
A menos que tenga razones especficas
para creer que los valores de la variable
dependiente son ocasionados por los
valores de las variables independientes, no
infiera causalidad de las relaciones que
encuentre mediante la regresin
Generalidades del AR
Si las variables X y Y estn relacionadas linealmente y para
cada valor de X, Y es una variable aleatoria, entonces cada
valor de Y se puede describir a travs del modelo:

donde

Supuesto: Errores aleatorios no estn correlacionados
es el punto en cual la lnea recta intercepta el eje y
es la pendiente de la lnea : cantidad en que se incrementa
o disminuye la variable Y por cada unidad que se incrementa
la variable X
c | | + + = X Y
1 0
) , 0 (
2
o c = ~
0
|
1
|
CASO LINEAL
Algunos Tipos de Relaciones entre Variables
Relacin lineal directa e inversa con
una sola variable independiente
Relacin curvilnea directa e inversa
con una sola variable independiente
Relacin exponencial con una sola
variable independiente
Relacin mltiple lineal con ms de una
variable independiente
Ecuaciones de Curvas Aproximantes
n
n
x a x a x a a y
x a x a x a x a a y
x a x a x a a y
x a x a a y
x a a y
+ + + + =
+ + + + =
+ + + =
+ + =
+ =
...
2
2 1 0
4
4
3
3
2
2 1 0
3
3
2
2 1 0
2
2 1 0
1 0
Lnea recta

Parbola o curva cuadrtica

Curva cbica

Curva curtica

Curva de grado n


Existen otros modelos de regresin que solo incluyen
una variable independiente, y que se aplican cuando
se espera o se observa que la relacin entre X y Y no
es modelada por una lnea recta
X
Y
1 0
| | +
E =
) ( 1
1 0
/ X Y | | + =
1
0
|
| X Y =
) ln(
1 0
X Y | | + =
Exponencial
Recproco
Multiplicativo
Logartmico
Continuacin..............
Otras Ecuaciones
( )
( )
( )
( ) ( )
2
2 1 0
1 0
1 0
1 0
log log y
1

1
logstica Curva
modificada Gompertz de Curva
g logq log log Gompertz de Curva
g modificada geomtrica Curva
g modificada l exponencia Curva
log log log geomtrica Curva
log log log l exponencia Curva
1 1
Hiprbola
x a x a a
g ab
y
g ab
y
h pq y
ab b p y pq y
ax y
ab y
x b a y ax y
x a a x b a y ab y
x a a
y

x a a
y
x
x
b
x x b
b
x
b
x
x
x
+ + =
+ =
+
=
+ =
+ = + = =
+ =
+ =
+ = =
+ = + = =
+ =
+
=
Para encontrar los valores de y
en cualquiera de los modelos presentados se
aplica el mtodo de mnimos cuadrados o se
utiliza un software de estadstica
0
|
1
|
1. Identificar un proyecto de mejora
2. Definir un propsito
3. Definir las variables
4.. Disear formato de hoja de verificacin
5. Recolectar los datos
6. Representar los datos en un diagrama de dispersin
para entender la relacin que existe entre la variable de
respuesta y la ( s) variable( s ) independiente( s )
7. Seleccionar el modelo de regresin
8. Estimar los parmetros a travs del mtodo de
mnimos cuadrados o utilizando el software indicado
9. Encontrar la ecuacin de mejor ajuste
10. Evaluar la calidad del ajuste
P
A
S
O
S

A
N
A
L
I
S
I
S
R
E
G
R
E
S
I
O
N
Observaciones Variable
Y
Variable
X
1 Y1 X1
2 Y2 X2
3 Y3 X3
. . . . .
. . . . .
. . . . .
n Yn Xn
Totales

=
n
i
Xi
1

=
n
i
Yi
1
Yi
2
Xi
2

=
n
i
i
Y
1
2

=
n
i
i
X
1
2
X
2
1
X
2
2
Y
2
1
X
2
3
Y
2
2
Y
2
3
Yn
2
Xn
2
.
.
.
Y X i i
Y X 1 1
Y X 2 2
Y X 3 3
Y X n n
Y X i
n
i
i

=1
Formato para Registro de Datos (Caso Lineal
Caso Lineal
La ecuacin para una lnea recta
donde la variable dependiente Y
est determinada por la variable
independiente X est dada por la
expresin:
Y = a + bX
Y :variable independiente
a :la interseccin con el eje X
b: la pendiente de la recta

Mtodo de Mnimos Cuadrados
La ecuacin de estimacin se simboliza por
Y = a + bX
Se deben estimar los valores de los parmetros, a travs
de las siguientes ecuaciones. Para encontrar el valor de b:



b es la pendiente de estimacin de mejor ajuste
X valores de X
Y valores de Y
X media de los valores de X
Y media de los valores de Y
n numero de parejas para las VD y VI
Para calcular el valor de a, la interseccin con el eje X se
utiliza:




=
2 2
2
) ( ) (
) )( ( ) )( (
X X n
XY X X Y
a

=
2 2
) ( ) (
) )( ( ) (
X X n
Y X XY n
b
Ecuaciones Normales


= = =
= =
+ =
+ =
n
i
n
i
i
n
i
i i
n
i
n
i
i
x b x a y x
x b an y
1 1
2
1
1 1
EVALUACION DE LA CALIDAD DE AJUSTE
Ecuacin de mejor ajuste
Clculo de los errores con la recta de
regresin, la suma de los errores debe ser cero
Coeficiente de determinacin
Coeficiente de correlacin
Error o desviacin estndar de la estimacin
Grfico de los residuales
Criterio 1
Graficar la ecuacin de mejor ajuste sobre el diagrama de
dispersin
x Curva de regresin ajustada
y = 0.0038x + 0.0692
0
0.5
1
1.5
2
0 100 200 300 400
Velocidad del aire
C
o
e
f
i
c
i
e
n
t
e

d
e

E
v
a
p
o
r
a
c
i

n
y
Pronstico y
Lineal (Pronstico y)
Criterio 2
Calcular el coeficiente de determinacin, valor entre 0 y 1
que se interpreta como la proporcin o porcentaje de la
variabilidad en los datos ( Y ) que es explicada por la
variable independiente ( X) del modelo de regresin.
Existe el coeficiente de determinacin ajustado que se
utiliza cuando hay muchos trminos en el modelo y es el
que se recomienda para fines de prediccin


=
= =

+
=
n
i
i
n
i
i i
n
i
i
y n y
y n y x b y a
r
1
2 2
2
1 1
2
Clculo del Coeficiente de Determinacin
Criterio 3
Calcular coeficiente de correlacin r, el cual mide la intensidad de la
relacin lineal entre dos variables X y Y. Es un valor que est entre -1 y 1
Si r est prximo a 1 relacin lineal positiva fuerte
Si r est prximo a 0 no hay correlacin
Si r est prximo a -1 relacin lineal negativa fuerte
Un valor cercano a 0 indica una correlacin dbil
Un valor cercano a 1 indica una correlacin fuerte
Un valor intermedio indica una correlacin moderada





2
r r =
Clculo del Coeficiente de Correlacin
Anlisis de Correlacin (AC)
Es la herramienta estadstica que se utiliza para
describir el grado hasta el cual una variable est
linealmente relacionada con otra.
Con frecuencia el AC se utiliza junto con el
Anlisis de regresin para medir que tan bien la
ecuacin de regresin explica los cambios de la
variable dependiente Y.
Sin embargo, la correlacin tambin se puede
usar para medir el grado de asociacin entre dos
variables.
Interpretacin del Coeficiente de Correlacin
Mide la fuerza de una relacin entre dos variables en una poblacin
Su valor vara de 1 a +1
Un valor de 1 indica una correlacin negativa (inversa o indirecta)
perfecta
Un valor de +1 indica una correlacin positiva (directa) perfecta
Un valor de 0 indica que no hay correlacin entre las variables
estudiadas
Un valor cercano a 0 indica una correlacin dbil
Un valor cercano a 1 indica una correlacin fuerte
Un valor intermedio indica una correlacin moderada
Interpretacin del Coeficiente de Determinacin
Mide la proporcin de la variacin en Y que explica la variable
independiente X. El coeficiente de determinacin se desarrolla de la
relacin entre dos tipos de variacin; la variacin de los valores Y
alrededor de :
1. La lnea de regresin ajustada
2. Su propia media
Criterio 4
Error estndar de estimacin o la desviacin estndar del error
Mientras este valor sea menor , mejor va a ser el ajuste del modelo
Si resultara que el error estndar tiene un valor de cero, se espera que la
ecuacin de estimacin sea un estimador perfecto de la variable dependiente
El error estndar de la estimacin mide la variabilidad de los valores
observados alrededor de la lnea de regresin
Se calcula por la expresin:




Y: valores de la variable dependiente
Y^: valores estimados de la ecuacin de estimacin que corresponde a cada
valor de Y
n : nmero de puntos de datos utilizados para ajustar la lnea de regresin
2
) (
1
2

=

=
n
Y Y
S
n
i
e
Interpretacin del error estndar
Mientras ms grande sea el error estndar de la
estimacin mayor ser la dispersin de los puntos
alrededor de la lnea de regresin
Si resultara que el error estndar tiene un valor de
cero, se espera que la ecuacin de estimacin sea un
estimador perfecto de la variable dependiente
El error estndar de la ecuacin de estimacin se
mide a lo largo del eje Y, y no perpendicularmente
desde la lnea de regresin
Criterio 5: Anlisis Grfico de los Residuales
Generalmente los grficos que se hacen para completar el
diagnstico del modelo son los siguientes:
a. Grfico de los residuos en papel de probabilidad
normal. El supuesto de normalidad sobre los errores se
cumple si los puntos en esta grfica tienden a ajustarse a
una lnea recta
b. Grfico de los residuos contra los valores predichos.
Si el modelo es adecuado, se espera que en esta grfica
los puntos no sigan ningn patrn y que por lo tanto estn
distribuidos aleatoriamente a lo largo y ancho
c. Los residuos contra cada variable regresora
Como se obtienen los residuos?
e i i
Y Y e =
e
i
i
Y
Y
e
Error o residuo

Valor observado de la variable dependiente

Valor estimado a partir de la ecuacin de mejor ajuste
Las siguientes cifras son mediciones de la velocidad del aire y del coeficiente de
evaporacin de gotitas de combustible en la cmara de combustin de un motor de
impulsin.
Velocidad Coeficiente
del aire (cm/s) de Evaporacin
x y
20 0.18
60 0.37
100 0.35
140 0.78
180 0.56
220 0.75
260 1.18
300 1.36
340 1.17
380 1.65
Ajuste una lnea recta a estos datos con el mtodo de mnimos cuadrados
Estimar el coeficiente de evaporacin de una gotita cuando la velocidad del aire es de
190 cm/s
Ejemplo de un Caso Lineal
Curva de regresin ajustada
0
0.2
0.4
0.6
0.8
1
1.2
1.4
1.6
1.8
0 100 200 300 400
Velocidad del aire
C
o
e
f
i
c
i
e
n
t
e

d
e

e
v
a
p
o
r
a
c
i

n
Y
Pronstico para Y
DIAGRAMA DE DISPERSION
Intercepcin 0.069242424

Pendiente 0.003828788

0
|
1
|
Del resultado de Excel se obtienen los parmetros
Ecuacin de Prediccin
Y = 0.0038X + 0.0692
x Curva de regresin ajustada
y = 0.0038x + 0.0692
0
0.5
1
1.5
2
0 100 200 300 400
Velocidad del aire
C
o
e
f
i
c
i
e
n
t
e

d
e

E
v
a
p
o
r
a
c
i

n
y
Pronstico y
Lineal (Pronstico y)
Observacin Pronstico y Residuos
1 0.145818182 0.03418182
2 0.298969697 0.0710303
3 0.452121212 -0.10212121
4 0.605272727 0.17472727
5 0.758424242 -0.19842424
6 0.911575758 -0.16157576
7 1.064727273 0.11527273
8 1.217878788 0.14212121
9 1.371030303 -0.2010303
10 1.524181818 0.12581818
ANALISIS DE LOS RESIDUALES
y = 0.0038x + 0.0692
Y
0.18
0.37
0.35
0.78
0.56
0.75
1.18
1.36
1.17
1.65
x Grfico de los residuales
-0.3
-0.2
-0.1
0
0.1
0.2
0 100 200 300 400
x
R
e
s
i
d
u
o
s
Grfico de probabilidad normal
0
0.5
1
1.5
2
0 20 40 60 80 100
Muestra percentil
C
o
e
f
i
c
i
e
n
t
e

d
e

E
v
a
p
o
r
a
c
i

n
Percentil Y
5 0.18
15 0.35
25 0.37
35 0.56
45 0.75
55 0.78
65 1.17
75 1.18
85 1.36
95 1.65
Resultados de Datos de Probabilidad
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.951481371
Coeficiente de determinacin R^2 0.9053168
R^2 ajustado 0.8934814
Error tpico 0.159052116
Observaciones 10
Conclusiones
El diagrama de dispersin sugiere que existe una relacin lineal directa entre la velocidad
del aire y el coeficiente de evaporacin
Existe una fuerte correlacin positiva entre la velocidad del aire y el coeficiente de
evaporacin
La variabilidad en el coeficiente de evaporacin es explicada en un 95.14% por la
velocidad del aire
La desviacin estndar es pequea, por lo tanto se puede considerar que el ajuste es bueno
El grfico de probabilidad normal es aproximadamente una lnea recta, por lo tanto se
puede concluir que los errores se distribuyen normalmente
Los otros grficos no presentan tendencias por lo cual se puede concluir que la calidad del
ajuste es buena
En la mayor parte de los problemas de investigacin donde se aplica el
Anlisis de Regresin se necesita ms de una variable independiente en el
modelo de regresin.
La complejidad de la mayor parte de los mecanismos cientficos es tal que
para ser capaces de predecir una respuesta importante se necesita un modelo
de regresin mltiple. Cuando este modelo es lineal en los coeficientes se
denomina Modelo de Regresin Lineal Mltiple.
Para k variables independientes X1, X2,............Xk, el modelo es

Z = Bo + B1X1 + B2X2 + .................BkXk
Y la respuesta estimada por:

Z = bo + b1X1 + b2X2 + .................bkXk
Donde cada coeficiente de regresin Bi se estima por bi de los datos de la muestra con el uso del mtodo de
mnimos cuadrados

Regresin Lineal Mltiple
Mtodo de Mnimos Cuadrados
Regresin Mltiple
Caso: Lineal con dos variables independientes
Paso 1: Ecuaciones Normales
Paso 2: Resolver el Sistema de Ecuaciones Simultneas
Paso 3: Expresar la ecuacin de prediccin



= = = =
= = = =
= = =
+ + =
+ + =
+ + =
n
i
i
n
i
i i
n
i
i
n
i i
n
i
i i
n
i
n
i
i i
n
i
i i
n
i
n
i
n
i
i i i
y c y x b y a z y
y x c x b x a z x
y c x b an z
1
2
1 1
2
1
1 1 1
2
1
1 1 1
cY bX a Z + + =
cy bx a Z + + =

Dureza ( Y ) Contenido de Temperatura (F)


Rockwell 30TCu ( % ) X
1
del Recocido ( X
2
)
5.3 1.5 66
7.8 2.5
87
7.4 0.5 69
9.8 1.2 141
10.8 2.6 93
9.1 0.3 105
8.1 2.4 111
7.2 2 78
6.5 0.7 66
12.6 1.6 123
A doce especmenes de lminas de acero recocido con contenidos diferentes
de Cobre y diferentes temperaturas de recocido se les mide la dureza y se
obtienen los siguientes resultados:
Ajuste una ecuacin de la forma
2 2 1 1 0
X X Y | | | + + =
Resultados obtenidos en EXCEL
2
0623 . 0
1
2247 . 0 2659 . 2 x x y + + =
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.75785623
Coeficiente de determinacin R^2 0.57434606
R^2 ajustado 0.45273065
Error tpico 1.59665346
Observaciones 10
Coeficientes
Intercepcin 2.26589673
Variable X 1 0.2246502
Variable X 2 0.06230446
Observacin Y Pronstico para Y Residuos
1 5.3 6.714966157 -1.41496616
2 7.8 8.248009943 -0.44800994
3 7.4 6.677229327 0.72277067
4 9.8 11.32040534 -1.52040534
5 10.8 8.644301702 2.1556983
6 9.1 8.875259723 0.22474028
7 8.1 9.72085188 -1.62085188
8 7.2 7.574944734 -0.37494473
9 6.5 6.535245997 -0.035246
10 12.6 10.2887852 2.3112148
Dado que este grfico no presenta una lnea aproximadamente recta el
modelo utilizado no es el ms adecuado
Resultados de Datos de
Probabilidad
Percentil Y
5 5.3
15 6.5
25 7.2
35 7.4
45 7.8
55 8.1
65 9.1
75 9.8
85 10.8
95 12.6
Grfico de probabilidad normal
0
2
4
6
8
10
12
14
0 20 40 60 80 100
Muestra percentil
Y
Variable X 1 Grfico de los residuales
-2
0
2
4
0 0.5 1 1.5 2 2.5 3
Variable X 1
R
e
s
i
d
u
o
s
Variable X 2 Grfico de los residuales
-2
0
2
4
0 50 100 150
Variable X 2
R
e
s
i
d
u
o
s
Conclusiones
Existe una correlacin moderada positiva entre la dureza y el contenido de cobre y la
temperatura de recocido
La variabilidad en la dureza de los especmenes es explicada en un 57.43 % por el
contenido de cobre y la temperatura de recocido
La desviacin estndar es pequea, por lo tanto se puede considerar que si se juzga la
calidad del ajuste en trminos de este indicador es bueno
El grfico de probabilidad normal no es aproximadamente una lnea recta, por lo tanto se
puede concluir que los errores no se distribuyen normalmente
Los otros grficos no presentan tendencias por lo cual se puede concluir que la calidad del
ajuste es moderadamente buena
Mtodo de Mnimos Cuadrados
Caso: Lineal con k variables independientes



= = = =
= = = =
= = =
+ + =
+ + =
+ + =
n
i
i
n
i
i
n
i
i
n
i i
n
i
i
n
i
n
i
i i
n
i
i i
n
i
n
i
n
i
i i
x c x b x a z y
x c x b x a z x
x c x b an z
1
4
1
3
1
2
1
1
3
1 1
2
1
1 1 1
2
k k
x b x b b y ...
1 1 0
+ + =
Paso 1: Ecuaciones Normales
Paso 2: Resolver el Sistema de Ecuaciones Simltaneas
Paso 3: Expresar la ecuacin de prediccin
k k
x b x b b y ...
1 1 0
+ + =
Se realiz un estudio sobre un camin de reparto ligero a
diesel para ver si la humedad, temperatura del aire y
presin baromtrica influyen en la emisin de xido
nitroso (en ppm). Las mediciones de las emisiones se
tomaron en diferentes momentos, con condiciones
experimentales variantes. Los datos son los siguientes:
Oxido Nitroso Humedad Temperatura Presin
Y
x1 x2 x3
0.9 72.4 76.3 29.18
0.91 41.6 70.3 29.35
0.96 34.3 77.1 29.24
0.89 35.1 68 29.27
1 10.7 79 29.78
1.1 12.9 67.4 29.39
1.15 8.3 66.8 29.69
1.03 20.1 76.9 29.48
0.77 72.2 77.7 29.09
1.07 24 67.7 29.6
1.07 23.2 76.8 29.38
0.94 47.4 86.6 29.35
1.1 31.5 76.9 29.63
1.1 10.6 86.3 29.56
1.1 11.2 86 29.48
0.91 73.3 76.3 29.4
0.87 75.4 77.9 29.28
0.78 96.6 78.7 29.29
0.82 107.4 86.8 29.03
0.95 54.9 70.9 29.37
Ajuste este modelo de regresin lineal mltiple a los datos y
despus estime la cantidad de xido nitrosos para las condiciones
donde la humedad es 50%, la temperatura 76F y la presin
baromtrica 29.30
Solucin
Para las ecuaciones normales encontramos que:
1219 . 571 5086 . 278 , 17 8670 . 976 , 44 3950 . 283 , 25 8400 . 587
, 4370 . 1483 8670 . 976 , 44 3200 . 912 , 117 0900 . 000 , 67 4000 . 1530
, 4770 . 779 3950 . 283 , 25 0900 . 000 , 67 8900 . 876 , 54 100 . 863
, 4200 . 19 8400 . 587 4000 . 1530 1000 . 863 20
3 2 1 0
3 2 1 0
3 2 1 0
3 2 1 0
= + + +
= + + +
= + + +
= + + +
b b b b
b b b b
b b b b
b b b b
La solucin de este conjunto de ecuaciones da las estimaciones nicas
154155 . 0 , 000799 . 0 , 002625 . 0 , 507778 . 3
3 2 1 0
= = = = b b b b
Por lo tanto, la ecuacin de regresin es:
3 2 1
154155 . 0 000799 . 002625 . 0 507778 . 3

x x x y + + =
Para 50% de humedad, una temperatura de 76F y una presin baromtrica de
29.30, la cantidad estimada de xido nitroso es :
9384 . 0
) 30 . 29 ( 154155 . 0 ) 0 . 76 ( 000799 . ) 0 . 50 ( 002625 . 0 507778 . 3

=
+ + = y
Mtodo de Mnimos Cuadrados
Parbola
Paso 1. Ecuaciones Normales
2
cx bx a y + + =



= = = =
= = = =
= = =
+ + =
+ + =
+ + =
n
i
i
n
i
i
n
i
i
n
i i
n
i
i
n
i
n
i
i i
n
i
i i
n
i
n
i
n
i
i i i
x c x b x a y x
x c x b x a y x
x c x b an y
1
4
1
3
1
2
1
2
1
3
1 1
2
1
1 1 1
2
Paso 2. Resolver el sistema de ecuaciones para a, b y c
Paso 3. Reemplazar los valores de los parmetros en la
ecuacin de la parbola
2
cx bx a y + + =
Tiempo de Secado Cantidad de aditivo
( Y ) ( X )
12 0
10.5 1
10 2
8 3
7 4
8 5
7.5 6
8.5 7
9 8
Los siguientes datos se refieren al tiempo de secado de un cierto
barniz y a la cantidad de aditivo aadido para reducir el tiempo
de secado
Variable X 1 Curva de regresin ajustada
0
10
20
0 2 4 6 8 10
Variable X 1
Y
Y
Pronstico para Y
Variable X 2 Curva de regresin ajustada
0
10
20
0 20 40 60 80
Variable X 2
Y
Y
Pronstico para Y
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.960564288
Coeficiente de determinacin R^2 0.922683751
R^2 ajustado 0.896911667
Error tpico 0.516746956
Observaciones 9
Parmetros Coeficientes
a 12.18484848
b -1.846536797
c 0.182900433
2
1829 . 0 8465 . 1 1848 . 12 x x y + =
Pronstico para Y Residuos
12.18484848 -0.18484848
10.52121212 -0.02121212
9.223376623 0.77662338
8.291341991 -0.29134199
7.725108225 -0.72510823
7.524675325 0.47532468
7.69004329 -0.19004329
8.221212121 0.27878788
9.118181818 -0.11818182
Y
12
10.5
10
8
7
8
7.5
8.5
9
2
1829 . 0 8465 . 1 1848 . 12 x x y + =
Grfico de probabilidad normal
0
2
4
6
8
10
12
14
0 20 40 60 80 100
Muestra percentil
Y
Resultados de datos de probabilidad
Percentil Y
5.55555556 7
16.6666667 7.5
27.7777778 8
38.8888889 8
50 8.5
61.1111111 9
72.2222222 10
83.3333333 10.5
94.4444444 12
Variable X 1 Grfico de los residuales
-1
-0.5
0
0.5
1
0 2 4 6 8 10
Variable X 1
R
e
s
i
d
u
o
s
Variable X 2 Grfico de los residuales
-1
-0.5
0
0.5
1
0 10 20 30 40 50 60 70
Variable X 2
R
e
s
i
d
u
o
s
Conclusiones
El diagrama de dispersin sugiere que existe una relacin curvilnea directa
entre el tiempo de secado y la cantidad de aditivo
Existe una fuerte correlacin positiva entre el tiempo de secado y la cantidad
de aditivo
La variabilidad en el coeficiente de evaporacin es explicada en un 92.26 %
por la cantidad de aditivo
La desviacin estndar es pequea, por lo tanto se puede considerar que el
ajuste es bueno
El grfico de probabilidad normal es aproximadamente una lnea recta, por lo
tanto se puede concluir que los errores se distribuyen normalmente
Los otros grficos no presentan tendencias por lo cual se puede concluir que
la calidad del ajuste es buena
X
Y o| =
Es prctica comn de los ingenieros
trazar datos apareados en varios
tipos de papel para grficas, a fin de
determinar si en escalas
apropiadamente transformadas los
puntos quedarn sobre una lnea
recta. Si este es el caso, la
naturaleza de la transformacin
conduce a una forma funcional de
la ecuacin de regresin y las
constantes necesarias pueden
calcularse aplicando el mtodo de
mnimos cuadrados para el caso de
regresin lineal simple a los datos
transformados.
Si un conjunto de datos
apareados consiste de n
puntos (x, y) y se endereza
cuando se grafica lnY vs
X, esto indica que la curva
de regresin de Y sobre X
es Exponencial, o sea
Que se convierte en
| o ln ln ln X Y + =
Los siguientes son precios de venta (z) de
cierta marca y modelo de automvil usado en
de w aos
Ajuste una curva de la forma
w
z o| =
Ventas AOS
z w
6350 1
5695 2
5750 2
5395 3
4985 5
4895 5
Ventas
lnz
AOS
z w
6350 8.756210092 1
5695 8.647343876 2
5750 8.656955134 2
5395 8.593227878 3
4985 8.514188682 5
4895 8.495969555 5
d w c z cd z
w
ln ln ln + = =
Estadsticas de la regresin
Coeficiente de correlacin mltiple 0.97724692
Coeficiente de determinacin R^2 0.95501154
R^2 ajustado 0.94376442
Error tpico 0.02309856
Observaciones 6
Coeficientes
Intercepcin 8.78130693
Variable X 1 -0.05688591
w
z
w z
) 9947 . 0 )( 9953 . 6510 (
7813 . 8 0569 . 0 ln
=
+ =
= z
Ecuacin de Regresin Ajustada
8.45
8.5
8.55
8.6
8.65
8.7
8.75
8.8
0 2 4 6
Aos de Uso del Automvil
V
e
n
t
a
s
Y
Pronstico para Y
Lineal (Y)
Ve
= z
Para decidir que curva usar, es til obtener diagramas de
dispersin de variables transformadas.
Si un diagrama de dispersin de logY versus X indica una
relacin lineal, la ecuacin tiene la forma de una curva
exponencial.
Si logY versus logX es lineal la ecuacin tiene la forma de
una curva potencial.
Se utiliza papel grfico especial para facilitar la decisin
sobre que curva usar.
El papel grfico que tiene solo una escala calibrada
logartmicamente se llama semilogartmico y el que tiene las
dos escalas se llama papel log-log.
Notas importantes
Tcnicas de mnimos cuadrados similares tambin se pueden aplicar al estimar los
coeficientes cuando el modelo lineal involucra, digamos, potencias y productos de
las variables independientes. Por ejemplo, cuando k=1, el experimentador puede
pensar que las medidas no caen en lnea recta pero que se describen de forma
ms apropiada con el mtodo de regresin polinomial.
Suponga que ahora que deseamos ajustar la ecuacin polinomial
Regresin Polinomial
r
r i
x x x | | | | + + + + = ...
2
2 0
A los n pares de observacin . Cada observacin, y
1
,
satisface la ecuacin
( ) { } n i y x
i
,... 2 , 1 ;
1
=
i
r
i r i i i
i
r
i r i i i i
e x b x b x b b y

x x x y
+ + + + + =
+ + + + + =
...
...
2
2 1 0
2
2 0
c | | | |
Donde r es el grado del polinomio, son de nuevo el
error aleatorio y residual asociados con la respuesta y
1
. Aqu,
el nmero de pares, n, debe ser al menos tan grande como r+1,
el nmero de parmetros a estimar. Ntese que el modelo
polinomial se puede considerar como un caso especial del
modelo de regresin lineal mltiple ms general donde
hacemos

r
r
x x x x x x = = = ,..., ,
2
2 1
) (
e i
Y Y




= = = =
+ +
=
= =
+
= = =
= = = =
= + + + +
= + + + +
= + + + +
n
i
i
r
i
n
i
r
i k
n
i
n
i
r
i
r
i
n
i
r
i
n
i
i i
n
i
r
i r
n
i
n
i
i
n
i
i
n
i
i
n
i
n
i
n
i
r
i r i i o
y x x b x b x b x b
y x x b x b x b x b
y x b x b x b nb
1 1
2
1 1
2
2
1
1
1
0
1 1
1
1 1
3
2
2
1 1
1
0
1 1 1 1
2
2 1
...
...
...
Las ecuaciones normales toman la forma :
Que se resuelven como antes para

r
b b b + + + ...
1 0

Vous aimerez peut-être aussi