Académique Documents
Professionnel Documents
Culture Documents
El trmino regresin fue utilizada por primera vez por FRANCIS GALTON (18221911) en sus estudios biolgicos sobre la herencia.
GALTON manifest que: la estatura de los hijos de padres inusualmente altos o inusualmente bajos, tienden a moverse o regresar a la estatura promedio de la poblacin.
I.
DEFINICIN: una tcnica estadstica que sirve para analizar la dependencia de una variable respecto a otra variable, es decir, conociendo los valores de una variable independiente se trata de estimar los valores de una variable dependiente.
Es
2.
3.
4.
Determinar si las variables independientes y la variable dependiente presentan fuerzas de relacin. Determinar la estructura o la ecuacin matemtica que relaciona las variables independientes con las dependientes. Pronosticar o predecir los valores de la variable dependiente en funcin de la variable independiente. Controlar otras variables independientes al evaluar las contribuciones de una variable especifica o un conjunto de variables
Y 0 1 X Y 0 1 X 1 ... N X N
Y 0 X X Y 0 1 1 Y 0 X
1
Nubes de Puntos
Sea un conjunto de pares de valores de las variables X e Y. Si los representamos en un diagrama de dispersin obtendremos una nube de puntos que nos dar una idea grfica de la posible correlacin entre ambas variables.
Y Y Y
No hay correlacin
Correlacin positiva
Correlacin negativa
Nubes de Puntos
X Y 0 1
donde:
Y = Variable dependiente
X= Variable independiente
0 1
= Parmetro de la ecuacin
0
1
una unidad.
Y 0 1 X
X Y 0 1
Para estimar los coeficientes de la ecuacin de regresin, se utiliza el Mtodo de los Mnimos Cuadrados Ordinarios (MMCO).
Este Mtodo trata de encontrar las coeficientes de la ecuacin que ms se aproxime al conjunto de datos, es decir, encuentra la ecuacin de la recta de tal manera que los errores que se forman sean los ms pequeos posibles.
Para estimar estos coeficientes de regresin , primeramente se deben construir las ecuaciones normales que son las siguientes:
Y
i 1
n 0 1 X
i 1
YX X X
i 1 0 i 1 1 i 1
n XY X Y n X 2 ( X ) 2
i 1 i 1 i 1 n i 1 i 1 n
y x 0 1
Luego se sustituyen los valores en la ecuacin de la recta para obtener la ecuacin estimada o predicha por el MMCO.
Despus de calcular la ecuacin de la lnea de regresin de la muestra, podra interesarse en medir hasta qu grado los puntos de datos de la muestra, se encuentran dispersos alrededor de la lnea de regresin de la muestra.
El error estndar de la estimacin mide la cantidad estndar en la cual los valores reales de Y difieren de los valores estimados . Para su clculo se utiliza la siguiente frmula:
S y. x
2 0 Y 1 XY Y i 1 i 1 i 1
n2
ANALISIS DE CORRELACIN
El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o afinidad entre las variables cuantitativas consideradas en un estudio.
Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre dos variables. Se llamar CORRELACION LINEAL O RECTILINEA si la funcin es una recta, y de CORRELACION NO LINEAL cuando la funcin es una curva o una funcin de grado superior.
El COEFICIENTE DE CORRELACION DE PEARSON Es el estadgrafo que mide el grado de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se define como:
n XY X Y n X ( X )
2 i 1 i 1 n i 1 n i 1 i 1 2
n Y ( Y )
2 i 1 i 1
Interpretacin:
-1
-0.7
-0.4
0.4
0.7
+1
Perfecta
NEGATIVA
POSITIVA
COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin mide el porcentaje de variabilidad en Y que puede ser explicada por la variable independiente X. Se denota por R2 o r2
r
2
0 Y 1 XY nY
nY
INTERPRETACION:
Si r2 0.70, la ecuacin estimada se ajusta o tiende a representar los datos. Si r2 = 1, la ecuacin estimada es perfecta.
EJERCICIOS DE APLICACIN:
Se tienen informacin de los costos de mantenimiento de 06 maquinas llenadotas de gaseosas de distintas edades de la Empresa Enrique Cassinelli e Hijos S.A. La Gerencia desea hacer estimaciones o pronsticos acerca del costo de mantenimiento (Y) en funcin del tiempo operativo de la mquina (X). La informacin que se tienen es la siguiente:
1 1 30
2 1 40
3 2 70
4 2 80
5 3 100
6 3 100
Determinar la ecuacin de regresin. Interpretar sus coeficientes 2. Pronosticar el costo de mantenimiento para una mquina que tienen 4 aos operativos. 3. Hallar el error estndar de estimacin.
COSTO
60
40
20 0 0 1 2 3 4
TIEMPO
de
la
ecuacin
de
X*X 1 1 4 4 9 9 28
n XY X Y n X ( X )
2 i 1 i 1 i 1 n i 1 i 1 n 2
y x= 70 - 932.5 (2) = 5 0 1
Interpretacin: 0 = 5: Cuando la mquina no tienen ningn ao de funcionamiento su costo de mantenimiento es de 5 dlares. 1 = 32.5: Por cada ao de funcionamiento de la maquina su costo de mantenimiento aumenta en 32.5 dlares.
Y=5+32.5*4=135, que significa, que el costo de mantenimiento para la maquina si tiene 4 aos de funcionamiento es de 135$.
S y. x
Y
i 1
0 Y 1 XY
i 1 i 1
n2
S y.x 6.61
Diagrama de Dispersion
Costo de mantenimiento $
100
80
60
y = 32,5x + 5 R = 0,9602
40
20
d. Obtener los resultados finales: Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.97991187 Coeficiente de determinacin R^2 0.96022727
Como podemos observar obtenemos los resultados de manera inmediata. Con los que debemos concluir e interpretar