Vous êtes sur la page 1sur 34

ANALISIS DE REGRESION Y CORRELACION

KARINA CARDENAS RODRIGUEZ

ANALISIS DE REGRESION Y CORRELACION

El trmino regresin fue utilizada por primera vez por FRANCIS GALTON (18221911) en sus estudios biolgicos sobre la herencia.
GALTON manifest que: la estatura de los hijos de padres inusualmente altos o inusualmente bajos, tienden a moverse o regresar a la estatura promedio de la poblacin.

I.

DEFINICIN: una tcnica estadstica que sirve para analizar la dependencia de una variable respecto a otra variable, es decir, conociendo los valores de una variable independiente se trata de estimar los valores de una variable dependiente.

Es

II. FUNCIONES DEL ANLISIS DE REGRESIN:


Las funciones que persigue el Anlisis de Regresin son:
1.

2.

3.

4.

Determinar si las variables independientes y la variable dependiente presentan fuerzas de relacin. Determinar la estructura o la ecuacin matemtica que relaciona las variables independientes con las dependientes. Pronosticar o predecir los valores de la variable dependiente en funcin de la variable independiente. Controlar otras variables independientes al evaluar las contribuciones de una variable especifica o un conjunto de variables

III. TIPOS DE REGRESIN:


TIPO Simple REGRESIN LINEAL Mltiple Potencia REGRESIN NO LINEAL Exponencial Hiperblico Ecuacin

Y 0 1 X Y 0 1 X 1 ... N X N

Y 0 X X Y 0 1 1 Y 0 X
1

IV. DIAGRAMA DE DISPERSIN


Es el primer paso a realizar para determinar si existe una relacin entre dos variables. Este grafico consiste en un conjunto de puntos (x, y) presentados en un plano cartesiano. Este diagrama permite visualizar el patrn de comportamiento de estas variables y por ende conocer la ecuacin de regresin que describen dichos datos.

Nubes de Puntos
Sea un conjunto de pares de valores de las variables X e Y. Si los representamos en un diagrama de dispersin obtendremos una nube de puntos que nos dar una idea grfica de la posible correlacin entre ambas variables.
Y Y Y

No hay correlacin

Correlacin positiva

Correlacin negativa

Nubes de Puntos

V. LA ECUACIN DE REGRESIN LINEAL:


Si la variable respuesta o variable dependiente (Y) est en relacin con la variable independiente (X), entonces la relacin funcional o ecuacin de regresin entre Y y X tienen la siguiente forma:
de regresin poblacional Y 0 1 X Ecuacin

X Y 0 1
donde:

Ecuacin de regresin muestral

Y = Variable dependiente

X= Variable independiente

0 1

= Parmetro de la ecuacin

0
1

= Intercepto. Valor de Y cuando X es igual a cero = Pendiente. Incremento de Y, cuando X aumenta en

una unidad.

Y 0 1 X

X Y 0 1

VI. ESTIMACIN DE LOS COEFICIENTES DE REGRESIN

Para estimar los coeficientes de la ecuacin de regresin, se utiliza el Mtodo de los Mnimos Cuadrados Ordinarios (MMCO).
Este Mtodo trata de encontrar las coeficientes de la ecuacin que ms se aproxime al conjunto de datos, es decir, encuentra la ecuacin de la recta de tal manera que los errores que se forman sean los ms pequeos posibles.

Para estimar estos coeficientes de regresin , primeramente se deben construir las ecuaciones normales que son las siguientes:

Y
i 1

n 0 1 X
i 1

YX X X
i 1 0 i 1 1 i 1

Al resolver este sistema de ecuaciones normales obtenemos las siguientes formulas:

n XY X Y n X 2 ( X ) 2
i 1 i 1 i 1 n i 1 i 1 n

y x 0 1

Luego se sustituyen los valores en la ecuacin de la recta para obtener la ecuacin estimada o predicha por el MMCO.

ERROR ESTNDAR DE LA ESTIMACIN

Despus de calcular la ecuacin de la lnea de regresin de la muestra, podra interesarse en medir hasta qu grado los puntos de datos de la muestra, se encuentran dispersos alrededor de la lnea de regresin de la muestra.

El error estndar de la estimacin mide la cantidad estndar en la cual los valores reales de Y difieren de los valores estimados . Para su clculo se utiliza la siguiente frmula:

S y. x

2 0 Y 1 XY Y i 1 i 1 i 1

n2

ANALISIS DE CORRELACIN

El anlisis de correlacin es una tcnica estadstica que mide el grado de asociacin o afinidad entre las variables cuantitativas consideradas en un estudio.

Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin entre dos variables. Se llamar CORRELACION LINEAL O RECTILINEA si la funcin es una recta, y de CORRELACION NO LINEAL cuando la funcin es una curva o una funcin de grado superior.

El COEFICIENTE DE CORRELACION DE PEARSON Es el estadgrafo que mide el grado de asociacin o afinidad entre las variables cuantitativas y se denota por r la cual se define como:

n XY X Y n X ( X )
2 i 1 i 1 n i 1 n i 1 i 1 2

n Y ( Y )
2 i 1 i 1

Interpretacin:

-1

-0.7

-0.4

0.4

0.7

+1

Perfecta Alta Regular Baja Baja Regular Alta

Perfecta

NEGATIVA

POSITIVA

COEFICIENTE DE DETERMINACIN
El coeficiente de determinacin mide el porcentaje de variabilidad en Y que puede ser explicada por la variable independiente X. Se denota por R2 o r2

r
2

0 Y 1 XY nY

nY

INTERPRETACION:

Si r2 0.70, la ecuacin estimada se ajusta o tiende a representar los datos. Si r2 = 1, la ecuacin estimada es perfecta.

EJERCICIOS DE APLICACIN:
Se tienen informacin de los costos de mantenimiento de 06 maquinas llenadotas de gaseosas de distintas edades de la Empresa Enrique Cassinelli e Hijos S.A. La Gerencia desea hacer estimaciones o pronsticos acerca del costo de mantenimiento (Y) en funcin del tiempo operativo de la mquina (X). La informacin que se tienen es la siguiente:

Maquina Tiempo operativo en Aos (X) Costo de mantenimiento $ (Y)


1.

1 1 30

2 1 40

3 2 70

4 2 80

5 3 100

6 3 100

Determinar la ecuacin de regresin. Interpretar sus coeficientes 2. Pronosticar el costo de mantenimiento para una mquina que tienen 4 aos operativos. 3. Hallar el error estndar de estimacin.

SOLUCIN Diagrama de dispersin:


COSTO DE MANTENIMIENTO
120 100 80

COSTO

60

40
20 0 0 1 2 3 4

TIEMPO

1.- Determinacin regresin:


MAQUINA 1 2 3 4 5 6 TOTAL X 1 1 2 2 3 3 12 Y

de

la

ecuacin

de

XY 30 40 70 80 100 100 420 30 40 140 160 300 300 970

X*X 1 1 4 4 9 9 28

Y*Y 900 1600 4900 6400 10000 10000 33800

Calculando los coeficientes de regresin:

n XY X Y n X ( X )
2 i 1 i 1 i 1 n i 1 i 1 n 2

6(970) (12)(420) 32.5 2 6(28) (12)

y x= 70 - 932.5 (2) = 5 0 1

Por lo tanto la ecuacin de regresin es: Y = 5 + 32.5 X

Interpretacin: 0 = 5: Cuando la mquina no tienen ningn ao de funcionamiento su costo de mantenimiento es de 5 dlares. 1 = 32.5: Por cada ao de funcionamiento de la maquina su costo de mantenimiento aumenta en 32.5 dlares.

Pronostico cuando la mquina tienen 4 aos de funcionamiento:

Y=5+32.5*4=135, que significa, que el costo de mantenimiento para la maquina si tiene 4 aos de funcionamiento es de 135$.

3.- Calculamos el error estndar de estimacin:

S y. x

Y
i 1

0 Y 1 XY
i 1 i 1

n2

33800 5(420) 32.5(970) = 4

S y.x 6.61

PARTE OPERATIVA UTILIZANDO EXCEL Ingreso de datos en la hoja de clculo EXCEL:

GRAFICAR PARA CONOCER LA TENDENCIA DE DATOS


120

Diagrama de Dispersion

Costo de mantenimiento $

100

80

60

y = 32,5x + 5 R = 0,9602

40

20

0 0 0,5 1 1,5 2 2,5 3 3,5

Tempo operativo en aos

b. Hacer clic en Datos /Anlisis de Datos/Regresin y aparece la siguiente ventana:

c.-Ingresar la respectiva informacin:


Aparece la ventana de dialogo donde hay que ingresar el rango de Y, el rango de X, activar rtulos, las opciones de salida y algunas alternativas de inters para el investigador.

d. Obtener los resultados finales: Resumen Estadsticas de la regresin Coeficiente de correlacin mltiple 0.97991187 Coeficiente de determinacin R^2 0.96022727

Coeficientes Intercepcin (X) Aos 5 32.5

Como podemos observar obtenemos los resultados de manera inmediata. Con los que debemos concluir e interpretar

Vous aimerez peut-être aussi