Vous êtes sur la page 1sur 13

Repblica Bolivariana de Venezuela

Ministerio del Poder Popular Para La Educacin Superior

Universidad Nacional Experimental Simn Rodrguez

Ncleo Valles del tuy

Materia: Estadstica II

REGRESION Y CORRELACION LINEAL

Facilitador : Participantes:

Ing. Carlos Navarros Jessibeth Gonzlez C.I 27.283.184

Yhon Gonzlez C.I 24.407.958

Santa Teresa del Tuy, Noviembre 2017


ndice

Introduccin.

Regresin lineal..

Tipos de regresin

Correlacin

Covarianza..

Coeficiente de correlacin de Pearson.

Anlisis del coeficiente de correlacin

Tipos de correlacin

Ejemplos.

Conclusin..

Bibliografas.
Introduccin

En la industria con mucha frecuencia es necesario resolver problemas que implican


conjuntos de variables, cuando se sabe que existe alguna relacin inherente entre ellas.
A partir de lo anterior, es necesario establecer modelos que expliquen dicha relacin.

En forma ms especifica el anlisis de correlacin y regresin comprende el anlisis de


los datos mustrales para saber qu es y cmo se relacionan entre si dos o ms variables
en una poblacin. El anlisis de correlacin produce un nmero que resume el grado de
la fuerza de relacin entre dos variables; y el anlisis de regresin da lugar a una
ecuacin matemtica que describe dicha relacin.

Si sabemos que existe una relacin entre una variable denominada dependiente y otras
denominadas independientes (como por ejemplo las existentes entre: la experiencia
profesional de los trabajadores y sus respectivos sueldos, las estaturas y pesos de
personas, la produccin agraria y la cantidad de fertilizantes utilizados, etc.), puede
darse el problema de que la dependiente asuma mltiples valores para una combinacin
de valores de las independientes
Regresin lineal

Permite determinar el grado de dependencia de las series de valores X e Y, prediciendo


el valor y estimado que se obtendra para un valor x que no est en la distribucin.

Expresndolo en forma simple, la regresin lineal es una tcnica que permite cuantificar
la relacin que puede ser observada cuando se grafica un diagrama de puntos dispersos
correspondientes a dos variables, cuya tendencia general es rectilnea (Figura la);
relacin que cabe compendiar mediante una ecuacin del mejor ajuste de la forma:

y = a + bx

En esta ecuacin, y representa los valores de la coordenada a lo largo del eje vertical
en el grfico (ordenada); en tanto que x indica la magnitud de la coordenada sobre
el eje horizontal (abscisa). El valor de a (que puede ser negativo, positivo o igual a
cero) es llamado el intercepto; en tanto que el valor de b (el cual puede ser negativo
o positivo) se denomina la pendiente o coeficiente de regresin.

Tabla

Serie de datos para el clculo de una regresin (a y b) y del coeficiente de correlacin


(r)

Nmero Valores de x Valores de y Nmero Valores de x Valores de y


1 9,0 0,50 7 6,7 1,00
2 9,4 0,50 8 8,4 0,50
3 7,4 1,23 9 8,0 0,50
4 9,7 1,00 10 10,0 0,50
5 10,4 0,30 11 9,2 0,50
6 5,0 1,50 12 6,2 1,00
13 7,7 0,50

Objetivos

Saber construir un modelo de regresin lineal simple que describa como influye una
variable X sobre otra variable Y.

Saber obtener estimaciones puntuales de los parmetros de dicho modelo.

Saber construir intervalos de confianza y resolver contrastes sobre dichos parmetros

Saber estimar el valor promedio de Y para un valor de X.

Saber predecir futuros de la variable respuesta, Y.


Un modelo de regresin es un modelo que permite describir cmo influye una variable
X sobre otra variable Y .

IX: Variable independiente o explicativa o exgena.

IY: Variable dependiente o respuesta o endgena.

El objetivo es obtener estimaciones razonables de Y para distintos valores de X a partir


de una muestra de n pares de valores (x1, y1), . . . ,(xn, yn).

Tipos de regresin

Podemos clasificar los tipos de regresin segn diversos criterios.

En primer lugar, en funcin del nmero de variables independientes:

Regresin simple: Cuando la variable Y depende nicamente de una nica


variable X.

Regresin mltiple: Cuando la variable Y depende de varias variables (X1, X2,


..., Xr)

En segundo lugar, en funcin del tipo de funcin f(X):

Regresin lineal: Cuando f(X) es una funcin lineal.

Regresin no lineal: Cuando f(X) no es una funcin lineal.

En tercer lugar, en funcin de la naturaleza de la relacin que exista entre las dos
variables:

La variable X puede ser la causa del valor de la variable Y.

Por ejemplo, en toxicologa, si X = Dosis de la droga e Y = Mortalidad, la mortalidad se


atribuye a la dosis administrada y no a otras causas.

Puede haber simplemente relacin entre las dos variables.

Por ejemplo, en un estudio de medicina en que se estudian las variables X = Peso e Y =


Altura de un grupo de individuos, puede haber relacin entre las dos, aunque difcilmente
una pueda considerarse causa de la otra.

En este tema se tratar nicamente de la Regresin lineal simple.


Correlacin

Correlacin lineal. Bajo el concepto de correlacin se recogen varios procedimientos e


indicadores estadsticos utilizados para determinar el grado de asociacin entre
dos variables; el ms sencillo de ellos es el de correlacin lineal que est basado en la
comparacin de la varianza asociada de dos variables (covarianza) y las desviaciones
estndar de cada uno a travs del clculo del coeficiente r de Pearson.

Covarianza

La covarianza (cov(x,y)) de dos variables es un indicador de la relacin entre ellas. Este


parmetro puede utilizarse para medir la relacin entre dos variables solo si estn
expresadas en la misma escala o unidad de medida. Est dada por la expresin:

Coeficiente de correlacin de Pearson

La correlacin o grado de asociacin de dos variables se mide utilizando el coeficiente


de correlacin de Pearson. Este coeficiente mide el grado de asociacin lineal entre dos
variables. Se denota como r y su valor flucta en el intervalo [-1, 1].

sx: desviacin estndar de la variable x.


sy: desviacin estndar de la variable y.

Anlisis del coeficiente de correlacin

Segn sea el valor del coeficiente de correlacin (r) se tiene que:

Si r es positivo, la relacin lineal entre las variables es directa. Se dice que la correlacin
es positiva.

Si r es negativo, la relacin lineal entre las variables es inversa. Se dice que la


correlacin es negativa.

Si r = 0, no existe relacin lineal entre las variables, se dice que la correlacin es nula.

Si r = 1, existe una relacin de dependencia total directa entre las variables. Es decir,
si una de ellas aumenta (o disminuye), la otra aumenta (o disminuye) en igual
proporcin.

Si r = -1, existe una relacin de dependencia total inversa entre las variables. Es decir,
si una de ellas aumenta (o disminuye), la otra disminuye(o aumentan igual proporcin.

Tipos de correlacin

1 Co rr e lac i n di re c ta
La corre la cin dire cta se da cua ndo a l a umenta r una de la s va ria bles la
otra a ume nta .

La re cta cor re sp on die nte a la n u be de p u nt os de la d ist ri bu c i n es u na


rec ta cre c ie nte .

2 Correlacin inversa

La correlacin inversa se da cuando al aumentar una de las variables


la otra disminuye.

La recta correspondient e a la nube de puntos de la distribucin es


una recta decrecient e.

3 Correlacin nula

La correlacin nula se da cuando no hay dependencia de ningn


tipo ent re las variables.

En est e caso se dice que las variables son incorreladas y la nube


de punt os tiene una forma redondeada.
Ejemplos de regresin y correlacin lineal

1) Cinco nios de 2, 3, 5, 7 y 8 aos de edad pesan, respectivamente, 14, 20, 32, 42


y 44 kilos.

1 Hallar la ecuacin de la recta de regresin de la edad sobre el peso.

2 Cul sera el peso aproximado de un nio de seis aos?

Xi Yi Xi2 Yi2 Xi Yi

2 14 4 196 28

3 20 9 400 60

5 32 25 1 024 160

7 42 49 1 764 294

8 44 64 1 936 352

25 152 151 5 320 894


2) Las estaturas y pesos de 10 jugadores de baloncesto de un equipo son:

Estatura (X) Peso (Y)

186 85
189 85
190 86
192 90
193 87
193 91
198 93
201 103
203 100
205 101

Calcular:

1 La recta de regresin de Y sobre X.

2 El coeficiente de correlacin.

3 El peso estimado de un jugador que mide 208 cm.

Xi Yi Xi2 Yi2 Xi Yi

186 85 34 596 7 225 15 810


189 85 35 721 7 225 16 065
190 86 36 100 7 396 16 340
192 90 36 864 8 100 17 280
193 87 37 249 7 569 16 791
193 91 37 249 8 281 17563
198 93 39 204 8 649 18 414
201 103 40 401 10 609 20 703
203 100 41 209 10 000 20 300
205 101 42 025 10 201 20 705
1 950 921 380 618 85 255 179 971
Correlacin positiva muy fuerte.

3) Se ha solicit ado a un grupo de 50 individuos informacin sobre el


nmero de horas que dedican diariamente a dormir y ver la televisin.
La clasificacin de las respuestas ha permitido elaborar la siente tabla:

X 6 7 8 9 10

Y 4 3 3 2 1

(fi) 3 16 20 10 1

Se pide:

1 Calcular el coeficiente de correlacin.

2 Determinar la ecuacin de la recta de regresin de Y sobre X.


3 Si una persona duerme ocho horas y media, cunto cabe esperar que vea la
televisin?

Xi Yi fi Xi fi Xi2 fi Yi fi Yi2 fi Xi Yi fi

6 4 3 18 108 12 48 72

7 3 16 112 784 48 144 336

8 3 20 160 1280 60 180 480

9 2 10 90 810 20 40 180

10 1 1 10 100 1 1 10

50 390 3082 141 413 1078

E s u n a c or r e l ac i n ne g at i v a y f u e rte .
Conclusin

La regresin lineal simple y la regresin mltiple, analiza la relacin de dos o ms


variables continuas, cuando analiza dos variables a esta se l conoce como variable
bivariantes que pueden corresponder a variables cualitativas. La finalidad de una
ecuacin de regresin es la de estimar los valores de una variable con base en los valores
conocidos de la otra. Del mismo modo, una ecuacin de regresin explica los valores de
una variable en trminos de otra. Es decir, se puede intuir una relacin de causa y efecto
entre dos o ms variables. El anlisis de regresin nicamente indica qu relacin
matemtica podra haber, de existir una.
Bibliografas

Pea, D. Regresin y anlisis de experimentos (2005)

Meyer, P. Probabilidad y aplicaciones estadsticas (1992)

Bouza Herrera, Carlos N. y Sistachs Vega, Vivian: Estadstica, Teora Bsica y Ejercicios.
Editorial Flix Varela, La Habana, 2004

Colectivo de autores. Estadstica, probabilidad y preclculo, Manual esencial. Editorial


Santillana.