Vous êtes sur la page 1sur 23

REGRESION Y CORRELACION LINEAL

REGRESIN
SIMPLE LINEAL SIMPLE
Es cuando una variable independiente ejerce influencia sobre otra variable dependiente.

Variable dependiente: la variable que se pronostica o estima.


Variable independiente: la variable que proporciona la base para la estimacin. Es la
variable predictora.

FORMA GENERAL DE LA ECUACION DE


REGRESIN SIMPLE
Y=a+bx
Donde:
Y se lee Y prima, es el valor pronosticado
de la variable Y para un valor seleccionador
de X.
a es la ordenada de la interseccin con el
eje Y, es decir, el valor estimado de Y cuando
X=0, es decir, donde la recta de regresin
cruza el eje Y.
b es la pendiente de la recta, o el cambio
promedio en Y por unidad de cambio en la
variable independiente X.
X es cualquier valor seleccionado de la
variable independiente.

b: Pendiente de la lnea de regresin


Donde:
X es el valor de la variable independiente.
Y es el valor de la variable dependiente.
n es el numero de elementos en la muestra.

X es cualquier valor seleccionado de la


variable independiente. En general, los
valores de a y b en la ecuacin de
regresin se denominan coeficientes
de regresin estimados, o tambin
coeficientes de regresin.

COEFICIENTE DE
CORRELACIN, R
El coeficiente de correlacin ( r ) es una
medida de la intensidad de la relacin entre
dos variables.
Requiere datos con escala de intervalo o de
razn (variables).
Puede tomar valores entre -1.00 y 1.00.
Valores de -1.00 o 1.00 indican correlacin
fuerte y perfecta.
Valores cercanos a 0.0 indican correlacin
dbil.
Valores negativos indican una relacin
NUBEinversa
DE PUNTOS
O DIAGRAMA
DISPERSIN.
y valores
positivosDE
indican
una
relacin directa.
Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor
posible, llamada recta de regresin.


Reglaparalainterpretaciondelvalordelcoeficientedecorrelacion"r":

r=0
la correlacin es nula.

r<0a0.20>
la correlacin es positiva pero casi nula

r<-0.20a0>
la correlacin es negativa (inversa) pero casi nula

r<0.20a0.40>
la correlacin es positiva y baja

r<-0.20a-0.40>
la correlacin es negativa (inversa) y baja

r<0.40a0.70>
la correlacin es positiva y buena o significativa
r<-0.40a-0.70>
la correlacin es negativa (inversa) y buena o significativa
r<0.70a1>
la correlacin es positiva y muy buena o muy significativa
r<-0.70a-1>
la correlacin es negativa (inversa) y muy buena o muy significativa

r=1
la correlacin es perfecta positiva

r=-1
la correlacin es perfecta y negativa(inversa)

Correlacin directa
La recta correspondiente a la nube
del puntos de la distribucin es una
recta creciente.

Correlacin inversa
La recta correspondiente a la de la
distribucin
es
una
recta
decreciente.

Correlacin nula
En este caso se dice que las
variables son encorraladas y la
nube de puntos tiene una forma
redondeada.

Correlacin no lineal

Correlacin negativa perfecta

Correlacin positiva perfecta

FORMULAS QUE NOS PERMITEN HALLAR EL COEFICIENTE


DE CORRELACIN R DE PEARSON
MODELOS
LNEA RECTA y= a+bx
CALCULA EL COEFICIENTE DE CORRELACIN R SIN
UTILIZAR MEDIAS ARITMTICAS DE LAS VARIABLES

TAMBIN SE PUEDE CALCULA EL COEFICIENTE DE


CORRELACIN R UTILIZANDO LAS MEDIAS
ARITMTICAS DE LAS VARIABLES
n = es el nmero de pares de observaciones.
X = es la suma de los valores de la variable X.
Y = es la suma de los valores de la variable Y.
(X2) = es la suma de los cuadrados de los valores de la
variable X.
(X)2 = es el cuadrado de la suma de los valores de la
variable X.

ERROR ESTNDAR DE LA ESTIMACION


Mide la dispersin de los valores observados alrededor de la recta de regresin.
La desviacin estndar se basa es los cuadrados de las desviaciones respecto a la media,
mientras que el error estndar de estimacin se basa en los en los cuadrados de las
desviaciones respecto a la lnea de regresin. Si la suma de los cuadrados de las desviaciones es
pequea esto significa que la lnea de regresin es representativa de los datos. Si los cuadrados
son grandes, entonces la recta de regresin puede no representar a los datos.
Frmulas usadas para calcular el error estndar:

n: numero de la muestra
X: total de x
y : total y
a : ordenada de la y en la muestra
b: pendiente de la muestra

El error de estndar de estimacin sirve


para mostrar la semejanza que existe
en concepto y calculo entre la
desviacin estndar y el error estndar
de estimacin.

Regresin lineal mltiple

Este tipo se presenta cuando dos o


ms
variables
independientes
influyen
sobre
una
variable
dependiente. Ejemplo: Y = f(x,
w, z).

El modelo de regresin lineal


mltiple es idntico al modelo de
regresin lineal simple, con la
nica diferencia de que aparecen
ms variables explicativas.

CALCULOS NECESARIOS PARA DETERMINAR LA


ECUACIN DE REGRESION LINEAL SIMPLE DE
MINIMOS CUADRADOS
EJEMPLO

En la empresa COPIER SALES OF AMRICA, la


gerente de ventas recopilo informacin
respecto al numero de llamadas telefnicas
hechas y la cantidad de copiadoras vendidas,
para una muestra de 10 representantes de
ventas. A la seorita Madeleine, gerente de esa
rea, le gustara ofrecer informacin especifica
referente a la relacin entre el numero de
llamadas y la cantidad de productos vendidos.
Utilice el mtodo de mnimos cuadrados para
determinar la ecuacin lineal.

Representa
ntes de
ventas

Llamadas
de ventas
(X)

Copiadoras
vendidas
(Y)

XY

CINTHIA

20

30

400

900

600

CAROLINA

40

60

1600

3600

2400

JOSE LUIS

20

40

400

1600

800

CARLOS

30

60

900

3600

1800

MILAGROS

10

30

100

900

300

MALENA

10

40

100

1600

400

BRYAN

20

40

400

1600

800

ANGEL

20

50

400

2500

1000

BEATRIZ

20

30

400

900

600

ANTONIO

30

70

900

4900

2100

TOTAL

220

450

5600

22100

10800

Encontrando b:

Luego a:

b=

a=

b=

a=

Por tanto, la ecuacin de


regresin es:
Y = a+b (x)

b=

a=

b=

a= 18.9476

b= 1.1842

Y = 18.9476 + 1.1842

DE MODO QUE SI UN VENDEDOR HACE 20 LLAMADAS


TELEFNICAS, PUEDE ESPERARSE QUE VENDA :

Y=18.9476+1.1842(X)
Y=18.9476+1.1842(20)
Y=42.6316
valor
b=1.1842 , significa que para cada llamada adicional que realizan los representantes de
ventas pueden esperar aumentar en casi 1.2 el numero de copiadoras vendidas.
El valor
a=18.9476 es el punto donde la ecuacin cruza el eje Y. Una traduccin literal es que si no
se hacen llamadas, esto es, X=0, se vendern 18.9476 copiadoras. Obsrvese que X=0 se
encuentra fuera del intervalo de valores incluidos en la muestra, las llamadas a clientes
fueron de 10 a 40, as que los clculos deben hacerse dentro de esa gama de valores.

ANLISIS DE CORRELACIN

Sirve para medir la adecuacin del modelo hallado


(bondad del ajuste de la recta de regresin al
conjunto de observaciones), en el caso de tener
una variable dependiente y varias independientes.
Dicha medida nos la da el coeficiente de
determinacin R2 , que verifica 0 R2 1.
Cuanto ms cercano a uno sea su valor, mayor es
el grado de asociacin lineal que existe entre la
variable dependiente y las independientes o
predictoras.
Nos mide la proporcin de la variacin total de las
observaciones que se explican mediante la
ecuacin (recta) de regresin

Ejemplo
Juan Escobedo, presidente de la Biblioteca UPAO, se ocupa de estudiar el costo de los libros
de texto para los estudiantes de Arquitectura. l cree que hay una relacin entre el nmero
de pginas en el texto y el precio de venta del libro. Para proporcionar una prueba,
selecciona una muestra de ocho libros de texto actualmente existentes en la librera.
Dibujar un diagrama de dispersin. Comprobar el coeficiente de correlacin.
Libro

Pginas

Precio ($)

Intr. a la Historia de la arquitectura

500

84

Anlisis estructural

700

75

Arte de proyectar

800

99

Arquitectura. Forma, espacio y orden

600

72

Arquitectura sostenible

400

69

Arquitectura e Interiores En Madera

500

81

La cuidad moderna

600

63

Color, espacio y estilo

800

93

nstruya un diagrama de dispersin


DIAGRAMA DE DISPERSION:
100

99
93

90

Precio de libros (en $)


84
81

80

75
70

72
69
63

60
350

400

450

500

550

600

Pginas de libros

650

700

750

800

850

alcule el coeficiente de correlacin


Libro

Pginas Precio($)
X
Y
XY
X2
Y2
Intr. a la Historia Arq.
500
84 42,000
250,000
7,056
nalisis Estr.
700
75
52,500
490,000
5,625
Arte de Proyectar
800
99
79,200
640,000
9,801
Arq. Forma espacio y orden
600
72
43,200
360,000
5,184
Arq. sostenible
400
69
27,600
160,000
4,761
Arq. e interiores en madera
500
81
40,500
250,000
6,561
La cuidad moderna
600
63
37,800
360,000
3,969
Color, espacio y estilo
800
93
74,400
640,000
8,649
Total
4,900
636
397,200 3,150,000

51,606

Sustituyendo en la formula los valores encontrados y


realizando los clculos obtenemos:

n ( X

n(XY ) (X )( Y )
2

) ( X )

n Y Y
2

8(397,200) ( 4,900)( 636)

8(3,150,000 (4,900) 8(51,606) (636)


2

0.614
El coeficiente de correlacin de 0.614 indica una relacin
muy intensa entre la cantidad de pginas y el precio de
los libros.

Calcule e interprete los coeficientes


de determinacin y no determinacin.
Coeficiente de Determinacin: Es el cuadrado del valor del coeficiente
de correlacin (r).
El coeficiente de determinacin se simboliza por R 2 y toma valores
entre 0 y 1.
R2 = ( r )2 = (0.614)2 = 0.37
37% de la variacin en los precios fue debido a la variacin en las pginas de
los libros.
Coeficiente de No Determinacin:
1- R2 = 1-0.37 = 0.63
63% de la variacin en los precios no fue
de los libros.

debido a la variacin en las pginas

Anlisis de regresin
La ecuacin de regresin es: Y' = a + bX, donde:
Y' es el valor pronosticado de la variable Y para un valor seleccionado de X.
a es la ordenada de la interseccin con el eje Y cuando X = 0. Es el valor estimado de Y
cuando X=0
b es la pendiente de la recta, o el cambio promedio en Y' para cada cambio de una unidad
en X.
el principio de mnimos cuadrados se utiliza para obtener a y b.
El principio de mnimos cuadrados se utiliza para obtener a y b. Las
ecuaciones para determinar a y b son:
n ( XY ) ( X )( Y )
n( X 2 ) ( X ) 2
Y
X
a
b
n
n

Ejemplo

Desarrolle una ecuacin de regresin para la informacin dada en el ejemplo anterior que
se puede utilizar para estimar el precio de venta basado en el nmero de pginas.

8(397 ,200 ) (4,900 )( 636 )


8(3,150 ,000 ) (4,900 )

.05143

636
4,900
0.05143
48 .0
8
8

La ecuacin de regresin es:


Y' = 48.0 + .05143X
La ecuacin cruza al eje Y en $48. Un libro sin las pginas costara $48.
La pendiente de la lnea es .05143. El costo de cada pgina adicional es de cinco
cntimos.
El signo del valor de b y el signo del valor de r sern siempre iguales.

Podemos utilizar la ecuacin de regresin para


estimar valores de Y.

El precio de venta estimado de un libro de 800 pginas es $89.14, encontrado por


Y 48 .0 0.05143 X
48 .0 0.05143 (800 ) 89 .14

DIAGRAMA DE DISPERSION:
100

90
f(x) = 0.05x + 48
R = 0.38

Precio de libros (en $)

80
Precio
Linear (Precio)
70

60
350 400 450 500 550 600 650 700 750 800 850

Pginas de libros

El error estndar de estimacin

El error estndar de estimacin mide


la dispersin de los valores
observados alrededor de la lnea de
regresin.
Las frmulas que se utilizan para
comprobar el error estndar son:

s y. x

(Y Y ) 2
n2
2

Y aY bXY
n2

EN EL EJEMPLO ANTERIOR:
Encuentre el error estndar de estimacin para el
problema que implica el nmero de pginas en un
libro y el precio de venta.
s y.x

aY bXY
n2

51,606 48 (636 ) 0.05143 (397 ,200 )


82
10 .408

Vous aimerez peut-être aussi