Vous êtes sur la page 1sur 40

28/05/2014

1
Estadstica de dos variables (X, Y) en parejas
El objetivo es:
1. Hallar una lnea de recta: Y=bX+a que mejor
se ajuste a la muestra de n pares de datos a fin de
pronosticar Y a partir de X .
Esto se denomina regresin lineal

2. Medir el nivel de asociacin entre las variables X, Y.
Esto se denomina Correlacin
COVARIANZA ENTRE DOS VARIABLES 1
28/05/2014 2
La covarianza de una variable bidimensional
(X,Y) con n valores
) , ( ),..., , ( ), , (
2 2 1 1 n n
y x y x y x
, es la
media aritmtica de los productos de las
desviaciones de cada una de las variables
respecto a su medias respectivas.
) )( (
( (
1 1
) )
y x
n
y x
n
y y x x
s
n
i
i i
n
i
i i
XY



.
La covarianza a diferencia de la varianza, puede ser
negativa.



COVARIANZA ENTRE DOS VARIABLES 2
En teora de la probabilidad y la estadstica la
Covarianza es una medida estadstica inicial que
te permite analizar si existe o no una relacin
lineal entre dos variables.

Ambas variables utilizan una escala de medida a
nivel de intervalo/razn
28/05/2014 3
COVARIANZA ENTRE DOS VARIABLES 3
Una covarianza alta, indica que el valor de una
variable est muy relacionada al valor de la otra
variable.

La covarianza presenta el inconveniente de que
su valor depende de la escala elegida para los
ejes, es decir variar si por ejemplo la altura lo
expresamos en metros o centmetros.

28/05/2014 4
COVARIANZA ENTRE DOS VARIABLES 4
El resultado numrico flucta entre los rangos
- a +, al no tener los lmites establecidos no
puede determinarse el grado de relacin lineal,
slo es posible ver la tendencia.

1.- Si SXY >0 Existe relacin lineal positiva
entre las dos variables.
2.- Si SXY < 0 Existe relacin lineal negativa
entre las dos variables.
3.- Si SXY = 0 No existe relacin lineal entre las
dos variables.


28/05/2014 5
COVARIANZA ENTRE DOS VARIABLES 5
Ejemplo 1: Los valores de dos variables X e Y se
distribuyen segn la siguiente tabla:



Hallar la covarianza de la distribucin
Procedemos a desarrollar los clculos:


28/05/2014 6
X 0 0 1 2 2 2 4 4 4
Y 1 2 3 1 2 3 1 2 3
COVARIANZA ENTRE DOS VARIABLES 6
28/05/2014 7
n X Y X*Y
1 0 1 0
2 0 2 0
3 1 3 3
4 2 1 2
5 2 2 4
6 2 3 6
7 4 1 4
8 4 2 8
9 4 3 12
SUMA 19 18 39
COVARIANZA ENTRE DOS VARIABLES 7
Media X = 19/9 , Media y = 18/9 = 2 , X*Y = 39

SXY = 39/9 19/9*2 = 1/9= 0.11


28/05/2014 8
COVARIANZA ENTRE DOS VARIABLES 8
Ejemplo 2: Los valores de dos variables X e Y se
distribuyen segn la siguiente tabla:




Hallar la covarianza de la distribucin



28/05/2014 9
X 0 0 0 2 2 2 4 4 4
Y 1 2 3 1 2 3 1 2 3
fi 2 1 2 1 4 5 3 2 0
COVARIANZA ENTRE DOS VARIABLES 9
28/05/2014 10
La frmula de la covarianza de una variable
bidimensional (X,Y) con n valores
) , ( ),..., , ( ), , (
2 2 1 1 n n
y x y x y x
, cambia con la presencia de
frecuencias.
) )( (
) )( ( ( (
1 1
) )
y x
n
y x f
n
y y x x f
s
n
i
i i i
n
i
i i i
XY



.



COVARIANZA ENTRE DOS VARIABLES 10







28/05/2014 11
X Y
fi
X*fi Y*fi X*Y*fi
0 1 2 0 2 0
0 2 1 0 2 0
0 3 2 0 6 0
2 1 1 2 1 2
2 2 4 8 8 16
2 3 5 10 15 30
4 1 3 12 3 12
4 2 2 8 4 16
4 3 0 0 0 0
18 18 20 40 41 76
COVARIANZA ENTRE DOS VARIABLES 11
Media X = 40/20=2 , Media y = 41/20 = 2.05 ,
X*Y*fi = 76

SXY = 76/20 (2)(2.05)= -0.3
28/05/2014 12
COVARIANZA ENTRE DOS VARIABLES 12
Una compaa de seguros considera que el
nmero de vehculos (y) que circulan por una
determinada autopista a ms de 120 km/h ,
puede ponerse en funcin del nmero de
accidentes (x) que ocurren en ella. Durante 5
das obtuvo los siguientes resultados:


Calcular la covarianza.
28/05/2014 13
Accidentes (X) 5 2 7 1 9
Vehculos (Y) 15 18 10 8 20
Coeficiente de Correlacin 1
La correlacin trata de establecer la relacin o
dependencia que existe entre dos variables que
intervienen en una distribucin bidimensional.
Debemos determinar si los cambios en una de
las variables influyen en los cambios de la otra.
En caso de que suceda, diremos que las
variables estn correlacionadas o que hay
correlacin entre ellas.
La correlacin entre dos variables no implica, por
si misma, ninguna relacin de causalidad.


28/05/2014 14
28/05/2014 15
Coeficiente de Correlacin 2
El ms conocido es el coeficiente de correlacin lineal
de Pearson, de la variable bidimensional (X, Y) de n
valores
) , ( ),..., , ( ), , (
2 2 1 1 n n
y x y x y x
y se representa por
el resultado de la frmula :
Y X
XY
s s
s
r

Este ndice mide la relacin lineal entre dos variables
aleatorias cuantitativas.
A diferencia de la Covarianza, el coeficiente de
correlacin de Pearson es independiente de la escala de
medida de las variables.
Coeficiente de Correlacin 3
La relacin entre dos variables cuantitativas
queda representada mediante la lnea de menor
ajuste, trazada a partir de la nube de puntos.
Los principales componentes elementales de una
lnea de ajuste y por tanto de una correlacin,
son la fuerza, el sentido y la forma.
La fuerza extrema, mide el grado en que la lnea
representa a la nube de puntos: nube estrecha y
alargada relacin fuerte, nube con tendencia
elptica o circular relacin dbil
28/05/2014 16
Coeficiente de Correlacin 4
El sentido mide la variacin de los valores de X
con respecto a Y:

si X Y , la relacin es positiva
si X Y , la relacin es positiva
si X Y , la relacin es negativa
si X Y , la relacin es negativa

La forma establece el tipo de lnea que define el
mejor ajuste




28/05/2014 17
Coeficiente de Correlacin 5
Interpretacin
El valor del ndice vara en el intervalo 1 r 1
r= +1 indica correlacin positiva perfecta.
Si 0 < r < 1 , existe una correlacin positiva.
r= -1 indica correlacin negativa perfecta.
Si -1 < r < 0 , existe una correlacin negativa.
r= 0 indica que no existe correlacin, pero no
necesariamente implica que las variables son
independientes , ejemplo los valores de una
circunferencia
Se acepta ll r ll 0.75 como un coeficiente de
correlacin aceptable

28/05/2014 18
Coeficiente de Correlacin 6
28/05/2014 19
Ejemplo:
X: Duracin en minutos de la publicidad
Y: nmero de artculos vendidos (Y), resultando:

Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170

a) Trace el diagrama de dispersin, e indique la
tendencia.
b) Calcule el coeficiente de correlacin de Pearson
Coeficiente de Correlacin 7
28/05/2014 20
50
73
69
87
108
128
135
132
148
170
0
20
40
60
80
100
120
140
160
180
0 10 20 30 40 50 60 70 80 90
U
n
i
d
a
d
e
s

V
e
n
d
i
d
a
s

Publicidad en Minutos
Dispersin de la Serie 1
Series1
Coeficiente de Correlacin 8
28/05/2014 21
50
73
69
87
108
128
135
132
148
170
0
20
40
60
80
100
120
140
160
180
0 10 20 30 40 50 60 70 80 90
U
n
i
d
a
d
e
s

V
e
n
d
i
d
a
s

Publicidad en Minutos
Tendencia de los Puntos de Dispersin
Series1
Linear (Series1)
Coeficiente de Correlacin 9
Clculos para el coeficiente de regresin:
28/05/2014 22
n X Y
Xi Yi
Xi*Yi
1 20 50 400 2500 1000
2 30 73 900 5329 2190
3 30 69 900 4761 2070
4 40 87 1600 7569 3480
5 50 108 2500 11664 5400
6 60 128 3600 16384 7680
7 60 135 3600 18225 8100
8 60 132 3600 17424 7920
9 70 148 4900 21904 10360
10 80 170 6400 28900 13600
Suma 500 1100 28400 134660 61800
Coeficiente de Correlacin 10
PromX =500/10=50 , PromY = 1100/10=110
Sxy = 61800/10 (50)(110) = 680
Sx = (28400/10 - 50)^ = 18.43
Sy = (134660/10 - 110)^ = 36.95

r = 680/(18.43*36.95) = 0.99


28/05/2014 23
Coeficiente de Correlacin 11

Ejercicio 1.- Las estaturas y pesos de 10 jugadores
de baloncesto de un equipo son las siguientes:





Calcular el coeficiente de correlacin.

28/05/2014 24
Estatura (X) 186 189 190 192 193 193 198 201 203 205
Peso (Y) 85 85 86 90 87 91 93 103 100 101
Coeficiente de Correlacin 12

Clculos:
28/05/2014 25
n
Xi Yi Xi Yi
Xi*Yi
1 186 85 34596 7225 15810
2 189 85 35721 7225 16065
3 190 86 36100 7396 16340
4 192 90 36864 8100 17280
5 193 87 37249 7569 16791
6 193 91 37249 8281 17563
7 198 93 39204 8649 18414
8 201 103 40401 10609 20703
9 203 100 41209 10000 20300
10 205 101 42025 10201 20705
Suma 1950 921 380618 85255 179971
Coeficiente de Correlacin 12

PromX =1950/10=195 , PromY = 921/10=92.1
Sxy = 179971/10 (195)(92.1) = 37.6
Sx = (380618/10 - 195)^ = 6.0663
Sy = (85255/10 92.1)^ = 6.5642

r = 37.6/(6.0663*6.5642) = 0.94

28/05/2014 26

28/05/2014 27
28/05/2014 28
Regresin Lneal Simple
El objetivo es:
Hallar una lnea de recta: Y=bX+a que mejor se
ajuste a la muestra de n valores (x
i
,y
i
) de (X, Y)

Si el modelo es adecuado nos permitir realizar
pronsticos de Y a partir de X .

El mtodo para hallar la recta es el de Mnimos
cuadrados
28/05/2014 29
Mtodo de mnimos cuadrados
i
Y
X
i
Y = a + bX
i
^
d
i
a
>
^
x
y
y




n
i
i i
n
i
i i
n
i
i
bx a y y y d SCE
1 =
2
1
2
1
2
) ( ) (


28/05/2014 30
Mtodo de mnimos cuadrados
Consiste en hallar los valores de a y b de manera
que hagan mnima, la suma:


n
i
i i
bx a y SCE
1 =
2
)] ( [



a y b se obtienen de las ecuaciones normales:

n
i
n
i
i i
x b na y
1 = 1 =
+

n
i
n
i
i
n
i
i i i
x b x a y x
1 = 1 =
2
1 =
+


28/05/2014 31
Mtodo de mnimos cuadrados


2 2
2
o ,
X
XY
i i
i i i i
s
s
b
x x n
y x y x n
b





x b y a



bX a Y x b y a e De NOTA.
resulta,
) ( x X b y Y


28/05/2014 32
Ejemplo
X: Duracin en minutos de la publicidad
Y: nmero de artculos vendidos (Y), resultando:

Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170

a) Trace el diagrama de dispersin, e indique la
tendencia.
b) Halle la recta de regresin de mnimos
cuadrados con el fin de predecir las ventas.

X: Duracin en minutos de la publicidad
Y: nmero de artculos vendidos (Y), resultando:

Semana 1 2 3 4 5 6 7 8 9 10
Publicidad X 20 30 30 40 50 60 60 60 70 80
Ventas Y 50 73 69 87 108 128 135 132 148 170

a) Trace el diagrama de dispersin, e indique la
tendencia.
b) Halle la recta de regresin de mnimos
cuadrados con el fin de predecir las ventas.

28/05/2014 33
Ejemplo
Continuando con el ejemplo anterior
c) Estime la venta si en una semana se hacen
100 minutos de propaganda.
d) Calcule el coeficiente de correlacin.
e) Si en la novena semana se incrementara la
publicidad en 5 minutos, en cuanto se estima
se incrementa la venta?.

28/05/2014 34
Particin de la varianza
La varianza de Y es :
n
y y
s
n
i
i
Y

1
2
2
) (
.
X
Y
_
_
i
i
^
y
y
y
x

) ( ) ( y y y y y y
i i i i


Error total Error no Explicado Error explicado
28/05/2014 35
Coeficiente de determinacin
2
1
2
1
2
1
) ( ) ( ) ( y y y y y y
i
n
i
i i
n
i
i
n
i




SCT SCE SCR

SCT
SCR
r
2
: es in determinac de coef. El

1
2
r
SCT
SCE



28/05/2014 36
Coeficiente de determinacin
1. De
1
2
r
SCT
SCE

se tiene
1 0
2
r
.

Entonces,
1 1 r
.

2) r
2
=1, slo si, SCE=0, o slo si,
i i
y y


Entonces, todos los
i
y
estn en la recta de
regresin.

Existe correlacin perfecta entre X e Y.


28/05/2014 37
Coeficiente de determinacin
3) r
2
= 0, slo si, SCR=0, o slo si,
y y
i



Entonces, no hay correlacin ni regresin.

4) El coeficiente de determinacin r
2
, es una
medida de la proximidad del ajuste de la recta de
regresin. Cuanto mayor sea el valor de r
2
, mejor
ser el ajuste y ms til la recta de regresin
como instrumento de prediccin.


28/05/2014 38
Ejemplo
Al investigar la relacin entre el precio de venta y el
precio de costo , se ha encontrado que la venta tiene
una media de 40 y desviacin estndar de 10 y que
el costo tiene una media de 25 y desviacin estndar
de 5.
Si el ndice de correlacin entre la venta y el costo es
0.95,
a) Qu % de la varianza de la demanda es explicada
por la ecuacin de la demanda sobre el precio?
b) Estime la demanda si el precio es de 30.


28/05/2014 39
Invarianza de b y r
Si se hacen X=X h, Y=Y h en X o Y o en ambos,
b y r no cambian, esto es:

2 2
'
2
' '
2
X
Y X
X
Y X
X
Y X
X
XY
s
s
s
s
s
s
s
s
b




.
'
'
'
'
' '
' '
Y X
XY
Y X
Y X
Y X
Y X
Y X
XY
s s
s
s s
s
s s
s
s s
s
r


28/05/2014 40
Ejemplo
Al estudiar la relacin entre el costos(X) y las
utilidades (Y) en dlares de ciertos productos a partir
de una muestra se obtuvo la siguiente informacin:
S
X
=5, S
Y
=4,
x
100,
y
50, Y260.76X.
a) Si cada valor del costo se aumenta en $3 y el
valor correspondiente a la utilidad se aumenta en
6 $, en cuanto se estima la utilidad para un costo
de $120?.
b) Qu porcentaje de la varianza de las utilidades es
explicada por la regresin de utilidades sobre
costos?.




Rp. a) Y'560.76(X'103), 68.92, b) r0.95, r
2
0.9025
el 90.25%

Vous aimerez peut-être aussi