Vous êtes sur la page 1sur 21

En ocasiones nos puede interesar estudiar si existe o no

algn tipo de relacin entre dos variables aleatorias. As, por


ejemplo, podemos preguntarnos si hay alguna relacin entre
las notas de la asignatura Estadstica I y las de Matemticas I.
CONCEPTO: Existe correlacin entre dos variables si una de
ellas est relacionada con la otra de alguna manera.
SUPUESTOS: LOS PARES DE DATOS (X, Y) TIENEN UNA
DISTRIBUCION NORMAL BIVARIABLE. PARA CUALQUIER
VALOR FIJO DE X, LOS VALORES CORRESPONDIENTES
A Y, DEBEN TENER UNA DISTRIBUCION EN FORMA DE
CAMPANA Y VICEVERSA.

En particular, nos interesa cuantificar la intensidad de la


relacin lineal entre dos variables. El parmetro que nos
da tal cuantificacin es el coeficiente de correlacin lineal
de Pearson r, cuyo valor oscila entre 1 y + 1 :
COEFICIENTE DE CORRELACION LINEAL (r) : mide la fuerza
de la relacin lineal entre los valores X y Y apareados en una
muestra. En algunos textos se le puede decir Coeficiente de
Correlacin de momento producto de Pearson.
REDONDEO DEL COEFICIENTE DE CORRELACION LINEAL:
Se redondea a tres posiciones decimales. Se redondea hasta
llegar la respuesta final y no en operaciones intermedias.

CUANDO HAY CORRELACIN


LINEAL POSITIVA (CERCANO A + 1)
SI AUMENTA X TAMBIEN
AUMENTA Y,

CUANDO HAY CORRELACIN


LINEAL NEGATIVA (CERCANO A - 1)
SI AUMENTA X DISMINUYE Y,
SI DISMINUYE X AUMENTA Y

ES POSIBLE PESAR UN OSO CON CINTA METRICA?


Algunos investigadores han estudiado osos anestesiados
para poder realizar algunas mediciones como la longitud y el
peso. En general es problemtico pesar un oso anestesiado
en su ambiente natural ya que son muy pesados.
Con los datos de la siguiente tabla, calcule el valor del
coeficiente de correlacin lineal, para determinar si existe o
no una relacin entre la longitud y los pesos de los osos,
utilice un nivel de significancia del 0.05.
LONGITUDES Y PESOS DE OSOS MACHO
x

LONGITUD
(pulg)

53

67.5

72

72

73.5

68.5

73

37

PESO (lb)

80

344

416 348

262

360

332

34

NOTACION PARA EL COEFICIENTE DE CORRELACION


LINEAL
n =
x=

representa el nmero de pares


de datos presentes.
Suma de todos los puntajes x

x=
Cada puntaje x se debe elevar al
cuadrado y luego todos deben sumarse
2

( x ) = Indica que los puntajes x deben


sumarse y el total debe elevarse al
cuadrado.
xy = Indica que cada puntaje x
primero se debe multiplicar con y, luego
se suman todos los productos.

r = representa el coeficiente de correlacin lineal para


una muestra.
p = representa el coeficiente de correlacion lineal para
una poblacin.
EJEMPLO: Con los datos de la tabla de las longitudes y pesos
de los Osos macho, calcule el valor del coeficiente de
correlacin lineal r.
Longitud
(pulg) x

Peso (lb)
y

53

80

4,240

2809

6400

67.5

344

23220

4556.25

118336

72

416

29952

5184

173056

72

348

25056

5184

121104

73.5

262

19257

5402.25

68644

68.5

360

24660

4692.25

129600

73

332

24236

5329

110224

37

34

1258

1369

1156

516.5

2176

151879

34525.75

728520

APLICAMOS LA FORMULA DE r

= _______8(151,879) (516.5)(2176)_____________
__________________ ________________
V8(34,525.75) (516.5) 2V 8(728,520) (2176) 2

______91,128_________
________ _________
V 9433.75 V 1,093,184

= 0.897

HAY DOS TIPOS DE INTERPRETACIONES:

1.- TRADICIONAL o VAGA: Si r encontrado es cercano a


cero, no existe una correlacin lineal significativa entre X y Y.
Si r es cercana a -1 +1, se concluye que si existe una
correlacin lineal significativa entre X y Y.
2.- ESPECIFICA A TRAVES DE TABLA PREDETERMINADA: Si
el valor absoluto de r excede el valor de la tabla 10,
concluimos que existe una correlacin lineal significativa, en
caso contrario no hay suficientes indicios para apoyar de que
existe una correlacin lineal significativa.

PRUEBA FORMAL DE HIPOTESIS PARA


CORRELACIONES.
SE PARTE DE QUE : Ho : p = 0 (No existe correlacin lineal)
Ha : p = 0 (Existe una correlacin lineal)
EL ESTADISTICO DE PRUEBA ES t:
t=

r_____

1 - r_
n - 2

VALORES CRITICOS: Utilice la tabla A-3, CON n 2 GRADOS DE


LIBERTAD. SI t > VALOR CRITICO DE LA TABLA A-3 RECHACE LA
Ho, SI t < VALOR CRITICO DE LA TABLA A-3 ACEPTAR LA Ho.

UTILIZANDO EL VALOR DE r DEL PROBLEMA DE LOS OSOS


MACHO, REALICE LA PRUEBA DE HIPOTESIS PARA VERIFICAR
SI EXISTE O NO CORRELACION LINEAL SIGNIFICATIVA.
1.

t=

r_____
2

___0.897____ =

1 - r_
n - 2

1 - 0.804609
8 - 2

___0.897____
0.18045821

___0.897____

0.195391
6

4.971

EL VALOR CRITICO DE LA TABLA A-3 ES t = 2.447, QUE


CORRESPONDE A UN NIVEL DE SIGNIFICANCIA DE 0.05,
DIVIDIDA ENTRE DOS COLAS Y EL NUMERO DE GRADOS DE
LIBERTAD ES n 2. POR LO TANTO t > VALOR CRITICO,
DEBEMOS RECHAZAR LA Ho. Y ACEPTAR LA Ha, QUE
INDICA QUE SI EXISTE CORRELACION LINEAL SIGNIFICATIVA.

EJEMPLO 2: EMBARCACIONES DE PLACER QUE SE


REGISTRARON EN FLORIDA (EN DECENAS DE MILES) Y
MUERTES DE MANATIES QUE SE RELACIONAN CON BARCOS,
UTILICE UN NIVEL DE SIGNIFICANCIA DE 0.01; CUAL ES LA
PROYECCION DE MANATIES MUERTOS, CUANDO SE
AUTORICEN 1,250,000 EMBARCACIONES.
AO

91

92

93

94

95

96

97

98

99

00

X
BARCOS

68

68

67

70

71

73

76

81

83

84

Y
MUERTES

53

38

35

49

42

60

54

67

82

78

10

x = 741
2

y = 33,456

x = 55,289
y = 558
xy = 42,214

= _______10(42,214) (741)(558)_____________
__________________
________________
V10(55,289) (741) 2
V 10(33,456) (558) 2

r = 0.921

r > 0.716,

LA TABLA A-6 AL 0.01 ES 0.716

por lo tanto si existe correlacion lineal entre X y Y.

ESTATURAS Y PESOS DE SUPERMODELOS: ABAJO SE PRESENTAN


LAS ESTATURAS (EN PULGADAS) Y LOS PESOS (EN LIBRAS) DE LAS
SUPERMODELOS. EXISTE CORRELACION?. PRUEBELO AL 0.01 DE
NIVEL SIGNIFICANCIA.

X
ESTATURA
(PULG)

70

70.5

68

65

70

70

70

70

71

Y PESO
(LBS)

117

119

105

115

119

127

113

123

115

SI HAY CORRELACION, ENCUENTRE EL PESO PROBABLE DE UNA


MODELO QUE MIDA 75 PULG.

EN LAS CORRELACIONES ANALIZAMOS DATOS


APAREADOS CON EL PROPOSITO DE DETERMINAR SI
EXISTIA UNA CORRELACION LINEAL SIGNIFICATIVA
ENTRE DOS VARIABLES. AHORA QUEREMOS DESCRIBIR
LA RELACION ENCONTRANDO LA GRAFICA Y LA
ECUACION DE LA RECTA QUE LA REPRESENTA.
ESTA LINEA RECTA SE DENOMINARA LINEA DE
REGRESION Y SU ECUACION SE DENOMINA ECUACION
DE REGRESION.

DADA UNA COLECCION DE DATOS DE MUESTRA


APAREADOS, LA ECUACION DE LA REGRESION ES IGUAL:
^

y = b0+ b1x

ESTA DEFINICION EXPRESA UNA RELACION ENTRE X


(llamada variable independiente) y Y^ (llamada variable
dependiente). b0 es la ordenada al origen y b1 es la
pendiente.

b0 =

y) ( x

)-(

x)

x ) - ( x)

n ( xy)
2

- (

xy)

n(

b1 =

x) ( y)

n( x ) - ( x)

Ordenada al origen
pendiente

EJEMPLO: Utilizando la tabla de las longitudes y pesos de los


Osos, en el cual el coeficiente de correlacin lineal es igual a
0.897. Obtenga ahora la ecuacion de regresion de la linea recta
que relaciona x con y.

COMO RECORDARAN LOS DATOS QUE OBTUVIMOS FUERON


LOS SIGUIENTES:
n

x = 34,525.75
2

x = 516.5

y = 728,520

y = 2176

xy = 151,879

AHORA UTILIZAMOS LAS FORMULAS, DE LA PENDIENTE Y


DE LA ORDENADA DE ORIGEN.
b1 = 9.65979 = 9.66
b0 = - 352

LA ECUACION ENTONCES ES :
^
y = - 352 + 9.66x

SI LA LONGITUD Y EL PESO DE LOS OSOS TIENEN UNA


CORRELACION LINEAL SIGNIFICATIVA, Y SABIENDO SU
ECUACION DE REGRESION. SI SE MIDE UN OSO Y SE
DETERMINA QUE TIENE UNA LONGITUD DE 71 Pulg,
PREDIGA SU PESO.
y^ = - 352 + 9.66x
y^ = - 352 + 9.66 (71)

= 334 lbs

UN OSO DE 71 pulg, DE LONGITUD ES PROBABLE QUE


PESE ALREDEDOR DE 334 LIBRAS.

PUNTOS PARA USAR LA ECUACION DE REGRESION:


1.- SI NO HAY UNA CORRELACION LINEAL SIGNIFICATIVA,
NO USE LA ECUACION DE REGRESION.
2.- SI USA LA ECUACION DE REGRESION PARA HACER
PREDICCIONES, NO SE SALGA DEL AMBITO DE LOS DATOS
DE MUESTRA DISPONIBLES.
3.- UNA ECUACION DE REGRESION BASADA EN DATOS
VIEJOS NO NECESARIAMENTE SIGUE SIENDO VALIDA EN
EL PRESENTE.
4.- NO HAGA PREDICCIONES ACERCA DE UNA POBLACION
DISTINTA DE LA POBLACION DE LA CUAL SE EXTRAJO LA
MUESTRA DE DATOS.

Embarcaciones de placer (en decenas de miles)


y muertes de Manaties.
Ao

Barcos (x)

Muertes de
Manaties (y)

1991

68

53

1992

68

38

1993

67

35

1994

70

49

1995

71

42

1996

73

60

1997

76

54

1998

81

67

1999

83

82

2000

84

78

Vous aimerez peut-être aussi