Vous êtes sur la page 1sur 8

IES CORVERA 1 MATEMTICAS CC.

SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

TEMA 10: ESTADSTICA BIDIMENSIONAL


BLOQUE III: ESTADSTICA y PROBABILIDAD
10.1.- DISTRIBUCIONES BIDIMENSIONALES. NUBES DE PUNTOS. CORRELACIN.
Consideremos un colectivo de n individuos. Estudiamos dos caracteres determinados por
dos variables x (notas de un examen de Matemticas e y (notas de un examen de Economa).
El conjunto de pares de valores (x1,y1), (x2,y2), (x3,y3), ............, (xn,yn), recibe el nombre de
distribucin bidimensional. Estos pares se pueden representar en un ejes de coordenadas formando
el denominado diagrama de dispersin o nube de puntos de la distribucin.
La relacin que puede existir entre las dos variables recibe el nombre de correlacin. En
este curso solamente trataremos la correlacin lineal, aquella donde los puntos de la nube se
ordenan entorno a una recta (recta de regresin) que marca la tendencia de la nube.
La correlacin puede ser positiva: si al aumentar una variable, tambin aumenta la otra; o
negativa: si al aumentar una variable, disminuye la otra.
Asimismo, la correlacin puede ser fuerte: si los puntos de la nube estn suficientemente
prximos a la recta de regresin; o dbil: los puntos de la nube estn dispersos sin que exista una
recta que sirva de ajuste.
Siguiendo con el ejemplo de los exmenes
de Matemticas (eje OX) y Economa (eje OY),
realizados a 6 grupos de alumnos de 1 de Sociales;
podemos sacar las siguientes conclusiones:
El grupo A presenta una correlacin fuerte
(perfecta, al estar todos los puntos sobre la recta
de regresin) y positiva (al aumentar las notas de
Matemticas, tambin aumentan las de Economa).
En este grupo los alumnos estudiaron de un modo
similar las dos asignaturas, teniendo para ellos un
mayor grado de dificultad la Economa.
El grupo B presenta una correlacin dbil
(los puntos estn separados de la recta de
regresin) y negativa (al aumentar las notas de
Matemticas, disminuyen las de Economa). En este
grupo una parte se decantaron por estudiar mejor
Matemticas y otra parte por dedicar ms tiempo a la Economa; una tercera parte estudiaron
ambas asignaturas de un modo similar.
El grupo C presenta una correlacin fuerte (los puntos estn prximos a la recta de
regresin) y negativa (al aumentar las notas de Matemticas, disminuyen las de Economa).
El grupo D presenta una correlacin muy dbil (los puntos estn muy separados de la recta
de regresin) y positiva (al aumentar las notas de Matemticas, aumentan las de Economa).
El grupo E no presenta correlacin, el diagrama de dispersin no se ajusta a ninguna recta.
El grupo F presenta una correlacin fuerte (los puntos estn prximos a la recta de
regresin) y positiva (al aumentar las notas de Matemticas, aumentan las de Economa).

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

10.2.- MEDIDA DE LA CORRELACIN. CENTRO


COEFICIENTE DE CORRELACIN LINEAL

DE

GRAVEDAD, COVARIANZA

Vamos obtener los parmetros estadsticos que nos permitirn clasificar de un modo preciso
la correlacin que existe entre las dos variables de una distribucin bidimensional.
El centro de gravedad de la nube de puntos, por donde deber pasar la recta de regresin
cuya ecuacin se obtendr en la prxima pregunta, es el punto cuyas coordenadas son ( x , y ); es
decir, las medias aritmticas de cada una de las variables.
n

xi . f i
x

y .f
i

i 1

i 1

La covarianza es la media aritmtica de los productos de las desviaciones tpicas de cada


variable respecto a su media. Se calcula mediante una de las siguientes expresiones:
n

(x
xy

x ).(yi y ). f i

i 1

La expresin de la derecha
es ms cmoda para obtener
numricamente la covarianza.

x .y . f
i

xy

i 1

x. y

El coeficiente de correlacin, que es el que realmente permite clasificar la correlacin,


viene dado por la expresin:

xy
x . y

xi .f i
x

donde, xy es la covarianza.
x y y son las desviaciones tpicas de cada variable.

i 1

2
i

i 1

.f i
y

Propiedades del coeficiente de correlacin:


No tiene dimensiones.
r toma valores comprendidos entre 1 y +1.
La correlacin de una distribucin bidimensional se determina del modo:
r=-1 r=-0,8

r=0

r=+0,8 r=+1

Perfecta y positiva

Fuerte y positiva

Dbil y positiva

Nula

Dbil y negativa

Fuerte y negativa

Perfecta y negativa

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

EJERCICIOS y PROBLEMAS:
1) Asigna a las nubes de puntos de la pregunta 10.1 los siguientes coeficientes de correlacin
lineal:
r=0,46 ; r=-0,94 ; r=1 ; r=0 ; r=0,9 y r=-0,63.

10.3.- LA RECTA DE REGRESIN LINEAL


Dado un diagrama de dispersin (x1,y1), (x2,y2), (x3,y3), ............, (xn,yn), la recta que mejor se
ajusta a esta nube de puntos se obtiene empleando el mtodo de los mnimos cuadrados. Este
mtodo se basa en tcnicas de clculo diferencial, cuyo soporte bsico es el concepto ya estudiado
de derivada.
Segn este mtodo, la recta de regresin lineal viene caracterizada por:
Pasa por el punto ( x , y ), centro de gravedad de la distribucin bidimensional.
Tiene por pendiente m el llamado coeficiente de regresin:

xy
x

Recta de regresin de y sobre x

yy

xy
x2

.( x x )

Recta de regresin de x sobre y

xx

xy
y2

xy
y

.( y y )

EJERCICIOS y PROBLEMAS:
2) La media de los pesos de una poblacin es de 65 kilogramos y la de las estaturas 170
centmetros. Las desviaciones tpicas son 5 kilogramos y 10 centmetros, respectivamente. La
covarianza de ambas variables de 40.
a) Obtn la recta de regresin siendo x los pesos.
b) Cunto estimas que pesar una persona que mida 180 centmetros?
c) Indica la correlacin que existe entre los pesos y las estaturas.

3) Dado el siguiente conjunto de datos bidimensionales:


x
y

1
2,1

1
2,5

2
3,1

3
3,0

4
3,8

4
3,2

5
4,3

6
3,9

6
4,4

a) Sin efectuar clculos, razona cul es su coeficiente de correlacin: r=0,3; r=-0,9; r=-0,1; r=0,92.
b) Cul es su recta de regresin: y=0,38.x+2,03; y=0,38.x+5,53; y=-1,38.x-2,03; y=-0,72.x+2,03?

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

10.4.- OBTENCIN DE LOS PARMETROS DE CORRELACIN CON LA CALCULADORA


A continuacin se indica cmo se obtienen los parmetros de correlacin con una calculadora
Mode 3 REG (1 LIN de regresin lineal). Si la calculadora cientfica solamente tiene
modo SD (estadstico unidimensional) habr que calcular por separado los parmetros
(media, varianza y desviacin tpica) correspondientes a cada una de las variables, as
como la covarianza.
Se borran posibles datos anteriores mediante SHIFT MODE SC l y se le da al
igual; puesto que, aunque se apague la calculadora, los datos no se borran.
Se introducen los datos: xi , y i ; f i M+

Se obtienen los parmetros: SHIFT 2

Medias.....................:

Desviaciones tpicas.......: xn ; yn
Coeficiente de correlacin: r
Recta de regresin........: A , B (coeficiente de regresin m) y=A+Bx
Estimaciones.: x , y

EJERCICIOS y PROBLEMAS:
4) La siguiente tabla muestra el nmero de grmenes patgenos por centmetro cbico de un
determinado cultivo segn el tiempo transcurrido:
N de HORAS (x)
N de GRMENES (y)

0
20

1
26

2
33

3
41

4
47

5
53

a) Obtn la recta de regresin para poder predecir el nmero de grmenes en funcin del tiempo.
b) Qu cantidad de grmenes por centmetro cbico es predecible encontrar cuando hayan
transcurrido 6 horas? Es buena esa prediccin?

5) El nmero de horas dedicadas semanalmente al estudio de la asignatura de Matemticas y la


calificacin obtenida en los exmenes por 6 personas aparecen en la siguiente tabla:
N HORAS DE ESTUDIO (x)

20

16

30

23

34

24

CALIFICACIN EXAMEN (y)

6,5

8,5

9,5

a) Califica la correlacin entre las dos variables.


b) Obtn la recta de regresin.
c) Aprobara una persona habiendo estudiado 10 horas a la semana?
d) Cuntas horas, minutos y segundos debe estudiar una persona para aprobar?

6) Durante el mes de Junio han sido observadas diariamente las temperaturas medias y las ventas
de helados de cierta poblacin, obtenindose la siguiente informacin:
Ventas (miles) y

Temperatura (C) x

[18, 20)

[20, 24)

[24, 30)

[150, 250)

10

[250, 300)

[300, 500)

10

a) Estudiar, a la vista de la informacin anterior, la dependencia existente entre las dos


variables.
b) Obtener la recta de regresin.

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

TEMA 10.- ESTADSTICA BIDIMENSIONAL

EJERCICIOS y PROBLEMAS FINALES


7) Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que dedica
diariamente a dormir y a ver la televisin. La clasificacin de las respuestas ha permitido elaborar
la tabla:
N HORAS DORMIDAS (x)
N HORAS TELEVISIN (y)
FRECUENCIAS ABSOLUTAS

6
4
3

7
3
16

8
3
20

9
2
10

10
1
1

a) Hallar la media y la mediana del nmero de horas dedicadas a dormir.


b) Hallar el porcentaje de individuos que ven la televisin por encima de la media.
c) Hallar el coeficiente de correlacin lineal. Interpretacin.
d) Obtn la ecuacin de la recta de regresin.
e) Si una persona duerme 7 horas y cuarto, cunto tiempo cabe esperar que vea la televisin?

8) Las puntuaciones obtenidas por los alumnos de un curso en una batera de test que mide la
habilidad abstracta (x) y el razonamiento verbal (y) son las siguientes:
x
[25,
[35,
[45,
[55,

y
35)
45)
55)
65)

20
6
3
---------------------

30
4
6
2
--------------

40
-----------1
5
3

50
--------------------3
7

a) Existe correlacin entre ambas variables?


b) Obtn la recta de regresin lineal.
c) Si un alumno o alumna ha obtenido una puntuacin de 70 puntos en razonamiento verbal, en
cunto se estima su habilidad abstracto?

9) En 5 estudios estadsticos se han obtenido los siguientes coeficientes de correlacin lineal:


r=-0,98; r=0,93; r=0,05; r=0,71 y r=-0,62.
Asocia cada uno de ellos con la corespondiente nube de puntos justificando las respuestas.
A

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

10) Dada una distribucin bidimensional, se sabe que x =1 e y =1, puede y=-3x+5 ser la recta de
regresin lineal de la distribucin?
_________________________________________________________________________
11) Una compaa discogrfica ha recopilado la siguiente informacin sobre el nmero de conciertos
dados, durante el verano, por 15 grupos musicales y las ventas de CD de estos grupos (expresadas
en miles de CD):
CD ( y ) /conciertos ( x )

[1, 5)

[10, 30)

[30, 40)

[40, 80)

[5, 10)

[10, 20)

a) Existe correlacin entre ambas variables?


b) Obtn la recta de regresin lineal.
c) Si un grupo musical ha vendido 18000 CD, qu n de conciertos es previsible que d?

12) Una distribucin bidimensional (xi, yi) tiene coeficiente de correlacin r=-0,96; siendo las
medias x =1 e y =2. Asimismo se sabe que su recta de regresin es una de las siguientes rectas:
y = -x + 2

y = 3x - 1

y = -2x + 4

y=x +1

Indica, razonadamente, cul es la ecuacin de la recta de regresin.

13) Una persona se somete a una dieta de adelgazamiento durante 5 semanas. A continuacin, se
detalla su peso al trmino de cada una de las semanas:
SEMANA DE DIETA (x)

PESO EN KILOGRAMOS (Y)

88,5

87

84

82,5

79

a) Calcular el coeficiente de correlacin lineal, calificando la correlacin que existe entre las
dos variables.
b) Obtn la recta de regresin.
c) Qu peso es de esperar que alcance esa persona si mantiene la dieta dos semanas ms?
d) Al cabo de cuntas semanas, de seguir con la dieta, habr llegado a los 70 kilogramos?

14) En una distribucin estadstica bidimensional el valor del coeficiente de correlacin lineal entre
la variable x, peso (en kilogramos) y la variable y, estatura (en centmetros), es 0,84. Se sabe
que x

PESO=68

kilogramos, PESO=5 kilogramos,

ESTATURA=170

centmetros y ESTATURA=10

centmetros. Obtn:
a) La covarianza de la distribucin.
b) El peso de un individuo que meda 175 centmetros.
c) La estatura de un individuo de 58 kilogramos.

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

15) En un grupo de participantes en un concurso, se ha analizado conjuntamente el tiempo que


dedicaron a la preparacin de las pruebas (x, en horas) y la puntuacin global obtenida (y). La
informacin correspondiente aparece recogida en la tabla siguiente:
0 x 10

10 x 15

15 x 25

25 x 50

0 y 5

5 y 15

15 y 30

30 y 50

Estudia el grado de correlacin lineal existente entre ambas variables. Interpreta el resultado.

16) De dos muestras, una de padres y otra de hijos, se han obtenido los siguientes parmetros:

PADRES=168

centmetros,

PADRES=5 centmetros,

HIJOS=170

centmetros y

HIJOS=7,5

centmetros. El coeficiente de correlacin lineal entre las tallas de hijos y padres es 0,9.
Estimar la talla de dos hijos si la talla de sus padres fueran 160 y 180 centmetros,
respectivamente.

17) Las tarifas de Paquete azul del servicio de Correos, correspondientes al ao 2008, son las
que figuran en la siguiente tabla:
Peso (en kilogramos) x

10

15

20

Tarifa (en euros) y

3,95

4,55

5,35

7,50

9,10

a) Existe correlacin entre las dos variables? Clasifcala.


b) Obtn la ecuacin de la recta de regresin.
c) Cunto tendremos que pagar por un paquete de 7 kilogramos?

TEMA 10.- ESTADSTICA BIDIMENSIONAL


SOLUCIONES A LOS EJERCICIOS Y PROBLEMAS
1) Asigna a las nubes de puntos de la pregunta 8.1 los siguientes coeficientes de correlacin.....
Soluciones: A r=1 ; B r=-0,63 ; C r=-0,94 ; D r=0,46 ; E r=0 ; F r=0,9.

2) La media de los pesos de una poblacin es de 65 kilogramos y la de las estaturas......


Soluciones: a) y =1,6.x + 66 ; b) 71,25 kilogramos ; c) correlacin fuerte y positiva.

3) Dado el siguiente conjunto de datos bidimensionales.....


Soluciones: a) r=0,92; b) y=0,38.x+2,03.

4) La siguiente tabla muestra el nmero de grmenes patgenos por centmetro cbico.....


Soluciones: a) y=6,74.x + 19,81 ; b) 60,27 bacterias; esta prediccin es muy buena puesto
que la correlacin es muy fuerte (r=0,99895).

5) El nmero de horas dedicadas al estudio de la asignatura de Matemticas.....


Soluciones: a) correlacin positiva y fuerte (r=0,975) ; b) y=0,2.x+2,78 ; c) no 4,78;
d) al menos 11 horas y 6 minutos.

IES CORVERA 1 MATEMTICAS CC. SOCIALES

TEMA 10: ESTADSTICA BIDIMENSIONAL

6) Durante un mes han sido observadas diariamente las temperaturas medias y las ventas......
Soluciones: a) correlacin positiva y fuerte (r=0,94) ; b) y=22,88.x-230,99.

7) Se ha solicitado a un grupo de 50 individuos informacin sobre el nmero de horas que dedica.....


Soluciones: a) x = 7,8 horas y Me = 8 horas ; b) 78% ; c) r=-0,879; por tanto, la
correlacin es negativa y fuerte ; d) y=-0,545.x+7,071 ; e) 3 horas y 7 minutos.

8) Las puntuaciones obtenidas por los alumnos de un curso en una batera de test....
Soluciones: a) correlacin positiva fuerte (r=0,837) ; b) y=0,82.x-1,9 ; c) 87,68 puntos.

9) En 5 estudios estadsticos se han obtenido los siguientes coeficientes de correlacin lineal.....


Solucin: A r=0,05 ; B r=0,71 ; C r=-0,98 ; D r=0,93 ; E r=-0,62.

10) Dada una distribucin bidimensional, se sabe que x =1 e y =1, puede y=-3x+5 ser la recta....
Solucin: no, la recta de regresin pasa por el centro de gravedad ( x =1, y =1), y el punto
( x =1, y =1) y=-3x+5.
_______________________________________________________________
11) Una compaa discogrfica ha recopilado la siguiente informacin sobre el n de conciertos...
Soluciones: a) correlacin positiva y fuerte (r=0,814); b) y=0,231.x+0,113; c) 77 conciertos.

12) Una distribucin bidimensional (xi, yi) tiene coeficiente de correlacin r=-0,96.....
Solucin: y = -2x + 4. Al ser r negativo, la pendiente de la recta tiene que ser negativa;
adems, es la recta que contiene al centro de gravedad ( x =1, y =2).

13) Una persona se somete a una dieta de adelgazamiento durante 5 semanas.......


Soluciones: a) correlacin negativa y fuerte (r=-0,99);b) y=-2,35.x+91,25;c) 74,8 kg
d) 9 semanas.

14) En una distribucin estadstica bidimensional el valor del coeficiente de correlacin.....


Soluciones: a) covarianza=42; b) 71 kilogramos; c) 153 centmetros.

15) En un grupo de participantes en un concurso, se ha analizado conjuntamente el tiempo...


Solucin: la correlacin es positiva pero dbil (r=0,70); as, en los resultados de las pruebas
inciden otros factores adems del tiempo dedicado a su preparacin.

16) De dos muestras, una de padres y otra de hijos, se han obtenido los siguientes parmetros...
Solucin: 159,2 y 186,2 centmetros, respectivamente.

17) Las tarifas de envo de pequeos paquetes del servicio de Correos....


Soluciones: a) correlacin positiva y muy fuerte (r=0,985); b) y=0,291.x+3,067; c) 5,10 .

Vous aimerez peut-être aussi