Vous êtes sur la page 1sur 6

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

APELLIDOS

NOMBRE Tfno

DNI (o Pasaporte)

e-mail

CENTRO ASOCIADO

Fecha

El alumno deber entregar este primer cuadernillo al Profesor-tutor de su Centro Asociado o al Profesor-tutor del campus (segn el caso) que le haya sido asignado antes del 2 de diciembre del 2009.

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

Francis Galton (1884) recogi los datos de 400 personas en las siguientes variables: Edad (23, 24 y 25 aos), Estado Civil (soltero, casado), Color de ojos (Avellana, Azul, Gris, Marrn, Negro, Verde), Residencia (Campo, Ciudad, Suburbio, Mar y Varias), Estatura y Peso. Estos datos fueron publicados en el Journal of the Antropological Institute en 1889 y aparecen recogidos en Vlez y col. (2006)1 pp. 18-19. La estatura en pulgadas ha sido transformada a metros ( 1 pulgada= 25,4 mm ) y el peso en libras a kg ( 1 libra= 0,4536 kg. ). A partir de los datos originales, se obtiene la siguiente tabla:
Color de Ojos Avellana Azul Gris Marrn Negro Verde No consta ni 27 127 111 110 15 3 7 400

1. Complete la siguiente Tabla, calculando las frecuencias relativas o proporciones y los porcentajes
Color de Ojos Avellana Azul Gris Marrn Negro Verde No consta ni 27 127 111 110 15 3 7 400 pi 0,0675 0,3175 0,2775 0,275 0,0375 0,0075 0,0175 1 Pi 6,75 31,75 27,75 27,5 3,75 0,75 1,75 100

2. Represente grficamente, mediante el diagrama de barras y el diagrama de sectores, los datos del ejercicio anterior.

3. A partir de la siguiente tabla, sobre la variable Edad, calcule la media y la varianza.


1

Vlez, R. y col. (2006).Mtodos estadsticos en Ciencias Sociales. Ediciones Acadmicas. Madrid (2 edic.).

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

Edad 23 24 25

ni 144 140 116 400

Media: (23x144 + 24x140 + 25x116) / 400 = 23,93 Varianza: ( (144x232 + 140x242 + 116x252 ) / 400) 23,932 = 0,6451

4. A partir de los datos originales, hemos agrupado la variable Estatura en 6 intervalos obteniendo la siguiente tabla:
Estatura 1,96 - 2,05 1,86 - 1,95 1,76 - 1,85 1,66 - 1,75 1,56 - 1,65 1,46 - 1,55 ni 1 12 126 206 53 2 400

Realice la representacin grfica del polgono de frecuencias.

Frecuencia

Estatura

5. Calcule la media, la desviacin tpica, la mediana y el ndice de asimetra para los datos de la tabla del ejercicio anterior.

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

Media: (2,005x1 + 1,905x12 + 1,805x126 + 1,705x206 + 1,605x53 + 1,505x2) / 400 = 1,729 Desviacin tpica = raz cuadrada de la varianza: Varianza: ( (1x2,0052 + 12x1,9052 + 126x1,8052 + 206x1,7052 + 53x1,6052 + 2x1,5052) / 400) 1,7292 = 0,005559 Desviacin tpica: 0,0745 Mediana: 1,655 + ( (400/2 - 55) / 206 ) x 0,01 = 1,725 ndice de asimetra: (Media Moda) / Desviacin tpica = (1,729 1,705) / 0,0745 = 0,322

6. Para la variable Peso hemos obtenido la siguiente tabla:


PESO 47,6 - 53,5 53,6 - 59,5 59,6 - 65,5 65,6 - 71,5 71,6 - 77,5 77,6 - 83,5 83,6 - 89,5 89,6 - 95,5 95,6 - 101,5 101,6-107,5 ni 13 76 140 103 46 11 5 5 0 1 400

Calcule los percentiles 25, 50 y 75.


P25: 59,55 + ( ((400x25) /100) 89) / 140 ) x 6 = 60,02 P50: 59,55 + ( ((400x50) /100) 89) / 140 ) x 6 = 64,30 P75: 65,55 + ( ((400x75) /100) 89) / 140 ) x 6 = 69,69

7. Cul de las dos variables Estatura y Peso presenta mayor variabilidad? (Realice los clculos oportunos y razone la respuesta).
Media: (50,55x13 + 56,55x76 + 62,55x140 + 68,55x103 + 74,55x46 + 80,55x11 + 86,55x5 + 92,55x5 + 98,55x0 + 104,55x1) / 400 = 65,22 Desviacin tpica = raz cuadrada de la varianza: Varianza: ( (13x50,552 + 76x56,552 + 140x62,552 + 103x68,552 + 46x74,552 + 11x80,552 + 5x86,552 + 5x92,552 + 0x98,552 + 1x104,552) / 400) 65,222 = 61,99 Desviacin tpica: 7,87 Coeficientes de variacin:

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

Estatura: (0,0745 / 1,729) x 100 = 4,31 Peso: (7,87 / 65,22) x 100 = 12,067 La variable Peso presenta una mayor variabilidad (12,07%) que la Estatura (4,31%). Esto es debido a que en el caso del Peso los resultados estn ms dispersos y no estn tan concentrados alrededor de la media como ocurre con los resultados de la Estatura.

8. Para las variables Residencia y Estado Civil, hemos obtenido la siguiente tabla:
ESTADO CIVIL RESIDENCIA Campo Ciudad Suburbio No consta y Otras Total general Casado 5 26 14 1 46 Soltero 58 186 103 7 354 Total general 63 212 117 8 400

Determine si existe relacin entre ellas e interprete el resultado.


Estadstico: Frecuencias tericas: (46x63) / 400 = 7,245 (46x212) / 400 = 24,38 (46x117) / 400 = 13,455 (46x8) / 400 = 0,92 (354x63) /400 = 55,755 (354x212) / 400 = 187,62 (354x117) / 400 = 103,545 (354x8) / 400 = 7,08 X2= (5-7,245)2 / 7,245 + (26-24,38)2 / 24,38 + (14-13,455)2 / 13,455 + (1-0,92)2 / 0,92 + (5855,755)2 / 55,755 + (186-187,62) 2 / 187,62 + (103-103,545)2 / 103,545 + (7-7,08)2 / 7,08 = 0,94 Coeficiente de contingencia: C= Raz cuadrada de 0,94 / (0,94+400) = 0,048 Teniendo en cuenta los valores obtenidos, descubrimos la casi inexistente relacin entre las dos variables dadas.

9. Para las variables Estatura y Peso, tenemos la siguiente representacin grfica:

INTRODUCCIN AL ANLISIS DE DATOS Curso 2009-10 Cuadernillo 1

120,0

100,0

80,0 PESO (kg)

60,0

40,0

20,0

0,0 0,00

0,50

1,00

1,50

2,00

2,50

ESTATURA (m)

Sabiendo que r 2 = 0,42 qu podemos decir de la relacin existente entre la Estatura y el Peso?
r = raz cuadrada de 0,42 = 0,648 Despejando el coeficiente de correlacin de Pearson, podemos ver que la relacin existente entre la Estatura y el Peso es una relacin directa. Por lo tanto, a mayores valores de la variable Estatura tienden a corresponder, en media, valores mayores de la variable Peso y, a valores menores de la variable Estatura tienden a corresponder, en media, valores menores de la variable Peso. La representacin grfica y el valor absoluto del coeficiente nos indican que la relacin lineal entre las dos variables es relativamente fuerte. Teniendo en cuenta que r = 1 indica la correlacin lineal perfecta y r = 0 la ausencia total de correlacin lineal, el valor de nuestro coeficiente es un valor algo intermedio. Sin embargo, obervando que hay un nmero bastante grande de sujetos en la muestra y la relacin causal de las variables Estatura y Peso, vemos de forma ms clara la relacin entre ambas variables.

10. Para las variables Peso y Estatura hemos obtenido la siguiente ecuacin de la recta de regresin: Y=72,06X 59,12 . Qu puntuacin pronosticaremos en el Peso a una persona que ha obtenido un valor de 1,55 en Estatura?
Y= -59,12 + 72,06 x 1,55 = 52,573 kg

Vous aimerez peut-être aussi