Vous êtes sur la page 1sur 11

Gua N 1: Estadstica Descriptiva

Profesor: Gonzalo Cruz R. 1.-Determine si las siguientes variables son discretas o continuas: a) Nmero de habitantes por kilmetro cuadrado b) Nmero de bacterias de cierto tipo, por mililitro c) Densidad de diferentes muestras de un mismo lquido d) Nmero de frutos de un rbol de la misma especie e) Velocidad de un vehculo al pasar por un determinado punto f) Puntuaciones obtenidas en un test por un grupo de personas g) Superficie dedicada a cierto cultivo, por hectreas, en un municipio h) Peso de un nio al cumplir 3 aos

2. Determine si las siguientes afirmaciones son verdaderas o falsas, justificando su aseveracin: a) Cuando las variables son medidas a nivel intervalar pueden recategorizarse para expresarlas en una escala ordinal, sin embargo no se puede hacer a la inversa b) Es imposible graficar cuando los datos estn medidos en nivel nominal ya que no hay registros de frecuencia para construir los grficos.

3. Comente: "La mejor medida de tendencia central es la media aritmtica, por eso la utilizaremos siempre salvo que no se conozcan los valores extremos de la variable"

4. El tiempo de espera de 322 pacientes, para ser atendidos en cierto ambulatorio mdico, es el que se muestra en la siguiente tabla: Tiempo de espera (minutos) [0, 5) [5, 10) [10, 15) [15, 20) [20, 25) Nmero de pacientes 3 35 98 63 55

[25, 30) [30, 35) [35, 40) [40, 45) [45, 50] a) Calcule los cuartiles y deciles 2 y 7

44 12 6 5 1

b) Si consideramos a los pacientes que esperan media hora o ms, Qu porcentaje representan del total? c) Cuntos pacientes esperan entre 7 y 23 minutos?, Qu porcentaje representan del total? 5. Los siguientes datos corresponden a los pesos de los bebs nacidos durante un cierto intervalo de tiempo en un hospital: 1,814 4,536 3,175 3,629 3,175 3,629 4,082 2,722 3,629 2,722 1,814 3,175 1,814 4,082 2,268 2,722 2,722 3,175 4,99 4,536 3,629 4,536 2,722 3,629 3,629 2,722 3,629 4,082 3,175 4,082 3,175 2,268 3,175 4,536 3,175 3,175 4,082 1,814 3,629 2,268 3,175 2,722 3,175 2,268 2,722 3,629 1,361 2,722 3,175 2,268

(a) Construir una distribucin de frecuencias de estos pesos. (b) Encontrar las frecuencias relativas. (c) Encontrar las frecuencias acumuladas. (d) Encontrar las frecuencias relativas acumuladas. (e) Dibujar un histograma con los datos. (f) Calcular las medidas de tendencia central. (g) Encontrar el percentil 24.

6. A continuacin se dan los resultados obtenidos con una muestra de 50 universitarios. la caracterstica es el tiempo de reaccin ante un estmulo auditivo:

0,111 0,112 0,123 0,117 0,107 0,117

0,111 0,097 0,119 0,112 0,121 0,105

0,11 0,098 0,117 0,111 0,119 0,106

0,113 0,106 0,109 0,1 0,102 0,095

0,118 0,102 0,116 0,111 0,128 0,1114

0,112 0,12 0,12 0,111 0,115

0,136 0,1 0,106 0,119 0,121

0,107 0,118 0,124 0,103 0,129

0,122 0,113 0,109 0,1 0,133

(a) Cul es la amplitud total de la distribucin de los datos? (b) Obtenga la distribucin de frecuencias absolutas y relativas. (c) Obtenga la distribucin de frecuencias acumuladas, absolutas y relativas. (d) Calcular la media, varianza y coeficiente de variacin. (e) Dibuje el polgono de frecuencias relativas. (f) Dibuje el polgono de frecuencias relativas acumuladas.

7. Con el fin de observar la relacin entre la inteligencia y el nivel socioeconmico (medido por el salario mensual familiar) se tomaron dos grupos, uno formado con sujetos de cociente Intelectual inferior a 95 y otro formado por los dems; De cada sujeto se anot el salario mensual familiar. Teniendo en cuenta los resultados que se indican en la tabla:

Nivel Socioeconmico Intervalos ($200.000 , $500.000] ($500.000 , $800.000] ($800.000 , $1.100.000] ($1.100.000 , $1.400.000] ($1.400.000 , $1.700.000] ($1.700.000 , $2.000.000]

CI<95 n1 75 35 20 30 25 15

CI95 n2 19 26 25 30 54 46

(a) Dibuje un grfico que permita comparar ambos grupos. (b) Calcule las medidas de tendencia central para aquellos sujetos con CI < 95. (c) Calcular las medidas de dispersin para aquellos sujetos con CI 95.

8. Un estudio consisti en anotar el nmero de palabras ledas en 15 segundos por un grupo de 120 sujetos dislxicos y 120 individuos normales. Teniendo en cuenta los resultados de la tabla: N palabras 25 o menos 26 27 28 29 30 o ms Calcule: Dislxicos 56 24 16 12 10 2 Normales 1 9 21 29 28 32

(a) Las medias aritmticas de ambos grupos. (b) Las medianas de ambos grupos. (c) El porcentaje de sujetos dislxicos que superaron la mediana de los normales. (d) Compare la variabilidad relativa de ambos grupos.

9. La tabla siguiente muestra la composicin por edad, sexo y trabajo de un grupo de personas con tuberculosis pulmonar en una provincia: Edad 1419 1924 2429 2934 3439 3944 Trabajadores No Trabajadores Totales

Varn Mujer Total Varn Mujer Total Varn Mujer Total 2 1 3 25 40 65 27 41 68 10 4 14 20 36 56 30 40 70 32 10 42 15 50 65 47 60 107 47 12 59 13 34 47 60 46 106 38 8 46 10 25 35 48 33 81 22 4 26 7 18 25 29 22 51

(a) Representar grficamente la distribucin de frecuencias de aquellas personas trabajadoras que padecen tuberculosis. (b) Representar grficamente la distribucin de frecuencias de los varones no trabajadores que padecen tuberculosis. (c) Representar grficamente la distribucin de frecuencias del nmero total de mujeres que padecen tuberculosis. (d) Por debajo de qu edad est el 50 % de los varones? (e) Por encima de qu edad se encuentra el 80 % de las mujeres? (f) Obtener la media, mediana y desviacin estndar de la distribucin de las edades de la muestra total. 10. En una epidemia de escarlatina, se ha recogido el nmero de muertos en 40 ciudades de un pas, obtenindose la siguiente tabla: Decesos Ciudades 0 1 2 3 4 5 6 7 7 11 10 7 1 2 1 1

(a) Representar grficamente estos datos. (b) Obtener la distribucin acumulada y representarla. (c) Calcular media, mediana y moda. (d) Calcular la varianza y la desviacin estndar.

(e) Porcentaje de ciudades con al menos 2 muertos. (f) Porcentaje de ciudades con ms de 3 muertos. (g) Porcentaje de ciudades con a lo sumo 5 muertos. 11. Se le ha tomado la temperatura corporal a un grupo de pacientes afectados de gripe, con los resultados siguientes: Temperatura (C) N pacientes Calcule: (a) Media aritmtica. (b) Moda y mediana. (c) Coeficiente de variacin de Pearson. ( se calcula dividiendo la Desv. Estndar por la Media) 12. Un eclogo est interesado en el tamao de la hoja de una determinada especie vegetal. Para ello recoge una muestra con los siguientes resultados: centmetros 2,5 3,2 4 5,5 5,8 6,1 N hojas 2 4 9 6 6 3 Determine los valores de: (a) Primer y tercer cuartiles. (b) Moda y mediana. (c) Percentiles 42 y 86 37 37,2 37,5 38 38,1 38,5 39 1 5 15 6 10 5 2

13. La siguiente distribucin de frecuencias se refiere a las edades de los empleados de una empresa: Edad (aos) 16-22 22-28 28-34 34-40 40-46 46-52 52-58 58-64 64-70 ni 11 15 32 28 16 25 14 10 6

Calcule:

(a) Media aritmtica, intervalo mediano, mediana, intervalo modal, cuartiles de primer y tercer orden, percentiles 32 y 81. (b) Desviacin estndar, coeficiente de variacin (= S/Media) y rango intercuartilico. 14. Dadas las observaciones siguientes: 11 15 19 23 13 25 26 20 27 20 24 22 20 10 28 27 33 29 15 29 29 26 25 20 21 16 18 31 27 20

(a) Agrupe los datos en cinco intervalos de longitud constante, comenzando por el valor 10. (b) Utilizando los intervalos anteriores, calcule: media, intervalo mediano, mediana, intervalo modal, (c) cuartiles de primer y tercer orden y el percentil 82. (d) desviacin estndar, coeficiente de variacin y rango intercuartlico.

15. Al examinar 158 casos de parlisis de Bell se anotaron las diferentes terapias seguidas por estos pacientes, resultando el conjunto de datos: C DQ ET NT OT : : : : : Corticoides Descomprensin quirrgica Electroterapia Ningn tratamiento Otras modalidades C 73 DQ 36 ET 19 NT 21 OT 9

Tratamiento N de pacientes

(a) Obtenga la tabla de frecuencias e indique qu porcentaje de pacientes toma corticoides. (b) Construya el diagrama de sectores. 16. Los siguientes datos representan el nmero de das de hospitalizacin por una apendicectoma: N de das N de casos 3 15 4 58 5 43 6 22 7 8 8 3 ms de 8 1

(a) Obtener la media y la varianza, as como los coeficientes de asimetra, curtosis y variacin. (b) Representar el correspondiente diagrama de barras.

17. La siguiente tabla muestra la distribucin de edades de 75 casos de una determinada enfermedad durante un ao y en un hospital determinado: Edad 5-15 15-25 25-35 35-45 45-55 55-65 ni 5 10 20 22 13 5

(a) Calcular la media, mediana, varianza, desviacin estndar y coeficiente de variacin. 18. Como parte de un proyecto de investigacin, cierto investigador obtuvo los siguientes niveles de SLP de una muestra de 10 individuos adultos bajo tratamiento de Diabetes Mellitus: 5,85 6,17 6,09 7,7 3,17 3,83 5,17 4,31 3,09 5,24

(a) Calcular la media, mediana, varianza y desviacin estndar. (b) Qu puede concluir respecto de la media y la mediana?

19. Se ha realizado con 100 mujeres un estudio sobre la edad en la que comenzaron a utilizar anticonceptivos orales. Los datos, agrupados en clases, estn en el siguiente cuadro: Consumo Ni [0,50] 25 [50,100) 60 [100,150) 90 [150,200) 98 [200,250] 100

(a) Calcule el porcentaje de mujeres que consume ms de 120 mg (b) Calcule la media, la mediana y la moda

20. Se ha realizado un estudio para valorar el efecto del alcohol sobre los niveles de colesterol en suero. Para ello, se ha recogido la cantidad de alcohol consumido por semana (en gr.) de 100 sujetos, obtenindose la siguiente tabla de frecuencias absolutas acumuladas:

Clases 13-25 25-37 37-49 49-61 61-73

ni 23 33

Ni

fi

72 90 10

(a) Calcular el porcentaje de sujetos que consumen entre 20 y 40 gr. de alcohol a la semana. (b) Calcular el consumo medio. (c) Calcular el nmero de sujetos que hay entre el percentil 15 y el cuartil tercero. (d) Obtener la mediana de la distribucin de frecuencias. 21. Se ha medido la tasa de glucosa en sangre a un grupo de 350 individuos. Los datos agrupados en 7 intervalos de amplitud 10 mg /100 ml se presentan en la siguiente tabla: Intervalos 65-75 75-85 85-95 95-105 105-115 115-125 125-135 n 14 42 63 84 70 56 21

(a) Calcular la desviacin estndar de los datos, sabiendo que la media es 101, 6 mg/100 ml. (b) Qu valor de tasa de glucosa es superado por el 40 % de los datos? 22. Para realizar un estudio que pretende valorar el proceso de crecimiento en 250 nios de edad similar, se ha utilizado el ndice de masa corporal (IMC = kg/m2). Los datos agrupados en 6 intervalos junto con la mayora de sus frecuencias relativas ( fi ), se presentan en la siguiente tabla: Peso Bajo Normal-Bajo Normal Normal-Alto Sobrepeso Obesidad Intervalos [1518) [1820) [2025) [2527) [2730) [3035] fi 0,04 0,12 0,4 0,16 0,12

(a) Cul es el IMC que superan el 50 % de los nios de este estudio? (b) Qu% de nios tienen un IMC superior a 22 kg/m2?

23. Con el objetivo de determinar la presencia de anemia en mujeres embaraza- das, se midieron los valores de hemoglobina (gr/dl) al final del primer trimestre en un grupo de 200 embarazadas que no seguan ningn tratamiento paralelo. La siguiente tabla presenta los porcentajes de embarazadas que se incluyeron en cada una de las categoras:

Hemoglobina (g/dl) [9,09,8) [9,810,6) [10,611,4) [11,412,2) [12,213,0) A partir de estos datos:

fi 10% 40% 30% 15% 5%

(a) El porcentaje de mujeres que presentaban anemia es decir, que tenan valores de hemoglobina por debajo de 11 gr/dl (b) Determinar la media, la mediana y la desviacin estndar de los datos. Es la media un buen representante de los datos? 24. La siguiente tabla nos muestra (en miles) el nmero de embarazos registrados en un pas a lo largo del ao 1996, segn los diferentes grupos de edad: Edad Fi% <20 4,49 [2025) 17,23 [2530) 48,69 [3035) 83,15 [3540) 97,00 [4045) 100,00

(a) Calcular la edad media de los embarazos as como los cuartiles. (b) Qu porcentaje qued embarazada con ms de 28 aos de edad? Obs: aproxime a nmeros enteros al calcular frecuencias absolutas. 25. En un reconocimiento mdico realizado a los 1000 trabajadores de una factora industrial, se ha medido la tensin arterial sistlica (mm Hg) obteniendo la siguiente distribucin de frecuencias. Completar la tabla sabiendo que la mediana de los datos es 138 mm Hg Categora ptima Normal Normal-Elevada HTA-Leve HTA-Moderada HTA-Severa Intervalo [110 , 120] (120 , 130] (130 , 140] (140 , 160] (160 , 180] (180 , 220] n 120 350 260 120

26. La siguiente tabla recoge la distribucin de frecuencias de triglicridos (en mg/dl) en el suero de un grupo de nios con 6 aos. Completar la tabla sabiendo que el percentil 20 de esta distribucin es 32 mg/dl. Nivel de triglicridos n 10-20 20-30 10 30-40 15 40-50 24 50-60 18 60-70 12 70-80 4 80-90 2

27. Uno de los medicamentos antivirales que se utilizan para combatir el virus de la gripe es la Amantadina. En un estudio sobre este medicamento se han administrado por va oral dosis nicas de 100 mg a 60 individuos adultos sanos. La variable estudiada (Tmax) es el tiempo requerido en minutos para alcanzar la concentracin mxima de plasma. La siguiente tabla recoge frecuencia relativas acumuladas (Fi ) de los datos del estudio:

[100 120] [120 140] [140 160] [160 180] [180 200]

0,25 0,75 0,90 0,95

(a) Determinar media, mediana y desviacin estndar de esta distribucin. (b) Determinar todas las medidas de dispersin y comente. 28. La ictericia neonatal es un fenmeno biolgico complejo, resultado de un desequilibrio transitorio entre la produccin y eliminacin de la bilirrubina. En el curso de una investigacin, se determinaron los niveles de bilirrubina a travs de bilirrubinometra transcutnea (BTc) de una muestra de neonatos con ictericia, obtenindose los siguientes resultados:

(a) Entre qu valores se encuentran el 30 % central de los datos de esta distribucin? (b) Calcular todas las medidas de tendencia central.

29. En 50 nios de 12 aos de edad se anot el nmero de dientes permanentes cariados u obturados, obtenindose que 8, 12, 10, 6, 4, 4, 4, 0 y 2 nios tenan 0, 1, 2, . . ., 7 y 8 dientes en esas condiciones. Calcular la media, mediana y desviacin estndar de la distribucin.

30. Se determin 20 veces el contenido de glucosa en sangre de una misma muestra por medio de dos mtodos, A y B, de determinacin rpida de la misma. Comparar la dispersin de ambos mtodos.
Mtodo A Mtodo B 140 141 142 127 138 136 135 142 126 148 139 142 141 151 144 146 145 148 147 136 130 132 146 138 145 148 147 135 136 137 141 146 138 131 134 146 139 140 148 146

31. Los siguientes datos corresponden a observaciones del nmero de camas diarias disponibles en el servicio de Ginecologa durante 30 das. 1 3 1 1 0 1 0 1 1 0 2 2 0 0 0 1 2 1 2 0 0 1 6 4 3 3 1 2 4 0 a) Construir la tabla de distribucin de frecuencias, absolutas y relativas, y un grfico de barras b) Calcular la mediana, las desviaciones respecto a la Media y la Mediana. d) Calcular el rango y el rango intercuartlico. e) Cmo cambian las respuestas anteriores si la observacin igual a 6 es un error de transcripcin y es en realidad igual a cero? f) Calcular la media y la desviacin estndar en cada uno de los casos (con el 6 y sin el 6).

32. A un grupo de 30 personas se les ha tomado el nmero de pulsaciones por minuto (ritmo cardiaco) obtenindose los siguientes resultados: 87 85 61 51 64 75 80 70 69 82 80 79 82 74 90 76 72 73 63 65 67 71 88 76 68 73 70 76 71 86 a) Agrupa los datos en cinco intervalos y construye la tabla de frecuencias. b) Representa grficamente esta distribucin. c) Calcula la media, mediana y moda. d) Calcula la desviacin estndar.

33. Dada las siguientes escalas: i. Escala Nominal ii. Escala Ordinal iii. Cuantitativa Discreta iv. Cuantitativa Continua (Escala de Razn) Clasifique las variables : a) b) c) d) e) Nmero de accidentes de trnsito ocurridos en Santiago durante 1 ao Colesterol en Sangre (mg/dl) Grado funcional de un paciente cardipata (I/II/III/IV) Grupo de tratamiento con 4 frmacos distintos (A/B/C/D) Grupo de tratamiento para perder peso (control/dieta/dieta+ejercicio/dieta+ejercicio+frmaco)

Vous aimerez peut-être aussi