Vous êtes sur la page 1sur 28

UNIVERSIDAD NACIONAL

“SANTIGO ANTÚNEZ DE MAYOLO

Curso: Estadística General

Organización y
presentación de datos
Sesión 03

Huaraz, mayo de 2018


Dra. Rosa Vilchez V.
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

BASE DE DATOS SOBRE SATISFACCION LABORAL - HOSPITAL DE HUARI-2018


Años de Número de Promoción Número de Tiene Relación con
Item Género Función Edad Ingreso anual
servicio promociones posible capacitaciones Automovil la gerencia
1 Femenino Técnico 19 1 14,400 0 Improbable 1 No Buena

2 Masculino Profesional 31 5 190,600 2 No está seguro 2 Si Buena

3 Masculino Profesional 34 8 193,400 1 Probable 2 Si Buena

4 Masculino Directivo 56 30 260,800 4 Improbable 5 Si Buena

5 Masculino Servicio 44 4 9,850 0 Improbable 1 No Regular

6 Masculino Servicio 44 10 9,800 0 Improbable 0 No Regular

7 Masculino Técnico 31 5 40,840 0 Improbable 3 No Buena

8 Femenino Profesional 37 8 93,700 1 No está seguro 2 No Buena

9 Masculino Profesional 54 23 110,150 2 Improbable 1 Si Mala

10 Masculino Servicio 52 18 9,050 0 Muy improbable 1 No Mala

11 Femenino Profesional 32 4 62,200 2 No está seguro 2 No Buena

12 Masculino Administrativo 44 14 31,200 3 Probable 1 No Regular

13 Masculino Administrativo 31 16 60,335 0 Muy improbable 2 Si Buena

14 Femenino Administrativo 28 10 30,990 1 Muy improbable 1 Si Buena

15 Femenino Técnico 23 5 29,360 1 Muy improbable 1 No Regular

¿una vez recopilada la información,


con las variables consideradas de
¿Qué podemos mayor importancia, el siguiente paso
hacer para resumir es presentarla a través de una tabla de
esta información? frecuencias y un gráfico que describa
adecuadamente las características mas
importantes
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla de distribución de frecuencias o tablas estadísticas


(TDF o CDF)
Es el resumen de un
Esta tabla muestra las
conjunto de datos,
frecuencias absolutas, las Las categorías o clases
presentados en una tabla
frecuencias relativas y los no se traslapan
de distribución de
porcentajes
frecuencias (TDF o CDF)

Frecuencias absolutas, relativas y porcentuales


 La frecuencia absoluta (fi ) de una clase es la cantidad de elementos que
pertenecen a esa clase.
 La frecuencia relativa (hi ) de una clase es la proporción de elementos que
pertenecen a esa clase

 La frecuencia porcentual (pi) de una clase es la frecuencia relativa multiplicada por


Frecuencia porcentual (pi ) = hi 100%
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla de distribución de frecuencias para


VARIABLES CUALITATIVAS

Se deberá presentar en la tabla las diferentes categorías que asume la


variable cualitativa (en la fila) y en la columna de las frecuencias
absolutas la cantidad de veces que se repite esta categoría de la variable.

 Si la medición está hecha en escala nominal sólo deberá mostrarse las


frecuencias absolutas y relativas.

 Si la variable cualitativa está medida en escala ordinal, tendrá sentido


mostrar las frecuencias acumuladas absolutas y relativas.

La distribución de frecuencias es un cuadro que se calcula de la siguiente


manera:
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla N° ….. :
Distribución de < unidades de estudio > según < variable >,
< territorio >, < fecha >
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Numero
Tabla 01: De la tabla

Distribución de estudiantes según su preferencia profesional. Título


Universidad Autónoma del Perú. 2017. de la Tabla

Preferencia profesional fi hi pi Encabezado


Administración 5 0,1667 16,67%
Enfermería 6 0,2000 20,00%
Derecho 4 0,1333 13,33% Cuerpo
Economía 3 0,1000 10,00%
o
Ingeniería 8 0,2667 26,67%
Periodismo 4 0,1333 13,33% Contenido
Total 30 1,00 100,0%

Fuente: Universidad Autónoma del Perú. Fuente


ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Ejercicio 1
Tabla 01:
Perú: Distribución de víctimas de feminicidio, según región de ocurrencia. 2017

Región fi pi
Lima 29 31,87%
Arequipa 10 10,99%
Puno 7 7,69%
Cusco 6 6,59%
Junín 6 6,59%
La Libertad 5 5,49%
Ayacucho 4 4,40%
Huánuco 4 4,40%
Lambayeque 4 4,40%
Otros 16 17,60%
Fuente: Ministerio público Perú – Observatorio de criminalidad. 2017

Nota: Un feminicidio es el asesinato de una mujer por razón de su sexo. Interprete:


 p1: _________________________________________________________
 f3: __________________________________________________________
 ¿Se podría afirmar que los hombres son mas violentos en Lima que los del norte del
país?:
_______________________________________________________________
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Representación gráfica de VARIABLES CUALITATIVAS

Gráfico de barras
En el eje horizontal se representa las categorías
de la variable y en el eje de ordenadas las
frecuencias absolutas, relativas o porcentuales.

Gráfico circular
En el eje horizontal se representa las categorías
de la variable y en el eje de ordenadas las
frecuencias absolutas, relativas o porcentuales.

Nota. Si la variable cualitativa es de escala ordinal se


recomienda usar el gráfico de barras.
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Ejercicio 2
El Jefe Zonal de Sunat-Trujillo, quiere conocer la cantidad de trabajadores según su
función en dicha institución. Los datos obtenidos se presentan a continuación:

Técnico Profesional Profesional Directivo Servicio Servicio Técnico Profesional

Profesional Servicio Profesional Administrativo Administrativo Administrativo Técnico Administrativo

Administrativo Técnico Directivo Técnico Servicio Técnico Técnico Servicio

Profesional Administrativo Administrativo Servicio Profesional Servicio Profesional Profesional

Administrativo Técnico Directivo Técnico Servicio Directivo Técnico Profesional

Se pide
a) Obtener la tabla de distribución de frecuencias (con fi, hi y pi).
b) Interprete la frecuencia absoluta de la segunda categoría.
c) Interprete la frecuencia porcentual de la tercera categoría.
d) Presente el gráfico de barras de frecuencias porcentuales.
e) Presente el gráfico circular de frecuencias porcentuales
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Solución
a) Tabla 02:
Distribución de trabajadores de la Sunat-Huacho según su función que
desempeña, Trujillo. 2017
Función fi hi pi
Administrativo 7 0.175 17.5%
Directivo 4 0.1 10.0%
Profesional 9 0.225 22.5%
Servicio 8 0.2 20.0%
Técnico 12 0.3 30.0%
Total 40 1 100.0%

Tabla 02: Oficina Sunat Trujillo.

b) f2=4 : de un total de 40 trabajadores de la Sunat, 4 son directivos.

c) p3=22.5% : el 22.5% de los trabajadores de la Sunat tienen su función como


profesionales.
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

d) Gráfico de Barras

e) Gráfico circular

Interpretación:
Del gráfico 01 se puede observar que el 30%
de trabajadores de la Sunat-Trujillo, son
técnicos.
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla de distribución de frecuencias de variables CUANTITATIVAS DISCRETAS


Es un resumen de un conjunto de datos Es un cuadro que presenta además de
que consiste en presentar para cada las frecuencias absolutas y relativas las
valor de la variable el número de frecuencias acumuladas absolutas y
elementos (frecuencia) que la componen acumuladas relativas.

Tabla 03:
Distribución de <unidades elementales> según <variable>, <lugar>. <fecha>
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Representación gráfica de variables CUANTITATIVAS DISCRETAS


Gráfico de bastones
Por lo general, el gráfico de bastones es utilizado cuando la variable es discreta.
Su uso es adecuado cuando existen muchas observaciones, pero pocos valores
de la variable.
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Ejercicio 3
Los siguientes datos corresponden al numero de capacitaciones del los
trabajadores de la Sunat de trujillo.

1 2 2 5 1 0 3 2 1 1
2 1 2 1 1 1 2 2 5 1
0 2 2 1 5 2 3 0 3 2
3 4 2 0 4 1 1 4 2 2

a) Obtenga la tabla de distribución de frecuencias completa.


b) Interprete la frecuencia absoluta de la segunda categoría, la segunda frecuencia
acumulada, tercera relativa simple y cuarta relativa acumulada porcentual.
c) Presente el gráfico de bastones.
d) Interpretes el gráfico de bastones.
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Solución
a. Presente la tabla de distribución de frecuencias.
Tabla __:
Distribución de los trabajadores de la Sunat-Trujillo, según las veces que
fueron capacitados, Trujillo. 2017
N° de
fi Fi hi Hi pi Pi
capacitaciones
0 4 4 0.100 0.100 10.0% 10.0%
1 12 16 0.300 0.400 30.0% 40.0%
2 14 30 0.350 0.750 35.0% 75.0%
3 4 34 0.100 0.850 10.0% 85.0%
4 3 37 0.075 0.925 7.5% 92.5%
5 3 40 0.075 1.000 7.5% 100.0%
Total 40 1.000 100.0%
Fuente: Oficina Sunat - Trujillo.

b. Interprete los siguientes valores f2 , F2 , h3 y H4%´(o P4)


f2 = 12 De 40 colaboradores, 12 han recibido solo una capacitación al año

F2 = 16 De 40 colaboradores, 16 han recibido de una a menos capacitaciones al año

La proporción de colaboradores que han recibido solo dos capacitación al año es 0,03
h3 = 0,035

H4%= 85% El 85% de los colaboradores han recibido de tres a menos capacitaciones al año
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

c. Presente el gráfico de bastones

d. Interprete el gráfico de bastones

Del gráfico adjunto se observa que 14 de 30 trabajadores tuvieron 2


capacitaciones al año
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla de distribución de frecuencias de variables CUANTITATIVAS CONTINUAS


Es un resumen de un conjunto de Los tres pasos para elaborar una tabla de
datos que consiste en presentar distribución de frecuencias para variables
cuantitativas continuas son:
para cada categoría el número de
•Determinar la cantidad de clases
elementos (frecuencia) que la •Determinar el ancho de cada clase
componen. •Determinar los límites de cada clase.

Cantidad de clases o intervalos

 Se recomienda usar entre 5 y 20 clases, inclusive.


 La idea es emplear suficientes clases para mostrar la variación de los datos,
pero no tantas, porque puede ocurrir que varias contengan ningún o pocos
elementos.
 Para determinar el número de clases se puede usar la regla de Sturges:

Regla de Sturges: k = 1 + 3,32 x log(n)

Si la estimación tiene decimales, se toma el entero más próximo (redondeo simple).


ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Amplitud o ancho de cada clase

 Usualmente se usa el mismo ancho para todas las clases.


 Se Calcula primero el rango R= Xmax – Xmin
 Se calcula el número de clases o intervalos K (según Sturges)
 Luego se calcula la amplitud A de la siguiente manera:

Amplitud = A = Rango = R
N° clases k

 La amplitud del intervalo debe tener la misma cantidad de cifras decimales


que tienen los datos originales.

Marcas de clase
· Son los puntos medios de los límites de cada intervalo.

mi = Límite inferior + Límite superior = Li + Ls


2 2
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Ejercicio 4
A continuación, se muestra 40 edades de los trabajadores de la Sunat-Trujillo.
Usando la regla de Sturges construya la tabla de distribución de frecuencias.
25 31 34 54 44 44 31 37 54 52

32 44 31 28 25 38 38 32 52 48

45 27 32 46 28 27 38 40 26 54

45 54 26 44 48 48 45 40 32 31

Solución
Formulas en Excel
Cálculo de los límites de los intervalos.
Máximo 54 =MAX(datos)
Mínimo 25 =MIN(datos)
Rango 29 =MAX(datos) – MIN(datos)
N° de datos (n) 40 =CONTAR(datos)
k (regla de Sturges) 6.3188 =1+3,32*LOG10(n)
k (entero) 6
A (amplitud) 4.8333 =Rango/k (entero)
A (redondeado al entero superior) 5
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla 05:
Distribución de trabajadores de la Sunat, según su edad en años, Trujillo.
2017
fi hi Fi Hi
Límite Inferior Límite Superior Marca de clase (mi)
25 30 27.5 8 0.20 8 0.2
30 35 32.5 9 0.23 17 0.43
35 40 37.5 4 0.10 21 0.53
40 45 42.5 6 0.15 27 0.68
45 50 47.5 7 0.18 34 0.85
50 55 52.5 6 0.15 40 1.00
Total 40 1.00
Fuente: Sunat de Trujillo.

Interprete.
f4 = 6 Son 6 trabajadores de la Sunat con edades de 40 a menos de 45 años
F2= 17 Son 17 trabajadores de la Sunat con edades de 25 a menos de 35 años
h1%=20% El 20% de los trabajadores de la Sunat, tienen de 25 a menos de 30 años
H5%=85% El 85% de los trabajadores de la Sunat, tienen edades de 25 a menos de 50 años
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Ejercicio 5
El jefe de la Oficina de Rentas de una municipalidad de Huaraz ha realizado un estudio
sobre los impuestos que pagan los vecinos del distrito. Los datos de los pagos de
impuestos, en soles, de 48 viviendas elegidas al azar en el 2017 fueron:

145,1 216,3 252,5 303,6 196,9 234,8 265,2 317,2 206,5 242,9 289,1 331,7

151,0 225,9 257,1 305,8 202,6 238,4 271,0 320,2 208,0 244,0 291,0 344,6

159,0 227,1 259,2 315,4 204,9 239,9 286,7 324,8 208,0 247,7 291,9 346,7

195,6 231,2 262,5 315,5 206,1 241,1 288,1 331,1 209,3 249,5 294,5 351,1

a) Elabore la tabla de frecuencias para la variable “Pago por impuestos


municipales” para el año 2017, con frecuencias fi, Fi, pi y Pi. Utilice la regla de
Sturges, para calcular el numero de intervalos o clases.
b) Interprete la frecuencia absoluta relativas y porcentuales: f2, F3, p4 y P4
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Solución: Entonces los intervalos:

 Determinar el Rango: R = valor máximo – valor mínimo = I1= [145.1 - 175.1)


I2= [175.1 - 205.1)
351,1 – 145,1 = 206 I3= [205.1 - 235.1)
I4= [235.1 - 265.1)
I5= [265.1 - 295.1)
 Determine el número de clases o intervalos k: I6= [295.1 - 325.1)
I7= [325.1 - 355.1)
k = 1 + 3,322*log(10)  K = 1 + 3,322*log10(48) = 6,585 ≈ 7
Diagrama tallo-hoja:
(Use redondeo simple) 14 5
15 1 9
19 5 6
 La amplitud : A = R/k = 206/7 = 29,429 = 29,5 , Entonces 20 2 4 6 6 8 8 9
21 6
A ≈ 30 22 5 7
23 1 4 8 9
24 1 2 4 7 9
Usamos redondeo por exceso a un decimal debido a que los 25 2 7 9
26 2 5
27 1
datos tienen un decimal (entero superior) 28 6 8 9
29 1 1 4
30 3 5
31 5 5 7
32 0 4
33 1 1
34 4 6
35 1
ORGANIZACIÓN DE LOS DATOS
Prof. Rosa Vilchez V.

Tabla 06:
Distribución de los vecinos del distrito de Huaraz, según los impuestos que pagan.
Huaraz, 2017.
Impuesto mi fi Fi pi(%) Pi(%)
[145.1 175.1) 160.1 3 3 6.25 6.25
[175.1 205.1) 190.1 4 7 8.33 14.58
[205.1 235.1) 220.1 10 17 20.83 35.42
[235.1 265.1) 250.1 11 28 22.92 58.33
[265.1 295.1) 280.1 8 36 16.67 75.00
[295.1 325.1) 310.1 7 43 14.58 89.58
[325.1 355.1) 340.1 5 48 10.42 100.00
Total 48 100.00
Fuente: Municipalidad de Huaraz

Interprete:
f2 = 4 : De 48 vecinos, 4 de ellos pagaron impuestos de 175,1 a menos de 205,1 nuevos soles
F2 = 7 : De 48 vecinos de Huaraz 7 de ellos contribuyeron menos de 205,1 nuevos soles
P4 = 22,92% : El 22,92% de los vecinos pagaron impuestos de 235,1 a menos de 265,1 nuevos soles.
P4 = 58.33% : El 58,33% de los vecinos pagaron impuestos de 145,1 a menos de 265,1 nuevos soles
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Representación gráfica de variables CUANTITATIVAS CONTINUAS

Histograma
Este gráfico se realiza a partir de una tabla de
frecuencias absolutas, relativas o porcentuales.

 Se traza colocando la variable sobre el eje


horizontal y las frecuencias sobre el eje
vertical.
 Cada frecuencia de clase se representa
trazando un rectángulo, cuya base es el
intervalo de clase sobre el eje horizontal y
cuya altura es proporcional a la frecuencia
correspondiente.
 Los rectángulos adyacentes se tocan entre sí.
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Representación gráfica de variables CUANTITATIVAS CONTINUAS

Polígono de frecuencias
 Este gráfico sirve también para representar el
comportamiento de una variable cuantitativa
continua.
 Se construye uniendo con una línea poligonal los
puntos medios o marcas de clase (mi) superiores de
cada intervalo.
 Esta se grafica teniendo como referencia el
Histograma (frecuencias simple o frecuencias
acumuladas

Ojiva (menor que)


Este gráfico se realiza a partir de una tabla de
frecuencias absolutas, relativas o porcentuales.
 Se traza colocando la variable sobre el eje
horizontal y las frecuencias sobre el eje vertical.
REPRESENTACIÓN GRAFICA
Prof. Rosa Vilchez V.

Otras representaciónes gráficas

Barras dobles Pirámide Cartograma

Series Otros tipos de gráficos


Pictograma
REPRESENTACIÓN GRAFICA DE LOS DATOS
Prof. Rosa Vilchez V.

Representación grafica de los datos según tipo de variable.


Resumen
Organización y presentación
de datos Prof. Rosa Vilchez V.

Vous aimerez peut-être aussi