Vous êtes sur la page 1sur 39

ESTADSTICA

ORGANIZACIN Y PRESENTACIN DE
DATOS
Organizacin y presentacin de
datos
Ordenando la Informacin
Al ordenar datos muy numerosos, es usual
agruparlos en clases o categoras. Al determinar
cuntos pertenecen a cada clase, establecemos
la frecuencia. Construimos as una tabla de
datos llamada tabla de frecuencias.
Para qu se construyen las tablas
de frecuencias ?

1. ORDENAR
2. AGRUPAR
3. RESUMIR informacin
Tabla de Frecuencias
El formato general de una tabla estadstica , llamada
tambin TABLA DE FRECUENCIAS O TABLA DE
DISTRIBUCIN DE FRECUENCIAS es la siguiente:

Nombre de la Frecuencia
variable
Categoras o Frecuencias
Recorrido de la Observadas
variable
TOTAL n
FRECUENCIA ABSOLUTA ( fi )
La frecuencia absoluta es el TABLA
nmero de veces que aparece un
valor (x i) en los datos xi fi
obtenidos.
0 4
Es el nmero de observaciones
que presentan una modalidad 1 9
perteneciente a la clase. 2 12
3 10
f1 + f2 + f3 + .f k = n
4 8
En nuestro ejemplo, la frecuencia 5 4
absoluta indica el nmero de 6 2
familias que tienen esa cantidad de 7 1
hijos:
FRECUENCIA ABSOLUTA
ACUMULADA ( Fi )
La frecuencia absoluta acumulada indica cuantos elementos de la
lista de datos son menores o iguales a un valor dado. Es la suma de
las frecuencias absolutas desde la primera fila hasta la fila elegida.
Representacin tabular de los datos que muestra cuantas
observaciones se hallan encima o debajo de ciertos valores.
xi f Fi
F1 = f1 0 4
i

F2 = f1 + f2 1 9
----------------------------- 2 12

Fk = f1 + f2 + .+ f k 3 10
4 8
5 4
6 2
7 1
Por ejemplo, sabemos que hay 25 matrimonios de la muestra que
tienen a lo ms 2 hijos:
7
FRECUENCIA RELATIVA ( hi )
Son datos que muestran la fraccin del conjunto total de datos que
caen dentro de cada conjunto de clases mutuamente excluyentes.
La frecuencia relativa es el cociente entre la frecuencia absoluta
(fi) y el nmero total de datos (n). En nuestro ejemplo n=50:
hi = fi/n
xi fi Fi hi
0 4 4
1 9 13
2 12 25
TABLA 3 10 35
4 8 43
5 4 47
6 2 49
7 1 50
FRECUENCIA RELATIVA ACUMULADA (Hi)
Es el tanto por uno de los elementos de la poblacin que estn en alguna clase y
que presentan una modalidad inferior o superior a la clase.

La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta


acumulada (Fi) y el nmero total de datos (n). En nuestro ejemplo, n =50:
TABLA H1 = F1/n
xi fi Fi hi Hi H2 = F2/n
0 4 4 0,08 -----------------------------
1 9 13 0,18 Hk = Fk/n
2 12 25 0,24
3 10 35 0,20
4 8 43 0,16
5 4 47 0,08
6 2 49 0,04
7 1 50 0,02
Como organizar los datos?
Cuando se tiene informacin acerca de cierta
caracterstica de una determinada cantidad de
datos, se proceder a organizar y presentar
estos de modo que facilite el anlisis.
Un primer paso es determinar si la variable es
Cualitativa o si es Cuantitativa.
Luego de esto se construye la tabla de
distribucin de frecuencias, la cual tendr
ciertas caractersticas segn sea el tipo de
variable.
Tambin se veremos algunas pautas para la
representacin de estos datos mediante grficos
ORGANIZACIN Y
PRESENTACIN DE
DATOS
VARIABLE CUALITATIVA
Tabla de distribucin de frecuencias
En esta caso la tabla de distribucin de frecuencias
tendr una columna para las posibles categoras de la
variable y otra para las frecuencias.
Tabla de distribucin de frecuencias
Variable fi hi Variable fi hi Fi Hi
C1 f1 h1 C1 f1 h1 F1 H1
C2 f2 h2 C2 f2 h2 F2 H2
... ... ... ... ... .. .. ..
Ck f k hk Ck fk hk Fk Hk
Escala de medicin: Nominal Escala de medicin: Ordinal
En este caso definimos las siguientes frecuencias:
Ci : Representa las categoras o posibles valores
de la variable en estudio.
fi : Es llamada frecuencia absoluta simple, y
representa el nmero de datos que tienen la
Caracterstica Ci
Se obtienen mediante un conteo directo de
los datos.
Siempre se debe cumplir que
hi : frecuencia relativa simple. Representa el
porcentaje de datos que tienen la
caracterstica Ci
Se calculan de la siguiente forma:
fi
hi
n
Donde n es el tamao de muestra, es decir es el
nmero de datos.
Si multiplicamos hi por 100, la tendremos
expresada en porcentaje.
Ejemplo:
Un restaurante de Florida emplea cuestionarios en los
que pide a sus clientes que evalen el servicio, la
calidad de los alimentos, los cocteles, los precios y la
atmsfera del restaurante. Cada uno de estos puntos
se evala con una escala de ptimo (O), muy bueno
(V), bueno (G), regular (A) y malo (P). Emplee la
estadstica descriptiva para resumir los datos siguientes
respecto a la calidad de los alimentos.
Se pide organizar los datos en una tabla de distribucin
de frecuencias
Cuadro 1
EVALUACIN DE LA CALIDAD DE LOS
ALIMENTOS

G V V O O O A G V P
G A G V O O A O V V
O G P O V A V O O O
O G V O O V G O G A
O G O G V O O A V V
En este caso, el cuadro de distribucin de frecuencias
tendr la siguiente forma:

CALIDAD DE LOS
ALIMENTOS fi Fi hi Hi
O 19 19 0.38 0.38
V 13 32 0.26 0.64
G 10 42 0.2 0.84
A 6 48 0.12 0.96
P 2 50 0.04 1
Total 50 1
Representacin Grfica

GRFICO CIRCULAR GRFICO DE BARRAS


20
18 19
P
A 4% 16
12%
O 14
38% 12 13

G 10
20% 10
8
6
6
4
V 2
26% 2
0
O V G A P
ORGANIZACIN Y
PRESENTACIN DE
DATOS
VARIABLE CUANTITATIVA DISCRETA
Tabla de distribucin de frecuencias
Si tenemos una variable Tabla de distribucin de
cuantitativa discreta, cuyos frecuencias
posibles valores son pocos, Variable Frecuencia Frecuencia Frecuencia Frecuencia

entonces la tabla de
Absoluta Relativa Absoluta Relativa
Acumulada Acumulada

distribucin de frecuencias Xi fi hi Fi Hi
tendr la forma mostrada.
En la primera columna se
X1 f1 h1 F1 H1
colocan todos los posibles
valores que puede tomar la X2 f2 h2 F2 H2
variable, y en las otras dos
columnas se presentan la ..... ... ... ... ...
frecuencias.
Xk fk hk Fk Hk
Para construir una tabla de distribucin de frecuencia
en este caso, consideraremos las siguientes pautas:
Primero se determina todos los posibles valores que puede
tomar la variable, a los que llamaremos X1, X2, ...... Xk
En esta tabla tenemos lo siguiente:
Xi : Cada uno de los posibles valores que
puede tomar la variable.
fi : Frecuencia absoluta simple del valor Xi
hi : Frecuencia relativa simple del valor de Xi

fi
hi
n
Fi : frecuencia absoluta acumulada, hasta el valor Xi
Hi : Frecuencia relativa acumulada, hasta el valor Xi
Ejemplo
Las tiendas Pelican, una divisin de National Clothing, es una
cadena de tiendas de ropa para mujer que tiene sucursales por
todo Estados Unidos. Hace poco la tienda realiz una promocin
en la que envi cupones de descuento a todos los clientes de
otras tiendas de National Clothing. Los datos obtenidos en una
muestra de 30 clientes acerca del nmero de artculos
comprados en las tiendas Pelican durante un da se presentan a
continuacin:

1 1 1 5 2 1 9 10 2 1
3 2 2 4 3 3 5 4 4 7
6 2 6 6 4 4 7 2 3 2
El cuadro de distribucin de frecuencias en
este caso ser:
Nmero
total
artculos fi hi Fi Hi
comprados

1 5 0.17 5 0.17
2 7 0.23 12 0.4
3 4 0.13 16 0.53
4 5 0.17 21 0.7
5 2 0.07 23 0.77
6 3 0.1 26 0.87
7 2 0.07 28 0.94
8 0 0 28 0.94
9 1 0.03 29 0.97
10 1 0.03 30 1
Total 30 1
Representacin grfica
HISTOGRAMA: Grfica en la que las clases se sealan en el eje horizontal y
las frecuencias de clases en el eje vertical. Las frecuencias de clase se
representan por medio de las alturas de las barras, estas se dibujan de manera
adyacente.

0
1 2 3 4 5 6 7 8 9 10
Representacin grfica
POLIGONO DE FRECUENCIA.- es similar a un histograma. Consiste en
segmentos de recta que conectan los puntos formados por las intersecciones
de los puntos medios de clase y las frecuencias.

7 7

5 5 5

4 4

3 3

2 2 2

1 1 1

0 0
1 2 3 4 5 6 7 8 9 10
Representacin grfica
POLIGONO DE FRECUENCIA ACUMULADA.-
35

30 30
29
28 28
26
25
23
21
20

16
15

12
10

5 5

0
1 2 3 4 5 6 7 8 9 10
ORGANIZACIN Y
PRESENTACIN DE
DATOS
VARIABLE CUANTITATIVA CONTINUA
Tabla de distribucin de
Frecuencias
En este caso la tabla de distribucin de
frecuencias tendr seis columnas, en cada una
de las cuales tendremos:
Intervalos de Clase: [Linf , Lsup [
Marcas de Clase: Xi
Frecuencias Absolutas simples: fi
Frecuencias Relativas simples: hi
Frecuencia Absolutas acumuladas: Fi
Frecuencias Relativas acumuladas: Hi
La tabla de distribucin de frecuencias tendr la
siguiente estructura:
Intervalos Xi fi hi Fi Hi
de Clase
[Linf , Lsup[ X1 f1 h1 F1 H1

[Linf , Lsup[ X2 F2 h2 F2 H2

..... .... .... .... .... ....

[Linf , Lsup] Xk fk hk Fk Hk
Total n 1
Algunas relaciones importantes entre los componentes
de esta tabla de distribucin de frecuencias
La marca de clase Xi es el punto medio del
intervalo de clase respectivo.
k es el nmero de intervalos de clase y n es el
nmero de datos.
Tendremos que:
fi
hi % (100)
n
Siempre se debe cumplir que:
k k

fi n h
i 1
i 100
i 1

Adems: Fk = n y Hk = 100
Procedimiento para construir una tabla de
distribucin de frecuencias:
Paso 1:
Determinar el rango o amplitud de las datos, este valor
se denota por la letra R, y se calcula de la siguiente
manera:
R = XMAX - XMIN
Paso 2:
Determinar el nmero de intervalos de clase, al que
denotaremos por k, y se calcula utilizando:
K = 1 + 3.322 Log(n) n<=50
K= 1.8914 + 3.9910 Log(n) 50< n <=100
K= 2.7560 + 5.8154 Log(n) n> 100

En este caso se utiliza el redondeo matemtico usual.


Paso 3:
Hallar la amplitud de clase, la denotaremos por A
A = R / k

El resultados se redondea al valor inmediato superior, teniendo


en cuenta el nmero de decimales que se est utilizando.
Paso 4:
i) En base a los resultados anteriores determinar los lmites
de los intervalos de clase.
ii) Proceder al conteo de los datos que dar como resultado
las frecuencias absolutas simples fi , a partir de estas se
calcular el resto de las frecuencias hi , Fi y Hi
Para explicar este procedimiento veamos el siguiente
ejercicio:

Ejemplo:
NRF/BIG proporciona los resultados de una investigacin
sobre las cantidades que gastan en vacaciones los
consumidores (USA today; 20 de diciembre de 2005). Los
datos siguientes son las cantidades gastadas en vacaciones
por los 25 consumidores de una muestra.

1200 850 740 590 340


450 890 260 610 350
1780 180 850 2050 770
800 1090 510 520 220
1450 280 1120 200 350
Procedimiento:
Paso 1:
Calculamos el rango o recorrido(R):
R = XMAX XMIN = 2050- 180 = 1870
Paso 2:
Determinamos el nmero de intervalos de clase(K)
K= 1 + 3.322 Log(n) n <=50
k = 1+3.322 log (25) =5.643946 = 6
Paso 3:
Calculamos la amplitud de clase (A):
A = R/k = 1870 /6 = 311.67 por lo tanto
A =312
Marca de Clase ( Xi )
La marca de clase es el punto medio de cada intervalo y
se calcula sumando los lmites de cada intervalo y
dividindolos entres dos, por ejemplo:

180+492
1 = 2
= 336

492+804
2 = 2
= 648


As sucesivamente.
fi hi Fi Hi
intervalos Xi

180 492 336 9 0.36 9 0.36

492 804 648 7 0.28 16 0.64

804 1116 960 4 0.16 20 0.8

1116 1428 1272 2 0.08 22 0.88

1428 1740 1584 1 0.04 23 0.92

1740 2052 1896 2 0.08 25 1

total 25 1
Representacin grfica
HISTOGRAMA: Grfica en la que las clases se sealan en el eje horizontal y
las frecuencias de clases en el eje vertical. Las frecuencias de clase se
representan por medio de las alturas de las barras, estas se dibujan de manera
adyacente.

10
9
8
7
6
5
4
3
2
1
0
336 648 960 1272 1584 1896
Representacin grfica
POLIGONO DE FRECUENCIA.- es similar a un histograma. Consiste en
segmentos de recta que conectan los puntos formados por las intersecciones
de los puntos medios de clase y las frecuencias.

10

9 9

7 7

4 4

2 2 2

1 1

0
336 648 960 1272 1584 1896
Representacin grfica
POLIGONO DE FRECUENCIA ACUMULADA.-

25

23
22

20 20

16
15

10
9

0
336 648 960 1272 1584

Vous aimerez peut-être aussi