Vous êtes sur la page 1sur 11

TEMA 03: ORGANIZACIN DE DATOS Y DISTRIBUCIN DE FRECUENCIAS

ORGANIZACIN DE LOS DATOS OBTENIDOS DE UNA MUESTRA


Una vez que se ha obtenido una muestra aleatoria sobre nuestra poblacin objetivo y se han
realizado las mediciones sobre todos los elementos contenidos en ella, se ha concluido la tarea de
obtencin de los datos. Las observaciones que se han obtenido son datos en bruto, que rara vez
son significativos sin organizacin ni descripcin.
Para la variable cualitativa grado de instruccin tomemos una muestra de 200 madres solteras
entre 15 y 25 aos de la ciudad de Piura. Los valores obtenidos se pueden agrupan en
diferentes modalidades: primaria completa, secundaria completa y educacin superior completa.
Para hacer un arreglo de estas observaciones, usaremos una tabla como la siguiente:
MODALIDAD

FRECUENCIA (fi)

Primaria completa

125

Secundaria completa

70

Educacin superior completa


TOTAL

5
200

En esta, se presenta la lista de modalidades que tiene la variable estadstica medida y que pueden
estar ordenadas de forma alfabtica, para una variable cualitativa nominal, o en orden ascendente
u orden descendente, para una variable cualitativa ordinal. Adems, se presenta la frecuencia
absoluta (fi) de cada modalidad. Esta frecuencia viene a ser la cantidad de observaciones de la
muestra que corresponden a la modalidad.
Consideremos ahora la variable cuantitativa discreta nmero de hijos y tomemos las observaciones
de una muestra de 150 familias de zonas marginales de Lima Metropolitana. Los valores obtenidos
se pueden agrupar en diferentes valores: 0 hijos, 1 hijo, 2 hijos, 3 hijos o 4 hijos. Para hacer un
arreglo de estas observaciones, usaremos una tabla como la siguiente:

VALORES

FRECUENCIA(fi)

0 HIJOS
1 HIJOS
2 HIJOS
3 HIJOS
4 HIJOS
TOTAL

2
15
40
55
38
150

Finalmente, para la variable cuantitativa continua estatura, tomemos una muestra de 100 nios de 10
aos del distrito de La Victoria. Los valores observados se pueden agrupar, ya no por valores, sino por
un grupo de valores o intervalo de clase. Para hacer un arreglo de estas observaciones, usaremos
una tabla del siguiente tipo:
INTERVALOS DE CLASE
[1.0 mt., 1.15mt[

FRECUENCIA(fi)
3

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

[1.15mt. , 1.30mt[

39

[1.30mt, 1.45mt[

55

[1.45mt., 1.60mt]

TOTAL
100
A la organizacin de las observaciones de una muestra en una tabla para expresar la frecuencia de
cada una de sus modalidades o valores se le conoce como distribucin de frecuencias. En las
distribuciones de frecuencia se acostumbra colocar otras columnas adems de la frecuencia absoluta
(fi), estas nos permitirn tener una mayor informacin sobre los datos y nos facilitarn los
clculos de las medidas descriptivas o estadsticos de la muestra. Las otras columnas pueden ser
las siguientes:

Frecuencia relativa (hi). Es la proporcin del total de observaciones que caen dentro de
cada modalidad o valor. Se obtiene dividiendo la frecuencia absoluta (fi) de la
modalidad entre e nmero total de observaciones (n).

Frecuencia acumulada(Fi). Para cada clase, valor o modalidad, la frecuencia


acumulada equivale la frecuencia absoluta (fi) de la fila sumada a la frecuencia
acumulada de la fila anterior. Para la primera fila, la frecuencia acumulada equivale
simplemente a la frecuencia absoluta de la misma fila.
Entonces, las tablas vistas anteriormente quedaran de la siguiente manera al aplicar la nuevas
definiciones:
VARIABLE CUALITATIVA
MODALIDAD

fi

hi

Fi

Primaria completa

125

125 / 200

125

Secundaria completa

70

70 / 200

195

Educacin superior
TOTAL

5
200

5/ 200
1

200

VARIABLE CUANTITATIVA DISCRETA

VALOR

fi

hi

Fi

0 Hijos

2/ 150

1 Hijo

1S

15 / 150

17

2 Hijos
3 Hijos
4 Hijos

40
55
38

40/ 150
55 / 150
38/ 150

57
112
150

TOTAL

150

CALCULO DE LOS INTERVALOS DE CLASE PARA UNA VARIABLE CUANTITATIVA DISCRETA


(CON MUCHOS VALORES) O UNA VARIABLE CUANTITATIVA CONTINUA
La organizacin de los datos para el caso en que la variable estadstica usada tenga muchos
Profesor : Carlos A. Garca Palacios

Pgina 2

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

valores implica e arreglo de las observaciones en intervalos de clases. El proceso para hallar los
intervalos de clase es el siguiente:
Debemos hallar, en primer lugar, en la muestra, el menor valor observado y el mayor valor observado.
Definimos como el rango de los datos a la diferencia entre estos dos valores.
Luego hallaremos el largo de cada uno de nuestros intervalos de
clase.
Ejemplo:
Se realiza una investigacin a los vendedores de una cadena de tiendas de departamentos para
determinar como se comportan sus ingresos diarios. Se selecciona una muestra aleatoria de 50
vendedores y se obtienen sus ingresos en dlares durante cierto da. A continuacin, se
presenta una lista ya ordenada de las observaciones hechas.

53

57

58

61

61

63

64

66

67

68

69

70

71

72

73

74

74

74

74

77

77

77

78

78

79

79

79

81

81

81

82

82

83

83

84

85

85

86

87

87

88

90

90

90

90

92

93

94

96

97

Para estos ingresos, el menor valor de la muestra es 53 dlares y el mayor valor de la


muestra es 97 dlares.
Luego, el rango de estos valores es: 97 - 53 = 44 dlares.
El largo de cada intervalo de clase estar definido como :

Para la construccin de una tabla por intervalos de clase debe tenerse en cuenta lo siguiente:

El nmero de intervalos no deber ser tan pequeo (menor de 5) o tan grande (ms de 15) que la
verdadera naturaleza de la distribucin sea imposible de visualizar.
La longitud del intervalo de clase deber ser siempre la misma. Si la longitud de cada
intervalo no fuera exacta, se puede tomar por exceso asegurndonos de este modo que la
reunin de todos los intervalos cubrir a todos los valores observados.

L a marca de clase (xi), definida como el punto medio del intervalo de clase,
deber tener de preferencia el mismo nmero de decimales que los valores
observados. La marca de clase puede considerarse que es un representante
de los datos que caen en el intervalo.

Profesor : Carlos A. Garca Palacios

Pgina 3

TEXTO DIDCTICO

INTERVALOS
[5 3, 59 .2 9 [
[59.29 , 65.58[
[65.58 , 71.87[
[71.87 , 78.16[
[78.16 , 84.45[
[84.45 , 90.74[
[90.74 , 97.03]
TOTAL

ESTADSTICA DESCRIPTIVA

xi
56.15
62.44
68.73
75.02
81.31
87.60
93.89

hi

Fi

3
4
6
11
11
10
5

3/ 50
4/ 50
6/50
11 / 50
11150
10 / 50
5/ 50

3
7
13
24
35
45
50

50

Adems, la diferencia entre las marcas de clase de dos intervalos adyacentes


deber ser constante e igual a la longitud del intervalo.

Cmo decidimos cuntos intervalos de clase tomar?

Existen varias reglas que se basan en el tamao de nuestra poblacin o muestra.


Una de las reglas ms usadas es la Regla de Sturges, regla emprica que
funciona bastante bien para grupos de 30 a 300 observaciones.

Esta regla nos dice que el nmero de intervalos de clase para una muestra de
tamao n ser k si este resulta un nmero entero; o el siguiente nmero entero a k,
si k resulta un nmero decimal.

K se obtiene de la siguiente expresin: k = 1 + 3.3 * log n. Donde n es el tamao de la


poblacin o muestra.
Para nuestro ejemplo, como n= 50 al aplicar la regla de Sturges tendremos k = 6.6, lo
que equivale a tomar 7 intervalos. En ese caso, tendremos que la longitud de cada
intervalo de clase sera : 44 / 7 = 6.29 unidades.

Profesor : Carlos A. Garca Palacios

Pgina 4

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

Ahora, si preferimos considerar 8 intervalos en vez de 7, tendremos una longitud de


intervalos igual a 44 / 8 = 5.5 unidades. Tendremos entonces la siguiente distribucin de
frecuencia:

INTERVALOS
[53 , 58.5[
[58.5 , 64[
[64 , 69.5[
[69.5 , 75[
[75 , 80.5[
[80.5 , 86[
[ 8 6 , 91.5[
[91.5 - 9 7 ]
TOTAL

Si

xi

fi

hi

Fi

55.75
61.25
66.75
72.25
77.75
83.25
88.75
94.25

3
3
5
8
8
10
8
5
50

3/ 50
3/ 50
5/ 50
8/ 50
8/ 50
10 / 50
8/ 50
5/ 50
1

3
6
11
19
27
37
45
50

consideramos un rango de 45 dlares en vez de los 44 que nos resultaron inicialmente,


al dividirlo entre 9 intervalos nos resultar una longitud de intervalo igual a 5
unidades. Hay que tener en cuenta que esa unidad aumentada en el rango la debemos
ver de la siguiente forma:
Restamos 0.5 al menor valor y aumentamos 0.5 al mayor valor, es decir, tendremos
ahora que el menor valor es 52.5 y el mayor valor es 97.5 Tendremos entonces la
siguiente distribucin de frecuencias:
INTERVALOS

xi

fi

hi

Fi

[52.5 , 57.5[

55

2/ 50

[57.5 , 62.5[

60

3/ 50

[62.5 , 67.5[

65

4/ 50

[67.5 , 72.5[

70

5/ 50

14

[72.5 , 77.5[

75

8/ 50

22

[77.5 , 82.5[

80

10

10 / 50

32

[82.5 , 87.5[

85

8/ 50

40

[87.5 , 92.5[

90

6/ 50

46

[92.5 , 97.5]

95

4/ 50

50

TOTAL

50

Cul distribucin de frecuencia escoger?


En realidad, depender del investigador. Dentro del curso, se preferir trabajar con la regla de
Sturges para uniformizar las respuestas.

TEMA 04 : GRFICAS

PRESENTACIN DE LOS DATOS OBTENIDOS DE UNA MUESTRA


Una vez realizada la organizacin de los datos observados, es necesario presentar estos de forma
grfica forma visual permitir resaltar algunos hechos que muestran los datos. Se vern diversos
tipos de grficos catalogados segn el tipo de variable a presentarse.
Profesor : Carlos A. Garca Palacios

Pgina 5

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

PARA UNA VARIABLE CUALITATIVA


Para una variable cualitativa, ya sea nominal u ordinal, la presentacin de la informacin obtenida
organizada en una distribucin de frecuencias puede ser presentada mediante dos grficos: grfico
de barras y grfico de sectores.
a) GRFICO DE BARRAS

En este tipo de presentacin, cada barra rectangular corresponde a una modalidad. Todas las barras
tienen base de igual longitud y altura proporcional a la frecuencia (fi) o frecuencia relativa (hi) que
presen modalidad.
Tomemos la distribucin de frecuencias de la variable grado de instruccin, obtenida de una
muestra de 150 mujeres. Se considerar que cada mujer pertenece al mayor grado de
instruccin que ha concluido.
MODALIDAD

fi

hi

Pi

Primaria Completa

60

0,40

40%

Secundaria Completa

55

0,37

37%

Superior Completa

35

0,23

23%

NUMERO DE
MUJERES

150

70
60
50
40
30
20
10
0

GRAFICA DE BARRAS
Primaria Completa
Secundaria
Completa
Superior Completa

GRADO DE INSTRUCCION
b) GRFICA DE SECTORES

Otra forma de presentar la informacin de una variable cualitativa es utilizando una grfica de
sectores (tambin denominada grfica tipo "pie" o "pastel"). La grfica de sectores es un crculo
dividido en varios sectores proporcionales en tamao a las frecuencias relativas (hi) de las
diferentes modalidades. Si cierta modalidad tiene una frecuencia relativa de 10%, le corresponde un
sector de la grfica con un ngulo central de 36 grados (10% de 360grados = 36 grados) para
representarla. Esto no descarta el hecho de que, en algunos casos, se utilice la frecuencia(fi) en la
elaboracin de esta grfica. En el caso anterior de la distribucin de frecuencias, tendremos:
Primaria completa

40% de 360 grados = 144 grados

Secundaria completa

37% de 360 grados = 133.2 grados

Profesor : Carlos A. Garca Palacios

Pgina 6

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

Superior completa

23% de 360 grados = 82.8 grados


MODALIDAD

fi

hi

Pi

Primaria Completa

60

0,40

40%

Secundaria Completa

55

0,37

37%

Superior Completa

35

0,23

23%

150

23%

40%

Primaria Completa
Secundaria Completa
Superior Completa

37%

PARA UNA VARIABLE CUANTITATIVA DISCRETA (CON POCOS VALORES)


Para las variables de este tipo tambin es posible usar los grficos de barras. Pero existe
otro grfico, diseado para este tipo de variables y es la GRFICA DE BASTONES. En
esta grfica, la frecuencia del valor de la variable es representado por un segme nto de
recta en vez de una barra.
Tomemos la variable nmero de hijos, los posibles valores de esta variable son 0 hijos,1
hijo, 2 hijos, 3 hijos 4 hijos. Luego, para una muestra de 100 datos tendremos la
distribucin de frecuencias:
VALOR

fi

hi

0 Hijos

7/ 100 = 0.07

1 Hijo

15

15 ./ 100 = 0.15

2 Hijos

40

40 / 100 = 0.40

3 Hijos

25

25 / 100 = 0.25

4 Hijos

13

13 / 100 = 0.13

TOTAL

100

1.00

Profesor : Carlos A. Garca Palacios

Pgina 7

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

P AR A U N A V AR I AB L E C U AN T IT AT I V A DISCRETA
(CON MUCHOS VALORES) O CONTINUA

Para el caso de una variable cuantitativa con valores agrupados en intervalos de clase existe una
grfica equivalente a la grfica de barras, se denomina HISTOGRAMA.
Esta forma de presentacin tambin consiste en graficar barras, pero, a diferencia de la
grfica de barras, aqu las barras estn pegadas unas a otras. Cada barra corresponde
a un intervalo de clase y se acostumbra a colocar el valor inicial y final de cada intervalo
o la marca de clase para identificar cada barra. La altura de cada barra puede ser
proporcional a la frecuencia (fi) o la frecuencia relativa (hi) del intervalo.
Ejemplo:
Tenemos la siguiente distribucin de frecuencias ya vista para la vari able estadstica
monto vendido al da:
Intervalos

xi

fi

Fi

hi

pi

[ 52,5 ; 57,5 >

55

0,04

4%

[ 57,5 ; 62,5 >

60

0,06

6%

[ 62,5 ; 67,5 >

65

0,08

8%

[ 67,5 ; 72,5 >

70

14

0,10

10%

[ 72,5 ; 77,5 >

75

22

0,16

16%

Profesor : Carlos A. Garca Palacios

Pgina 8

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

[ 77,5 ; 82,5 >

80

10

32

0,20

20%

[ 82,5 ; 87,5 >

85

40

0,16

16%

[ 87,5 ; 92,5 >

90

46

0,12

12%

[ 92,5 ; 97,5 ]

95

50

0,08

8%

1,00

100%

Total

50

FRECUENCIAS

HISTOGRAMA
15
10
5
0

55

60

65

70

75

80

85

90

95

MARCAS DE CLASE

Uniendo los puntos medios de


histograma se obtiene un grfico
polgono de frecuencias ayudar
mejor describa a los elementos
estudia.

los lados superiores de cada barra rectangular del


llamado polgono de frecuencias. El conocimiento del
ms adelante en la bsqueda del modelo terico que
de la poblacin de acuerdo con la variable que se

OTRO EJEMPLO DE POLIGONO DE FRECUENCIAS

Profesor : Carlos A. Garca Palacios

Pgina 9

TEXTO DIDCTICO

ESTADSTICA DESCRIPTIVA

Una grfica similar al polgono de frecuencias es la ojiva, pero sta se obtiene de aplicar
parcialmente la misma tcnica a una distribucin acumulativa y de igual manera que stas, existen
las ojivas mayor que y las ojivas menor que.
Existen dos diferencias fundamentales entre las ojivas y los polgonos de frecuencias (y por esto la
aplicacin de la tcnica es parcial):
Un extremo de la ojiva no se "amarra" al eje horizontal, para la ojiva mayor que sucede con el
extremo izquierdo; para la ojiva menor que, con el derecho.
En el eje horizontal en lugar de colocar las marcas de clase se colocan las fronteras de clase. Para
el caso de la ojiva mayor que es la frontera menor; para la ojiva menor que, la mayor.
Las siguientes son ejemplos de ojivas, a la izquierda la mayor que, a la derecha la menor que,
utilizando los datos que se usaron para ejemplificar el histograma:

La ojiva mayor que (izquierda) se le denomina de esta manera porque viendo el punto que est
sobre la frontera de clase "4:00" se ven las visitas que se realizaron en una hora mayor que las 4:00
horas (en cuestiones temporales se dira: despus de las 4:00 horas). De forma anloga, en la ojiva
menor que la frecuencia que se representa en cada frontera de clase son el nmero de
observaciones menores que la frontera sealada (en caso de tiempos sera el nmero de
observaciones antes de la hora que seala la frontera).
Si se utiliza una distribucin porcentual acumulativa entonces se obtiene una ojiva (mayor que o
menor que segn sea el caso) cuyo eje vertical tiene una escala que va del 0% al 100%. El
siguiente ejemplo es la misma ojiva menor que que se acaba de usar, pero con una distribucin
porcentual:

Profesor : Carlos A. Garca Palacios

Pgina 10

TEXTO DIDCTICO

Profesor : Carlos A. Garca Palacios

ESTADSTICA DESCRIPTIVA

Pgina 11

Vous aimerez peut-être aussi