Vous êtes sur la page 1sur 14

Unidad 2.

Representacin numrica y grfica de datos

2.1. Organizacin de datos y distribucin de frecuencias


Introduccin La descripcin estadstica organiza los datos y los presenta en forma de tablas y grficas. Esta rea slo describe, resume, organiza y representalos datos obtenidos de una poblacin o muestra de la poblacin, sin elaborar inferencias ni obtener conclusiones. La organizacin de datos se realiza a travs detablas que se utilizan para simplificar la presentacin y distribucin de estos datos. A continuacin, conocers que existen diferentes tipos de presentacin de datos y con base en ellos, distintas clasificaciones de frecuencia, como: frecuencia relativa, frecuencia acumulada y frecuencia absoluta.

2.1.1. Frecuencias

Frecuencia o Frecuencia absoluta

La frecuencia o frecuencia absoluta es el nmero de veces que se repite un valor dentro de un conjunto de datos, se denota como fi. Por ejemplo, supongamos que tienes la siguiente serie de datos: 3, 2, 5, 7, 3, 7, 7, 5, 2, 7, 3. Si los organizas en una tabla, tendras:
Dato 2
3

Frecuencia 2 (porque se repite 2 veces) 3 (porque se repite 3 veces) 2 (porque se repite 2 veces) 4 (porque se repite 4 veces) 11

5
7

Total de datos (N)

Frecuencia absoluta acumulada La frecuencia absoluta acumulada es la suma de las frecuencias de las variables hasta el rengln i, se representa como Fi. Tambin es conocida como frecuencia acumulada. Siguiendo con el ejemplo anterior:
Dato 2
3

Frecuencia 2
3

Frecuencia acumulada 2 (hasta aqu tienes 2 datos 5 (la suma de la frecuencia del primer dato con la del segundo dato 2+3) 7 (frecuencia de 2+frecuencia de 3+frecuencia de 5) 11 (frecuencia de 2+frecuencia de 3+frecuencia de 5 frecuencia de 7)

5
7

2
4

Total de datos (N)

11

Frecuencia relativa

La frecuencia relativa es el resultado de dividir la frecuencia de cada dato entre el nmero total de datos(N). La suma de esta columna da 1 (excepto cuando el resultado de las divisiones se redondea). Este dato tambin puede verse como un porcentaje, se representa como hi. Siguiendo con el ejemplo anterior:
Dato 2
3

Frecuencia 2
3

Frecuencia acumulada 2
5

Frecuancia relativa 0.181 (se divide 2/11)


0.272 (se divide 3/11)

0.181 (se divide 2/11)

11

0.363 (se divide 4/11)

Total de datos (N)

11

Frecuencia relativa acumulada La frecuencia relativa acumulada es la suma de las frecuencias relativas hasta el rengln i. Se representa como Hi, observa el ejemplo:
Dato 2 Frecuencia 2 Frecuencia acumulada 2 Frecuencia relativa 0.1818 Frecuencia relativa acumulada 0.1818 (hasta este rengln slo tienes esta frecuencia relativa) 0.4545 (se suma la frecuencia relativa del primer dato con la del segundo dato 0.1818+0.2727) 0.6363 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5) 0.9999 (la frecuencia relativa de 2+la frecuencia relativa de 3+la frecuencia relativa de 5+la frecuencia relativa de 7)

0.2727

0.1818

11

0.3636

Total de datos (N)

11

Ejemplo de organizacin de frecuencias En la siguiente pantalla observars una tabla con la organizacin de frecuencias, los datos presentados son los siguientes: 18, 41, 23, 47,18, 23, 23, 41, 41, 47, 47, 52, 23, 47, 23, 47, 18, 47, 7, 23, 18, 47, 52, 41, 52, 18, 23, 52, 7, 18, 52, 23.

Datos No. obtenidos Frecuencia rengln de la fi variable

Frecuencia acumulada Fi

Otra forma para obtenerFi

Frecuencia relativa hi

Frecuencia relativa acumulada Hi

1 2 3 4 5

7 18 23 41 47

f1= 2 f2= 6 f3= 8 f4= 4 f5= 7

f1=F1= 2 f1+f2= F2= 8 f1+f2+f3= F3=16 f1+f2+f3+f4=F4=20 f1+f2+f3+f4+f5=F5=27

f1 = F1=2 F1+f2=F2=8 F2+f3=F3=16 F3+f4=F4=20 F4+f5=F5=27

h1=f1/N=0.0625 h2=f2/N=0.1875 h3=f3/N=0.2500 h4=f4/N=0.1250 h5=f5/N=0.2187

h1=H1=0.0625 h1+h2=H2= 0.2500 h1+h2+h3= H3=0.5000 h1+h2+h3+h4 =H4=0.6250

h1+h2+h3+ h4+h5=H5=0.8430 h1+h2+h3+ h4+h5+h6= H6=1.0000

52

f6= 5

f1+f2+f3+f4+f5+f6=F6=32 F5+f6=F6=32

h6=f6/N=0.1563

Total

N=32

1.0000

2.1.2. Intervalos
Otro concepto muy utilizado en estadstica descriptiva es el de intervalo. Conoce qu es y los dems conceptos asociados.

Intervalos
Conjunto de valores agrupados entre dos nmeros, conocidos como lmites, en este caso, lmites del intervalo.

Intervalo de clase
Se llama intervalo de clase a la expresin que denota un intervalo.

Amplitud del intervalo


La amplitud del intervalo es la distancia que hay entre los lmites superior e inferior del intervalo. Se calcula restando el valor del lmite inferior al valor del lmite superior.

Frontera de clase
Son los puntos medios entre los lmites de intervalos consecutivos. Las fronteras de clase se utilizan para recuperar los datos entre el lmite superior de un intervalo y el lmite inferior del siguiente.

Marca de clase
Tambin conocida como punto medio de clase, es el resultado de la suma de los lmites inferior y superior del intervalo, dividido entre dos.

Ejemplo de intervalos Observa cmo se representan los conceptos relacionados con los intervalos, coloca el cursor sobre las palabras resaltadas.

Dados los nmeros 15 y 25, tendras que: El intervalo corresponde a todos los nmeros que se encuentran entre 15 y 25. El intervalo de clase sera: 15-25 Los lmites del intervalo son: Lmite inferior=15 Lmite superior=25 La amplitud del intervalo 15-25 sera: 25 menos 15, es decir, 10. Es recomendable que todos los intervalos tengan la misma amplitud, por lo que se puede restar el dato menor al dato mayor y dividir el resultado entre el nmero de intervalos. La frontera de clase: dados los intervalos 4-14, 15-25 y 26-36, las fronteras de clase seran: 3.5 y 14.5, para el primer intervalo, 14.5 y 25.5 para el segundo intervalo, por ltimo, 25.5 y 36.5 para el tercer intervalo. La marca de clase del intervalo 15-25 es igual a: 15+25=40/2=20. Es recomendable que la marca del intervalo coincida con alguno de los datos, aunque esto no es necesario ni siempre se logra; sobre todo cuando los intervalos tienen la misma amplitud.

2.1.3. Construccin de intervalos de clase


La formacin de clases o intervalos de clase, que se representa con (k), depende, generalmente, del tamao del rango de la poblacin o muestra. Lo que se debe hacer para determinar los intervalos de clase es lo siguiente.
Paso 1. Calcular el rango Se identifica el nmero mayor (Xn) y el nmero menor (X1) en los datos. El rango es el resultado de restar el nmero menor al nmero mayor; esto es: 240 R= Xn X1 Por ejemplo: Para una serie de datos que van desde el 18 hasta el 56,se tiene lo siguiente: Xn= 56 X1= 18 por lo tanto, R= Xn X1= 56 18= 38 Paso 2. Determinar el nmero de intervalos que se desea tener No existe una regla para determinar el nmero de intervalos, pero generalmente se suelen crear entre 5 y 20 intervalos. La decisin la toma el investigador. Siguiendo con el ejemplo, se van a construir 7 intervalos. Entonces k= 7

Paso 3. Dividir el rango entre el nmero de intervalos que se desea tener Recuerda que es recomendable elegir un nmero entre 5 y 20 para los intervalos y dividir el rango entre el nmero deseado de intervalos. Siguiendo con el ejemplo: Si son 7 intervalos 38/7 = 5.428 sta ser la amplitud de los intervalos. Cuando no es un nmero entero, se escoge el entero sin decimales. Paso 4. Formacin de intervalos: Los intervalos se forman comenzando un nmero antes del primer dato. Intervalos: 17 a 22 (se cuenta 5 desde 18 hasta 22) 23 a 28 (el siguiente intervalo comienza a partir del lmite superior del intervalo anterior) 29 a 34 35 a 40 41 a 46 47 a 52 53 a 58

Nota. No importa que el ltimo intervalo exceda el ltimo dato.

Ejemplo de construccin de intervalos El director de una consultora en desarrollo de software desea conocer el nmero de incidencias en sus desarrollos reportadas durante los meses de agosto y septiembre. Para ello registra los siguientes datos: 35, 24, 26, 23, 50, 20, 25, 56, 30, 30, 38, 36, 35, 29, 28, 30, 40, 39, 38, 40, 27, 24, 30, 32, 35, 27, 29, 22, 28, 27, 48, 40, 48, 31, 39, 28, 46, 36, 37, 52, 44, 49, 52, 41, 31, 31, 56, 58, 38, 26, 25, 24, 60, 55, 48, 37, 31, 30, 22, 20. Observa cada paso: 1. 2. 3. 4. Calcular el rango: R=XnX1=60-20=40 Determinar el nmero de intervalos entre 5 y 20: Elegir 8 intervalos. Dividir el rango entre el nmero de intervalos: 40/8=5 Se forman los intervalos: Comenzar por un nmero anterior al lmite inferior: 19-24, 25-30, 31-36, 37-42, 43-48, 49-54, 55-60

2.1.4. Tablas de datos

Existen diferentes tipos de tablas para presentar datos, las ms utilizadas son: Tabla de datos, Tabla de frecuencias, Tabla por intervalos de clase y Tablas de doble entrada. Conoce en qu consiste cada una:

Tablas de datos Una tabla de datos es la forma ms sencilla de organizar un conjunto de datos y se utiliza cuando la informacin que necesitas son los datos mismos. Se organizan en columnas o renglones y se registran las mediciones o datos obtenidos. Ejemplo: Imagina que la medicin de temperatura a lo largo del da da como resultado los siguientes valores (en grados Celsius): 20.4, 21.2, 22.1, 23.9, 25.3, 26.9, 27.7 A partir de estos valores construyes la siguiente tabla:

2.1.5. Tablas de frecuencias

Las tablas de frecuencia aportan mayor informacin que las tablas de datos, ya que estn construidas con las categoras de la variable que se est midiendo y su frecuencia. Ejemplo:

Un experimento da como resultado los siguientes valores: 1, 2, 2, 2, 1, 1, 5, 4, 3, 2, 2, 1, 3, 4, 5, 6, 2, 3, 4, 5, 5, 4, 3, 3, 2 Si agrupas los datos por categoras, segn la frecuencia o nmero de veces que aparece cada dato, tendras la siguiente tabla:

Las tablas de frecuencias pueden construirse anexando las columnas correspondientes a la frecuencia acumulada, la frecuencia relativa y frecuencia relativa acumulada

2.1.6. Tablas por intervalos de clase


En este tipo de tablas los datos son presentados por intervalos de clase y no por los valores correspondientes a cada variable. Ejemplo: En una encuesta sobre el desempleo en el rea metropolitana de la ciudad de Mxico, se organizan los datos por grupos de edades (intervalos de clase) y se presenta la frecuencia de cada intervalo, teniendo un total de 23,700 desempleados.

2.1.7. Tablas de doble entrada

Estas tablas proporcionan informacin referente a dos variables o eventos relacionados entre s. La informacin se distribuye poniendo en los renglones de la tabla la informacin de una de las variables y en las columnas la informacin de la otra variable. Ejemplo: Se cuenta el nmero de cirugas realizadas por edades en una muestra de 100 personas, los resultados son los siguientes:

Una tabla cualquiera puede ser vista como una tabla de doble entrada, en la cual las variables relacionadas son los rangos contra el valor de las variables en dicho rango. Por ejemplo, imagina que mides la temperatura de un lquido con respecto al tiempo de calentamiento. En el rengln colocas los tiempos y en las columnas la temperatura obtenida. Puedes considerar la tabla como una tabla de frecuencias o como una tabla de doble entrada:

2.2. Representacin grfica de los datos 2.2.1. Histograma


El histograma es la representacin grfica de una variable continua. Se elabora en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar la variable independiente, es decir, la escala de medicin o fronteras de clase. El eje vertical representa la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma permite apreciar visualmente la distribucin y dispersin de las mediciones.

2.2.2. Grfica de barras

Este tipo de grfica se utiliza para datos de tipo ordinal, nominal y discreto. En stas se muestran la frecuencia, la frecuencia relativa y el porcentaje por medio de la altura y no por el rea de la barra. Esta grfica muestra las discontinuidades en las mediciones por medio de espacios vacios entre las barras.

La grfica de barras se traza sobre un eje de coordenadas. Y puede ser de dos formas:

Un histograma y una grfica de barras son muy semejantes, la diferencia radica en que el histograma no presenta separacin entre las barras.

2.2.3. Grfica de lneas


Una grfica de lneas tambin se construye en un sistema coordenado rectangular y muestra la relacin entre las variables mediante puntos conectados por lneas continuas. La frecuencia de cada valor medido es representada por la altura del punto. En el eje horizontal se representa la variable y en el eje vertical, la frecuencia. Se determinan los puntos de corte del valor de la variable con su frecuencia y se unen, obtenindose la grfica de lnea

2.2.4. Grfica de reas o de pastel


Una forma de representar datos u observaciones de una variable cualitativa es mediante un diagrama circular. Esta grfica muestra la relacin entre las variables dividiendo un crculo (o pastel) en sectores (o rebanadas). Tambin, se utilizan para representar la

distribucin de frecuencias, pero es el rea de cada sector la proporcional a los valores medidos. Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema con respecto a la circunferencia, determinando sectores circulares para cada categora.

Histograma En esta figura se muestra el histograma de las mediciones en cm vs la frecuencia, nota como el ancho de las clases es el mismo.

Medicin en Frecuencia Frecuencia Porcentaje cm acumulada

30 30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9

3 7 12 18 23 21 17 11 5 1

3 10 22 40 63 84 101 112 117 118

3% 6% 10% 15% 19% 18% 14% 9% 4% 1%

Grfica de pastel En la grfica de pastel se muestra dentro de cada rebanada la medicin en cm y el porcentaje que corresponde a la frecuencia relativa.
Medicin en Frecuencia Frecuencia Porcentaje cm acumulada

30 30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9

3 7 12 18 23 21 17 11 5 1

3 10 22 40 63 84 101 112 117 118

3% 6% 10% 15% 19% 18% 14% 9% 4% 1%

Grfica de lnea En esta figura se muestra la frecuencia acumulada mediante una grfica de lnea.

Medicin en Frecuencia Frecuencia Porcentaje cm acumulada

30 30.1 30.2 30.3 30.4. 30.5 30.6 30.7 30.8 30.9

3 7 12 18 23 21 17 11 5 1

3 10 22 40 63 84 101 112 117 118

3% 6% 10% 15% 19% 18% 14% 9% 4% 1%

Vous aimerez peut-être aussi