Vous êtes sur la page 1sur 11

Captulo 2 ESTADSTICA DESCRIPTIVA MTODOS TABULARES Y GRFICOS La estadstica descriptiva o anlisis exploratorio de datos ofrece modos de presentar y evaluar

las caractersticas principales de los datos a travs de tablas, grficos y medidas de resmenes. En este captulo presentaremos formas simples de resumir y representar grficamente conjuntos de datos. 2.1 OBJETIVOS DEL CAPITULO Conocer y entender lo mtodos tabulares para organizar, resumir la informacin obtenida en una investigacin. Conocer los tratamientos de la informacin segn el tipo de dato o variable. Entender la forma de interpretacin de la informacin obtenida para la toma de decisiones. Determinar la forma de presentacin de la informacin mediante las tablas estadsticas. Conocer los diferentes grficos utilizados para la presentacin de la informacin estadstica. Utilizar el Excel en el manejo de las tablas de distribuciones y los grficos. 2.2 DISTRIBUCIONES DE FRECUENCIAS Definicin: La distribucin de frecuencias son mtodos para organizar y resumir la informacin obtenida en una investigacin, con el objetivo principal de analizar e interpretar los resultados. Adems, este mtodo sirve para organizar y ordenar el nmero de veces que se repite cada valor. Los mtodos de distribuciones de frecuencias son: a. Distribucin de frecuencias absoluta: Est definida como el nmero de veces que se repite los distintos valores que toma la variable. Para efectos del estudio lo representaremos con la notacin donde es el nmero de valores que toma la variable 1, 2, 3, La distribucin de frecuencias absoluta presenta las siguientes propiedades:

La sumatoria de las frecuencias absolutas debe ser igual al tamao de la poblacin o al tamao de la muestra segn el caso. La distribucin de frecuencias absolutas siempre est representada en nmeros enteros (variable discreta)

b. Distribucin de frecuencias relativa: Est definida como el porcentaje de ocurrencia que toma los distintos valores de la variable. Para efectos del estudio la denotaremos donde es el nmero de valores que toma la variable 1, 2, 3, De donde la frecuencia relativa se define

La distribucin de frecuencias relativa

presenta las siguientes propiedades:

La sumatoria de las frecuencias relativas debe ser igual a 1 (si est determinada en cifra referida) o 100% (si est determinada en trminos porcentuales). La frecuencia relativa toma valores entre 0 y 1 o entre 0% y 100%, se representa (0% 100%). La frecuencia relativa puede definirse como una probabilidad ya que toma valores entre 0 y 1 o 0% y 100%. c. Distribucin de frecuencias absoluta acumulada: Est definida como la suma o acumulacin de cada uno de los valores de la frecuencia absoluta, siempre y cuando la variable est organizada en forma ascendente o descendente. Para efectos del estudio la denotaremos donde es el nmero de valores que toma la variable 1, 2, 3, Esquema general para el clculo de la distribucin de frecuencias absolutas acumuladas.

de donde k es en nmero de valores que toma la variable El ltimo valor de la frecuencia absoluta acumulada debe ser igual al tamao de la muestra o de la poblacin. d. Distribucin de frecuencias relativa acumulada: Est definida coma la suma o acumulacin de cada uno de los valores que toma la frecuencia relativa. Para efectos del estudio la denotaremos donde es el nmero de valores que toma la variable 1, 2, 3, Esquema general para el clculo de la distribucin de frecuencias absolutas acumuladas.

de donde k es en nmero de valores que toma la variable El ltimo valor de la frecuencia absoluta acumulada debe ser igual a 100%. e. Marcas de Clase: Cada valor de la variable se conoce como clase. Cuando la informacin est agrupada en intervalos cada intervalo es conocido como intervalo de clase. Entonces las marcas clase estn definidas como los puntos medios de cada intervalo de clase cuando la informacin se encuentra agrupada en intervalos. Las marcas de clase las denotaremos con . Para calcular las marcas de clase utilizaremos la siguiente relacin para cada clase:

2.2.1 Tabla de distribucin de frecuencias datos categricos El modo ms simple de presentar datos categricos es por medio de una tabla de distribucin de frecuencias. Esta tabla indica el nmero de unidades de anlisis que caen en cada una de las clases de la variable cualitativa o categrica. Para elaborar las tabas de distribuciones de frecuencias lo ilustraremos con el siguiente ejemplo. Ejemplo 2.1 Se le realiz una encuesta a un grupo de 30 estudiantes de la Universidad, se les pregunt si fuman o no, elaborar tabla de distribucin de frecuencias e interpretarla, si se obtuvo los siguientes resultados: si no si Solucin Para realizar la tabla de distribucin de frecuencias primero que todo identificamos la variable, la escribimos en las columnas de una tabla, luego realizamos el conteo para determinar la frecuencia absoluta y con esta realizamos la frecuencia relativa as: Para el conteo se utilizar el mtodo de conteo de inventarios. no no no no no no no si no No No Si si no si si no no no no no No Si No no si no

Interpretaciones: 9 de los 30 estudiantes encuestados fuman. 21 de los 30 estudiantes encuestados no fuman. El 30% de los 30 estudiantes encuestados fuman. El 70% de los 30 estudiantes encuestados no fuman. El 30% de los estudiantes que equivale a 9 estudiantes fuman. El 70% de los estudiantes que equivale a 21 estudiantes no fuman.

Nota: Las distribuciones de frecuencias acumuladas no se pueden determinar ya que con las variables categricas no se pueden realizar operaciones matemticas. 2.2.2 Tabla de distribucin de frecuencias datos cuantitativos discretos. La forma de presentar la informacin para datos cuantitativos discreto presenta 2 mtodos, cuando el rango de la variable es pequea y cuando el rango de la variable es grande. a. Distribucin de frecuencias para rangos pequeos: Para este caso utilizaremos una tabla de distribuciones de frecuencias, que de aqu en adelante la llamaremos series frecuentes, para clculos posteriores. Esta tabla indica el nmero de unidades de anlisis que caen en cada uno de los datos que tome la variable. Para elaborar las tabas de distribuciones de frecuencias lo ilustraremos con el siguiente ejemplo. Ejemplo 2.2 Se realiza un estudio a 30 familias de la ciudad, para determinar el nmero de hijos por familia, elaborar la tabla de distribucin de frecuencias e interpretarla, si se encontr la siguiente informacin: 0 4 2 Solucin: Para simplificar obviaremos los procedimientos que fueron ilustrados anteriormente y procederemos a la elaboracin de la tabla; utilizaremos las notaciones utilizadas para cada caso. 1 2 3 0 3 2 2 1 1 2 0 0 4 1 1 3 2 2 1 3 2 2 2 3 1 4 2

Donde y son las frecuencias acumuladas ascendentes y frecuencias acumuladas descendentes 0 1 2 3 4 Totales Interpretaciones: 4 7 11 5 3 30 13.3% 23.3% 36.7% 16.7% 10% 100% 4 11 22 27 30 30 26 19 8 3 13.3% 36.3% 73.3% 90.0% 100.0%

son las

100.0% 87.7% 63.4% 26.7% 10.0%

Para simplificar las interpretaciones, interpretaremos la tercera clase (se encuentra sombreada) y de la misma forma se interpretan las dems clases. 11 de las 30 familias estudiadas tienen 2 hijos. El 36.7% de las 30 familias estudiadas tienen dos hijos o tambin se puede interpretar, el 36.7% de las familias que equivalen a 11 familias tienen 2 hijos. 22 de las 30 familias estudiadas tienen hasta 2 hijos. 19 de las 30 familias estudiadas tienen 2 o ms hijos. El 73.3% de las familias estudiadas tienen hasta 2 hijos o tambin se puede interpretar, el 73.3% de las familias que equivalen a 22 familias tienen hasta 2 hijos. El 63.4% de las familias estudiadas tienen 2 o ms hijos o tambin se puede interpretar, el 63.4% de las familias que equivalen a 19 familias tienen 2 o ms hijos. b. Distribucin de frecuencias para rangos grandes: Para este caso utilizaremos una tabla de distribuciones de frecuencias, agrupada en intervalos, que de aqu en adelante la llamaremos series agrupadas, para clculos posteriores. Esta tabla agrupa cada uno de los datos en intervalos con amplitud constante. Para elaborar las tablas de distribuciones de frecuencias primero ilustraremos el procedimiento de agrupar en intervalos. Procedimiento para agrupar o clasificar por intervalos: Para agrupar por intervalos los datos cuando la variable es discreta con rango amplio, utilizaremos el mtodo del rango ampliado, el cual consiste en: 1. Determinar el rango o recorrido de la variable bajo estudio donde.

2. Determinar el nmero de intervalos. Para el clculo del nmero de intervalos utilizaremos la frmula de Stugger.

De donde n es el tamao de la muestra. 3. Determinar la amplitud del intervalo. Para el clculo de la amplitud del intervalo utilizaremos la siguiente frmula:

Donde C es una constante mnima, donde al sumrsela al rango R y dividirla por el nmero de intervalos I da como resultado un nmero entero. 4. Determinar la amplitud del rango. Consiste en fraccionar la constante C en dos partes enteras iguales (si es posible), o en dos valores enteros aproximados, de tal forma, que una de las partes se le pueda restar al valor mnimo de la variable, para obtener el lmite inferior del intervalo y la otra parte sumrsela al valor mximo de la variable, para obtener el lmite superior del intervalo, en valores enteros, o sea: Valor entero Valor entero 5. Construir los intervalos. Para construir los intervalos utilizaremos el siguiente esquema: Clase 1 2 3 I Intervalos

6. Elaborar la tabla de distribucin de frecuencias. Se utilizan los mtodos de distribuciones vistas anteriormente. Nota: Cuando un dato de la variable coincide con el valor de los lmites, este se asigna al intervalo que aparece como lmite superior. Ejemplo 2.3 En los siguientes datos encontramos la cantidad de artculos defectuosos obtenidos por da, durante 30 das, en una mquina en empresa. Elaborar tabla de distribucin de frecuencias e interpretar la informacin obtenida.

73 63 56 Solucin

69 64 58

72 52 51

67 55 59

63 63 64

62 62 61

66 58 64

68 54 57

52 63 56

61 62 56

Como la variable es discreta y presenta un rango amplio de datos utilizaremos el procedimiento para agruparla por intervalos. 1. Determinamos el rango de la variable

2. Calculamos en nmero de intervalos

Este valor se puede aproximar a 5 por defecto o 6 por exceso, para este caso 6 3. Calculamos la amplitud del intervalo

4. Determinamos la amplitud del rango Fraccionamos en 2 partes y

= 51 1 = 50

73 + 1 = 74

5. Construir los intervalos Clase 1 2 3 4 5 6 50 Intervalos

62 60

6. Elaborar tabla de distribucin de frecuencias Clase 1 2 3 4 5 6 Intervalos 50 4 7 6 8 3 2 30 13,33% 23,33% 20% 26,67% 10% 6,67% 100% 4 11 17 25 28 30 30 26 19 13 5 2 13,33% 36,66% 56,66% 83,33% 93,33% 100% 100% 86,67% 63,34% 43,34% 16,67% 6,67% 52 56 60 64 68 70

62 60 Total

Interpretaciones: Para este caso se interpretar la clase 4 como ilustracin, ya que de la misma forma se interpretarn las dems clases. En 8 de los 30 das estudiados se encontraron entre 62 y 66 artculos defectuosos. En el 26,67% de los 30 das estudiados se encontraron entre 62 y 66 artculos defectuosos o tambin se puede interpretar, en el 26,67% que equivale a 8 das se encontraron entre 62 y 66 artculos defectuosos. En 25 de los 30 das estudiados se encontraron hasta 66 artculos defectuosos. En 13 de los 30 das estudiados se encontraron 62 o ms artculos defectuosos. En el 83.33% de los das estudiados que equivale a 25 das se encontraron hasta 66 artculos defectuosos. En el 43.34% de los das estudiados que equivale a 13 das se encontraron 62 o ms artculos defectuosos. En 8 de los 30 das estudiados se encontraron en promedio 64 artculos defectuosos. En el 26,67% que equivale a 8 das se encontraron en promedio 64 artculos defectuosos. 2.2.3 Tabla de distribucin de frecuencias datos cuantitativos continuos.

Para este caso utilizaremos una tabla de distribuciones de frecuencias, agrupada en intervalos, que de aqu en adelante la llamaremos series agrupadas, para clculos posteriores. Esta tabla agrupa cada uno de los datos en intervalos con amplitud constante, en enteros o enteros y cifras decimales. Para elaborar las tablas de distribuciones de frecuencias, utilizaremos el procedimiento para agrupar por intervalos, pero considerando la cantidad de cifras decimales de la variable continua. Ejemplo 2.4 Se realiz un estudio a 30 entidades financieras para determinar la tasa de inters de colocacin mensual del mercado y se encontr la siguiente informacin: 3,25 3,18 2,75 1,1 0,75 2,94 1,80 0,93 2,6 2,35 1,08 3,01 3 1,28 3,14 3,08 1,43 2,86 2,76 1,76 2,94 2 1,98 2,54 1,8 2,04 2,47 2,5 2,36 1,28

Resumir y organizar la informacin obtenida mediante las tablas de distribucin de frecuencias. Solucin 1. Determinamos el rango de la variable

2. Calculamos en nmero de intervalos

Este valor se puede aproximar a 5 por defecto o 6 por exceso, para este caso 5 3. Calculamos la amplitud del intervalo

4. Determinamos la amplitud del rango Como , no se fracciona

= 0,75

3,25 5 y 6 Construir los intervalos y elaboramos la tabla de distribucin de frecuencias Clase 1 2 3 4 5 Intervalos 0,75 4 3 6 7 10 30 13.33% 10% 20% 23,33% 33,34% 100% 4 7 13 20 30 30 26 23 17 10 13.33% 23,33% 43,33% 66,66% 100% 100% 86.67% 76,67% 56,67% 33,34% 1 1,5 2 2,5 3

2,25 Total

Interpretaciones: Para este caso se interpretar la clase 3 como ilustracin, ya que de la misma forma se interpretarn las dems clases. 6 de las 30 entidades financieras estudiadas, tienen una tasa de inters de colocacin mensual entre 1,75 y 2,25. El 20% de las 30 entidades financieras estudiadas, tienen una tasa de inters de colocacin mensual entre 1,75 y 2,25, o tambin se puede interpretar, el 20% que equivale a 6 entidades financieras, tienen una tasa de inters de colocacin mensual 1,75 y 2,25. 13 de las 30 entidades financieras estudiadas, tienen una tasa de inters de colocacin mensual hasta 2,25. 23 de las 30 entidades financieras estudiadas, tienen una tasa de inters de colocacin mensual de 1,75 o ms. El 43.33% que equivale a 13 entidades financieras, tienen una tasa de inters de colocacin mensual hasta 2,25. El 76.67% que equivale a 23 entidades financieras, tienen una tasa de inters de colocacin mensual de 1,75 o ms.

6 de las 30 entidades financieras estudiadas, tienen una tasa de inters de colocacin mensual promedio de 2. El 20% que equivale a 6 entidades financieras, tienen una tasa de inters de colocacin mensual promedio de 2. 2.2.4. Tablas de contingencias En estadstica una tabla de contingencia, es una tabla bidimensional donde se clasifican las observaciones mustrales segn dos caractersticas cualitativas, nominales u ordinales; cada una con un nmero determinado de resultados posibles. Una de las caractersticas o variable, determina las filas de la tabla y la otra las columnas. Caracterstica B .. .. Caracterstica A .. .. n Total

.. Total

Si la muestra corresponde a una nica poblacin y los individuos se clasifican segn dos variables cualitativas, medidas sobre cada uno de ellos con k y m posibles resultados para cada variable, el objetivo del anlisis de la tabla ser determinar si existe relacin entre las variables.

Vous aimerez peut-être aussi