Vous êtes sur la page 1sur 21

ARGUETA LPEZ ALEJANDRA BELEN

UNIDAD TEMTICA 1: ESTADSTICA DESCRIPTIVA


1.1 Recopilacin de datos
Uso de tcnicas y herramientas que pueden ser utilizadas para desarrollar sistemas de
informacin, los cuales pueden ser la entrevistas, la encuesta, el cuestionario, la
observacin, el diagrama de flujo y el diccionario de datos.
1.1.1 Datos no agrupados
Es el conjunto de datos obtenidos en una recopilacin que no han sido clasificados en
clases o categoras, pues no es necesario clasificar dichos datos. Cuando la muestra
contiene pocos elementos los datos pueden ser analizados sin necesidad de formar
clases con ellos; a esto se le denomina tratamiento de datos no agrupados.
Es aquella distribucin que indica las frecuencias con que aparecen los datos
estadsticos, desde el menor de ellos hasta el mayor de ese conjunto sin que se haya
hecho ninguna modificacin al tamao de las unidades originales. En estas
distribuciones cada dato mantiene su propia identidad despus que la distribucin de
frecuencia se ha elaborado. En estas distribuciones los valores de cada variable han
sido solamente reagrupados, siguiendo un orden lgico con sus respectivas
frecuencias.
EJEMPLO 1.1

Datos agrupados
Es el conjunto de datos obtenidos en una recopilacin que han sido organizados en
varias clases o categoras. El fin de agruparlos es resumir la informacin adquirida;
generalmente, los elementos son de gran tamao, por lo cual requieren ser agrupados,
20

ARGUETA LPEZ ALEJANDRA BELEN


esto implica: ordenar, clasificar y expresarlos en una tabla de frecuencias; para que los
datos puedan clasificarse se debe de verificar que stos sean significativos, esto es,
que la informacin sea repetitiva y una vez hecha dicha clasificacin verificar que
tenga coherencia y lgica.
Es aquella distribucin en la que la disposicin tabular de los datos estadsticos se
encuentra ordenados en clases y con la frecuencia de clase; es decir, los datos
originales de varios valores adyacentes del conjunto se combinan para formar un
intervalo de clase. No existen normas establecidas para determinar cundo es
apropiado utilizar datos agrupados o datos no agrupados; sin embargo, se sugiere que
cuando el nmero total de datos (N) es igual o superior a 50 y adems el rango o
recorrido de la serie de datos es mayor de 20, entonces, se utilizara la distribucin de
frecuencia para datos agrupados, tambin se utilizara este tipo de distribucin cuando
se requiera elaborar grficos lineales como el histograma, el polgono de frecuencia o la
grfica

ojiva.

La razn fundamental para utilizar la distribucin de frecuencia de clases es


proporcionar mejor comunicacin acerca del patrn establecido en los datos y facilitar la
manipulacin de los mismos. Los datos se agrupan en clases con el fin de sintetizar,
resumir, condensar o hacer que la informacin obtenida de una investigacin sea
manejable

con

mayor

facilidad.

Los datos agrupados se refieren al hecho de que estn ordenados, clasificados y


contados.
EJEMPLO 1.1.1

20

ARGUETA LPEZ ALEJANDRA BELEN

1.2 Ordenacin y clasificacin


Cuando los datos contienen una gran cantidad de elementos, para facilitar los clculos
es necesario agruparlos.
1.2.1 N de intervalos de clase
Nmero de Intervalos de Clase (ni).- No debe ser menor de 5 y mayor de 12, ya que un
nmero mayor o menor de clases podra oscurecer el comportamiento de los datos.
Para calcular el nmero de intervalos se aplica la regla de Sturges:

Siendo n el tamao de la muestra.

1.2.2 Tamao de intervalo


El Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el nmero de intervalos

Cuando el valor de i no es exacto, se debe redondear al valor superior ms cercano.


Esto altera el valor de rango por lo que es necesario efectuar un ajuste.

20

ARGUETA LPEZ ALEJANDRA BELEN

EJEMPLO 1.2

1.2.3 Distribucin de frecuencias


20

ARGUETA LPEZ ALEJANDRA BELEN


La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma
de tabla de

los

datos

estadsticos,

asignando

cada dato su frecuencia

correspondiente.
Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un
estudio estadstico.
Se representa por fi.
La suma de las frecuencias absolutas es igual al nmero total de datos, que se
representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula)
que se lee suma o sumatoria.

Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado
valor y el nmero total de datos.
Se puede expresar en tantos por ciento y se representa por fr.
fi
fr= N
La suma de las frecuencias relativas es igual a 1.
Frecuencia acumulada
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores
inferiores o iguales al valor considerado.
Se representa por fa.
Frecuencia relativa acumulada
20

ARGUETA LPEZ ALEJANDRA BELEN


La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un
determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Este tipo de tablas de frecuencias se utiliza con variables discretas.
EJEMPLO 1.2.1

Distribucin de frecuencias agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si
las variables toman un nmero grande de valores o la variable es continua.
Se agrupan los valores en intervalos que

tengan

la misma

amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.


Lmites de la clase
Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la
clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a
todo el intervalo para el clculo de algunos parmetros.
M . C=

Ls + Li
2

20

ARGUETA LPEZ ALEJANDRA BELEN

EJEMPLO 1.2.2

1.3 Estudio descriptivo


Un estudio descriptivo es un tipo de metodologa a aplicar para deducir un bien o
circunstancia que se est presentando; se aplica describiendo todas sus dimensiones,
en este caso se describe el rgano u objeto a estudiar. Los estudios descriptivos se
centran en recolectar datos que describan la situacin tal y como es.
1.3.1 Medidas de tendencia central. Media, Moda, Mediana, Media ponderada.
Nos indican en torno a qu valor (centro) se distribuyen los datos.
Las medidas de centralizacin son:
Media aritmtica
La media aritmtica es el valor promedio de la distribucin.
EJEMPLO 1.3

20

ARGUETA LPEZ ALEJANDRA BELEN

Para datos agrupados:

Mediana
La mediana es la puntacin de la escala que separa la mitad superior de la distribucin
y la inferior, es decir divide la serie de datos en dos partes iguales.
EJEMPLO 1.3.1
La serie ordenada de 9 datos es:
1, 3. 7. 14, 16. 30, 99. 120, 2,000.
La mediana es el quinto dato ordenado que divide a la serie en 2 grupos de 4 datos
cada uno. Esto es. Me 16.

Para datos agrupados:


20

ARGUETA LPEZ ALEJANDRA BELEN

Moda
El dato que ms veces se repite.
La moda no siempre existe y si existe, no siempre es nica.
En matemtica, la moda es el valor de la variable en el que existe un mximo absoluto
(o dos o ms mximos relativos iguales).
La moda es una medida promedio que se usa cuando se quiere sealar el valor ms
comn de una serie de datos. Por ejemplo, los comerciantes se estoquean con
productos que estn de moda.
La moda es el promedio menos importante debido a su ambigedad.
EJEMPLO 1.3.2

20

ARGUETA LPEZ ALEJANDRA BELEN


La moda de los datos:
a) 7, 9, 7, 8, 7, 4, 7, 13, 7 es igual a 7. Esta serie de dalos es unimodal.
b) 5, 3, 4, 5, 7, 3, 5, 6 3 es igual tanto a 3, como a 5. Esta serie de dalos es
bimodal.
c) 31, 11, 12, 19 no existe. (Tambin vale decir que cada uno de los datos es una
moda).
Para datos agrupados:

Media ponderada
La media ponderada es una medida de tendencia central, que es apropiada cuando en
un conjunto de datos cada uno de ellos tiene una importancia relativa (o peso) respecto
de los dems datos. Se obtiene multiplicando cada uno de los datos por su ponderacin
(peso) para luego sumarlos, obteniendo as una suma ponderada; despus se divide
esta entre la suma de los pesos, dando como resultado la media ponderada.
20

ARGUETA LPEZ ALEJANDRA BELEN


EJEMPLO 1.3.3

1.3.2 Medidas de dispersin. Rango, Desviacin, Media Absoluta, Varianza, Desviacin


Estndar, Coeficiente de variacin
Las medidas de dispersin nos informan sobre cunto se alejan del centro los valores
de la distribucin.
Las medidas de dispersin son:
Rango o recorrido
El rango de variacin o recorrido, R, de una serie de datos, es la diferencia entre sus
valores mximo y mnimo. Esto es: R= Xmax-Xmin, siendo x max el valor mximo y x
min el valor mnimo.

20

ARGUETA LPEZ ALEJANDRA BELEN


El rango es una medida de dispersin muy fcilmente calculable, pero es muy inestable,
ya que depende nicamente de los dos valores extremos. Su valor puede cambiar
grandemente si se aade o elimina un slo dato. Por tanto su uso es muy limitado.
EJEMPLO 1.3.4
Dadas las dos series de datos
a) 1, 4, 4, 5, 5, 5, 5, 6, 6, 9
b) 1, 2, 3, 4, 5, 6, 7, 8, 9
Ambas series tienen la misma media, 5, y el mismo rango, 8, pero las dos series no
tienen la misma dispersin, ya que la segunda tiene mayor variabilidad.
El empleo del rango como medida de comparacin de variacin puede estar justificado
cuando se precise rpidamente de una medida de dispersin y no haya tiempo de
calcular algunas de las otras.
Desviacin media absoluta
La desviacin

media es

la media

aritmtica de

los valores

absolutos de

las desviaciones respecto a la media.


Varianza
La varianza, es una medida que cuantifica el grado de dispersin o de variacin de los
valores de una variable cuantitativa con respecto a su media aritmtica. Si los valores
tienden a concentrarse alrededor de su media, la varianza ser pequea. Si los valores
tienden a distribuirse lejos de la media, la varianza ser grande.
Para datos no agrupados:

20

ARGUETA LPEZ ALEJANDRA BELEN

Para datos agrupados:


Coeficiente de Variacin
Su frmula expresa la desviacin estndar como porcentaje de la media aritmtica,
mostrando una mejor interpretacin porcentual del grado de variabilidad que la
desviacin tpica o estndar. Por otro lado presenta problemas ya que a diferencia de
la desviacin tpica este coeficiente es variable ante cambios de origen. Por ello es
importante que todos los valores sean positivos y su media d, por tanto, un valor
positivo. A mayor valor del coeficiente de variacin mayor heterogeneidad de los valores
de la variable; y a menor C.V., mayor homogeneidad en los valores de la variable. Suele
representarse por medio de las siglas C.V.
Se calcula:

20

ARGUETA LPEZ ALEJANDRA BELEN

Desviacin Estndar
La desviacin tpica o desviacin estndar (denotada con el smbolo o s, dependiendo
de la procedencia del conjunto de datos) es una medida de dispersin para variables de
razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la
raz cuadrada de la varianza de la variable.
EJEMPLO 1.3.5

20

ARGUETA LPEZ ALEJANDRA BELEN

1.3.3 Medidas de sesgo y curtosis. Coeficiente de asimetra de Pearson y el momento


tres. Curtosis momento cuatro o por percentiles.
Coeficiente de asimetra de Pearson
El coeficiente de asimetra de Pearson CAP mide la diferencia entre la media y
la moda respecto a la dispersin del conjunto X=(x1, x2,, xN).
Este procedimiento, menos usado, lo emplearemos solamente en distribuciones
unimodales y poco asimtricas.
Si CAP<0: la distribucin tiene una asimetra negativa, puesto que la media es menor
que la moda.
Si CAP=0: la distribucin es simtrica.

20

ARGUETA LPEZ ALEJANDRA BELEN


Si CAP>0: la distribucin tiene una asimetra positiva, ya que la media es mayor que
la moda.
EJEMPLO 1.3.6

EJEMPLO 1.3.7

Curtosis momento cuatro


Permite medir el grado de la agudeza de una distribucin, es decir, para saber cun
agudo o plano es un polgono de frecuencias.
20

ARGUETA LPEZ ALEJANDRA BELEN


Observemos los tipos de curtosis, en las siguientes
grficas:
En la figura A se observa que ambas curvas son simtricas y tienen la misma
media, mientras que una de las curvas es ms crtica. La figura B se le denomina
mesocrtica (intermedio con punta). La figura C se le denomina leptocrtica (delgada
con punta) y la figura D se le denomina platicrtica (aplanado con punta).
El

coeficiente

de

curtosis

de

un

grupo

de

datos,

es

una

medida

del

apuntamiento o aplastamiento de su polgono de frecuencias, se define como:

En donde C75 es el percentil 75, etc.


Cuando el coeficiente de curtosis tiende a 0,5; esto es, si las diferencias C75C25 y
C90-C10, son aproximadamente iguales, la curva se llama leptocrtica.
Si el coeficiente de curtosis tiende a 0, esto es, cuando la diferencia C75C25

es

pequea, respecto de C90-C10, la curva se llama platicrtica.


Si el coeficiente de curtosis es aproximadamente 0,25; esto es, si C90-C10
es aproximadamente el doble de C75C25 , la curva se llama mesocrtica.

1.4 Graficas.
Un grfico o representacin

grfica es

un

tipo

de

representacin

generalmente numricos,

de datos,

mediante recursos

grficos (lneas, vectores, superficies o smbolos), para que se manifieste visualmente


la relacin matemtica o correlacin estadstica que guardan entre s.
Para datos no agrupados:
Escalonada: Altamente utilizados en distribuciones para variable con frecuencia
discreta. Este tipo de diagramas presentan un perfil escalonado, producindose un
salto en cada uno de los valores definidos de la variable aleatoria. Es continua por la
derecha, pero no por la izquierda. La cuanta de cada salto es precisamente la
probabilidad en ese punto, la funcin de cuanta.
20

ARGUETA LPEZ ALEJANDRA BELEN

De lneas:

Para datos agrupados:


1.4.1 Histograma
Est formado por rectngulos cuya base es la amplitud del intervalo y tiene la
caracterstica que la superficie que corresponde a las barras es representativa de la
cantidad de casos o frecuencia de cada tramo de valores, puede construirse con clases
que tienen el mismo tamao o diferente (intervalo variable). La utilizacin de los
intervalos de amplitud variable se recomienda cuando en alguno de los intervalos, de
amplitud constante, se presente la frecuencia cero o la frecuencia de alguno o algunos
de los intervalos sean mucho mayor que la de los dems, logrando as que las
observaciones se hallen mejor repartidas dentro del intervalo.
EJEMPLO 1.4

20

ARGUETA LPEZ ALEJANDRA BELEN

1.4.2 Polgono de Frecuencias


Se puede obtener uniendo cada punto medio (marca de clase) de los rectngulos del
histograma con lneas rectas, teniendo cuidado de agregar al inicio y al final marcas de
clase adicionales, con el objeto de asegurar la igualdad del reas.
EJEMPLO 1.4.1

1.4.3 Ojivas
Cuando se trata de relacionar observaciones en un mismo aspecto para dos colectivos
diferentes no es posible ejecutar comparaciones sobre la base de la frecuencia, es
necesario tener una base estndar, la frecuencia relativa. La ojiva representa
grficamente la forma en que se acumulan los datos y permiten ver cuantas
observaciones se hallan por arriba o debajo de ciertos valores. Es til para obtener una
medida de los cuartiles, deciles, percentiles.
EJMPLO 1.4.2

20

ARGUETA LPEZ ALEJANDRA BELEN

1.4.4 Pastel
En los grficos de sectores, tambin conocidos como diagramas de "tartas", se divide
un crculo en tantas porciones como clases tenga la variable, de modo que a cada clase
le corresponde un arco de crculo proporcional a su frecuencia absoluta o relativa. Un
ejemplo se muestra en la grfica. Como se puede observar, la informacin que se debe
mostrar en cada sector hace referencia al nmero de casos dentro de cada categora y
al porcentaje del total que estos representan. Si el nmero de categoras es
excesivamente grande, la imagen proporcionada por el grfico de sectores no es lo
suficientemente clara y por lo tanto la situacin ideal es cuando hay alrededor de tres
categoras. En este caso se pueden apreciar con claridad dichos subgrupos.

EJEMPLO 1.4.3

20

ARGUETA LPEZ ALEJANDRA BELEN

REFERENCIAS
BIBLIOGRFICAS
Behar, R., & Yepez, M. (2007). Estadtica. Un enfoque descriptivo. Cali: Universidad del
Valle. Pags 151-181
Zamora, M. C. (2003). Estadtica descriptiva e inferencial. Lima: Moshera. Pags 52-85

REFERENCIAS ELECTRNICAS
Ditutor. (10 de 09 de 15). Obtenido de http://www.ditutor.com/estadistica/estadistica.html

http://colposfesz.galeon.com/est501/probabi/teo/cap402/cap402.htm

20

Vous aimerez peut-être aussi