Vous êtes sur la page 1sur 14

ESTADISTICA DESCRIPTIVA

1. DEFINICION

La estadstica es una ciencia que facilita la toma de decisiones:

 Mediante la presentacin ordenada de los datos observados en tablas y grficos


estadsticos.

 Reduciendo los datos observados a un pequeo numero de medidas estadsticas que


permitirn la comparacin entre diferentes series de datos.

 Y estimando la probabilidad de xito que tiene cada una de las decisiones posibles.

2. RAMAS DE LA ESTADISTICA

 ESTADISTICA DESCRIPTIVA: la cual se encarga de la recoleccin, clasificacin y


descripcin de datos mustrales o poblacionales, para su interpretacin y anlisis.

 ESTADISTICA MATEMATICA O INFERENCIAL: que desarrolla modelos tericos que se


ajusten a una determinada realidad con cierto grado de confianza. Basada en la Teora
de Probabilidades, tambin conocida como Estadstica Deductiva o Inferencia
Estadstica.

3. CONCEPTOS BASICOS

3.1 POBLACION, COLECTIVO O UNIVERSO

cualquier conjunto de personas, objetos, ideas o acontecimientos que se someten a la


observacin estadstica de una o varias caractersticas que comparten sus elementos y que
permiten diferenciarlos.

Son poblaciones por ejemplo, los diferentes automviles que se encuentran en un


concesionario o las diferentes religiones de un pas.

3.2 VARIABLE

Las variables se clasifican en continuas o discretas, segn admitan o no infinitos valores


intermedios entre dos valores prximos respectivamente. En la practica, la distincin entre
variable discreta y continua no es fcil, ya que todas las variables pueden ser consideradas
discretas, porque los instrumentos de medida no permiten pasar de un cierto limite de
precisin.
4. DISTRIBUCIN DE FRECUENCIAS

4.1 DISTRIBUCIN DE FRECUENCIAS SIMPLE

4.1.1 Frecuencia absoluta simple

Es el nmero de veces que se presenta un determinado dato de un carcter en los diferentes


elementos de una poblacin. Se presenta por na .

La frecuencia absoluta es, por tanto, el nmero de repeticiones de un determinado valor de la


variable o una determinada modalidad del atributo. La frecuencia absoluta tambin representa
el nmero de elementos de la poblacin que tienen el mismo valor o modalidad. La suma total
de todas las frecuencias absolutas es el tamao de la poblacin de elementos observados. Se
representa por N.

4.1.2 Frecuencia relativa simple

Se obtiene dividiendo la frecuencia absoluta de un determinado dato entre la suma de las


frecuencias absolutas de todos los datos observados, es decir, entre el tamao de la poblacin.
Se representa por fr = na / N

La frecuencia relativa es, una proporcin entre el nmero de veces que se repite un dato y el
tamao de la poblacin.

Las frecuencias relativas se suelen presentar en porcentaje (%fr) que se obtiene al multiplicar
por 100 el valor correspondiente de la frecuencia relativa. En este caso, la suma total de todas
las frecuencias relativas porcentuales ser 100.

4.1.3 Frecuencia absoluta acumulada

La frecuencia absoluta acumulada de un dato es igual a la frecuencia absoluta de este dato


ms la suma de las frecuencias absolutas de los datos anteriores. Se representa por Na. Esta
frecuencia representa, cuando existe una relacin de orden, el nmero de elementos de la
poblacin que quedan por encima o por debajo del elemento cuyo valor o modalidad se
observa.

4.1.4 Frecuencia relativa acumulada

La frecuencia relativa acumulada de un dato es igual a la suma de las frecuencias relativas de


todos los datos menores o iguales de dicho valor. Se representa por Fa. Al igual que las
frecuencias relativas simples, se suelen presentar en porcentajes (%Fa).

EJEMPLO:

Se ha realizado un estudio del numero de empleados de 15 ferreteras de una zona de Madrid


con los siguientes resultados: 4; 5; 4; 3; 3; 6; 4; 5; 3; 3; 4; 5; 3; 6. Construir la tabla estadstica
empleando frecuencias absolutas simples y acumuladas y, tambin, frecuencias relativas en
porcentaje, simples y acumuladas.
Solucin:

N Frecuencia Frecuencia Frecuencia relativa Frecuencia


empleados absoluta absoluta simple en % (%f ) relativa
r
por tienda simple (n ) acumulada (N ) acumulada
a a
en % (%F )
a

3 5 5 5/ 15 = 0.33(x 100) 33,3


= 33.3%
4 4 9 4/15 = 0.26 (x 100) 60
= 26.6%
5 3 12 3/15 = 0.2 (x 100) = 80
20%
6 3 15 3/15 = 0.2 (x 100) = 100
20%

 En primer lugar, se ordenan las tiendas de menor a mayor nmero de empleados,


segunde detalla en la primera columna de la tabla inferior. En la segunda columna
figuran las veces que se repite un mismo valor (la frecuencia absoluta). La suma de las
frecuencias absolutas (15) es el nmero de elementos de la poblacin.

 En la tercera columna aparecen las frecuencias absolutas acumuladas, cuyos valores se


obtienen sumando al valor de la frecuencia absoluta correspondiente, la suma de
todas las frecuencias absolutas anteriores.

 En la cuarta columna estn las frecuencias relativas simples en porcentaje, obtenidas


al dividir el valor de la frecuencia absoluta correspondiente entre el numero de
elementos de la poblacin, y multiplicadas por 100.

 En la quinta columna estn las frecuencias relativas acumuladas en porcentaje,


resultado de la suma del valor de la frecuencia relativa en porcentaje correspondiente
mas, la suma de todas las frecuencias relativas en porcentaje anteriores.

4.2 DISTRIBUCIN DE FRECUENCIAS POR INTERVALOS O DATOS CONTINUOS

Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de
frecuencias simple, debido a que se encuentran distribuidos a travs de todo el recorrido y el
nmero de veces que se repite cada observacin no es significativo en todos los casos, y en la
mayora de ellos su frecuencia es baja.

5. MEDIDAS DE TENDENCIA CENTRAL


Las medidas de tendencia central, llamadas as porque tienden a localizarse en el centro de la
informacin, son de gran importancia en el manejo de las tcnicas estadsticas, sin embargo,
su interpretacin no debe hacerse aisladamente de las medidas de dispersin, ya que la
representatividad de ellas est asociada con el grado de concentracin de la informacin.

Las principales medidas de tendencia central son:

5.1 MEDIA ARITMTICA

Cotidiana e inconscientemente estamos utilizando la media aritmtica. Cuando por ejemplo,


decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no
aseguramos que diariamente deba consumir exactamente los 20 cigarrillos que contiene un
paquete sino que es el resultado de la observacin, es decir, dicho sujeto puede consumir 18,
un da; 19 otro; 20, 21, 22; pero segn nuestro criterio, el nmero de unidades estar
alrededor de 20.

Matemticamente, la media aritmtica se define como la suma de los valores observados


dividida entre el nmero de observaciones.

          

 

 

Donde:

 :      




 :     

:    

! "  , $   %   

EJEMPLO

Cantidad de cigarrillos consumidos por un fumador en una semana.

Lunes: 18 Viernes: 20

Martes: 21 Sbado: 19

Mircoles: 22 Domingo: 19

Jueves: 21

Solucin: Entonces la media aritmtica es

          

 

 

& 


&
'        (  )  )

  (
&

El fumador consume en promedio 20 cigarrillos diarios.

Cuando la variable est agrupada en una distribucin de frecuencias, la media aritmtica se


calcula por la frmula:

  *    *     *     + *+ +
  *

 

Ejemplo:

1. Cantidad de cigarrillos consumidos por un fumador en una semana dada

Cantidad  Frecuencia *
18 1
19 2
20 1
21 2
22 1
7

+
  * ',-  ),-  (,-  ,-  ,-

   (

&
. /011 2234
  (

5 0

2. Calculo de La Media Aritmtica. El Salario/da de 50 Operarias.

MILES $/DIA Xi fi Xi fi
50 1 50
51 3 153
52 5 260
53 9 477
54 12 648
55 10 550
56 5 280
57 3 171
58 2 116
SUMAS O TOTAL 50 2705
)  * &(6

   67. 

6(
  67. (( 9:434/5 0


3. Si la informacin est relacionada en una distribucin de frecuencias por intervalos,


se toman como valores de la variable las marcas de clase de los intervalos,
entindase por marca de clase el punto medio entre los lmites de cada clase o
intervalo.

Clculo de La Media Aritmtica de la Resistencia de 100 Baldosas

&  * 77'((

   77'

((

La resistencia promedio de las 100 baldosas es de 448 Kg/Cm.

5.2 LA MEDIANA

No se basa en la magnitud de los datos, como la media aritmtica, sino en la posicin central
que ocupa en el orden de su magnitud, dividiendo la informacin en dos partes iguales,
dejando igual nmero de datos por encima y por debajo de ella.
5.2.1 La Mediana Cuando los datos no estn Agrupados en Intervalos.

Partiendo de la informacin bruta, ordenamos los datos ascendente o descendentemente:

<= , <> , <? . . <A <B  C 

D:5 0
0  D:  
F 4
:4 +901
E G,


E
G  ,
F-
D:5 0
0  D:   
4
:4 901


Ejemplo:

1. En el ejercicio de los cigarrillos, consumidos por un fumador tenemos lunes 18, martes
21, mircoles 22, jueves 21, viernes 20, sbado 19, y domingo 19. Ordenando
ascendentemente:

<=  18, <>  19, <?  19, <L  20, <O  21, <P  21, <Q  22

n, es impar, entonces

D:5 0
0  D:  
F   &F  7  (
E G , -
 

2. Consumo mensual de agua, en m3, por la fbrica de confecciones la hilacha

Enero= 10 Mayo= 14 Septiembre = 18

Febrero = 12 Junio= 19 Octubre = 22

Marzo= 15 Julio= 17 Noviembre = 15

Abril = 18 Agosto= 18 Diciembre = 13

<=  10, <>  12, <?  13, <L  14, <O  15, <P  15, <Q  17, <V  18, <W  18,
<=X  18, <==  19, <=>  22

E
G  ,
F-    
E G , F-
D:5 0
0  D:   
  
 
,Y-  & 6  &
D:    Y
 

Como se puede observar, en este caso la mediana no es un dato perteneciente a la


informacin, es un parmetro que divide la informacin dejando el 50% por encima y el 50%
por debajo de ella.
5.2.2 La Mediana Cuando la Informacin se Encuentra Agrupada en Intervalos

Si la informacin esta agrupada en intervalos iguales, entonces la mediana se calcula segn la


siguiente expresin:

\ C,A]=-
  Z[  2 ^
CA

Me: Mediana

LI: Limite inferior del intervalo donde se encuentra la mediana (intervalo mediano), el cual se
determina observando en que clase se encuentra la posicin n/2.

n: Numero de observaciones

C,A]=- : _        

CA : _      

A: Amplitud del intervalo.

EJEMPLO

En la columna de frecuencia acumulada advertimos que la observacin nmero 50 se halla en


el cuarto intervalo 4.


((
\ *0, ]- \ d6
D:  `a   b c D:   ((  776. 76 e//f+
* d6

Se concluye que el 50% de las baldosas resiste menos de 445.45 Kg/Cm2 y el 50% resiste mas
de 445.45 Kg/Cm2.
5.3 LA MODA

La moda, como su nombre lo indica, es el valor ms comn (de mayor frecuencia dentro de
una distribucin. Una informacin puede tener una moda y se llama unimodal, dos modas y se
llama bimodal, o varias modas y llamarse multimodal. Sin embargo puede ocurrir que la
informacin no posea moda.

5.3.1 La Moda Cuando los datos no estn Agrupados en Intervalos

El valor que ms veces se repite es 54 con una


frecuencia de 12, entonces decimos que la moda
es Mo = 54.000.00 pesos diarios.

Los valores de mayor frecuencia corresponden a 19 y


21, por lo tanto se trata de una distribucin bimodal
con Mo1=19 y Mo2=21.
5.3.2 Clculo de la Moda Cuando la Informacin est Agrupada en Intervalos

Cuando la informacin se encuentra agrupada en intervalos de igual tamao la moda se calcula


con la siguiente expresin.

*+ \ *,+]-
D3  `a  b
*+ \ *,+]- \ *,+F-

Donde:

Mo: Moda

LI: Limite inferior del intervalo modal

*+ : Frecuencia de la clase modal

*,+]-: Frecuencia de la clase premodal.

*,+F-: Frecuencia de la clase posmodal.

A: Amplitud de los intervalos.

EJEMPLO

*+ \ *,+]-
D3  `a  b
*+ \ *,+]- \ *,+F-

dd \ 
c D3  7((  ((  777. 77 e//f+
,dd- \  \ '

A pesar que el valor 444.44 no es un dato real de la informacin asumimos ese parmetro
como el de mayor ocurrencia.
6. MEDIDAS DE DISPERSIN

Para medir el grado de dispersin de una variable, se utilizan principalmente los siguientes
indicadores:

6.1 RANGO O RECORRIDO

Es la medida de dispersin mas sencilla ya que solo considera los dos valores extremos de una
coleccin de datos, sin embargo, su mayor utilizacin est en el campo de la estadstica no
paramtrica.

R = Xmax Xmin

Xmax, Xmin son el mximo y el mnimo valor de la variable X, respectivamente.

En el ejemplo introductorio, vemos que el rango para la primera informacin es R1=95-5=90,


mientras que R2=51-49=2, se hace pues manifiesta la gran dispersin de la primera
informacin contra la homogeneidad de la segunda.

6.2 DESVIACIN MEDIA

La desviacin media, mide la distancia absoluta promedio entre cada uno de los datos, y el
parmetro que caracteriza la informacin. Usualmente se considera la desviacin media con
respecto a la media aritmtica:


 | \ |*
+
gD 

Donde,

DM: Desviacin media

 : Diferentes valores de la variable X

* : Numero de veces que se repite la observacin 

 : Media aritmtica de la informacin




n: tamao de la muestra

m: Numero de agrupamientos o intervalos.


EJEMPLO:

 | \ |*
+  &(
gD    . 7

6(

1.400.00 es el error promedio que se


comete al remplazar los ingresos
diarios de cada una de las 50 obreras
por 54.100 pesos.

6.3 VARIANZA

La varianza obvia los signos presentes en la desviacin estndar elevando las diferencias al
cuadrado, lo cual resulta ser ms elegante, aparte de que es supremamente til en el ajuste de
modelos estadsticos que generalmente conllevan formas cuadrticas.

Numricamente definimos la varianza, como desviacin cuadrtica media de los datos con
respecto a la media aritmtica:

+ - *
 ,j \ j
i 

Donde,

i> : Varianza

<A : valor de la variable x

<k : Media aritmtica de la informacin

CA : Frecuencia absoluta de la observacin <A

n: Tamao de la muestra

m: Numero de agrupamiento o intervalos.


EJEMPLO: 1)

+ - * Y(. 6(
 ,j \ j
i    d. 

6(

Como los datos estn expresados en miles de pesos y la varianza se encuentra en forma
cuadrtica obtenemos una varianza de 3210.000 pesos. Sin embargo para una mejor
comprensin debemos recurrir a la desviacin tpica o estndar definida como la raz cuadrada
de la varianza:

+ - *
 ,j \ j
i  li  m c i  d.   . &)

El error estndar es de 1.791 pesos/diarios.

2) En el ejemplo de las baldosas:


+,j \ j
- *
i  li  m  c i  )6)Y  7( e//f+

6.4 COEFICIENTE DE VARIABILIDAD

El coeficiente de variabilidad tiene en cuenta el valor de la media aritmtica, para establecer


un nmero relativo, que hace comparable el grado de dispersin entre dos o mas variables, y
se define como:

i
fo  ((



Comparemos la homogeneidad de las dos informaciones anteriores, las cuales tienen diferente
unidad de medida.

Ejemplo:

9:434
1) para el salario:
. &)
fo  5 0
9:434  (. (dd c fo  d. d%
67. 
5 0

2) para la resistencia
7( e//.+
fo   (. d6 c fo  d. 6%
77' e//.+

Concluimos que es mucho ms dispersa la informacin correspondiente a la resistencia de las


baldosas.

Vous aimerez peut-être aussi