Vous êtes sur la page 1sur 15

1.1.

Introduccin
Para la mejor comprensin de este manual es necesario tener un conocimiento previo sobre una serie
de conceptos estadsticos que son utilizados muy frecuentemente. stos son:
1.
2.
3.

Poblacin y muestra.
Variables y atributos.
Escalas de medida.

1.1.1. POBLACIN Y MUESTRA


Se llama poblacin, universo o colectivo al conjunto de elementos que poseen una determinada
caracterstica. Cada uno de los elementos que forman parte de la poblacin se
denomina individuo o unidad estadstica.
No siempre es posible estudiar todos y cada uno de los individuos de una poblacin (por razones
econmicas, de tiempo, etc.) sino solamente una parte de ella, lo que se conoce como muestra. Una
muestra es cualquier subconjunto de la poblacin elegido en trminos de representatividad. El
tamao de una muestra viene determinado por el nmero de individuos que contiene.

1.1.2. VARIABLES Y ATRIBUTOS


Un carcter o fenmeno estadstico permite clasificar los individuos de una poblacin. Los
fenmenos estadsticos pueden ser de dos tipos: cuantitativos y cualitativos. Los primeros son
aquellos que se pueden medir o contar, como por ejemplo la edad de los trabajadores afiliados al
sistema de la Seguridad Social, las pensiones de jubilacin, los salarios de los trabajadores, el
tamao de una empresa, etc. Los segundos, por el contrario, no se pueden medir o contar; por
ejemplo, el nivel de estudios de los trabajadores de una empresa, el tipo de accidentes de trabajo, los
tipos de pensiones no contributivas de la Seguridad Social, etc.
Se denomina variable a cualquier carcter o fenmeno estadstico que pueda expresarse en valores
numricos. Los resultados derivados de la observacin de una variable son los valores o datos. Por
ejemplo, la variable salarios puede tomar los valores 800 , 950 , 1.400 , etc.
Generalmente las variables se suelen representar con las ltimas letras maysculas del alfabeto
(, X, Y, Z), y los valores con letras minsculas [(x1, x2, x3, , xn), (y1, y2, y3, , yn), (z1, z2, z3, , zn)].
Pgina 3 | Inicio del artculo

Las variables pueden ser, a su vez, clasificadas como discretas o continuas. En aras de una fcil
comprensin, se dice que una variable es discreta cuando presenta un nmero finito de valores: por
ejemplo, el nmero de asalariados en una empresa puede ser de 10, 11, 12, 13, etc. Una variable es
continua cuando puede tomar infinitos valores dentro del intervalo finito o infinito en el que est
definida; la altura de los trabajadores de una empresa es una variable continua puesto que, utilizando
un instrumento de medida de gran precisin, entre dos alturas cualesquiera se podran encontrar
infinitos valores de la misma. No obstante, aun en la actualidad, los instrumentos de medida cuentan
con una precisin limitada, lo que lleva a tratar muchas variables continuas como si fuesen discretas.
Tal es el caso de la altura de los trabajadores de una empresa.
Se denomina variable cualitativa, atributo o factor a cualquier carcter o fenmeno estadstico que
no pueda presentarse en valores numricos. Los resultados derivados de la observacin de un

atributo son lasmodalidades, categoras o niveles. Por ejemplo, el atributo tipo de accidentes de
trabajo puede tener dos modalidades: con baja y sin baja.
Normalmente, los atributos se suelen denotar con las primeras letras maysculas del alfabeto
(A, B, C, ) y las modalidades con letras minsculas [(a1, a2, a3, , an), (b1, b2, b3, , bn), (c1, c2, c3,
, cn)].
Los atributos gozan de gran importancia en el campo de las relaciones laborales. Como ejemplos se
pueden citar los siguientes: el tipo de salario (en dinero o especie); la raza, sexo, edad, estado civil,
condicin social, ideas polticas o religiosas del trabajador; las circunstancias de la ausencia laboral
remunerada (licencia por matrimonio, enfermedad, traslado de domicilio habitual, etc.); los motivos
de suspensin del contrato laboral (por mutuo acuerdo entre las partes, por causas consignadas
vlidamente en el contrato laboral, salvo que las mismas constituyan abuso de derecho manifiesto
por parte del empresario, por incapacidad temporal del trabajador, por maternidad de la mujer
trabajadora, por adopcin o recogimiento de menores de 5 aos, etc.); las causas de extincin del
contrato laboral (por expiracin del tiempo convenido o realizacin de la obra o servicio objeto del
contrato, por la dimisin del trabajador, por muerte, gran invalidez o invalidez permanente total o
absoluta del trabajador, por mutuo acuerdo entre las partes, por jubilacin del trabajador, etc.); las
infracciones del empresario (leves, graves y muy graves); las causas de accidentes laborales
(sobreesfuerzo, cadas de personas, golpes, atropellos, etc.); el nivel de riesgo laboral (bajo, medio y
alto); las prestaciones del Rgimen General de la Seguridad Social (asistencia sanitaria, prestaciones
farmacuticas, maternidad, incapacidad temporal, incapacidad permanente, jubilacin, etc.); las
prestaciones por desempleo (de nivel contributivo, de nivel asistencial), etc.
Pgina 4 | Inicio del artculo

1.1.3. ESCALAS DE MEDIDA


Las observaciones de un carcter o fenmeno pueden presentarse en tres tipos de escalas:
A. Escala nominal. Las observaciones de un carcter vienen expresadas en escala nominal cuando
se pueden clasificar en varias categoras, excluyentes entre s, entre las cuales no existe ninguna
relacin de orden y, por tanto, no se puede establecer un origen de referencia, como tampoco es
posible operar matemticamente. Vienen dados en este tipo de escala los caracteres cualitativos, es
decir, los atributos, como por ejemplo: el estado civil, el sexo, los sectores de actividad econmica,
las prestaciones del Rgimen de la Seguridad Social, las causas de extincin del contrato laboral, etc.
B. Escala ordinal. Se diferencia de la escala anterior en que, en este caso, se pueden establecer
relaciones de orden entre las diferentes categoras, existiendo, por tanto, un origen de referencia.
Estas categoras se pueden ordenar segn el grado en que posean cierta caracterstica, lo que permite
decir que una categora espreferible o mejor que otra, pero no se puede determinar cunto ms se
prefiere o es mejor. Los atributos tambin vienen expresados en este tipo de escala, pero solamente
aqullos en los cuales se pueda establecer un orden entre sus categoras: por ejemplo, el nivel de
estudios (bajo, medio, alto), las infracciones laborales del empresario (leves, graves, muy graves), el
nivel de riesgo laboral (bajo, medio, alto), etc.

C. Escala cuantitativa. A diferencia de las dos anteriores, la escala cuantitativa posee una unidad de
medida, con lo cual se puede operar matemticamente y obtener una serie de medidas que van a
caracterizar el fenmeno que se est analizando. Las observaciones derivadas de los caracteres
cuantitativos vienen dadas en este tipo de escala.

1.2. Distribuciones unidimensionales de frecuencias


Toda la informacin obtenida acerca de los diferentes valores o modalidades que pueda tomar una
variable o atributo se puede ordenar y presentar en las denominadas tablas1 o distribuciones de
frecuencias. Antes de proceder al estudio de estas tablas, es necesario conocer los diferentes tipos de
frecuencias que existen. Para ello se har referencia a las variables, siendo extensible el comentario
para los atributos.
Pgina 5 | Inicio del artculo

1.2.1. TIPOS DE FRECUENCIAS


Supngase que de un colectivo determinado se quiere analizar la variable X, que toma los valores
(x1, x2, x3, , xn), donde cada uno de ellos puede repetirse una o varias veces.
Se define la frecuencia total (N) como el nmero total de observaciones, valores o datos que se
tienen de la variable X.
El nmero de veces que se repite el valor xi se denomina frecuencia absoluta (ni) o,
simplemente, frecuencia. Si la variable X presenta n valores distintos, cada uno de los cuales se
repite una o varias veces, la suma de las respectivas frecuencias de cada valor ser igual a la
frecuencia total:

La frecuencia absoluta indica el nmero de veces que se repite un determinado valor, pero no aporta
nada acerca de la importancia relativa de dicho valor. Por ejemplo, si en una empresa con 50
empleados 10 de ellos tienen un salario mensual de 1.100 , la frecuencia absoluta del valor 1.100 es
10, y, si en otra empresa con 20 empleados, 10 tienen tambin un salario mensual de 1.100 , la
frecuencia absoluta del valor 1.100 es, igualmente, 10. Sin embargo, ambas frecuencias no significan
lo mismo, puesto que en la primera empresa 10 equivale al 20% del total de empleados y en la
segunda al 50%.
Para conocer la importancia relativa que tiene cada valor dentro del conjunto total de valores
observados se utiliza la frecuencia relativa, que se define como el cociente entre la frecuencia
absoluta del valor considerado y la frecuencia total:

La expresin anterior multiplicada por 100, refleja la frecuencia absoluta en porcentaje respecto del
nmero total de datos.
La suma de frecuencias relativas es igual a la unidad (o a 100 si se trabaja con porcentajes):

Muchas veces interesa considerar cada valor, no de forma aislada, sino puesto en relacin con los
dems. Por ejemplo, si en una empresa de 30 trabajadores hay 5 que ganan mensualmente 720 , 7
que ganan 800 , 8 que ganan 1.300 Pgina 6 | Inicio del artculoy 10 que ganan 1.000 , cabra
preguntarse: cuntos trabajadores ganan menos de 1.000 ? Para ello se deberan considerar todos
los trabajadores que ganan 720, 800 y 1.000 , es decir, habra que acumular sus respectivas
frecuencias absolutas: 5 + 7 + 10 = 22.
La frecuencia absoluta acumulada hasta el valor xi (Ni) indica el nmero de frecuencias que hay
hasta el valorxi, incluido ste y supuestos los valores ordenados de menor a mayor:

La ltima frecuencia asboluta acumulada es igual a la frecuencia total N:

En consonancia con la frecuencia relativa, se define la frecuencia relativa acumulada (Fi) como el
cociente entre la frecuencia absoluta acumulada y la frecuencia total,

expresin que multiplicada por 100 es equivalente a la frecuencia acumulada en porcentaje respecto
del total.
La ltima frecuencia relativa acumulada es igual a la unidad (o a 100 si se trabaja con porcentajes):

Todo lo expuesto anteriormente queda reflejado en la siguiente tabla, tabla de frecuencias, en la cual
la primera columna representa los valores de la variable analizada (xi), la segunda las frecuencias
absolutas (ni), la tercera las frecuencias relativas (fi), la cuarta las frecuencias absolutas acumuladas
(Ni) y la quinta las frecuencias relativas acumuladas (Fi).
Pgina 7 | Inicio del artculo

Recuadro: Ocultar

EJEMPLO 1.1
En una empresa con 20 empleados, 5 perciben un salario mensual de 1.500 , 3 de 2.000 ,
7 de 2.500 , 4 de 3.000 y 1 de 3.500 .
La tabla de frecuencias correspondiente sera:

donde:
n2 = 3 indica que hay 3 trabajadores cuyo sueldo es x2 = 2.000 .
f3 = 0,35 significa que, del total de trabajadores, el 35 por 100 tiene un sueldo de x3 = 2.500
.

Pgina 8 | Inicio del artculo

N4 = 19 quiere decir que existen 19 trabajadores con un sueldo igual o inferior a x4 = 3.000
.
F2 = 0,4 refleja que el 40 por 100 de los trabajadores percibe un sueldo igual o inferior a x2=
2.000 .
Recuadro: Ocultar

EJEMPLO 1.2
Segn el Departamento de Treball i Industria de la Generalitat de Catalunya, en 2004 los
accidentes laborales con baja, segn su gravedad, fueron:
Leves: 172.671

En este caso, la tabla de frececuencias sera:

Recuadro: Ocultar

EJEMPLO 1.3
La tabla de frecuencias siguiente hace referencia al paro registrado por sectores
econmicos, en Espaa, en noviembre de 2005.

Ntese que, en este caso, no tiene demasiado sentido calcular las frecuencias acumuladas ya
que no se puede establecer ningn orden de preferencia entre los diferentes sectores
econmicos.
Pgina 9 | Inicio del artculo

1.2.2. DISTRIBUCIONES UNIDIMENSIONALES DE


FRECUENCIAS
El trmino unidimensional hace referencia a la observacin exclusiva de una variable o atributo.
La distribucin de frecuencias de dicha variable o atributo est formada por los diferentes valores o
modalidades que puede tomar y sus respectivas frecuencias. Como las frecuencias absolutas (ni) son
las que se conocen habitualmente, la distribucin de frecuencias se denota genricamente por los
pares de valores (Xi; ni).
Cuando el nmero de valores que toma la variable no es demasiado grande (queda a juicio del
investigador establecer si es grande o pequeo), toda la informacin disponible aparece recogida en

la tabla, donde cada uno de los valores se encuentra asociado con su correspondiente frecuencia. En
este caso, se dice que la distribucin se encuentra no agrupada en intervalos, como la utilizada en el
ejemplo 1. Si todas las frecuencias absolutas son iguales a 1, la distribucin se denomina
de frecuencias unitarias.
Sin embargo, a veces sucede que la variable objeto de anlisis presenta un elevado nmero de
valores, por lo que es aconsejable agrupar dichos valores en intervalos con el fin de facilitar su
presentacin y de que, a la hora de realiar ciertos clculos, stos sean relativamente fciles de
determinar. Cuando se presenta o se da esta situacin, la distribucin de frecuencias obtenida se
denomina agrupada en intervalos, siendo la frecuencia de cada intervalo igual a la suma de las
frecuencias de todos los valores incluidos en l. La agrupacin en intervalos hace manejable la
distribucin pero, sin embargo, con ella se pierde informacin.
Una distribucin agrupada en intervalos se representa por (Li-1 Li; ni), donde Li-1 es el extremo
inferior del intervalo y Li el extremo superior. La diferencia entre ambos extremos es la amplitud del
intervalo, que se denota por ci. Normalmente se establece que los intervalos son abiertos por la
izquierda y cerrados por la derecha (Li-1 Li], con lo cual incluyen los valores comprendidos
entre Li-1 y Li, incluido Li y excluido Li-1. En el caso particular del primer intervalo ambos extremos se
consideran cerrados. Las distribuciones agrupadas en intervalos son tiles cuando se trabaja con
variables continuas.
Se denomina recorrido o rango de una variable a la diferencia entre el mximo y el mnimo valor de
la variable:

Finalmente, cuando se trabaja con distribuciones agrupadas en intervalos, no es posible asignar a


cada valor del intervalo su frecuencia (ya que sta corresponde a un conjunto de valores y no a uno
solo), ni tampoco se puede operar matemticamente para determinar ciertos clculos de inters. Ante
esta situacin, se eligePgina 10 | Inicio del artculocomo valor representativo del intervalo la marca
de clase, x'i, que se define como el punto medio del mismo:

Esta manera de proceder lleva implcita la suposicin de que los valores se encuentran
uniformemente distribuidos a lo largo del intervalo.
Recuadro: Ocultar

EJEMPLO 1.4
Las pensiones por invalidez de 50 individuos, agrupadas por intervalos, son las que se
recogen en la siguiente tabla de frecuencias:

1.3. Representaciones grficas


A la hora de describir el comportamiento de un carcter estadstico, a menudo resulta complicado
manejar toda la informacin recogida en la tabla de frecuencias. Sin embargo, dicha informacin
puede ser resumida en unas cuantas cifras, como se ver en el Capitulo 2, o bien puede
representarse en un grfico que refleje, de manera ms simple y rpida, el comportamiento global de
dicho carcter.

1.3.1. CARACTERES CUALITATIVOS


Comenzando por los caracteres cualitativos o atributos, se pueden destacar en primer lugar
los diagramas de sectores (Grfico 1.1), que reflejan las frecuencias absolutas o relativas de las
diferentes modalidades de un carcter cualitativo mediante sectores circulares.
El ngulo central de cada sector es proporcional a la frecuencia de la modalidad que representa y,
consecuentemente, tambin lo ser su rea.
Pgina 11 | Inicio del artculo

Grfico 1.1. Paro registrado en


Espaa (noviembre, 2005). Diagrama de sectores. Fuente: Distribucin del Ejemplo 1.3.

Los diagramas de barras (Grfico 1.2) expresan mediante rectngulos verticales las frecuencias
absolutas o relativas de las distintas modalidades observadas. En este caso, los rectngulos tienen la
misma base y la altura es proporcional a la frecuencia.

Grfico
1.2. Paro registrado en Espaa (noviembre, 2005). Diagrama de barras (frecuencias absolutas). Fuente:Distribucin del
Ejempio 1.3.

El diagrama de Pareto combina un diagrama de barras con un polgono acumulativo de frecuencias.


Se puede observar en el Grfico 1.2 (diagramas de barras) que, de las cinco modalidades existentes,
los sectores servicios e industria son los que cuentan con mayor nmero de parados. En el diagrama
de Pareto (Grfico 1.3) estas modalidades se encuentran ordenadas por orden decreciente de
frecuencias, lo que indica, por ejemplo, que ms del 60% de los parados proviene de los sectores
terciario e industrial.
Pgina 12 | Inicio del artculo

Grfi
co 1.3. Paro registrado en Espaa (noviembre, 2005). Diagrama de Pareto. Fuente: Distribucin del Ejemplo 1.3.

Otras representaciones muy utilizadas son los denominados cartogramas y pictogramas. Un


cartograma (Grfico 1.4) es un grfico realizado sobre un mapa, en el cual el carcter cualitativo
analizado se seala en determinadas zonas con diferentes colores o rayados, y un pictograma es un
dibujo alusivo al carcter representado.

Grfico 1.4. Fondo


de garanta salarial: Empresas afectadas segn causa de la prestacin. Fuente: Anuario de Estadsticas Laborales y de
Asuntos Sociales 2004.Ministerio de Trabajo y Asuntos Sociales.
Pgina 13 | Inicio del artculo

1.3.2. CARACTERES CUANTITATIVOS


Cuando los caracteres son cuantitativos, es decir, cuando se analizan variables, es necesario
distinguir si la distribucin de frecuencias est agrupada en intervalos o no.

1.3.2.1. Distribuciones no agrupadas en intervalos


Los diagramas de puntos (Grfico 1.5) consisten en superponer tantos puntos como frecuencias
(absolutas o relativas) se observen en cada valor de la distribucin.

Grfico
1.5. Diagrama de puntos. Fuente: Distribucin del Ejemplo 1.1.

Los diagramas de barras (Grfico 1.6) surgen cuando se traza para la base correspondiente a cada
valor de la variable una perpendicular al eje de abscisas de

Grfico
1.6. Diagrama de barras. Fuente: Distribucin del Ejemplo 1.1.
Pgina 14 | Inicio del artculo

altura igual a su frecuencia (absoluta o relativa). Uniendo los extremos superiores de las barras se
tienen los llamados polgonos de frecuencias (Grfico 1.7). Si se trabaja con frecuencias acumuladas
(absolutas o relativas), los grficos resultantes son los polgonos acumulativos de
frecuencias (Grfico 1.8).

Grfico
1.7. Polgono de frecuencias. Fuente: Distribucin del Ejemplo 1.1.

Grfico
1.8. Polgono acumulativo de frecuencias. Fuente: Distribucin del Ejemplo 1.1.

Una forma muy peculiar de presentar los caracteres cuantitativos es mediante el diagrama de tallo y
hojas(Grfico 1.9), en el cual los datos aparecen recogidos en una tabla con dos columnas: en la
derecha (hoja) se encuentran las unidades de los valores y en la izquierda (tallo), de derecha a
izquierda, las decenas, centenas, etc. de los mismos.

Grfic
o 1.9. Diagrama de tallo y hojas.
Pgina 15 | Inicio del artculo

1.3.2.2. Distribuciones agrupadas en intervalos


Si la distribucin de frecuencias est agrupada en intervalos, los grficos ms utilizados son
los histogramas(Grfico 1.10). stos se construyen levantando sobre cada intervalo un rectngulo
cuya rea sea proporcional a la frecuencia absoluta (o relativa) del correspondiente intervalo. Si los
intervalos tienen la misma amplitud la altura de los rectngulos es la frecuencia absoluta (o relativa),
y si la amplitud es distinta la altura es igual a ladensidad de frecuencia (di), definida como el
cociente entre la frecuencia absoluta (o relativa) y la amplitud.

Grfico
1.10. Histograma de frecuencias. Fuente: Distribucin del Ejemplo 1.4.

Otros grficos utilizados en las distribuciones agrupadas en intervalos son los polgonos
acumulativos de frecuencias (Grfico 1.11), que resultan de la unin de los puntos (Li; Ni) (Li; Fi).
Pgina 16 | Inicio del artculo

Grfico
1.11. Polgono acumulativo de frecuencias. Fuente: Distribucin del Ejemplo 1.4.

1 Cuando se trabaja con dos variables o atributos la tabla es de doble entrada: tabla de correlacin
(variables) y tabla de contingencia (atributos).
Cita de fuente (MLA 7.a edicin)
Montero Lorenzo, Jse Maria. "Conceptos Generales." Estadstica descriptiva. Madrid: Paraninfo, 2007. 116. Gale Virtual Reference Library. Web. 14 Sept. 2016.
URL
http://go.galegroup.com/ps/i.do?p=GVRL&sw=w&u=unad&v=2.1&id=GALE
%7CCX4052100007&it=r&asid=0a7332df0d4700de0bd272caa41e1718
Nmero de documento de Gale: GALE|CX4052100007

Ver otros artculos vinculados a estos trminos de ndice:


Los localizadores de pgina que refieren a este artculo no estn vinculados.

Amplitud del intervalo


1: 9

Cartogramas
1: 12

Categoras

o
o

1: 3
1: 94

Densidad de frecuencia

o
o

1: 15
1: 34

Diagrama de barras
1: 11

Diagrama de Pareto
1: 11

Diagrama de tallo y hojas


1: 14

Diagramas de puntos
1: 13

Diagramas de sectores
1: 10

Distribucin agrupada en intervalos


1: 9

Distribucin de frecuencias unitarias


1: 9

Distribucin no agrupada en intervalos


1: 9
1: 27

o
o

Distribucin unidimensional de frecuencias


1: 4

Distribuciones de frecuencias
1: 4

Escala cuantitativa
1: 4

Escala nominal
1: 4

Escala ordinal
1: 4

Factor
1: 3

Frecuencia absoluta
1: 5

Frecuencia absoluta acumulada


1: 6

Frecuencia relativa
1: 5

Frecuencia relativa acumulada


1: 6

Frecuencia total

1: 5

Histogramas
1: 15

Marca de clase
1: 10

Modalidades
1: 3

Muestra
1: 2

Niveles
1: 3

Pictogramas
1: 12

Poblacin
1: 2

Polgonos acumulativos de frecuencias

1: 14

Polgonos de frecuencias

1: 14

Recorrido o rango

1: 9
1: 41

o
o

o
o

Variable
1: 2
1: 3

Variable continua
1: 3

Variable cualitativa
1: 3

Variable discreta
1: 3

Vous aimerez peut-être aussi