Académique Documents
Professionnel Documents
Culture Documents
Las medidas nos permiten informacin sobre la serie de datos que estamos analizando.
Estas medidas permiten conocer diversas caractersticas de esta serie de datos.
Medicin, Se ha definido como la asignacin de nmeros a los elementos u objetos para
representar o cuantificar una propiedad. El problema bsico est dado por la asignacin
un numeral que represente la magnitud de la caracterstica que queremos medir y que
dicho nmeros pueden analizarse por manipulaciones de acuerdo a ciertas reglas.
Niveles o Escalas de mediciones, al respecto cabe sealar algunas definiciones:
Nominal, consiste en la asignacin, puramente arbitraria de nmeros a cada una de las
diferentes categoras en las cuales podemos dividir el carcter que observamos, sin que
puedan establecerse relaciones entre dichas categoras, a no ser el de que cada
elemento pueda pertenecer a una y solo una de estas categoras; Ordinal, En caso de
que puedan detectarse diversos grados de un atributo o propiedad de un objeto, la
medida ordinal es la indicada, puesto que entonces puede recurrirse a la propiedad de
orden de los nmeros asignndolo a los objetos en estudio de modo que, si la cifra
asignada al objeto A es mayor que la de B, puede inferirse que A posee un mayor grado
de atributo que B; Intervalos, est caracterizada por una unidad de medida comn y
constante que asigna un nmero igual al nmero de unidades equivalentes a la de la
magnitud que posea el elemento observado; y Coeficientes, entonces, a iguales
diferencias entre los nmeros asignados corresponden iguales diferencias en el grado de
atributo presente en el objeto de estudio. Adems, siendo que cero ya no es arbitrario,
sino un valor absoluto, podemos decir que A. Tiene dos, tres o cuatro veces la magnitud
de la propiedad presente en B.
MEDIDAS DE POSICIN
Medidas de posicin central, informan sobre los valores medios de la serie de datos.
Medidas de posicin no centrales, informan de como se distribuye el resto de los
valores de la serie. Las principales medidas de posicin central son:
Valor Medio, Promedio o Valor Central, es el valor medio ponderado de la serie de
datos. Se pueden calcular diversos tipos de media, siendo las ms utilizadas:
Media Aritmtica, se calcula sumando los valores y dividiendo en el nmero de ellos, o
sumando los valores de multiplicar cada valor por el nmero de veces que se repite. La
suma de todos estos productos se divide por el total de datos de la muestra
x x x xn 1 n
x * n x * n x n * n n
X 1 2 3
xi
X 1 1 2 2
n
n 1
n
1
xk
ni
n1
nk
fi
f1
fk
x g n x1 1 * x 2 2 * x n
nn
n 1n x n
Segn el tipo de datos que se analice ser ms apropiado utilizar la media aritmtica o la
media geomtrica. La media geomtrica se suele utilizar en series de datos como tipos
de inters anuales, inflacin, etc., donde el valor de cada ao tiene un efecto
multiplicativo sobre el de los aos anteriores. En todo caso, la media aritmtica es la
medida de posicin central ms utilizada.
Ahora bien, Logx g
Logx 1 Logx n
, luego x g n x 1 x 2 x n
n
xa
xa
n
(1 / x 1 ) (1 / x n )
Media Cuadrtica. x c , es la raz cuadrada de la media aritmtica de los cuadrados:
xc
x 12 x 2n
n
Media Ponderada, se calcula sumando los valores multiplicados por sus frecuencias o
significancias, y dividiendo en la suma de las significancias,
2
Xp
* si
Mediana L c( j / f )
En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la
frmula de la mediana se complica un poco ms (pero no demasiado): Sea (li-1,li] el
intervalo donde hemos encontrado que por debajo estn el 50% de las observaciones.
Entonces se obtiene la mediana a partir de las frecuencias absolutas acumuladas,
mediante interpolacin lineal:
n
(n/2) N 1
(n/2) N i 1
CC BB
i
Med l i 1
ai
AC AB
ai
Med l i 1
ni
F(l j ) F(l j1 )
aj
( x l j1 )
De este modo, Med es el punto donde F(Med) 1 / 2 . Esto equivale a decir que la mediana
divide al histograma en dos partes de reas iguales a 1/2. Entre las propiedades de la
mediana, se destacan principalmente,
-
Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones
extremas, ya que no depende de los valores que toma la variable, sino del orden de
las mismas. Por ello es adecuado su uso en distribuciones asimtricas.
Es de clculo rpido y de interpretacin sencilla.
A diferencia de la media, la mediana de una variable discreta es siempre un valor de
la variable que estudiamos (por ejemplo, la mediana de una variable nmero de hijos
toma siempre valores enteros).
Si una poblacin est formada por 2 subpoblaciones de medianas Med1 y Med2, slo se
puede afirmar que la mediana, Med, de la poblacin est comprendida entre Med1 y
Med2: Med 1 Med Med 2
El mayor defecto de la mediana es que tiene unas propiedades matemticas
complicadas, lo que hace que sea muy difcil de utilizar en inferencia estadstica.
Es funcin de los intervalos escogidos.
Puede ser calculada aunque el intervalo inferior o el superior no tenga lmites.
La suma de las diferencias de los valores absolutos de n puntuaciones respecto a su
mediana es menor o igual que cualquier otro valor. Este es el equivalente al teorema
de Knig con respecto a la media, pero donde se considera como medida de
dispersin a:
n
x
i 1
Med
AB A B AB A B
n i n i 1
(n i n i 1 ) (n i n i 1 )
de donde se despeja Moda
Relacin entre media, mediana y moda. En el caso de distribuciones unimodales, la
mediana est con frecuencia comprendida entre la media y la moda (incluso ms cerca
de la media). En distribuciones que presentan cierta inclinacin, es ms aconsejable el
uso de la mediana. Sin embargo en estudios relacionados con propsitos estadsticos y
de inferencia suele ser ms apta la media.
Ejemplo, Consideremos una tabla estadstica relativa a una variable continua, de la que
nos dan los intervalos, las marcas de clase ci, y las frecuencias absolutas ni.
Intervalo
00-02
02-04
04-06
06-08
08-10
ci
1
3
5
7
9
12
ni
2
1
4
3
2
Ni
2
3
7
10
12
64
nici
2
3
20
21
18
Para calcular la media podemos aadir una columna con las cantidades n ici. La suma de
los trminos de esa columna dividida por n=12 es la media x 64 / 12 5.3 . La mediana
es el valor de la variable que deja por debajo de s a la mitad de las n observaciones, es
decir 6. Construimos la tabla de las frecuencias absolutas acumuladas, N i y vemos que
eso ocurre en la modalidad tercera, es decir, i=3, entonces, (l i-1,li]= (4,6], que
corresponde el intervalo en donde se encuentra la mediana, entonces tenemos
5
Med l i 1
(n / 2) N i 1
(12 / 2) 3
ai 4
5.5 l i 1 , l i
ni
4
Para el clculo de la Moda, lo primero es encontrar los intervalos modales, buscando los
mximos relativos en la columna de las frecuencias absolutas, ni. Vemos que hay dos
modas, correspondientes a las modalidades j=1, j=3. En el primer intervalo modal,
(l0,l1]=(0,2], la moda se calcula como
n i n i 1
20
Moda l i 1
ai 0
2 1.3
(n i n i 1 ) (n i n i 1 )
(2 0) (2 1)
Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6
1,25
1,26
1,27
1,28
1,29
1,30
2
3
3
4
3
3
14
17
20
24
27
30
6,6 %
10,0 %
10,0 %
13,3 %
10,0 %
10,0 %
Media aritmtica: X m
Media geomtrica:
30
46,6 %
56,6 %
66,6 %
80,0 %
90,0 %
100,0 %
Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.
Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Ejemplo, Dado el registro de estaturas de estudiantes, hallar los principales parmetros
estadsticos analizados
Frecuencia
Variabl Absoluta
e
Simpl Acumula
e
da
1,20
1
1
1,21
4
5
1,22
4
9
1,23
2
11
1,24
1
12
1,25
2
14
1,26
3
17
1,27
3
20
Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6,6 %
46,6 %
10,0 % 56,6 %
10,0 % 66,6 %
7
1,28
1,29
1,30
4
3
3
24
27
30
13,3 % 80,0 %
10,0 % 90,0 %
10,0 % 100,0 %
Media aritmtica: X m
Media geomtrica:
30
Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.
Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Medidas no Centrales. Las medidas no centrales permiten conocer otros puntos
caractersticos de la distribucin que no son los valores centrales, tales como
Curtiles, son 3 valores que distribuyen la serie de datos, ordenada de forma creciente
o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25%
de los resultados.
Dciles, son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de
los resultados.
Percntiles, son 99 valores que distribuyen la serie de datos, ordenada de forma
creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra
el 1% de los resultados.
Estadsticos de posicin. Para una variable discreta, se define el percentil de orden
k, como la observacin, Pk, que deja por debajo de si el k% de la poblacin. Esta
definicin nos recuerda a la mediana, pues como consecuencia de la definicin es
evidente que Med= P50
8
ni
14
10
15
26
20
15
n=10
0
Ni
14
24
39
65
85
100
Solucin:
Primer cuartil:
n/4=25, ni>n/4=39, luego Q1=2
Segundo cuartil: 2n/4=50, Primera Ni>2n/4=65, luego Q2=3
Tercer cuartil:
3n/4=75, Primera Ni>3n/4=85, luego Q3=4
LAS MEDIDAS. Estudia la distribucin de los valores de la serie analizando si stos se
encuentran ms o menos concentrados, o ms o menos dispersos. Existen diversas
medidas de dispersin, entre las ms utilizadas podemos destacar las siguientes:
Rango, mide la amplitud de los valores de la muestra y se calcula por diferencia entre el
valor ms elevado y el valor ms bajo.
Los estadsticos de tendencia central o posicin nos indican donde se sita un grupo de
puntuaciones. Los de variabilidad o dispersin nos indican si esas puntuaciones o valores
estn prximas entre s o si por el contrario estn o muy dispersas. Una medida
9
x X
n
s2
s 2 xi X
n
ni
n
= s2
CV =
(x
i 1
x) 0
Si los errores se consideran con signo positivo, en este caso no pueden compensarse.
Esto ocurre si tomamos como medida de error alguna de las siguientes:
n
x
i 1
x 0 error absoluto
(x
i 1
x) 2 0 error cuadrtico
Knig. Para cualquier posible valor k que consideremos como candidato a medida
central, lo mejora en el sentido de los mnimos cuadrados, es decir
2
(x x) (x k)
i 1
i 1
siendo k x
1
xi
n
11
x i
i 1
x
i 1
n 0
x
)
i
n 1 i 1
n 1
Medidas de forma o Concentracin. Las medidas de forma permiten conocer que
forma tiene la curva que representa la serie de datos de la muestra. En concreto,
podemos estudiar las siguientes caractersticas de la curva,
Concentracin, mide si los valores de la variable estn ms o menos uniformemente
repartidos a lo largo de la muestra. Para medir el nivel de concentracin de una
distribucin de frecuencia se pueden utilizar distintos indicadores, entre ellos el ndice de
Gini, para medir el nivel de concentracin de una distribucin de frecuencia se pueden
utilizar distintos indicadores, entre ellos el ndice de Gini, el cual se calcula
n1
Ig
P Q
i1
n1
P
i1
vamos a plantear el saber si los datos se distribuyen de forma simtrica con respecto a
un valor central, o si bien la grfica que representa la distribucin de frecuencias es de
una forma diferente del lado derecho que del lado izquierdo.
Si la simetra ha sido determinada, podemos preguntarnos si la curva es ms o menos
apuntada (larga y estrecha). Este apuntamiento habr que medirlo comparado a cierta
distribucin de frecuencias que consideramos normal (no por casualidad es ste el
nombre que recibe la distribucin de referencia).
Estadsticos de asimetra. Para saber si una distribucin de frecuencias es simtrica, hay
que precisar con respecto a qu. Un buen candidato es la mediana, ya que para
variables continuas, divide al histograma de frecuencias en dos partes de igual rea.
Podemos basarnos en ella para, de forma natural, decir que una distribucin de
frecuencias es simtrica si el lado derecho de la grfica (a partir de la mediana) es la
imagen por un espejo del lado izquierdo,
1 n
n
x i X 2 * n i
1
siendo
A
3/ 2
n 1
A
Hemos comentado que el concepto de asimetra se refiere a si la curva que forman los
valores de la serie presenta la misma forma a izquierda y derecha de un valor central
(media aritmtica)
Los resultados pueden ser los siguientes:
- =0 (distribucin simtrica; existe la misma concentracin de valores a la derecha y
a la izquierda de la media).
- >0 (distribucin asimtrica positiva; existe mayor concentracin de valores a la
derecha de la media que a su izquierda)
- <0 (distribucin asimtrica negativa; existe mayor concentracin de valores a la
izquierda de la media que a su derecha).
14
n
1 n
1
siendo
A
x i X 2 * ni
3/2
n
A
1
-
30
Frecuencia
Relativa
Simpl Acumula
e
da
3,3 %
3,3 %
13,3 % 16,6 %
13,3 % 30,0 %
6,6 %
36,6 %
3,3 %
40,0 %
6,6 %
46,6 %
10,0 % 56,6 %
10,0 % 66,6 %
13,3 % 80,0 %
10,0 % 90,0 %
10,0 % 100,0 %
Mediana: 1,26, ya que por debajo est el 50% de los valores y por arriba el otro 50%.
15
Moda: Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo
tanto esta seria cuenta con 3 modas
Cuarteles, Deciles y Percentiles
1 cuartil: es el valor 1,22
2 cuartil: es el valor 1,26
3 cuartil: es el valor 1,28
Rango: 130 1.20 =0.10
Vamos a calcular los valores de las distintas posiciones centrales:
Varianza:
(1.20 1.253) 2 4 (1.21 1.253) 2 * 4 (130 1.253)2 * 3
S 2x
30
0.010 0.032
Coeficiente de variacin: CV
0.032
0.0255
1.253
Ig
P Q
i1
n1
P
i1
16
Los ndices reflejan los porcentajes de cambios en algn evento en un periodo de tiempo
dado respecto a un tiempo de referencia. Con miras de dar una demostracin y
aplicacin de los ndices en la estadstica y desarrollo de las investigaciones se presenta
el siguiente problema
Ejemplo, Sea el cuadro que representa el costo del kg de pescado en los diferentes aos
Pi( t )
ndice = 15.3*100/12.2 = 125.4%: En este caso I i ( t ) ( 0 ) * 100
Pi
b. ndices agregados simples. Se calculan como una media aritmtica simple de precios
relativos, por ejemplo,
n
I as ( t )
P
i 1
n
(t)
i
P
i 1
(0)
i
17
I sm ( t )
(t)
i
i 1
Pi( 0 )
*100
n
En cuyo caso resulta,
d. Laspeyres. Tiene por objeto utilizar los pesos Q del ao base, de modo que ,
n
I L (t)
Q i( 0)
(0)
i
i 1
n
i 1
(t)
i
(0)
i
*100
Q
e. Paashe. Similar a Laspeyres, pero con una formulacin distinta que pretende obtener
una mejor ponderacin del evento, se calcula utilizando los pesos de cada periodo
analizado y no los del ao base
n
I P (t )
Q i( t )
(t)
i
i 1
n
i 1
(t )
i
(0)
i
* 100
Q
18
REPRESENTACIONES GRFICAS
DIAGRAMA DE CAJAS Y BIGOTES
Presentacin visual que describe al mismo tiempo varias caractersticas importantes de
un conjunto de datos, tales como el centro, la dispersin, el alejamiento de la simetra, y
la identificacin de valores extremos (puntos atpicos), es decir, de valores que se alejan
de una manera poco usual del resto de los datos. Presenta los tres cuartiles, (y los
valores mnimos y mximos) alineados sobre una caja vertical u horizontalmente.
Procedimiento. Para el diagrama de cajas y bigotes se requiere
Calcular la mediana y los otros dos cuartiles, con los cuales se formar la caja, que tiene
la mediana como eje central, y como lados los dos cuartiles. Estos cuartiles reciben
tambin los nombres de " bisagras". La altura (anchura) de la caja no interesa.
La distancia H definida como la distancia entre el cuartil superior y el cuartil inferior, es
decir, corresponde al rango intecuartlico H = Q3 - Q1 = RIC.
El paso correspondiente a 1.5 veces la distancia Paso = 1.5 H
Cercas Internas, ubicadas a un paso de las bisagras o de los respectivos cuartiles. As,
las Cercas Internas Inferior (CIi) y Superior (CIs) estarn dadas por:
CIi = Q1 Paso
CIs = Q3 + Paso
19
Si la cerca interna inferior da menor que el valor mnimo de la muestra, sta se hace
igual al valor mnimo; igualmente, si la cerca interna superior da mayor que el valor
mximo, sta se hace igual a dicho valor.
Cercas Externas, ubicadas a un paso de las cercas internas. As, las Cercas Externas
Inferior (CEi) y Superior (CEs) estarn dadas por:
CEi = CIi Paso
CEs = CIs + Paso
Se denominan "valores adyacentes" los ubicados entre las cercas internas y los bordes
de las cajas. Por simplicidad no se grafican.
"Valores extremos" son los ubicados entre las dos cercas, y merecen especial atencin,
ya que pueden ser valores atpicos, que, en algunos casos, no pertenecen realmente a la
distribucin general de donde provienen los datos.
"Valores lejanos" o, ubicados por fuera de las cercas externas, correspondientes a
valores extremos, que requieren un mayor anlisis que los valores atpicos.
20
Como se observa hay dos valores que merecen especial atencin: 98.8 y 100.3 que
estn entre las cercas interna y externa superior.
Las medidas siguientes se han tomado de libros de biologa y medicina, pero son
parmetros muy aplicable y gran importancia para el estudiante de estadstica, y por
tanto los reproducimos, tal como se mostrar en la bibliografa.
Proporciones. Son los cocientes entre dos mediciones, por ejemplo si en una poblacin
de 2500 habitantes se diagnostican 150 casos de gripe aviar, entonces, la proporcin de
enfermos es de 150/2500 = 0.06 (6%). El valor de una proporcin puede variar as de 0 a
1, y suele expresarse como un porcentaje.
Razones. Al igual que en el caso anterior es una divisin, pero aqu el numerador no
forma parte del denominador como en le caso anterior, por ejemplo, la razn entre la
poblacin con gripe aviar y la sana es 150/2350 = 3/47 =0,064. Cuando, como en el
caso del ejemplo, la razn se calcula entre la probabilidad de que ocurra un evento y la
probabilidad de que ste no ocurra, la razn recibe tambin el nombre de odds. El valor
de una odds vara entre cero y el infinito. El valor 0 corresponde al caso en que la
enfermedad nunca ocurra, mientras que el valor infinito correspondera tericamente a
una enfermedad que est siempre presente.
Proporcion
Odds
Odds 1
Odds
Proporcion
1 Proporcion
Tasas. El concepto de tasa es similar al de una proporcin, con la diferencia de que las
tasas llevan incorporado el concepto de tiempo. El numerador lo constituye la frecuencia
absoluta de casos del problema a estudiar. A su vez, el denominador est constituido por
la suma de los perodos individuales de riesgo a los que han estado expuestos los sujetos
susceptibles de la poblacin a estudio. De su clculo se desprende la velocidad con que
se produce el cambio de una situacin frente a otra. Se han considerado dos tipos de
tasas:
Prevalenca P. Esta tasa cuantifica la proporcin de elementos de una poblacin que
presentan una determinada caracterstica en un momento
21
clasifique sin la caracterstica. La sensibilidad es, por lo tanto, la capacidad del test o
criterio para detectar la caracterstica. Cuando los datos obtenidos a partir de una
muestra se clasifican en una tabla, es fcil estimar a partir de ella la sensibilidad como la
proporcin de elementos con la caracterstica
Sensibilidad
23
Pictogramas. Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. La escala de los dibujos debe ser tal que el rea de cada uno
de ellos sea proporcional a la frecuencia de la modalidad que representa.
24
Otros. Cuando las variables son continuas, utilizamos como diagramas diferenciales los
histogramas y los polgonos de frecuencias. Un histograma se construye a partir de la
tabla estadstica, representando sobre cada intervalo, un rectngulo que tiene a este
segmento como base. El criterio para calcular la altura de cada rectngulo es el de
mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada
intervalo y el rea de los mismos. El polgono se construye fcilmente si tenemos
representado previamente el histograma, ya que consiste en unir mediante lneas rectas
los puntos del histograma que corresponden a las marcas de clase. Para representar el
polgono de frecuencias en el primer y ltimo intervalo, suponemos que adyacentes a
ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una
lnea recta los puntos del histograma que corresponden a sus marcas de clase.
Pirmides, Conos, Telaraas, etc. Estos grficos se utilizan para mostrar, los
primeros elementos comparaciones entre elementos resaltando el peso de cada uno, tal
como lo hace el histograma o el grfico de barras
25
Las telaraas tienen una importancia enorme, ya que permiten comparar ciclos y
tendencias
Una vez distribuidos todos los valores en los intervalos de clase, y obtenida la frecuencia
absoluta de cada intervalo, se realizan algunos clculos para mejorar la presentacin de
los resultados. Por lo general, se calcula para cada intervalo la frecuencia relativa y la
frecuencia relativa acumulada, las cuales estn dadas por:
F
i
Fa i k 1 Frk
Frecuencias relativas y relativas acumuladas del intervalo i Fri i
n
donde Fi es la frecuencia absoluta del intervalo i, es decir, corresponde al nmero de
valores observados que quedaron en dicho intervalo.
Informacin grfica. El Histograma. Generalmente la distribucin de frecuencia se
complementa con el Histograma, que es simplemente un grfico de barras. En la abscisa
se colocan los lmites de los intervalos de clase b 0, b1, b2,.., bM, y en la ordenada se
grafica, bien sea la frecuencia absoluta, o la frecuencia relativa. Para cada intervalo se
levanta una barra cuya longitud es proporcional a la frecuencia (absoluta, o relativa). La
forma que toma el grfico es la misma, bien sea que se trabaje con frecuencia absoluta o
relativa, ya que la diferencia entre las dos es simplemente un cambio de escala. A veces
se grafica una ordenada izquierda con la frecuencia absoluta, y una ordenada derecha
con la frecuencia relativa. Los histogramas tambin pueden construirse con la frecuencia
(absoluta o relativa) acumulada.
26
27
Como en la situacin anterior, puede interesar comparar dos poblaciones. En este caso
tambin es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre
grficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para
cada una de ellas un diagrama semicircular. Sean n 1 n 2 los tamaos respectivos de las
2 poblaciones. La poblacin ms pequea se representa con un semicrculo de radio r1 y
la mayor con otro de radio r2. La relacin existente entre los radios, es la que se obtiene
de suponer que la relacin entre las reas de las circunferencias es igual a la de los
tamaos de las poblaciones respectivas, es decir:
r22 n 2
n
r2 r1 2
2
n1
r1 n 1
Pictogramas, Expresan con dibujos alusivo al tema de estudio las frecuencias de las
modalidades de la variable. Estos grficos se hacen representado a diferentes escalas un
mismo dibujo.
El escalamiento de los dibujos debe ser tal que el rea de cada uno de ellos sea
proporcional a la frecuencia de la modalidad que representa. Este tipo de grficos suele
usarse en los medios de comunicacin, para que sean comprendidos por el pblico no
especializado, sin que sea necesaria una explicacin compleja.
Grficos para variables cuantitativas. Para las variables cuantitativas,
consideraremos dos tipos de grficos, en funcin de que para realizarlos se usen las
frecuencias (absolutas o relativas) o las frecuencias acumuladas:
Diagramas diferenciales: Son aquellos en los que se representan frecuencias
absolutas o relativas. En ellos se representa el nmero o porcentaje de elementos que
presenta una modalidad dada.
Diagramas integrales: Son aquellos en los que se representan el nmero de
elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir
de las frecuencias acumuladas, lo que da lugar a grficos crecientes, y es obvio que este
tipo de grficos no tiene sentido para variables cualitativas.
Grficos para variables discretas. Cuando representamos una variable discreta,
usamos el diagrama de barras cuando pretendemos hacer una grfica diferencial. Las
28
barras deben ser estrechas para representar el que los valores que toma la variable son
discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma
de escalera.
Ejemplo, Se lanzan tres monedas al aire en 8 ocasiones y se contabiliza el nmero de
caras, X, obtenindose los siguientes resultados, x = 2,1, 0, 1, 3, 2, 1, 2. Representar
grficamente el resultado.
En primer lugar observamos que la variable X es cuantitativa discreta, presentando las
modalidades, x est incluido en 0, 1, 2, 3, Ordenamos a continuacin los datos en una
tabla estadstica
Figura: Diagrama diferencial (barras) e integral para una variable discreta. Obsrvese
que el diagrama integral (creciente) contabiliza el nmero de observaciones de la
variable inferiores o iguales a cada punto del eje de abscisas.
29