Vous êtes sur la page 1sur 25

ESTADSTICA

ANTECEDENTES HISTRICOS:
Desde el comienzo de las civilizaciones han existido formas sencillas de estadstica, pues ya se utilizaban
representaciones grficas y otros smbolos en pieles, rocas, madera y paredes de cuevas para contar el
nmero de personas, animales o cosas.
EGIPCIOS.- En el siglo XXXI A.C. antes de construir las pirmides, analizaban los datos de la poblacin
y la renta del pas.
BABILONIOS.- Hacia el ao 3000 A.C. usaban pequeas tablillas de arcilla para recopilar datos sobre la
produccin agrcola.
GRIEGOS.- Hacia el ao 594 A.C. realizaban censos cuya informacin se utilizaba para cobrar
impuestos.
ROMANOS.- Fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin,
superficie y renta de todos sus territorios bajo su control.
Dado el uso que se le daba a la estadstica, durante mucho tiempo se entendi por estadstica la
informacin relacionada con el gobierno; de hecho la palabra estadstica proviene del latn statisticus , que
significa "del Estado.
En nuestros das la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los
valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos o fsicos, y sirve para relacionar
y analizar dichos datos.
ESTADSTICA.- Se define como la rama de las matemticas que se encarga de la recopilacin,
organizacin, presentacin, anlisis e interpretacin de una muestra de datos tomados de una poblacin.
POBLACIN.- Es el conjunto de todos los datos objeto de anlisis, definido de forma tal que permita
distinguir entre los elementos que lo conforman y los que no.
MUESTRA.- Es un subconjunto representativo de una poblacin.
CASO PRCTICO:
El jefe de redaccin del peridico local La voz de Motul desea conocer el nivel de satisfaccin de sus
lectores respecto de la seccin social, para lo cual encuesta a 80 de sus lectores pidindoles que indiquen
su nivel de satisfaccin como: muy satisfecho, satisfecho, poco satisfecho.
Cul sera uno de los datos de esta encuesta?
Cul sera la poblacin?
Cul sera la muestra?
DIVISIN DE LA ESTADSTICA:
La estadstica para su estudio se divide en dos partes: estadstica descriptiva y estadstica inferencial.
DESCRIPTIVA.- Describe el comportamiento de una coleccin de datos por medio de tablas , grficas y
valores.
INFERENCIAL.- Realiza generalizaciones, pronsticos, anlisis y proyecciones para la toma de
decisiones, partiendo de la informacin de la estadstica descriptiva y empleando como herramienta la
probabilidad.


VARIABLE:
Una variable es un trmino de una expresin matemtica que puede tomar un conjunto de valores dentro
de un intervalo, llamado dominio de la variable. Por lo general, se representan con smbolos tales como A,
b, X, W, y.
Las variables pueden ser discretas o continuas dependiendo de los valores que asuman.
DISCRETA.- Toma valores que generalmente son enteros; proviene de conteos o enumeraciones y dan
origen a datos discretos, por ejemplo el nmero de materias aprobadas semestralmente, el nmero de
goles anotados en un partido de futbol, etc.
CONTNUA.- Toma cualquier valor, ya sea entero o fraccionario, proviene de mediciones y originan datos
continuos; son ejemplos de stas: la altura y el peso de los alumnos de una seccin, la distancia que
recorre una jabalina al ser lanzada en una competencia, etc.
DATOS
Nmeros, medidas o caractersticas que han sido recopiladas como resultado de observaciones por
conteo o mediciones. Cuando los datos provienen de un conteo, toman valores discretos, de los nmeros
naturales, (1, 2, 3, 4, ..), o cuando provienen de una medicin, toman valores continuos (0.0036,
2.71828.., 1.5, 3.1416.., 9.0,..), de los nmeros reales. Los datos discretos y los continuos se denominan
numricos o cuantitativos; existe otro tipo de datos llamados cualitativos o de atributo, los cuales
describen un elemento de una poblacin, como por ejemplo los colores (azul, rojo, amarillo), la
complexin de las personas (delgada, media robusta, gruesa), la clasificacin de los sabores (dulce,
salado, agrio, amargo, picante).

PARMETRO
Es cualquier caracterstica numrica de una poblacin, por ejemplo: la proporcin de personas del mismo
sexo o raza.

DATO ESTADSTICO
Un dato estadstico o simplemente un estadstico, es un nmero resultante de la manipulacin de ciertos
datos iniciales de acuerdo con los procedimientos matemticos especficos. Comnmente, se usa un
dato estadstico que se calcula a partir de una muestra para estimar un parmetro de una poblacin.
EJEMPLO: Sea el caso de una industria que produce aceros especiales. Entre sus productos hay tornillos
para los cuales existen estrechos mrgenes de tolerancia respecto a sus medidas. Como parte de los
procedimientos del control de calidad, se selecciona un nmero de tornillos de la produccin diaria y se
miden cuidadosamente; el conjunto de las medidas de estos tornillos constituyen la muestra. Cuando los
datos son manipulados de acuerdo con las reglas estadsticas, se pueden obtener algunas caractersticas
representativas de la totalidad de la poblacin, tales como las medidas promedio de los tornillos; el valor
numrico resultante constituye un estadstico. La poblacin en la cual estamos interesados es el conjunto
de medidas de los tornillos de la produccin completa diaria de la fbrica. Una medida promedio de
alguna dimensin de los tornillos producidos en un da constituye un parmetro.

EJERCICIOS
1.-Se desea conocer en el municipio de Motul las edades de los residentes del fraccionamiento La
herradura, para esto se lleva a cabo un estudio y se seleccionan 50 personas de ese fraccionamiento.
Responder las siguientes preguntas:
Cul sera el dato de cada estudio?
El conjunto de datos que se recopila representa una muestra o una poblacin?. Explicar la respuesta.
2.- En el congreso del estado de Yucatn se desea conocer el nivel acadmico de sus integrantes.
* Definir la poblacin.
* Dar tres ejemplos de tipos de muestras para realizar el estudio.
3.- Anotar la letra C dentro del parntesis si el enunciado se refiere a una variable continua, una D si se
refiere a una variable discreta y una A si se refiere a una variable de atributo.
( ) Nmero de coches que pasan cada da por una caseta de revisin.
( ) La cantidad de leche que trae un envase de tamao grande.
( ) Las estaturas de los integrantes del equipo de basquetbol.
( ) La cantidad de personas que asisten diariamente a la biblioteca.
( ) La cantidad de accidentes que ocurren cada da en Mrida.
( ) Si una llave est defectuosa o no.
( ) El tiempo que se necesita para contestar una llamada telefnica en una oficina

























**ORGANIZACIN DE DATOS**
Por lo general los datos se organizan y presentan en forma Ordenada o Agrupada en intervalos,
dependiendo del nmero de datos diferentes que se tengan en la coleccin.
I.- DATOS ORDENADOS
a) Presentacin Tabular
La manera ms sencilla de organizar una coleccin de datos es ordenarlos de menor a mayor y
presentarlos en una tabla denominada tabla de distribucin de frecuencias en la cual se va
asociando a cada dato un nmero natural llamado frecuencia (f) del dato, que se define como el nmero
de veces que se repite un dato en una coleccin. Consideremos el siguiente ejemplo:
La siguiente coleccin de datos muestra las calificaciones finales de un grupo de 45 alumnos que
representaron un examen de estadstica en el C.B.T.i.s 80. Construir una tabla de distribucin de
frecuencias.
6 9 10 9 8 7 7 5 8 7 7 9 8 7 8
9 8 8 10 9 10 8 7 7 5 7 8 9 9 10
8 7 8 8 6 7 8 6 9 8 7 9 9 9 7

Para construir una tabla de distribucin de frecuencias en forma ordenada para los 45 datos,
primeramente se deben determinar los valores extremos, es decir el menor (X
o
) y el mayor (X
f
) de los
datos. A continuacin se calculan el rango restando el dato menor del dato mayor;
R = X
f
- X
o
= 10 - 5 = 5
Luego se calcula el nmero de datos, es decir los casos o renglones que se tratarn:
No. de casos c = R + 1 = 6
Como el clculo indica 6 casos, se debe construir una tabla de 6 renglones.
Se debe observar el nmero de veces que se repite cada uno de los datos: 5, 6, 7, 8, 9,10, y empleando
marcas de conteo, presentarlos en la tabla anotando su correspondiente frecuencia.
CALIFICACIONES
(x)
CONTEO # DE ALUMNOS
FRECUENCIA (f)
5 II 2
6 III 3
7 IIII IIII II 12
8 IIII IIII III 13
9 IIII IIII I 11
10 IIII 4
f = 45
De la tabla anterior podemos hacer las siguientes observaciones:
- 2 alumnos obtuvieron 5 puntos de calificacin (la menor).
- 3 alumnos obtuvieron 6 puntos de calificacin.
- 4 alumnos obtuvieron 10 puntos de calificacin (la mayor).
- 8 es la calificacin que ms se repite, pues tiene la mayor frecuencia (13).
Frecuencia acumulada (fa).- Nmero natural que representa el nmero de datos que son menores o
iguales al dato en cuestin. Se calcula sumando la frecuencia del dato y las frecuencias de los datos
menores que l.
CALIFICACIONES
(x)
CONTEO # DE ALUMNOS
FRECUENCIA (f)
FRECUENCIA
ACUMULADA (fa)
5 II 2 2
6 III 3 5
7 IIII IIII II 12 17
8 IIII IIII III 13 30
9 IIII IIII I 11 41
10 IIII 4 45

Se observa en la tabla que para el primer dato su frecuencia acumulada es igual a su frecuencia, y que la
frecuencia acumulada del ltimo dato es igual al total de datos. Estas situaciones se repetirn en todos los
casos.
Por otra parte, la frecuencia acumulada del dato 7 significa que 17 de los 45 alumnos tuvieron calificacin
de 7 o menor, aunque tambin se podra decir que 45-17 = 28 alumnos obtuvieron calificacin mayor que
7.
Frecuencia relativa (fr).- Valor que representa el porcentaje del nmero de veces que se repite un dato
en la coleccin. Se calcula dividiendo la frecuencia de cada dato entre la sumatoria de la frecuencia,
multiplicado por 100.

CALIFICACIONES
(x)
# DE ALUMNOS
FRECUENCIA (f)
FRECUENCIA
ACUMULADA (fa)
% DE ALUMOS
FRECUENCIA RELATIVA (fr)
5 2 2 4.44
6 3 5 6.67
7 12 17 26.67
8 13 30 28.89
9 11 41 24.44
10 4 45 8.89
f = 45 fr = 100.0
La frecuencia relativa del dato 7 significa que el 27 % de los 45 alumnos tuvieron calificacin de 7.
Cabe mencionar que todos los valores de la frecuencia relativa estn expresados en forma porcentual,
por lo tanto su suma debe ser igual a 100.
Frecuencia relativa acumulada.- Se obtiene dividiendo la frecuencia acumulada del dato entre la
sumatoria de la frecuencia y multiplicando por 100.

CALIFICACIONES
(x)
# DE ALUMNOS
FRECUENCIA (f)
FRECUENCIA
ACUMULADA (fa)
% DE ALUMNOS
FRECUENCIA
RELATIVA (fr)
FRECUENCIA
RELATIVA
ACUMULADA
5 2 2 4.44 4.44
6 3 5 6.67 11.11
7 12 17 26.67 37.78
8 13 30 28.89 66.67
9 11 41 24.44 91.11
10 4 45 8.89 100.0
f = 45 fr = 100.0
En referencia a la frecuencia relativa acumulada del dato 7, se puede decir que el 38% de los alumnos
obtuvieron calificacin de 7 o menor.
EJERCICIO:
Realizar una encuesta con todos los compaeros de tu grupo preguntndoles su edad actual , incluyendo
la tuya y construir una tabla de distribucin de frecuencias.





R = X
f
- X
o
=
No. de casos c =
EDADES
(x)
# DE ALUMNOS
FRECUENCIA (f)
FRECUENCIA
ACUMULADA (fa)
% DE ALUMNOS
FRECUENCIA
RELATIVA (fr)
FRECUENCIA
RELATIVA
ACUMULADA




f = fr =
De la tabla que obtengas, contesta las siguientes preguntas:
Cuntos alumnos tienen 18 aos o menos?
R =
Cul es la edad que predomina en el grupo?
R =

Cuntos alumnos tienen ms de 18 aos?
R =
Qu porcentaje de alumnos tiene 17aos
R =
Qu porcentaje de alumnos tiene 19 aos o menos?
R =

b) Presentacin grfica:
Tambin se puede presentar la misma informacin contenida en las tablas de distribucin de frecuencias
mediante el empleo de grficas, siendo las ms comunes el histograma de frecuencias, el polgono de
frecuencias y el polgono acumulativo.
Histograma de frecuencias.- Conjunto de rectngulos de igual longitud cuyos centros de las bases
representan a los datos y las alturas a sus correspondientes frecuencias.
Para construir un histograma de frecuencias se sitan sobre el eje horizontal los valores de los datos
manteniendo la misma escala entre cada uno de los datos. Generalmente al construir la escala en el eje
horizontal se empieza con un dato anterior al primer dato y se termina con un dato posterior al ltimo dato.
En el eje vertical se colocan las frecuencias utilizando la mayor frecuencia como referencia para
representar el mximo valor sobre el eje vertical; seguidamente se decide la escala a utilizar cuidando que
las dimensiones entre los valores sea la misma.
Una vez construidos los ejes, se procede a asignar a cada dato su respectiva frecuencia, de la misma
manera como se sita una pareja ordenada en un plano coordenado.
Ya marcados los puntos se trazan los rectngulos que, como se mencion con anterioridad, las bases son
segmentos iguales cuyos puntos medios son los datos y las alturas la frecuencia correspondiente a cada
dato.
Histograma de frecuencias relativas.- Conjunto de rectngulos de igual longitud cuyos centros de las
bases representan a los datos y las alturas los porcentajes de las frecuencias de los datos. Para
construir un histograma de frecuencias relativas se siguen los mismos pasos utilizados para construir el
histograma de frecuencias.
Los histogramas de frecuencia y frecuencia relativa correspondiente a los datos de la tabla del ejemplo
de calificaciones de Estadstica, se muestran a continuacin:
CALIFICACIONES
(x)
# DE ALUMNOS
FRECUENCIA (f)
5 2
6 3
7 12
8 13
9 11
10 4


CALIFICACIONES
(x)
% DE ALUMNOS
FRECUENCIA RELATIVA (fr)
5 4.44
6 6.67
7 26.67
8 28.89
9 24.44
10 8.89



0
2
4
6
8
10
12
14
4 5 6 7 8 9 10 11
N

M
E
R
O

D
E

A
L
U
M
N
O
S

CALIFICACIONES
0
5
10
15
20
25
30
35
4 5 6 7 8 9 10 11
%

D
E

A
L
U
M
N
O
S

CALIFICACIONES
Polgono de frecuencias.- Polgono irregular de n lados que describe en su parte superior el
comportamiento de las frecuencias de cada uno de los datos de la coleccin.











Polgono de frecuencias relativas.- Polgono irregular de n lados que describe en su parte superior el
comportamiento de la frecuencia relativa porcentual de cada uno de los datos de la coleccin.
CALIFICACIONES
(x)
% DE ALUMNOS
FRECUENCIA RELATIVA (fr)
5 4.44
6 6.67
7 26.67
8 28.89
9 24.44
10 8.89

0
2
4
6
8
10
12
14
4 5 6 7 8 9 10 11
#

D
E

A
L
U
M
N
O
S

CALIFICACIONES
CALIFICACIONES
(x)
# DE ALUMNOS
FRECUENCIA (f)
5 2
6 3
7 12
8 13
9 11
10 4

Polgono acumulativo.- Grfica escalonada o tipo escalera que muestra el comportamiento de la
frecuencia acumulada de los datos de un conjunto.
CALIFICACIONES
(x)
FRECUENCIA
ACUMULADA (fa)
FRECUENCIA
RELATIVA
ACUMULADA
5 2 4.44
6 5 11.11
7 17 37.78
8 30 66.67
9 41 91.11
10 45 100.0



0
5
10
15
20
25
30
35
4 5 6 7 8 9 10 11
%

D
E


A
L
U
M
N
O
S

CALIFICACIONES
0
5
10
15
20
25
30
35
40
45
50
5 6 7 8 9 10
N

M
E
R
O

D
E

A
L
U
M
N
O
S

CALIFICACIONES



EJERCICIO
Grafica el histograma de frecuencias y frecuencias relativas, el polgono de frecuencias y frecuencias
relativas, el polgono acumulativo y acumulativo porcentual del caso de las edades de tu grupo.














0
20
40
60
80
100
120
5 6 7 8 9 10
%

D
E

A
L
U
M
N
O
S

CALIFICACIONES
EDADES (x) FRECUENCIA (f)





EDADES (x) (f r) (%)





DATOS AGRUPADOS
Otra manera de organizar los datos estadsticos es presentarlos agrupados en las tablas de
distribucin de frecuencias, en las cuales figuran los llamados intervalos o clases. Esta forma de
organizacin se emplea cuando se tienen muchos datos diferentes.

Otras razones para hacer este tipo de agrupaciones son:
Es poco prctico tratar con un gran nmero de datos distribuidos en muchos casos a menos que se
disponga de calculadoras o computadoras, ayuda, tiempo
Algunos de los datos presentan frecuencia tan baja que no se justifica mantenerlos como entidades
distintas y separadas.

Los intervalos de clase no debern ser demasiado amplios porque se puede perder informacin.
Ni tampoco tan reducidos, porque se desvirta el objetivo que se busca con la agrupacin en intervalos de
clase.

No existe norma que nos indique de que tamao debe ser el intervalo, no obstante, se acepta
generalmente que los datos obtenidos pueden ser agrupados desde 5 a 20 intervalos de clases,

INTERVALO.- Se define como cada una de las clases en los cuales se agrupan los datos objeto de
estudio.

FRECUENCIA DEL INTERVALO ( f ).- Nmero natural que representa el nmero de datos que contiene
un intervalo.

LMITE INFERIOR Y SUPERIOR.- Son los valores donde inicia y termina un intervalo; nunca coincide el
lmite superior de un intervalo con el inferior del siguiente

MARCA DE CLASE.- Es el Punto Medio o representante del Intervalo de Clase, y se convierte en la
variable x, esto es imprescindible, pues cada intervalo debe tener un representante y el ms apropiado
es obviamente el promedio del intervalo.
Se obtiene promediando los lmites superior e inferior de cada intervalo, entonces: marca de clase x =
(Lsup + Linf) / 2
LMITES REALES.- Son los nuevos valores que se obtienen a partir de los lmites de los intervalos,
promediando el lmite superior de un intervalo con el lmite inferior del siguiente (coincidiendo ahora
ambos en un mismo punto).
Para efectos de construccin de las grficas y algunos clculos, se requiere entonces que las Tablas de
Distribucin de Frecuencias presenten las columnas donde se deben escribir los lmites reales
EJERCICIOS: Elaborar la tabla de distribucin de frecuencias para los siguientes ejemplos, manejar
todas las columnas hasta Lmites Reales y aadir al final, de antemano, la columna del producto fx
para inducir el clculo de la media.
Peso de 50 ratas de laboratorio




136 129 118 95 103 129 127 132 120 104
125 92 124 100 146 110 87 108 110 133
135 119 115 113 113 126 126 118 82 104
137 126 115 118 95 106 119 119 105 132
126 120 127 101 121 148 125 117 102 146
Poblacin de venados en 72 sectores ecolgicos de proteccin a la vida silvestre





MEDIDAS DE TENDENCIA CENTRAL.
Definiremos una medida de tendencia central como un ndice de localizacin central empleado en la
descripcin de las distribuciones de frecuencia. Puesto que el centro de una distribucin puede ser
definida de diferentes maneras, habr tambin diferentes medidas de tendencia central. Las medidas que
estudiaremos son tres: La media aritmtica, la moda, y la mediana.

LA MEDIA ARITMTICA
Muchos alumnos ya estn familiarizados con esta medida de tendencia central pues la conocen como
promedio, por ejemplo, para obtener su promedio acadmico, suman las calificaciones y dividen entre el
nmero de materias que cursaron. La media aritmtica se define entonces como la suma de los valores
de los datos entre el nmero de datos. El smbolo x se lee x barra, se usa para designar la media.
n
x x x x
x
n
...
3 2 1
+ + +
= , en donde n es la suma de los naturales desde 1 hasta n, la frmula
general es:

n
x
x

=

En el ejercicio de las calificaciones de 28 estudiantes, la media es:
25 . 7
28
203
28
7 7 9 10 9 7 8 7 7 7 5 6 6 8 7 5 9 5 6 7 8 9 6 7 5 10 7 8
= =
+ + + + + + + + + + + + + + + + + + + + + + + + + + +
=
x
x


Cuando tenemos una distribucin de frecuencias agrupadas se utiliza el punto medio de cada intervalo
(marca de clase) para representar todas las calificaciones dentro del intervalo. Cada punto medio se
multiplica por su frecuencia correspondiente, se suman los productos y el resultado se divide entre N, en
este caso, a este tipo de promedio se le llama media ponderada o promedio pesado. La media de un
ejemplo de datos agrupados es:

18 10 9 14 12 17 20 33 15 21 16 13
13 0 0 12 14 17 11 18 16 13 5 6
8 16 13 18 8 28 19 1 14 4 6 16
2 12 11 21 10 11 15 24 8 20 19 7
21 19 16 2 20 17 13 20 10 16 12 10
15 8 16 22 29 16 4 18 21 10 18 9
( )

=
+ + +
+ + +
=
f
xf
f f f f
f x f x f x f x
x
k
k k
...
...
3 2 1
3 3 2 2 1 1

En la prctica, conviene desarrollar este clculo sobre la misma tabla de frecuencias que se ha estado
trabajando, de modo que sea fcil llegar al resultado y verificar errores: se completa la tabla multiplicando
en cada rengln el valor correspondiente de f por el valor de la marca de clase x y se escribe en la
columna que indica el producto fx:
Ejemplo:

Intervalos Frec. Marca de Frec. Acum. Lmites reales
de clases
f
clase (x) (fa) Inf. Sup fx
30 36 3 33 99
37 43 5 40 200
44 50 12 47 564
51 57 9 54 486
58 64 6 61 366
65 71 1 68 68

E f = 36
E fx =
1783


Finalmente, se suman los valores de la columna fx y esta suma se divide entre la suma de las frecuencias
de la columna f, el cociente resultante es x , es decir, la media aritmtica ponderada.



( )
5 . 49
36
1783
= = =

f
xf
x



LA MEDIANA
En un conjunto de datos no agrupados la mediana se determina ordenando los datos y tomando el
nmero de la marca de clase que esta exactamente a la mitad. Si el nmero de datos es par, se suman
los dos valores centrales y se divide entre 2. En un conjunto de datos agrupados, la mediana se define
como el valor de una distribucin abajo y arriba de la cual cae la mitad de las frecuencias, este mtodo
emprico o por inspeccin es vlido cuando la distribucin de frecuencias est muy bien equilibrada. En
otras palabras la mediana es el valor central que divide en dos partes iguales a un conjunto de datos.
En general, la mediana se debe calcular con la frmula siguiente, basada en la llamada clase mediana,
que es aquella clase o intervalo que contiene el dato o datos centrales.
:
C
fm
fa
n
Lri mediana
|
|
|
|
.
|

\
|

+ =
2


Donde:
Lri = Lmite real inferior de la clase mediana.
n = Frecuencia total o suma de frecuencias.
fm = Frecuencia de la clase mediana.
fa = Frecuencia acumulada anterior a la clase mediana.
C = Amplitud del intervalo de la clase mediana.

Ejemplo: Calcular la mediana para la siguiente tabla de distribucin de frecuencias:
Se completa la tabla registrando los lmites reales y la frecuencia acumulada.

Intervalos Frec. Marca de Frec. Acum. Lmites reales
de clases
f
clase (x) (fa) Inf. Sup fx
30 36 3 33 3 29.5 36.5 99
37 43 5 40 8 36.5 43.5 200
44 50 12 47 20 43.5 50.5 564
51 57 9 54 29 50.5 57.5 486
58 64 6 61 35 57.5 64.5 366
65 71 1 68 36 64.5 71.5 68

E f = 36
E fx =
1783

Se determina la posicin del dato central dividiendo la suma de las frecuencias por dos, esto es, 36/2 =
18; el dato a localizar es el que ocupa el lugar 18.
NOTA: Cuando la suma de las frecuencias es impar se sabe que se tiene un dato central. En este caso,
se le debe sumar 1 a la suma de las frecuencias y luego dividirlo por 2.
De la columna de las frecuencias acumuladas se observa que el dato 18 se encuentra en el intervalo:
44 50 (clase mediana).
Una vez localizada la clase mediana se procede a obtener las variables a sustituir en la frmula.
Lri = Lmite real inferior de la clase mediana = 43.5
n = Frecuencia total o suma de frecuencias = 36
fm = Frecuencia de la clase mediana = 12
fa = Frecuencia acumulada anterior a la clase mediana = 8
C = Amplitud del intervalo de la clase mediana = (50.5 43-5) = 7.

Sustituyendo estos valores en la frmula se obtiene:
( )
33 . 49
7 8333 . 0 5 . 43
7
12
8
2
36
5 . 43
2
=
+ =
|
|
|
|
.
|

\
|

+ =
|
|
|
|
.
|

\
|

+ =
mediana
mediana
mediana
C
fm
fa
n
Lri mediana

Aunque por lo regular la media representa un mejor parmetro de la poblacin que la moda y la mediana,
algunas ocasiones se prefiere la mediana como medida de tendencia central cuando la distribucin es
visiblemente asimtrica la media proporciona una estimacin falsa de la tendencia central.
Pnganse por caso los siguientes valores 2,3,5,7,8, la media y la mediana son 5 y por lo tanto se puede
tomar cualquiera de las dos como medida de tendencia central, sin embargo en los valores 2,3,5,7,33,la
mediana es 5 y la media es 10, entonces diremos que la mediana es un mejor parmetro que la media
porque 2,3,7, estn mas cerca de 5 que de 10.
Por ejemplo, el ingreso anual por familia es un fenmeno social comnmente estudiado en donde se
prefiere usar la mediana en vez de la media, porque algunos salarios son muy altos y por lo tanto la
media sobrestima el ingreso obtenido por la mayora de las familias.

LA MODA
La moda es la medida apropiada siempre que se desee una estimacin aproximada rpida de la
tendencia central del dato ms recurrente. La moda se define como el dato que ocurre con ms
frecuencia en datos no agrupados y por esa razn es fcil de localizar, ya que se determina por
inspeccin, es decir de manera emprica, si buscamos la moda en la tabla de valores no agrupados
siguiente, es fcil ver en el ejemplo que la moda es 7 porque su frecuencia ms alta es 10.
x f
10 2
9 4
8 4
7 10
6 4
5 4

Generalmente no se puede determinar el valor de la moda empricamente, como se hizo en el caso
anterior, porque en las distribuciones de frecuencias de datos agrupados por intervalos de clase no se
puede saber si la frecuencia mayor corresponde exactamente a la marca de clase del intervalo con
mayor frecuencia, por lo que se aplica la siguiente frmula, basada en la llamada clase o intervalo
modal que es aquel intervalo que o clase que tiene la mayor frecuencia:


C
d d
d
Lri a
|
|
.
|

\
|
+
+ =
2 1
1
mod

Donde:
Lri = Lmite real inferior de la clase modal
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia inmediata inferior.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia inmediata superior.
C = Amplitud de la clase modal.





Ejemplo: Calcular la moda para la siguiente tabla de distribucin de frecuencias:

Intervalos Frec. Marca de Frec. Acum. Lmites reales
de clases
f
clase (x) (fa) Inf. Sup fx
30 36 3 33 3 29.5 36.5 99
37 43 5 40 8 36.5 43.5 200
44 50 12 47 20 43.5 50.5 564
51 57 9 54 29 50.5 57.5 486
58 64 6 61 35 57.5 64.5 366
65 71 1 68 36 64.5 71.5 68

E f = 36
E fx =
1783

En la tabla se observa que la mayor frecuencia es 12; por lo tanto, la clase modal es el intervalo:
44 50; con esta informacin se localizan las variables a sustituir en la frmula.

Lri = Lmite real inferior de la clase modal = 43.5
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia inmediata inferior = 7
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia inmediata superior = 3
C = Amplitud de la clase modal = 7
Sustituyendo estos valores en la frmula se obtiene:

( )
4 . 48 mod
7 7 . 0 5 . 43 mod
7
3 7
7
5 . 43 mod
mod
2 1
1
=
+ =
|
.
|

\
|
+
+ =
|
|
.
|

\
|
+
+ =
a
a
a
C
d d
d
Lri a


EJERCICIO:
Los salarios semanales de 100 empleados de la maquiladora Monty se distribuyen como indica
la siguiente tabla. Calcule la media, mediana y moda
Salarios Frec. Marca de Frec. Lm. reales
f clase (x) acum. inf. Sup. f(x)
440 448 9
449 457 20
458 466 33
467 475 25
476 484 13


MEDIDAS DE DISPERSION
Una calificacin por si misma carece de significado y solo lo adquiere cuando se compara con otras
calificaciones. En el tema anterior vimos que algunos valores nos pueden servir como punto de
comparacin. As, una calificacin definida podemos compararla con alguna medida de tendencia central
y saber si dicha calificacin es mas grande o pequea, o que tan lejos o cerca esta de tal valor central.
En este sentido debemos buscar una forma de calcular que tan dispersas estn las calificaciones del valor
central.
LA DESVIACION MEDIA
La variabilidad o dispersin de un conjunto o coleccin de datos generalmente se miden en trminos de la
desviacin de cada dato con respecto a la media aritmtica del conjunto ( ) x x , si las desviaciones
son pequeas, los datos son menos variables o estn menos dispersos que si las desviaciones son
grandes.
Sea una coleccin de n datos, entonces la desviacin media est definida por:

n
x x
M D


= .

Donde x es la media aritmtica de los datos.
Ejemplo: Un estudiante obtuvo en 5 exmenes las calificaciones: 50,60, 80, 55 y 70 puntos,
encontraremos la desviacin media de sus calificaciones.
Tenemos media = puntos x _ 63
5
315
5
70 55 80 60 50
= =
+ + + +
=

As:


puntos M D
M D
n
x x
M D
_ 6 . 9
5
48
5
7 8 17 3 13
. .
5
63 70 63 55 63 80 63 60 63 50
. .
. .
= =
+ + + +
=
+ + + +
=

=



Luego, si sumamos y restamos el valor obtenido a la media aritmtica tenemos el intervalo 53.4 72.6,
entonces cualquier calificacin que est dentro de este intervalo, podemos decir que es una regular
calificacin. Si est a la izquierda de dicho intervalo diremos que es una baja calificacin puesto que est
muy lejos de la media aritmtica y es menor que esta y si est a la derecha del intervalo diremos que es
una buena calificacin aunque tambin est lejos pero a la derecha de la media.
Es importante observar que las desviaciones de los datos con respecto a media estn tomadas en valor
absoluto. Esto es necesario porque una propiedad de la media es que la suma algebraica de tales
desviaciones es siempre cero, en nuestro ejemplo 63 = x y as tenemos:
= x x
1

50 53 = -13
= x x
2

60 63 = -3
= x x
3

80 63 = 17
= x x
4

55 63 = -8
= x x
5

70 63 = 7
Suma algebraica = 0
Datos ordenados.- Si los datos se dan ordenados en una tabla de distribucin de frecuencias, la
desviacin media se obtiene por la frmula:

( )


=
f
x x f
M D.
Donde:
: x x

Valor absoluto de la desviacin de cada dato respecto a la x
f : Frecuencia de cada dato.
:

f Sumatoria de frecuencias o el total de datos.


Ejemplo: En un examen de matemticas 50 estudiantes obtuvieron calificaciones cuya distribucin es la
siguiente:
CALIFICACIN FRECUENCIA
50 6
60 8
65 9
75 11
90 10
100 6
f = 50
Para encontrar la desviacin media los clculos se disponen en un cuadro como sigue:
Calificacin (x) Frecuencia f x f
x x

x x f

50 6 300 23.8 142.8
60 8 480 13.8 110.4
65 9 585 8.8 79.2
75 11 825 1.2 13.2
90 10 900 16.2 162.0
100 6 600 26.2 157.2
= 50 = 3,690 = 664.8
As tenemos:
puntos
f
xf
x _ 8 . 73
50
690 , 3
= = =



Y
( )
puntos
f
x x f
M D _ 30 . 13
50
8 . 664
. = =








Datos agrupados.-Para una distribucin de frecuencias en la que los datos estn agrupados, primero se
obtienen los valores absolutos de de las desviaciones de cada marca de clase con respecto a la media
aritmtica y despus se multiplica cada valor absoluto por su respectiva frecuencia, posteriormente se
calcula la sumatoria de estos productos para sustituir en la frmula, es decir:

.


=
f
x x f
M D.
Donde:
: x x Valor absoluto de la desviacin de cada marca de clase respecto a la media.
f : Frecuencia de cada marca de clase.
:

f Sumatoria de frecuencias o el total de datos





Ejemplo: Encontrar la desviacin media para la siguiente tabla de distribucin de frecuencias que muestra
las alturas en pulgadas de 100 atletas de una delegacin olmpica.

INTERVALOS FRECUENCIA
60 - 62 5
63 - 65 18
66 - 68 42
69 - 71 27
72 - 74 8

Se completa la tabla primeramente calculando las marcas de clase para obtener posteriormente las
sumatorias correspondientes para el clculo de la desviacin media.

INTERVALOS Frecuencia f Marca de clase
(x)
(x)f
x x

x x f

60 - 62 5 61 305 6.45 32.25
63 - 65 18 64 1,152 3.45 62.10
66 - 68 42 67 2,814 0.45 18.90
69 - 71 27 70 1,890 2.55 68.85
72 - 74 8 73 584 5.55 44.40

f = 100 = 6745 = 226.50

adas pu
f
xf
x lg _ 45 . 67
100
745 , 6
= = =



adas pu
f
x x f
M D lg _ 265 . 2
100
50 . 226
. = =



LA VARIANZA Y LA DESVIACION ESTANDAR
En el clculo de la desviacin media mencionamos el problema de que las diferencias de la media menos
las calificaciones podran ser negativas. Otra forma de evitar este problema es elevar al cuadrado cada
diferencia y de este modo eliminaremos el signo menos.
La varianza s
2
se define como la suma de los cuadrados de las desviaciones de las observaciones con
respecto a la media dividida por n o la suma de f. Es decir:

( )
n
x x
s VARIANZA


= =
2
2

Donde:
( ) :
2
x x Cuadrado de la desviacin de cada dato respecto a la x
n : Total de datos.
Ntese que nuevamente se estn tomando las desviaciones de los datos respecto de la x siendo la
varianza la media de los cuadrados de dichas desviaciones; resulta as ser una medida de dispersin en
la que figuran desviaciones al cuadrado. Para superar esta insuficiencia y disponer de una medida de
dispersin para los datos que sea en cierta forma semejante a la desviacin media, se toma la raz
cuadrada (positiva) de la varianza y le llamamos Desviacin estndar , la cual por lo general se
representa con la letra s, as en smbolos tenemos:
Desviacin estndar = s = Varianza

Consideraciones anlogas a las hechas en la seccin anterior al estudiar la desviacin media implican
que para colecciones de datos ordenados en una tabla de frecuencias o bien, agrupados en intervalos
de clase las frmulas para calcular la Varianza queda como sigue:
a) Para datos ordenados:

( )
f
x x f
s VARIANZA


= =
2
2

b) Para datos agrupados:

( )
f
x x f
s VARIANZA


= =
2
2

Donde todos los smbolos tienen el significado de siempre
Desde luego es suficiente referirnos a las frmulas para encontrar la Varianza puesto que la Desviacin
estndar se obtiene simplemente tomando la raz cuadrada (positiva).
Prcticamente la desviacin media y la desviacin estndar son parmetros que miden lo mismo; sin
embargo, por sus propiedades matemticas se prefiere a la desviacin estndar s .

EJEMPLOS: Los procedimientos de clculo para encontrar la Varianza y de sta la Desviacin estndar
en cada uno de los tres casos (datos enlistados, datos ordenados y datos agrupados), son muy similares
a los empleados para encontrar la desviacin media; para verlos tomemos las mismas distribuciones de la
seccin anterior y encontraremos la Varianza y la Desviacin estndar.


EJEMPLO 1.-
Un estudiante obtuvo en 5 exmenes las calificaciones: 50,60, 80, 55 y 70 puntos, encontraremos la
desviacin media de sus calificaciones.
Tenemos media = puntos x _ 63
5
315
5
70 55 80 60 50
= =
+ + + +
=

As Varianza:
( )
( ) ( ) ( ) ( ) ( ) | |
( ) ( ) ( ) ( ) ( )
puntos s
s
n
x x
s
_ 116
5
580
5
49 64 289 9 169
5
7 8 17 3 13
5
63 70 63 55 63 80 63 60 63 50
2 2 2 2 2
2
2 2 2 2 2
2
2
2
= =
+ + + +
=
+ + + +
=
+ + + +
=

=



De donde Desviacin estndar = puntos Varianza s _ 77 . 10 116 = = =


Recordemos que las calificaciones tienen desviacin media D.M.= 9.6 puntos.

EJEMPLO 2.- En un examen de matemticas 50 estudiantes obtuvieron calificaciones cuya distribucin
es la siguiente:
Calificacin (x) Frecuencia f x f
x x

( )
2
x x

( )
2
x x f

50 6 300 -23.8 566.44 3,398.64
60 8 480 -13.8 190.44 1,523.53
65 9 585 -8.8 77.44 696.96
75 11 825 1.2 1.44 15.84
90 10 900 16.2 262.44 2,624.40
100 6 600 26.2 686.44 4,118.14
= 50 = 3,690 = 12,378

As tenemos:
( )
56 . 247
50
378 , 12
_
_ 8 . 73
50
690 , 3
2
2
= =


= =
= = =

f
x x f
s Varianza y
puntos
f
xf
x

De donde la Desviacin estndar
puntos Varianza s _ 73 . 15 6 . 247 = = =


Recordemos la desviacin media fue D.M. = 13.296 puntos.
EJEMPLO 3.- La siguiente tabla de distribucin de frecuencias muestra las alturas en pulgadas de 100
atletas de una delegacin olmpica.
INTERVALOS Frecuencia f Marca de
clase (x)
x f
x x

( )
2
x x

( )
2
x x f

60 - 62 5 61 305 -6.45 41.60 208.0
63 - 65 18 64 1,152 -3.45 11.90 214.2
66 - 68 42 67 2,814 -0.45 0.20 8.4
69 - 71 27 70 1,890 2.55 6.50 175.5
72 - 74 8 73 584 5.55 30.80 246.4
= 100 = 6,745 = 852.5

As tenemos:
( )
525 . 8
100
5 . 852
_
lg _ 45 . 67
100
745 , 6
2
2
= =


= =
= = =

f
x x f
s Varianza y
adas pu
f
xf
x

De donde la Desviacin estndar
adas pu Varianza s lg _ 92 . 2 525 . 8 = = =

Recordemos la desviacin media de las alturas fue D.M. = 2.265.









EJERCICIOS:
1. Una muestra de 70 herramientas cortantes de un proceso industrial, dio para
su vida til (aproximando a la hora ms cercana) la distribucin siguiente:
Intervalos Frec. Marca
de
Frec. Lmites reales f(x) x x

x x f

( )
2
x x

( )
2
x x f

de clases f clase
(x)
acum. Inf. Sup.

0 ~ 24 2
25 ~ 49 4
50 ~ 74 12
75 ~ 99 30
100 ~ 124 18
125 ~ 149 4
f= = = =

Calcular: Media, Mediana, Moda, Desviacin media y Desviacin estndar.
2.- Segn estudios estadsticos de los Servicios Coordinados de Salud Pblica del
Estado de Yucatn, la mortalidad por grupos de edad en la ciudad de Mrida el ao de
1978, tuvo la distribucin siguiente:

Intervalos Frec. Marca
de
Frec. Lmites reales f(x) x x

x x f

( )
2
x x

( )
2
x x f

de clases f clase
(x)
acum. Inf. Sup.

1 ~ 4 49
5 ~ 14 40
15 ~ 44 235
45 ~ 64 390
65 ~ 69 173
70 ~ 74 221
75 ~ 79 279
f= = = =

Calcular: Media, Mediana, Moda, Desviacin media y Desviacin estndar.




3.- Calcular la moda, mediana, media, desviacin media y desviacin estndar con los
siguientes datos agrupados.
Intervalos Frec. Marca de Frec. Lmites reales

de clases
f clase (x)
acum. inf. Sup.
f(x)
| x - x |
f | x - x |
( x - x )
2
f ( x - x )
2
30 36 4
37 43 3
44 50 2
51 57 2
58 64 1
65 71 3
Totales

Vous aimerez peut-être aussi