Vous êtes sur la page 1sur 30

4

3 Estadstica descriptiva
3.1 Conceptos bsicos de estadstica

3.1.1 Definicin de estadstica

La estadstica es una rama de la ciencia matemtica que se encarga de recopilar,
organizar, analizar, interpretar y presentar un conjunto de datos con el objetivo de ayudar
en la toma de decisiones eficientes en cualquier actividad que involucre la incertidumbre.

Para su estudio la estadstica se divide en estadstica descriptiva y en estadstica
inferencial. La estadstica descriptiva estudia los mtodos para organizar, resumir y
presentar los datos de manera informativa y es la que estudiaremos en esta unidad,
mientras que la estadstica inferencial estudia los mtodos para inferir en una poblacin
basndose en el muestreo.

Entonces cuando requerimos analizar un proyecto, proceso o actividad, es necesario
tomar una muestra de datos del proyecto en cuestin (Estadstica Inferencial) y a partir
de los mismos obtener sus caractersticas tales como la media, la mediana, la moda, la
desviacin estndar, el rango, etc., su tipo de distribucin de probabilidad y el
comportamiento de los datos al ser graficados de diversas formas, todo lo anterior es
posible gracias a la estadstica descriptiva.



3.1.2 Inferencia estadstica

La estadstica inferencial es el conjunto de mtodos estadsticos que permiten deducir
(inferir) como se distribuye la poblacin en estudio o las relaciones aleatorias entre varias
variables de inters a partir de la informacin que proporciona una muestra, esta
deduccin se mide en trminos probabilsticos, es decir, toda inferencia se acompaa de
su probabilidad de xito. La inferencia estadstica se basa en la teora de muestras, la
estimacin de parmetros, contraste de hiptesis, diseo de experimentos y la inferencia
bayesiana.

5

3.1.3 Teora de decisin

Para una persona que toma decisiones, es difcil tener en cuenta todos los factores que
inciden en la decisin, por tanto, es indispensable encontrar alguna manera de
descomponer estos factores, de tal manera que le permita al tomador de decisiones,
pensar en las implicaciones de cada factor, en forma racional. Cualquier problema de
decisin, tiene ciertas caractersticas que describe su naturaleza y adems pueden
proporcionar alternativas para su solucin.

La teora de decisiones es una aproximacin analtica y sistemtica para estudiar la toma
de decisiones.

Los tipos de decisin que toma la gente dependen de cuanto saben o de la informacin
que tienen acerca de la decisin. Tres decisiones son definidas y explicadas a
continuacin:

TIPO 1: Decisin Tomada Bajo Hechos Ciertos: En este ambiente, quienes toman la
decisin saben con certeza la consecuencia de cada alternativa o decisin a seguir.
Naturalmente, ellos escogen la alternativa que maximizar su buen comienzo o con la
que se obtendrn mejores resultados.

TIPO 2: Decisin Tomada Bajo Riesgos: Aqu, la decisin tomada conoce la probabilidad
de ocurrencia de cada resultado. Nosotros sabemos por ejemplo, que la probabilidad de
falla de una computadora DELL es de 0.025. En decisiones tomadas bajo riesgo, la
decisin tentativa maximizar su bienestar. Los modelos de teora de decisiones para
problemas de negocios se emplean es la maximizacin de la espera del valor monetario
y maximizacin de esperar una prdida.

TIPO 3: Decisin Tomada Bajo Hechos Inciertos: En esta categora, las decisiones
tomadas no son uniformes en las probabilidades de las variaciones de los resultados. Por
ejemplo, la probabilidad de que un alumno de ingeniera en sistemas computacionales de
ITSP en 25 aos sea presidente de la repblica mexicana, no se sabe. Algunas veces
esto es imposible adicionarlo a la probabilidad de que suceda una nueva empresa o
producto.


6
En trminos generales si usted va a tomar una decisin se recomienda considerara los
siguientes pasos:

1. Defina claramente el problema
2. Liste las posibles alternativas
3. Identifique los posibles resultados
4. Liste el costo o la utilidad de cada combinacin de alternativas y resultados
5. Seleccione uno de los modelos matemticos de la teora de decisiones
6. Aplique el modelo y tome su decisin


3.1.4 Poblacin

Hay que recordar que la estadstica se encarga de recopilar, organizar, analizar,
interpretar y presentar un conjunto de datos con el objetivo de ayudar en la toma de
decisiones eficientes, para ello es necesario conocer y entender el concepto de
poblacin como la totalidad de elementos o cosas bajo consideracin o estudio. Este
concepto es fcil de entender, su problema radica en la aplicacin, es decir, al momento
de identificar y delimitar la poblacin en un proyecto de investigacin.

Por ejemplo si se tiene la siguiente pregunta de investigacin: Que marca de
computadora prefieren los alumnos del ITSP?, En esta investigacin la poblacin esta
compuesta por todos los alumnos que estn inscritos en el ITSP, aquella persona que
asista a clases y que no este inscrita, los que ya se dieron de baja, los que ya
egresaron, los docentes y los trabajadores del ITSP no son alumnos del ITSP, por lo
tanto no son elemento de nuestra poblacin de estudio.

Otro ejemplo sera sobre la siguiente pregunta de investigacin Qu preferencia tiene el
buscador google a nivel mundial? En este caso la poblacin de estudio son todas
aquellas personas que usan el Internet para buscar informacin, incluyendo a los
habitantes de la India, China, el Salvador, Etc. Indiscutiblemente realizar esta
investigacin requerir de mayores recursos econmicos, de tiempo y esfuerzo.

7
3.1.5 Muestra aleatoria

Una muestra es la porcin de la poblacin que se selecciona para su anlisis (determinar
los estadsticos). El uso de mtodos estadsticos inferenciales se deriva de la necesidad
del muestreo. A medida que una poblacin crece, por lo general resulta demasiado
costoso, tardado e incomodo obtener nuestra informacin de toda la poblacin. La
determinacin de las caractersticas de la poblacin tiene que basarse en la informacin
contenida en una muestra de esa poblacin. La teora de probabilidades proporciona
el enlace al averiguar la probabilidad que los resultados de la muestra reflejen fielmente
los resultados de la poblacin, por lo que es necesario conocer las tcnicas o sistemas
de muestreo probabilstico.

Los mtodos de muestreo probabilstico o aleatorio, se basan en el principio de
equiprobabilidad, es decir, aquellos en los que los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra, esto con la finalidad de
asegurar la representatividad de la muestra extrada y estos son; el muestreo aleatorio
simple, muestreo sistemtico, muestreo estratificado, muestreo por conglomerados y el
bietpico y por tanto, los ms recomendables, ya que disminuye la probabilidad de tener
sesgos (error) o para minimizar el error muestral y as obtener un nivel de confianza.

Si una muestra aleatoria se elige de tal forma que todos los elementos de la poblacin
tengan la misma probabilidad de ser seleccionados, la llamamos muestra aleatoria
simple.

Ejemplo 1.1
Suponga que nos interesa elegir una muestra aleatoria de 5 estudiantes en un grupo de
estadstica de 20 alumnos.
20
C
5
da el nmero total de formas de elegir una muestra no
ordenada y este resultado es 15,504 maneras diferentes de tomar la muestra. Si listamos
las 15,504 en trozos separados de papel, una tarea tremenda, luego los colocamos en un
recipiente y despus los revolvemos, entonces podremos tener una muestra aleatoria de
5 si seleccionamos un trozo de papel con cinco nombres. Un procedimiento ms simple
para elegir una muestra aleatoria sera escribir cada uno de los 20 nombres en pedazos

8
separados de papel, colocarlos en un recipiente, revolverlos y despus extraer cinco
papeles al mismo tiempo.

Otro mtodo parea obtener una muestra aleatoria de 5 estudiantes en un grupo de 20
utiliza una tabla de nmeros aleatorios. Se puede construir la tabla usando una
calculadora o una computadora. Tambin se puede prescindir de estas y hacer la tabla
escribiendo diez dgitos del 0 al 9 en tiras de papel, las colocamos en un recipiente y los
revolvemos, de ah, la primera tira seleccionada determina el primer nmero de la tabla,
se regresa al recipiente y despus de revolver otra vez se selecciona la seguida tira que
determina el segundo nmero de la tabla; el proceso contina hasta obtener una tabla de
dgitos aleatorios con tantos nmeros como se desee.

Hay muchas situaciones en las cuales el muestreo aleatorio simple es poco prctico,
imposible o no deseado; aunque sera deseable usar muestras aleatorias simples para
las encuestas nacionales de opinin sobre productos o sobre elecciones presidenciales,
sera muy costoso o tardado.

El muestreo estratificado requiere de separar a la poblacin segn grupos que no se
traslapen llamados estratos, y de elegir despus una muestra aleatoria simple en cada
estrato. La informacin de las muestras aleatorias simples de cada estrato constituira
entonces una muestra global.

Ejemplo 1.2
Suponga que nos interesa obtener una muestra de las opiniones de los profesores de
una gran universidad. Puede ser difcil obtener una muestra con todos los profesores, as
que supongamos que elegimos una muestra aleatoria de cada colegio, o departamento
acadmico; los estratos vendran a ser los colegios, o departamentos acadmicos.

El muestreo por conglomerados requiere de elegir una muestra aleatoria simple de
unidades heterogneas entre s de la poblacin llamadas conglomerados. Cada

9
elemento de la poblacin pertenece exactamente a un conglomerado, y los elementos
dentro de cada conglomerado son usualmente heterogneos o dismiles.

Ejemplo 1.3
Suponga que una compaa de servicio de televisin por cable est pensando en abrir
una sucursal en una ciudad grande; la compaa planea realizar un estudio para
determinar el porcentaje de familias que utilizaran sus servicios, como no es prctico
preguntar en cada casa, la empresa decide seleccionar una parte de la ciudad al azar, la
cual forma un conglomerado.

En el muestreo por conglomerados, stos se forman para representar, tan fielmente
como sea posible, a toda la poblacin; entonces se usa una muestra aleatoria simple de
conglomerados para estudiarla. Los estudios de instituciones sociales como iglesias,
hospitales, escuelas y prisiones se realizan, generalmente, con base en el muestreo por
conglomerados.

El muestreo sistemtico es una tcnica de muestreo que requiere de una seleccin
aleatoria inicial de observaciones seguida de otra seleccin de observaciones obtenida
usando algn sistema o regla.

Ejemplo 1.4
Para obtener una muestra de suscriptores telefnicos en una ciudad grande, puede
obtenerse primero una muestra aleatoria de los nmeros de las pginas del directorio
telefnico; al elegir el vigsimo nombre de cada pgina obtendramos un muestreo
sistemtico, tambin podemos escoger un nombre de la primera pgina del directorio y
despus seleccionar cada nombre del lugar nmero cien a partir del ya seleccionado. Por
ejemplo, podramos seleccionar un nmero al azar entre los primeros 100; supongamos
que el elegido es el 40, entonces seleccionamos los nombres del directorio que
corresponden a los nmeros 40, 140, 240, 340 y as sucesivamente.


10
Es necesario mencionar que tambin existen mtodos de muestreo no probabilstico. A
veces, para estudios exploratorios, el muestreo probabilstico resulta excesivamente
costoso y se acude a mtodos no probabilsticos, an siendo conscientes de que no
sirven para realizar generalizaciones, pues no se tiene certeza de que la muestra
extrada sea representativa, ya que no todos los sujetos de la poblacin tienen la misma
probabilidad de ser elegidos. En general se seleccionan a los sujetos siguiendo
determinados criterios procurando que la muestra sea representativa (significativa).

3.1.6 Parmetros aleatorios

Cuando un estadstico o estimador que es una medida de resumen que representa o
caracteriza a los elementos analizados de una muestra, dicho resumen puede ser la
media, el rango la moda, entre otros estimadores, si estos estadsticos se infieren a toda
la poblacin se convierte en un parmetro. Por lo tanto los parmetros sern aleatorios
ya que estn en funcin a los resultados que se obtienen en las muestras.

La definicin del parmetro es: medida generalmente desconocida, pues es un valor que
representa supuestamente una caracterstica de toda la poblacin y se basa en la
muestra.
Caractersticas de un buen estimador

El estimador es un valor nico del estadstico.
Se determina a partir de un muestreo aleatorio
El estimador proviene de un tamao de muestra n adecuado
El estimador no debe alejarse mucho del valor real por lo tanto se recomienda
utilizar la media de medias (estimador insesgado)
Una menor variacin (s
2
) con respecto a la media


3.1.7 Enfoque clsico

Cuando se trabaja con muestras existe una inseguridad implcita en la investigacin que
se pueden investigar en forma cientfica, a esta investigacin se le denomina Teora de la
probabilidad, y que en ocasiones tambin se le llama ciencia de la incertidumbre.


11
Entonces podemos decir que la probabilidad es la rama de la estadstica que se encarga
de describir la posibilidad relativa de que ocurra un evento, por lo tanto la probabilidad
nos permite tomar decisiones con informacin limitada y minimizar la cuestin aleatoria.
Por ejemplo al fabricar un producto cul es la posibilidad que tenga defectos? o la
probabilidad de que un trabajador tenga un accidente, entre otras.

La probabilidad clsica se basa en la consideracin de que los resultados de un
experimento son igualmente posibles. Empleando este punto de vista la probabilidad se
calcula dividiendo los eventos favorables entre los eventos posibles:

3.2 Descripcin de datos

Cuando se tenga un conjunto de 29 datos o menos, y esta se desea analizar. Entonces
se recomienda que los datos se examinen en vivo, es decir, sin agrupar los datos en
clases. Este anlisis se logra por medio de formulas y mtodos muy particulares para
describir datos, encontrando un nico valor para describir un conjunto de los mismos,
para realizar la descripcin contamos con las medidas de tendencia central y de
dispersin. Por otro lado cuando se tengan un conjunto de datos mayor de 29 se
recomienda agruparlos para un mejor anlisis y presentacin.

3.2.1 Datos agrupados y no agrupados

Cuando una muestra consta de 30 datos o ms, lo recomendable es agrupar los datos en
clases o categoras y a partir de estas determinar las caractersticas de la muestra y por
consiguiente las de la poblacin de donde fue tomada. Los datos se agrupan en
categoras para tener control y nocin en la descripcin de los mismos, ya que cuando se
tienen muchos datos es difcil determinar su valor tpico y difcil la concentracin para el
anlisis e interpretacin. Si el tamao de muestra es menor a 30, como se dijo en la
seccin anterior se recomienda analizar los datos en vivo, es decir, sin agruparlos.






12
3.2.2 Frecuencia de clases (fa)

Si se tiene grandes cantidades de datos sueltos es til distribuirlos en clases categoras, y
determinar el nmero de individuos que pertenecen a cada categora, a lo que se llama
Frecuencia de Clase. A una disposicin de tabular de los datos por clases, con sus
correspondientes frecuencias de clase, se les conoce como distribucin de frecuencias o tabla
de frecuencias

Para establecer el nmero de clases se recomienda lo siguiente:
a) Nmero de clases (k) = 1+ [ (3.322)logaritmo de total de datos]
b) Utilizar la regla 2 a la k, es decir, 2
k
n, donde n es el nmero de datos
c) Utilizar la siguiente directriz
Nmero de observaciones (n) Nmero recomendado de clases (k)
9-16 4
17-32 5
33-64 6
65-128 7
129-256 8
257-512 9
513-1024 10
d) Su juicio profesional puede determinar el nmero de clases, pero recuerde demasiadas o
pocas clases no darn a conocer las formas bsicas de la distribucin.

3.2.3 Frecuencia relativa

La frecuencia relativa es el cociente de dividir entre la frecuencia absoluta de la clase y la
sumatoria de todas las frecuencias absolutas (es el tamao de la muestra), se podra decir que
es la probabilidad de que un datos se encuentra en una clase determinada. Si a la frecuencia
relativa se multiplica por 100, se obtiene el porcentaje de cada clase.

3.2.4 Punto medio (pm)

El punto medio (pm X
i
) es el valor central de un intervalo de clases, se determina promediando
el lmite inferior y el lmite superior de una clase en particular, es decir, al sumar el lmite inferior y
el lmite superior y dividirlo entre dos, este valor nos sirve para calcular el promedio de nuestro

13
conjunto de datos agrupados, ya que una vez que se determina el punto medio este valor se
multiplica por la frecuencia absoluta se suman y se dividen entre nmero de datos.

3.2.5 Lmites

El smbolo que define a una clase, se llama intervalo de clase. A los nmeros que definen las
clases se les conoce como lmites de clase; el nmero ms pequeo es el lmite inferior de
clase, mientras que el ms grande es el lmite superior de clase. A un intervalo de clase que, por
lo menos tericamente, no tiene lmite de clase inferior o superior se le llama Intervalo de Clase
Abierto. Por ejemplo, en grupos de edades de individuos, el intervalo de clase 65 aos o ms
es un Intervalo de Clase Abierto.


3.2.6 Histograma de frecuencias

En la estadstica la representacin de los datos se realizar por medio de grficos que
permitan presentar informacin de forma ms sencilla donde las conclusiones son fciles
de entender, graficas que nos permitan comparar, o simplemente para observar una
tendencia y de esta forma facilitar la toma de decisin. Es necesario mencionar que
existen diferentes tipos de graficas y la eleccin de ella depender del objetivo de la
presentacin. A continuacin mencionaremos las graficas ms usuales y la
recomendacin para su uso:

Descripcin Ejemplo
Histograma de frecuencias, grafico de barras o
columnas; se usan principalmente para compara datos
entre diferentes segmentos llmese clase, sectores,
lneas de produccin, empresas o la productividad en
periodos de tiempo.

0
50
100
1er trim. 2do trim. 3er trim. 4to trim.
Este Oeste Norte

14
Grafica de lneas; Este tipo de graficas ayudan
observar la evolucin de los datos a travs del tiempo.
Por lo general se utilizan para mostrar un mismo tipo de
dato.

Graficas de pastel o tartas; En este tipo de graficas
nos sirven para observar la contribucin de cada parte a
un total, es una forma creativa de comparar las
porciones con colores diferentes:

Diagrama de puntos o graficas de dispersin: se
utilizan para observar la relacin de dos variables, una
variable independiente que se coloca en el eje (X) o eje
horizontal en el ejemplo las horas de estudio y una
variable dependiente que se coloca en el eje (Y) o eje
vertical en el ejemplo es la calificacin.


Recomendaciones generales para presentar las graficas

En Microsoft Excel se pueden obtener las diferentes graficas, pero hay que adecuarlos
de acuerdo a las necesidades, es necesario considerar las siguientes recomendaciones.

La tercera dimensin: Este efecto puede dar una mejor presentacin a la grafica, pero
hace que la informacin sea ms difcil de leer e interpretar y recuerda que el objetivo de
la grafica es precisamente facilitar la interpretacin, por lo que se recomienda realizar las
graficas de segunda dimensin.

El fondo del grafico: El fondo se recomienda que sea blanco o en su defecto un 5% de
gris, siempre hay que evitar colores obscuros o muy fuertes, ya que el objetivo es resaltar
el contenido (barras o lneas) y no en s la grafica.

Los colores en las barras o lneas: En algunos casos cuando se esta comparando
grupos diferentes se recomienda experimentar un poco hasta encontrar el contraste
0
50
100
1er trim. 2do trim. 3er trim. 4to trim.
Este Norte
Este Oeste Norte
0
50
100
15 20 30 60
C
a
l
i
f
i
c
a
c
i

n

horas de estudio

15
adecuado, y esto har que la grafica sea fcil de leer. Mientras que en algunos casos se
recomienda un solo color de baja vibracin, normalmente un color gris.

Espesor de las barras: En el espesor se recomienda minimizar el uso de la tinta por
dato mostrado, empleando barras ms finas, eliminando el borde de las barras o en su
defecto eliminar el fondo e incrementando el grosor de los bordes de la barra. El objetivo
es optimizar la presentacin para una lectura ms clara y sencilla.

Lnea de divisin: Se recomienda nicamente la lnea horizontal, es decir, del eje y,
con un estilo punteado, color gris y grosor fino.

Elementos mnimos que debe contener una grafica: El titulo general de la grafica, en
donde se explique la temtica; la grafica elaborada con las recomendaciones anteriores;
el titulo de las ejes (X y Y); Una breve explicacin sobre la grafica; la fuente donde se
obtuvo la grafica o la informacin que se grafico.
El tamao de la grafica debe ser lo suficientemente grande para apreciar la informacin, se
recomienda que ocupe tres cuartas partes de una hoja y que se localice en la parte central.

3.3 Medidas de tendencia central

Se les llama medidas de tendencia porque indican la forma en que un conjunto de datos
se agrupan hacia el centro. Algunas de las medidas de tendencia central son la media
aritmtica, la mediana, la media geomtrica, la moda, etc. debido a que al observar la
distribucin de los datos, estas tienden a estar localizadas generalmente en su parte
central.

A continuacin definiremos algunas medidas de tendencia central y la forma de calcular
su valor:

La media aritmtica ( x ): Es la suma de todos los valores dividido por el nmero total
de los mismos, tambin se le conoce como promedio y es el punto de equilibrio de un

16
conjunto de datos, esta medida normalmente se utiliza para comparar dos poblaciones.
La media aritmtica se determina con la frmula siguiente:
n
x
n
i
i x
=
=
1

Donde:
x = media aritmtica
X
i
= dato i
n = nmero de datos en la muestra


Por ejemplos se han tomado como muestra las medidas de seis tuercas que se utilizan
en el armado de una computadora, las cuales son; 162mm, 160, 161, 162, 161 y 160,
determine su media aritmtica.
Solucin: mm X 161
6
160 161 162 161 160 162
=
+ + + + +
=

Se toman muestras sobre la velocidad de RAM DINMICA en cinco computadoras, es
decir, los tiempos que tarda en vaciarse los datos para poder dar entrada a la siguiente
serie de datos en nanosegundos (ns), encontrndose lo siguiente: 76.5ns 74.8, 85.3,
79.5, 81.4, determine el tiempo promedio de vaciado de las memorias analizadas.
Solucin: ns x 5 . 79
5
4 . 81 5 . 79 3 . 85 8 . 74 5 . 76
=
+ + + +
=

Ahora si deseamos determinar la edad promedio de los estudiantes de una escuela de
nivel superior al iniciar sus estudios, suponga que se toman las edades de algunos de los
alumnos de cierta clase y estas son las que siguen: 20, 18, 18, 19, 18, 19, 35, 20, 18, 18, 19.

Solucin: aos x 18 . 20
11
19 18 18 20 35 19 18 19 18 18 20
=
+ + + + + + + + + +
=

Si observamos las edades nos damos cuenta que el valor de 35 aos es un valor
diferente al de las dems edades, en esta situacin se recomienda descartar el valor ya
que se considera un valor atpico, es decir un valor que es debido a circunstancias

17
especiales, en este caso puede ser que el alumno este realizando una segunda
licenciatura, por lo que la edad promedio se debe calcular con 10 edades tpicas para
conocer la edad promedio de los alumnos al iniciar sus estudios en el nivel superior, tal
como se muestra a continuacin:

aos x 7 . 18
10
19 18 18 20 19 18 19 18 18 20
=
+ + + + + + + + +
=

Entonces tendremos una conclusin ms realista de la edad promedio que los jvenes
inician sus estudios en el nivel superior.

Nota: Se recomienda descartar todos aquellos datos atpicos que se encuentren en la
muestra o muestras, cuando se utilizan todos los datos en una medida de tendencia
central, ya que en muchas ocasiones se debe a las lecturas realizadas en forma
incorrecta y que no representan al conjunto de datos.
Media geomtrica (MG). Es til para encontrar el promedio de porcentajes, ndices o en
las tasas de defectos cuando los valores de los datos de la muestra no son lineales, es
decir que su valor depende de varios factores a la vez. La media geomtrica de un
conjunto de datos se define como la raz n-sima del producto de los n valores o
elementos de la muestra, se determina de la siguiente forma:
) )...( )( (
2 1
n
n x x x
MG =
Donde:
MG = media geomtrica
x
i
= dato i
n = nmero de datos en la muestra

Por ejemplo las ganancias obtenidas en porcentaje por una distribuidora de
computadoras fueron 3%, 2, 4 y 6. Cul es la media geomtrica de la ganancia?
Solucin:
4
4
144 ) 6 )( 4 )( 2 )( 3 ( = = MG = 3.4641

Entonces podemos concluir que las ganancias de la empresa es de 3.46%. De otra forma
si hubiramos obtenido la media aritmtica de las ganancias seria de 3.75% obtenida por
(3+2+4+6)/4. Aunque la ganancia de 6% no es extremadamente grande, sin embargo

18
afecta el resultado de la media aritmtica, mientras que la media geomtrica es una cifra
ms conservadora.

Nota: Para utilizar la media geomtrica los nmeros utilizados deben ser positivos y el
resultado siempre ser menor o igual que la media aritmtica, nunca mayor.

Media aritmtica ponderada (
xw
). Esta media es un caso especial de la media
aritmtica, se utiliza cuando hay varias observaciones del mismo valor o cuando los
datos se han agrupado en una distribucin de frecuencias. La media ponderada se
puede definir como el cociente de un conjunto de datos designados por X
1
, X
2
, X
3
X
n

entre los pesos correspondientes designados por w
1
, w
2
, w
3
w
n.
Se calcula con la
siguiente formula:
w
x w
x
i
i i
w

=
) (

Donde:
xw
= media aritmtica ponderada
x
i
= dato i
w
i =
peso del dato i

Por ejemplo a continuacin se enlistan las materias que Juan Garca curs en el primer
semestre de Ingeniera en sistemas computacuionales, el nmero de crditos y la
calificacin obtenida;
Materia Numero Crditos Calificacin
DIBUJO 3 90
FSICA I 8 82
FUNDAMENTOS DE PROGRAMACIN 8 96
INTRODUCCIN A LA ISIC. 6 78
MATEMTICAS I 8 100
MATEMTICAS PARA COMPUTADORA 8 100
SEMINARIO DE TICA 4 75
Recuerde que los crditos de cada asignatura dependen de la importancia que tiene
cada una de ellas en la formacin profesional, en este caso en ingeniera en sistemas
computacionales.


19
Por lo tanto determinaremos la media ponderada de la calificacin que obtuvo Juan
Garca en su primer semestre.
Solucin:
45
4062
4 8 8 6 8 8 3
) 82 ( 4 ) 96 ( 8 ) 100 ( 8 ) 78 ( 6 ) 75 ( 8 ) 100 ( 8 ) 90 ( 3
=
+ + + + + +
+ + + + + +
=
xw
=90.267

S comparamos el promedio ponderado con la media aritmtica, que es un 88.7143, nos
damos cuenta de que este ltimo es ligeramente mayor, por no considerar el peso o
crdito que aporta las materias de mayor importancia.

Por ejemplo la industria Carter Co. Paga a sus empleados $65, 75 o 85 por hora segn el
grado de preparacin. Hay 14 empleados que reciben la tarifa de $65; 10 la de $75 y 2
de $85. Cul es la tarifa por hora pagada a los empleados de la industria?

Solucin:
26
1830
2 10 14
) 85 ( 2 ) 75 ( 10 ) 65 ( 14
=
+ +
+ +
=
xw
=$70.3846

De otro modo tendramos:
x =(65+65+65+65+65+65+65+65+65+65+65+65+65+65+75+75+75+75+75+75+75+75+75+75+85+85)/26
x = $70.3846

Tal como se puede observar en el ejercicio anterior la media ponderada nos facilita el
clculo del promedio cuando tenemos valores que se repiten con frecuencia.

Mediana (M). La mediana es el punto medio o valor central de un conjunto de datos
ordenados en magnitud. Se puede decir que la mediana tiene el 50% de las
observaciones por arriba de la mediana y 50% por debajo de ella.

La mediana se utiliza para minimizar el impacto de valores altos o muy bajos en un
conjunto de datos para determinar el promedio representativo.

Ejemplo los siguientes datos son las mediciones obtenidas de un circuito utilizado en un
arns de lavadora; se toman como muestra siete circuitos y sus mediciones son: 113mm,
112, 115, 112, 112, 114, 115.


20
Lo primero que realizaremos es ordenar los datos de menor a mayor tal como se muestra
a continuacin: 112, 112, 112, 113, 114, 115, 115

Posteriormente observamos el dato que se encuentra en la parte central, en este caso el
dato 113mm es el que queda en la parte central, por lo que este es el que dar valor de
la mediana, entonces: M =113mm

Algo muy sencillo, pero que sucede si nuestro conjunto de datos es par, muy bien en este caso
despus de ordenar los datos en cuanto a su magnitud, observamos los dos valores centrales y
obtenemos una media aritmtica de ambos valores y obtenemos la mediana.
Por ejemplo los siguientes datos son las mediciones obtenidas de un circuito utilizado en
un arns de lavadora: 113mm, 112, 115, 111, 112, 114, 115, 114.

Recuerda al calcular la mediana primer ordenamos nuestros datos en magnitud de menor a
mayor, tal como se muestra a continuacin: 111, 112,112, 113, 114, 114, 115, 115
Se observa que en la parte central de los datos no hay dato alguno por lo que la
mediana se determina con el promedio de los datos subrayados, entonces:
2
114 113+
= M =113.5mm
Nota: Es imprescindible para calcular el valor de la mediana el que primero se ordenen
los datos en cuanto a su magnitud, ya que de no hacerlo, se incurrira en un grave error.

La moda (m). Es otra medida de tendencia central, que se define como aquel valor o
valores que ms se repiten o que tienen mayor frecuencia en un conjunto de datos, la
muestra de una poblacin nos genera la distribucin de los datos una vez que estos se
han graficado y en esta grfica es posible observar la moda o modas de la misma, es por
esto que una distribucin de datos puede ser amodal (carece de moda), unimodal (tiene
una sola moda), bimodal (tiene dos modas) o polimodal (tiene ms de dos modas).


21
Por ejemplo a continuacin se determinar la moda de un conjunto de datos que se
refieren a la estatura de un grupo de jvenes; 159cm, 164, 169, 170, 169, 169, 169, 170,
169, 192, 185, 183.

Solucin:
Estatura cm 159 164 169 170 183 185 192
Frecuencia 1 1 5 2 1 1 1

La tabla anterior muestra la distribucin de frecuencias de los datos o el nmero de
veces que estos se repiten, la mayor frecuencia que es 5 corresponde a una estatura de
169cm, por lo que esta sera la moda, por lo tanto m =169cm

Los datos que a continuacin se presentan se refieren a la edad de alumnos de primer
semestre del Instituto Tecnolgico Superior Purhpecha: 18 aos, 17, 19, 21, 19, 18, 22,
22, 18, 18, 17, 19, 19, 19, 18, 20, 21, 20, 18, 19, 18, 19, 18,19, 22, 35
Solucin:
Edad (aos) 17 18 19 20 21 22 35
Frecuencia 2 8 8 2 2 3 1

En este caso se observa que las edades que ms frecuencia tienen son las de 18 y 19
aos con ocho repeticiones, por lo que se concluye que nuestro conjunto de datos es
bimodal. Por lo tanto m =18 y 19 aos.

La moda al igual que la mediana no es afectada por valores muy altos o muy bajos, sin
embargo tiene las desventajas, que hacen que se utilicen con menor frecuencia que la
media o la mediana, ya que en muchos conjuntos de datos no se presentan valor modal
y en algunos otros se puede presentar ms de una moda.

3.4 Medidas de dispersin

Las medidas de tendencia central como las que analizaron en la seccin anterior nos indican el
valor central de un conjunto de datos, sin embargo estos valores no nos sirven de mucho si no
conocemos se dispersin. Por ejemplo supongamos que usted no sabe nadar y se le informa

22
que tiene que cruzar un ro que tiene una profundidad promedio de 80cm y se le omite indicar
que en algunas secciones del ro se presentan profundidades de hasta 210cm, una informacin
valiosa que puede servir para tomar la decisin de cruzar o no cruzar el ro. Obviamente de
contar con dicha informacin le evitara problemas o la misma muerte.

La analoga anterior se hizo con el objeto de que el alumno comprenda la importancia
que tiene las medidas de dispersin, ya que una excesiva variabilidad o dispersin en un
conjunto de datos indica la inestabilidad del proceso en la mayora de los casos.

Las medidas de dispersin ms comunes son: el rango, la desviacin estndar, la
varianza, el coeficiente de variacin, entre otras, y que se describen a continuacin:

Nota: Una medida de dispersin puede utilizarse para evaluar la confiabilidad de dos o ms promedios

Rango o recorrido (R). Tambin se le conoce como amplitud de la variacin y se define
como la diferencia entre el dato mayor y el dato menor localizado en un conjunto de
datos y se determina con la siguiente formula:
R =Dato mayor Dato menor
Por ejemplo se han tomado como muestras la produccin diaria en dos lneas de
ensamble para computadoras JSJ-2, los datos se presentan a continuacin:

Lnea Produccin diaria en unidades Media aritmtica Rango
1 48, 49,49, 50,50,50,51,51,52 x = 50 52-48= 4
2 40,47,47,50,50,50,53,53,60 x = 50 60-40=20

Con base a la media aritmtica (promedio), se podra concluir que las dos lneas de
ensamble, presentan la misma distribucin de produccin diaria, sin embargo al analizar
el rango de produccin podemos concluir que no presentan la misma distribucin de
produccin diaria, ya que en la lnea uno la produccin vara de 48 a 52 ensambles por
da. La produccin en la lnea dos es ms errtica, variando de 40 a 60 ensambles por
da, por lo tanto sera un tanto difcil de predecir la produccin en la lnea dos, adems se

23
tendra que realizar una investigacin exhaustiva para comprender su variabilidad, ya
que es una distribucin atpica y existen factores atribuibles a la distribucin.
A continuacin se presentan mediciones de la resistencia a la tensin de la soldadura
usada para unir dos cables, estas son: 88.5kg, 92.4, 97.3, 88.0, 100.0, 96.5, 87.9, 102.4,
85.9, determine su rango o recorrido.

Solucin: R =102.4- 85.9= 16.5kg

Se toman las mediciones de la cantidad de grasa de la leche en gramos por cada 100ml
de leche que entra a un proceso de pasteurizacin, los valores se muestran a
continuacin: 14.85, 15.32, 12.76, 16.29, 15.84, 17.3, 17.61, 16.33, determine el rango o
recorrido de la cantidad de grasa por cada 100ml de leche.

Solucin: R = 17.61 12.76 = 4.85gramos

Una de las desventajas del rango es que nicamente se basa en dos valores el mximo y
mnimo no considera todos los datos, por lo tanto es una medida de dispersin no muy
confiable y poco representativa, sin embargo existen otras medidas ms confiables como
las que se describen a continuacin.
Desviacin media ( ). Esta medida de dispersin nos representa la diferencia absoluta
promedio que existe entre cada dato que se encuentra en la muestra y la media de los
datos y se puede determinar con la siguiente formula:

n
x
d
xi


=
Donde:
x
i
= dato i o valor de cada observacin
= media aritmtica de la muestra
|| = Indican el valor absoluto. En otras palabras no se considera el signo de las desviaciones
n = nmero de datos en la muestra

_
d
_
x

24
A continuacin se determinar la desviacin absoluta media de los siguientes datos que
son las concentraciones de cobre (Cu) de algunas muestras, las que a continuacin se
presentan: 19gr, 13, 22, 20, 17, 21, 23

El primer paso para calcular la desviacin media es obtener la media aritmtica:
= =
+ + + + + +
=
7
135
7
23 21 17 20 22 13 19
x 19.286
Posteriormente se procede a calcular el promedio de las diferencias absolutas entre cada
dato y la media calculada.
7
286 . 19 23 . 286 . 19 21 286 . 19 17 286 . 19 20 286 . 19 22 286 . 19 13 286 . 19 19 + + + + + +
= d
gr d 531 . 2
7
714 . 17
7
714 . 3 714 . 1 286 . 2 714 . 0 714 . 2 286 . 6 286 . 0
= =
+ + + + + +
=
La interpretacin de este resultado sera que el grado de alejamiento absoluto promedio
de los datos con respecto a su media es de 2.531 gramos.

Por qu sacar el valor absoluto de las diferencias entre cada dato y la media aritmtica?
Si solo se hicieran diferencias entre cada dato y la media aritmtica, estas tendran
signos positivos y negativos ya que algunos datos son menores que la media y otros son
mayores que la media, luego al sumar las diferencias, con sus signos correspondientes,
stas se iran anulando unas con otras y no sera posible medir leal grado de
alejamiento promedio de los datos en la muestra, es decir la suma aritmtica, dar como
resultado igual a cero.

La desviacin media tiene dos ventajas. Primero utiliza en su clculo todos los valores de
la muestra. Recuerda que el rango nicamente utiliza los valores extremos. Segundo la
desviacin media es fcil de comprender, ya que cuantifica el promedio en que los
valores se desvan con respecto a la media. Sin embargo su principal desventaja es el
uso de valores absolutos, ya que generalmente es difcil de trabajar con estos. Por lo
tanto la desviacin media no se usa frecuentemente como las otras medidas de
dispersin, como la desviacin estndar.

25


Varianza muestral (s
2
). Se define como las desviaciones cuadrticas con respecto a la
media, es decir, es el promedio de las diferencias elevadas al cuadrado entre cada valor
que se tiene en la muestra y se obtiene con la siguiente formula:

1
) (
2
2

=

n
i
x
x
s

Donde:
s
2
: Varianza muestral
: Suma
x
i
: Valor i
x : Media aritmtica
n: Nmero de observaciones

Observe que en la definicin de la varianza que las desviaciones con respecto a la media
se elevan al cuadrado. Los signos de las desviaciones (+ -) no se omiten como se hizo
en la desviacin media. Elevar las diferencias al cuadrado elimina los signos negativos,
ya que al multiplicar dos valores negativos se obtiene resultados positivos.

Por ejemplo se tiene la cantidad de glucosa en miligramos (mg) encontrada en muestras
de sangre de algunos pacientes, 14.2, 12.1, 15.6, 18.1, 14.3, determine su varianza.

Lo primero que hay que calcular es la media aritmtica de la muestra como ya se ha
hecho anteriormente, para este caso tenemos una media aritmtica de 14.86mg
mg
s
2
2 2 2 2
2
853 . 4
4
412 . 19
1 5
) 86 . 14 3 . 14 ( ) 86 . 14 1 . 18 ( ) 86 . 14 6 . 15 ( ) 86 . 14 1 . 12 (
2
) 86 . 14 2 . 14 (
= =
+ + +
=



Al igual que el rango y la desviacin media la varianza se utiliza para comparar la dispersin
en dos o ms conjuntos de observaciones. Por ejemplo si en un grupo de pacientes
diabticos presentar una varianza de 7.365mg
2
, diramos que este grupo de personas
presentan mayor variacin de contenido de glucosa en la sangre que el grupo anterior
analizado, la varianza se recomienda utilizar cuando los valores a analizar son pequeos.


26
Nota: Dentro de la inferencia estadstica se plantea la diferencia entre una variancia
muestral s
2
y la varianza poblacional, que se representa por o
2
, y su formula difiere con
respecto a la varianza muestra, tal como se muestra a continuacin
1
) (
2
2

=

N
i
x

o

Donde:
o
2
: Varianza poblacional
: Suma
x
i
: Valor i
: Media aritmtica poblacional
N: Tamao de la poblacin

Desviacin estndar muestral (s). Es la desviacin o diferencia promedio que existe
entre cada dato de la muestra y la media aritmtica de la muestra, su clculo es posible
con la siguiente formula:
1
) (
2

=

n
i
x
x
s

Donde:
s: Desviacin estndar muestral
: Suma
x
i
: Valor i
x : Media aritmtica
n: Nmero de observaciones
Tambin la desviacin estndar muestral se puede obtener a partir de la varianza,
sacndole raz cuadrada, tal como se muestra a continuacin:
s =
s
2

Donde:
s
2
= varianza o variancia
s = Desviacin estndar muestral

Por tanto la desviacin estndar de la muestra anterior sera;
s =
mg mg 2029 . 2 853 . 4
2
=


27
La interpretacin de este resultado sera, que la cantidad de glucosa encontrada en la
muestra es en promedio de 14.86 miligramos y que la cantidad de glucosa en la muestra
se aleja o dispersa en promedio 2.2029mg alrededor de la media.

En este caso solo nos interesa conocer el significado de la desviacin estndar, aunque
es necesario decir que s es la desviacin de la muestra y que o es la desviacin de la
poblacin, as como s
2
es la varianza de la muestra y o
2
es la varianza de la poblacin.
1
) (
2

=

N
i
x

o

Donde:o =Desviacin estndar poblacional, =Suma, x
i
=Valor i, =Media aritmtica
poblacional, N =Tamao de la poblacin.

Coeficiente de variacin (C.V). Se define como la razn de la desviacin estndar con
respecto a la media expresa sta como un porcentaje, y se puede determinar con la
siguiente formula:
C.V = ) 100 (
x
s

Donde:
s: Desviacin estndar muestral
x : Media aritmtica

Por ejemplo en el caso del contenido de glucosa se tiene una media de 14.86mg y una
desviacin estndar de 2.2029mg, con estos datos podemos determinar la variabilidad
en porcentaje, tal como se muestra a continuacin:
C.V = ) 100 (
86 . 14
2029 . 2
=14.825%
Podemos concluir que en el contenido de glucosa en la sangre de 5 personas analizadas
presentan una variabilidad de 14.825%.

El coeficiente de variacin frecuentemente se utiliza para comparar la variabilidad relativa
entre dos muestras o poblaciones que no estn expresadas en las mismas unidades.


28
Sin duda las medidas de tendencia central y de dispersin son mtodos que nos
permiten describir un conjunto de datos, posibilitando as la interpretacin.

3.5 Parmetros para datos agrupados

Cuando una muestra consta de 30 datos o ms, lo recomendable es agrupar los datos en
clases o categoras y a partir de estas determinar las caractersticas de la muestra y por
consiguiente las de la poblacin de donde fue tomada. Los datos se agrupan en
categoras para tener control y nocin en la descripcin de los mismos, ya que cuando se
tienen muchos datos es difcil determinar su valor tpico y difcil la concentracin para el
anlisis e interpretacin.
Los siguientes datos se refieren al dimetro en centmetros de un engrane.
6.75 7.00 7.00 6.75 6.50 6.50 7.15 7.00 7.25 6.75
6.50 6.50 6.50 6.25 6.25 6.50 6.65 7.00 6.25 6.25
7.25 6.70 6.00 6.75 6.00 6.75 6.75 7.10 7.00 6.75
7.00 6.70 6.50 6.75 6.25 6.65 6.75 7.10 7.00 7.15

Paso uno: determinar el rango (R) = DM - Dm = 7.25 6.00 = 1.25
Paso dos: determinar el nmero de clases (k)
k = 1+ [ (3.322)logaritmo de total de datos] = 1+ [ (3.322)1.602] = 1+5.32 ~ 6
Paso tres: Calcular el intervalo de clase (IC) = 1.25 / 6 = 0.2083 ~ 0.21
Pas cuatro: Calcular los intervalos de clase para cada grupo recuerda que para formar
la primera clase se toma un valor un poco menor que el valor menor encontrado en la
muestra, tal como se muestra a continuacin:
5.97+0.21 = 6.18
Paso cinco: Construir la tabla de distribucin de frecuencias:

IC Frecuencia
absoluta (fa)
fa acumulada
(faa)
Frecuencia
relativa (fr)
(fr)
acumulada
Punto medio
(pm) Li Ls
5.97 6.18 2 2 2/40 = 0.05 0.05 6.075
6.19 6.40 5 7 5/40=0.125 0.175 6.295
6.41 6.62 7 14 0.175 0.350 6.515
6.63 6.84 13 27 0.325 0.675 6.735
6.85 7.06 7 34 0.175 0.850 6.955
7.07 7.28 6 40 0.15 1.000 7.175
Total 40 1.000

29
1.3.2 Medidas de tendencia central para datos agrupados
La media aritmtica ( ), para datos agrupados se calcula con la siguiente formula:
n
x
k
i
i i
fa pm
=
=
1
*

Donde:
k = nmero de clases
pm
i
= punto medio de la clase i
fa
i
= frecuencia absoluta de la clase i
n = Nmero de datos

Por lo que se recomienda agregar una columna ms a la tabla de frecuencias para
calcularla. Por ejemplo en el caso del ejemplo en los datos se refieren al dimetro en
centmetros del engrane, se tendra la siguiente tabla:
IC Frecuencia
absoluta (fa)
fa
acumulada
Frecuencia
relativa (fr)
(fr)
acumulada
Punto
medio(pm)
pm*fa
k Li Ls
1 5.97 6.18 2 2 2/40 = 0.05 0.05 6.075 12.15
2 6.19 6.40 5 7 5/40=0.125 0.175 6.295 31.475
3 6.41 6.62 7 14 0.175 0.350 6.515 45.605
4 6.63 6.84 13 27 0.325 0.675 6.735 87.555
5 6.85 7.06 7 34 0.175 0.850 6.955 48.685
6 7.07 7.28 6 40 0.15 1.000 7.175 43.05
Total 40 1.000 268.52
n
x
k
i
i i
fa pm
=
=
1
*
=
40
52 . 268
= x =6.713cm
La Mediana (M), se determina con la siguiente formula:
a
fa
faa n
Li M *
2 /
(


+ =
Li = Promedio entre el limite inferior que contiene la mediana y el limite superior de la
clase anterior a la mediana
n = Nmero de datos
faa = Frecuencia absoluta acumulada de la clase anterior a la mediana
fa = Frecuencia absoluta de la clase de la mediana
a = Ancho de clase

Lo primero que hay que realizar es localizar la clase de la mediana, esto se logra al
dividir el nmero de datos entre dos y el resultado se localiza en la frecuencia absoluta
acumulada. Por ejemplo en nuestro caso al dividir 40/2=20, entonces localizamos en la
columna fa, en que clase se encuentra el elemento 20, al analizar concluimos que la
clase de la mediana se localiza en la clase cuatro y es con la clase que se trabajara.
_
x

30
Al sustituir los datos tendramos que:
22 . 0 *
13
14 2 / 40
625 . 6
(


+ = M =6.7265cm
La Moda (m), se calcula con la siguiente formula:
a Li m
d d
d
*
2 1
1
(
(

+
+ =
Donde:
Li = Promedio entre el limite inferior que contiene la mediana y el limite superior de la
clase anterior a la mediana
d
1
= Diferencia de la fa entre la clase modal y la clase anterior a la moda
d
2
= Diferencia de la fa entre la clase modal y la clase posterior a la moda
a = Ancho de la clase

Continuando con el ejemplo se tendra que la clase de la moda es la clase 4, ya que
contiene la mayor frecuencia absoluta de las clases, al sustituir los valores se podr
calcular la moda, tal como se muestra a continuacin:

22 . 0 *
6 6
6
635 . 6
(

+
+ = m =6.745cm
Medidas de dispersin para datos agrupados

Rango para datos agrupados (R); recuerda que el rango se define como la diferencia
entre el dato mayor y el dato menor. Para calcular el rango en un conjunto de datos
agrupados se resta el lmite superior de la clase mayor y el lmite inferior de la clase
menor. Por ejemplo en nuestro ejemplo se tendra el siguiente rango:

R = 7.28 - 5.97 = 1.31cm

Entonces nuestra conclusin sera que se tiene una amplia variacin de los dimetros de
engrana ya que es de 1.31cm, un valor considerable por tratarse de un mismo modelo
de engrane, por lo tanto es necesario revisar nuestro proceso de produccin.


31
Desviacin estndar para datos agrupados (S), su clculo se determina con la siguiente
frmula:
S =
1
*
*
2
1
1
2

(
(
(
(
(

|
.
|

\
|

=
=
n
n
fa pm
k
i
k
i
fa pm

Para su clculo se recomienda agregar dos columnas ms en nuestra tabla de
frecuencias tal como se muestra a continuacin:
IC
(fa) (faa) (fr) (fra) (pm) pm*fa (pm
2
) (pm
2
*fa)
k Li Ls
1 5.97 6.18 2 2 2/40 = 0.05 0.05 6.075 12.15 36.9056 73.8113
2 6.19 6.40 5 7 5/40=0.125 0.175 6.295 31.475 39.6270 198.1351
3 6.41 6.62 7 14 0.175 0.350 6.515 45.605 42.4452 297.1166
4 6.63 6.84 13 27 0.325 0.675 6.735 87.555 45.3602 589.6829
5 6.85 7.06 7 34 0.175 0.850 6.955 48.685 48.3720 338.6042
6 7.07 7.28 6 40 0.15 1.000 7.175 43.05 51.4806 308.8838
Total 40 1.000 268.52 1806.2338

S =
1 40
40
2338 . 1806
52 . 268
2

(
(

=
1 40
40
9904 . 72102
2338 . 1806

=
39
5748 . 802 2338 . 1806
=
S =
39
5748 . 802 2338 . 1806
=
39
659 . 3
= 0938 . 0 = 0.3063cm

Por lo comn la desviacin estndar se emplea por lo comn como una medida para
comparar la dispersin en dos o ms conjuntos de observacin. Por ejemplo si en otra
lnea de produccin denomina b obtuvisemos una desviacin estndar de 0.1235,
nuestra conclusin sera que en la lnea de nuestro estudio presenta mayor variacin que
la lnea b.

Varianza (s
2
), para determinar la varianza en un conjunto de datos agrupados,
nicamente se eleva al cuadrado la desviacin estndar, tal como se muestra a
continuacin:


32
s
2
= 0.3063
2
= 0.0938cm
2


El coeficiente de variacin (C.V), se calcula de igual forma que para datos no agrupados,
por lo tanto se tendra:
C.V = ) 100 (
x
s
= ) 100 (
713 . 6
3063 . 0
=4.56%

El coeficiente de variacin nos permite entender con mayor claridad la variacin que
existe en un conjunto de datos con respecto a la media, en nuestro caso tenemos una
variacin de 4.56%, un valor aparentemente bajo, sin embargo en la calidad y precisin
que se manejan los engranes es un valor significativo, capaz de hacer reflexionar el
proceso productivo.

Representacin de los datos
A continuacin se presenta la grafica de la tabla de frecuencias del ejercicio anterior:

Titulo general: Grafica No. 1. Que representa el dimetro en centmetros de un engrane
de la empresa XGRAN, segn se tamao.




Polgono de frecuencia
0
2
4
6
8
10
0
12
2
14
4
5.97 - 6.18
6.18
6.19 - 6.40
6.40
6.41 - 6.62
6.62
6.63 - 6.84
6.84
6.85 - 7.06
7.06
7.07 - 7.28
7.28
F
r
e
c
u
e
n
c
i
a

a
b
s
o
l
u
t
a

Dimetro en centmetros

33
Explicacin: En la grafica se puede observar que la mayor frecuencia absoluta se
encuentra en los engranes de 6.63 a 6.84cm con trece observaciones.

Fuente: Datos que se obtuvieron de la lnea de produccin dos, de la empresa XGRAN

Nota: Tambin se puede utilizar el punto medio en cada una de las barras para identificar
el valor del eje horizontal (eje x).