Vous êtes sur la page 1sur 54

1

MATERI AL DI DCTI CO

AD 503
ANLI SI S ESTAD STI CO DE LOS NEGOCI OS


1 PARTE
I NTRODUCCI N A LA ESTAD STI CA
Y ESTAD STI CA DESCRI PTI VA






Dr . Ant oni o Gonzl ez Fr agoso






2
1. I NTRODUCCI N A LA ESTAD STI CA

En esta parte, se ver una breve introduccin de lo
que es la estadstica, se tratarn con los conceptos de
ms importancia, se explicar lo importante que es la
estadstica en la solucin de problemas reales, en
particular en problemas que tengan que ver en el
rea de los negocios.

1.1. Concept os

Est adst i ca

Ciencia relacionada con la coleccin, resumen,
descripcin y el anlisis de datos, con la finalidad de
obtener conclusiones objetivas y confiables.

Pobl aci n

Conjunto de individuos u objetos, del cual existe
inters de conocer una o varias caractersticas.

Muest r a

Subconjunto de una poblacin. Se obtiene con la
intencin de hacer alguna inferencia sobre alguna
caracterstica de inters de la poblacin.

3
Par met r o

Es una constante que caracteriza a una poblacin.

Por ejemplo, la dureza promedio de un material, la
variacin en un proceso, el porcentaje de ciudadanos
que apoyan a cierto candidato.

Es comn que los parmetros no se conozcan. Para
conocerlos necesitamos, la informacin de toda la
poblacin (censo). En problemas reales, en la mayora
de las veces, es difcil contar con la informacin
completa de una poblacin.

Est adst i ca

Nmero calculado con los valores observados de una
muestra.

Por ejemplo, la dureza promedio muestral de un
material, la varianza muestral de un proceso, el
porcentaje muestral de ciudadanos que apoyan a
cierto candidato.

Se conoce, cuando es obtenida una muestra de la
poblacin, y son usados para estimar o hacer alguna
inferencia sobre algn parmetro.

4
Acl ar aci n: La palabra estadstica es usada para
conceptos diferentes, la estadstica como ciencia y
ltimamente estadstica como nmero que depende
de datos de una muestra.

Obser vaci n: En la prctica, difcilmente se
podr contar con toda la informacin de una
poblacin, por lo mismo, difcilmente se podrn
conocer los valores del parmetro de inters. Un
camino prctico que ofrece la Estadstica (como
ciencia) es, la de usar la informacin de una muestra
(representativa), para r eal i zar est i maci ones de
par met r os por medi o de est adst i cas (como
nmero).

Por qu en l a vi da pr ct i ca se pr ef i er e una
Muest r a?

Consume menos tiempo.
Cuesta menos.
Es menos difcil de analizar.
Se tiene ms control para obtener datos de
buena calidad.
Puede dar mayor informacin.
En ocasiones, el lograr un dato, significa destruir
una pieza.
En ocasiones es imposible obtener la informacin
de toda una poblacin o todo un proceso.

5
Obser vaci n: Lo importante del ejercicio
estadstico es, lograr que la informacin obtenida en
la muestra, sea representativa de la poblacin, para
lograr estimaciones confiables.



Er r or es:

De este ejercicio estadstico, siempre se tendr la
posibilidad de cometer errores, entendiendo como un
error, l a di f er enci a absol ut a ent r e el ver dader o
val or del par met r o y l a est i maci n lograda para
ese parmetro.

Los errores se dividen en:

Er r or es muest r al es.
Er r r or es no muest r al es.
POBLACIN

- MEDIA
- VARIANZA
MUESTRA

- MEDIA MUESTRAL
- VARIANZA MUESTRAL
6
Los er r or es muest r al es se manifiestan de manera
natural, no se pueden evitar. Aunque la informacin
de la muestra sea obtenida en forma
representativa, este tipo de error es muy probable
que siempre est presente.

Los er r or es no muest r al es, se manifiestan por
errores humanos, si se pueden y se deben de evitar.
Por ejemplo, la captura errnea de un dato, la
omisin de un elemento que result en la muestra, la
medicin equivocada de un dato.


1.2 Cl asi f i caci n de l a Est adst i ca

La estadstica se clasifica en:

Estadstica Descriptiva
Inferencia Estadstica

Est adst i ca Descr i pt i va

Es la parte de la Estadstica que se encarga de
or denar , pr esent ar y r esumi r l a i nf or maci n
obtenida de una poblacin y de esta manera tener
una primera interpretacin de lo que pasa en la
poblacin. No sirve para inferir, para concluir, a
menos que la informacin obtenida sea la de toda la
poblacin (censo).
7
I nf er enci a Est adst i ca

Da procedimientos adecuados (matemticamente
bien fundamentados) para poder inferir sobre alguna
caracterstica o caractersticas desconocidas de una
poblacin a partir de una muestra representativa
obtenida de sta. De esta manera se podrn dar
conclusiones y posiblemente hasta tomar decisiones.
En pocas palabras, poder decir algo de la poblacin
usando solo informacin de la muestra.

Observacin: El muestreo est ligado con ests dos
partes de la estadstica

Muest r eo

Se proponen procedimientos ptimos, metodologa
bien fundamentada, para obtener (recolectar)
informacin parcial, pero r epr esent at i va de una
poblacin.

Ti pos de Muest r eo

Muest r eo Pr obabi l st i co. Se usa cuando se
tiene un marco de muestreo y por ende puede
conocerse la probabilidad de observar una unidad
de la poblacin.

8
Muest r eo no Pr obabi l st i co. Cuando no se
tiene un marco de muestreo. Por ejemplo, el
muestreo voluntario. No se puede conocer la
probabilidad de observar una unidad de la
poblacin.

Ti pos de Muest r eo Pr obabi l st i co

Entre los principales mtodos de muestreo
probabilstico que son usados en la realidad, se
encuentran:
Muestreo simple aleatorio o aleatorio.

Muestreo estratificado.

Muestreo sistemtico.

A continuacin se presentan los esquemas de
muestreo aleatorio y muestreo estratificado
PROCESO
71
16
22
37
3
62
Lista de Nmeros al Azar
Muestreo Aleatorio


9
3
16
37
22
71
62
70
66
8
2
55
24
74
56
32
23
10
33
M I M II M III
Nmeros
al Azar
Muestreo Estratificado


El muestreo ms utilizado en estadstica es el
muest r o al eat or i o. Adems otros esquemas de
muestreo estn fundamentados en el muestreo
aleatorio.

Muest r a Al eat or i a

Muestra obtenida de tal manera que cada
muestra posible de tamao fijo (n elementos) tiene la
misma oportunidad de ser seleccionada. Dicho de otra
manera todos los elementos de la poblacin tienen la
misma posibilidad de ser seleccionados.



10
1.3 Apl i acci ones a l os Negoci os

Es muy importante en la gestin de cualquier negocio
o empresa, respaldar las decisiones con informacin
vers y precisa, saber utilizar los datos en el
momento oportuno. La estadstica es una herramienta
potencial para lograr interpretaciones adecuadas y de
esta manera no tomar acciones equivocadas.

Apl i caci ones:

Para saber el nivel de satisfaccin de mis
clientes.

Saber cuales son las regiones potenciales para la
venta de mi producto.

En qu das del mes se generan ms ventas?

Para pronosticar el precio de la materia prima.

Para saber el clima laboral de mi empresa.

Para saber cuales son los productos o los
servicios con ms demanda.

Para pronosticar las ventas en los prximos
meses.

11
Para estimar el tiempo promedio de espera en el
servicio que ofrezco.

Para mejorar los procesos de mi empresa.

Para controlar el nivel de calidad de mi producto
o de mi servicio

Para estimar el tiempo que dura mi servicio que
ofrezco.

Para estimar la capacidad de atencin a mis
clientes.

Para pronosticar la inflacin del siguiente mes.

Para saber si mi nuevo producto o servicio ser
aceptado en un nueva poblacin
Para comparar mi producto o servicio con la
competencia.

Para comparar la calidad entre diferentes
sucursales de la empresa.

Para estimar la tasas mensuales de desempleo.

Para comparar los salarios promedio en
diferentes regiones.

12
Para mostrar evidencia que mi empresa ha
mejorado y mantener este logro.

Para relacionar dos variables de importancia, por
ejmeplo, las utilidades con la cantidad invertida.

Para estimar el tiempo promedio de facturacin.

Para estimar el nmero promedio de clientes que
llegan al da.



1.4 Ni vel es de Medi ci n

Var i abl e

Una variable es la caracterstica de inters de una
poblacin o proceso.

Var i abl e de cal i dad

Se conoce como variable de calidad a la
caracterstica crtica para la calidad de un producto,
servicio o proceso. Comnmente llamadas: CTQ
(Critical-to-Quality), o VCC (caracterstica crtica de la
calidad, o variable crtica de la calidad).


13
Ejemplos:
El tiempo que tarda un servicio.
La opinin de un cliente, sobre un
servicio.
La satisfaccin de un cliente sobre su
equipo de cmputo.
Motivacin de un empleado en su
trabajo.
El tipo de problema que tiene un
equipo.
Ventas de equipo de cmputo en un
mes.
Evaluacin de un operador.

Dat o

Un dato es un valor o categora especfica de la
variable.

Ejemplos:
El servici dur 12 minutos y 32
segundos.
A un cliente, el servicio le pareci
regular.
A un cliente su nuevo equipo le pareci
excelente.
A un empleado, su motivacin en el
trabajo es baja.
14
Un equipo especfico tuvo el problema
de no encender.
Las ventas del equipo de cmputo en un
mes fueron de $5,345,123.67
La evaluacin de un operador fue
satisfecho.

Exper i ment o

Un experimento es la actividad planeada para obtener
un conjunto de datos (muestra).

Para algunos de los ejemplos tratados anteriormente:

Cada 20 servicios realizados en la
semana se les toma el tiempo de este.
Se seleccionan al azar a 50 personas
que recibieron el servicio en el ltimo
mes y se les pregunta que les pareci
este.
Se seleccionan al azar a 50 servicios que
se realizaron en el ltimo mes y anota el
tipo de problema.

Medi da:

Una medida es una asignacin numrica a un
elemento, usualmente un elemento no numrico.

15
Obser vaci n: No en todos los ejemplos
anteriores, se pueden obtener medidas de las
variables. No todo en esta vida es medible.

Ti po de var i abl es:

Nominal.
Ordinal.
Intervalo.
Cociente (Ratio).

Var i abl e Nomi nal :

Indica la presencia o ausencia de algn atributo. Ellas
son meramente categricas. En caso de que se le
asigne nmeros a las diferentes categoras, estos
carecen de valor aritmtico (No medibles). Es un error
darles tratamiento de nmeros. Las nicas
operaciones permitidas son:

= (igual)
(diferente).

Ejemplo:

Variable: Opinin sobre el servicio.
Categoras: completamente satisfecho, muy
satisfecho, satisfecho, algo insatisfecho, insatisfecho.

16
Variable: Tipo de problema en el equipo.
Categoras: no enciende, no imprime, imprime con
manchas, se atora el papel, etc.

Variable: Solucin del problema
Categoras: si, no.

Las tcnicas estadsticas para estas variables son
anlisis estadsticos para proporciones (intervalos de
confianza y pruebas de hiptesis para proporciones).
Tablas de contingencia o anlisis de informacin
cruzada y anlisis de regresin logstica, para
comprobar estadsticamente la dependencia entre dos
o ms variables nominales.

Var i abl e Or di nal :

Es aquella variable que tiene un orden natural de sus
posibles valores, pero las distancias entre los valores
no tienen algn significado. Son variables nominales
pero con un orden natural, en ocasiones con un
nmero asignado.

A pesar de poder asignar un nmero en forma
natural, de acuerdo a su orden, es un error darle un
tratamiento aritmtico. Se pueden analizar con los
operadores:

= (igual),
17
(diferente),
(mayor que),
< (menor que).

Ejemplo: Opinin sobre el servicio.

Categoras: completamente satisfecho (5), muy
satisfecho (4), satisfecho (3), algo insatisfecho (2),
insatisfecho (1).

Ejemplo: Tipo de error.

Categoras: fatal (5), grave (4), regular (3), menor
(2), insignificante (1).

Para el ejemplo de la opinin del servicio, obsrvese
que la distancia 5 4 = 1, no tiene el mismo
significado que 4 -3 = 1. Tampoco tiene sentido
realizar otros clculos aritmticos.

El tratamiento estadstico para estas variables es muy
similar al de las variables nominales.


Var i abl e por I nt er val o:

La diferencia entre cualquier dos puntos sucesivos es
siempre igual. El cero no indica ausencia de la
caracterstica. Es posible tomar mediciones. Se puede
18
sumar, restar, ordenar elementos. No tiene sentido
multiplicar o dividir elementos.

Ej empl o: Tiempo calendario.

Valores: cualquier nmero.

Temperatura en grados centgrados del medio
ambiente

Valores: cualquier nmero mayor o igual a -273.

En ambos ejemplos, el cero no indica ausencia de
tiempo o de temperatura.

Var i abl e por r azn:

El cero indica ausencia de un atributo. Se pueden
realizar todas las operaciones aritmticas: sumar,
restar, multiplicar y dividir. Es posible tomar
mediciones.

Ej empl o: El peso en gramos de un artculo.

Valores: entre 0 y un valor mximo.

Ej empl o: El dimetro de una pieza.

Valores: entre 0 y un valor mximo.
19
Ej empl o: Tiempo de servicio.

Valores: cualquier nmero no negativo.

En estudios de calidad las variables tienen la siguiente
clasificacin:


Nominales
At r i but os
Ordinales

Var i abl es
Intervalo
Cont i nuas
Razn


Acl ar aci n: Existen tambin las variables
discretas. Estas son variables que estn directamente
relacionadas con las variables por atributos, siendo el
objetivo de estas variables, las de contar nmero de
sucesos.

Ej empl o: Si la variable es, el cliente estuvo
conforme o no. Una variable discreta relacionada con
esta variable nominal es, el nmero de
inconformidades en un da (valores enteros no
negativos).
20

Los datos relacionados con variables continuas o
discretas, son llamados datos cuantitativos, los datos
que provienen de variables nominales u ordinales, son
conocidos como datos cualitattivos.

Por esta razn, los instrumentos de medicin y las
metodologas para analizar los datos son diferentes.
Para evaluar los procesos de servicio, son muy usadas
las encuestas, como instrumentos de medicin. En los
cuestionarios se busca mucho la opinin del cliente.
Por lo que surgen muchas variables por atributos,
pero adems muchas respuestas son subjetivas.


1.5 I nt r oducci n al ambi ent e Mi ni t ab

Es un paquete estadstico, con muchas herramientas
y muy amigable. A continuacin se presenta el
ambiente de Minitab. Este ambiente est compuesto
de una ventana de Sessi on, lugar donde aparecen
los resultados de la realizacin de una tarea; la
ventana wor ksheet (hoja de trabajo), espacio donde
se ingresan los datos de un problema; los diferentes
conos de mens para realizar tareas especficas y
los diferentes conos par a navegar. Vese siguiente
figura
21
Barras Men
Vent ana Dat a
(Similar a una hoja
Excel, pero no es una
hoja de clculo)
Vent ana Sessi on
(Lleva un
histrico de
rdenes y
resultados)
Ttulo de la
columna
Mens de
Probabilidad,
Estadstica
y Grficas
Nmero
de rengln
Celdas
conos
(Para
Navegar)



Es importante indicar que un archivo minitab, se
puede salvar de dos maneras como ar chi vo de
dat os (worksheet) y como pr oyect o de t r abaj o.
Como archivo de datos, solo se guardan los datos que
fueron utilizados y como proyecto, se guarda todo,
archivo de datos, grficas y tareas ejecutadas. Los
22
archivos de Minitab que usaremos, estn salvados
como archivo de datos.

Acl ar aci n: La mayora de los ejemplos realizados
en este curso, son apoyados con el paquete Minitab
15. Cada vez que se utilice este paquete sern dadas
las instrucciones. Es importante aclarar que el
propsito de este curso, no es el de capacitar al
estudiante en Minitab, sino aplicar la estadstica en
diversos ejemplos, con apoyo de Minitab.

Tambin muchos clculos sern realizados por medio
de Excel. Es importante que el estudiante, tenga
nocin del manejo de Excel, principalmente para la
realizacin de clculos bsicos.

2. DESCRI PCI N NUMRI CA DE LOS DATOS

Una vez, obtenida la muestra de una poblacin, es
importante, empezar a entender algunas caractersti-
cas de la poblacin, por lo que se sugiere realizar
descripciones numricas y grficas de los datos
recolectados.

Esta parte de la estadstica, se le conoce como
estadstica descriptiva y se divide en numr i ca y
gr f i ca. Empezaremos a tratar la parte numrica.

23
Existen varias medidas clsicas (resmenes numri-
cos) de los datos, las cuales de alguna manera nos
indican alguna caracterstica del grupo de los datos
(de la muestra) y por lo tanto nos pueden dar una
idea de cmo es, est caracterstica en toda la
poblacin.

Estas medidas se clasifican en:

Medi das de Tendenci a Cent r al .
Medi das de Di sper si n.
Ot r as Medi das ( Sesgo y Kur t si s) .

Trataremos con los dos primeros tipos de medidas, de
tendencia central y de dispersin.

2.1 Medi das de Tendenci a Cent r al

El objetivo de estas medidas, es medir la mitad o el
centro de los datos. Las tres medidas de tendencia
central que se tratarn son: media, mediana y moda.

La Medi a Muest r al

Se calcula como




n
X X X
n
X
X
n
n
i
i
+ + +
= =

=

2 1 1
24
Donde,
n
X X X , , ,
2 1

son los datos de la muestra y n
es el nmero de datos en la muestra.

La media de la poblacin est representada por , y
se calcula de la misma manera, pero usando todos los
datos la poblacin.

La medi ana muest r al
Medi ana
(n
X
1)/2 + =
Nmero impar de observaciones
7 6 5 3 2 1
X X X X X X + + + + + +
4
X
Valor mediano
+
Nmero par de observaciones
2
X X
Mediana
1 (n/2)+ n/2
+
=
8 7 6 3 2 1
X X X X X X + + + + + + +
5 4
X X
Promedio de loa dos datos que se encuentran
a la mitad
El nmero que se encuentra a la
mitad de una muestra ordenada.


La Moda Muest r al

La moda es el dato de la muestra que ms se repite
(el dato con ms frecuencia). Puede haber ms de
una moda.


25
2.2 Medi das de Di sper si n

El objetivo de una medida de dispersin es, el de
medir el grado de variabilidad entre los datos. Las
medidas de dispersin que se tratarn son: Rango,
Varianza muestral y desviacin estndar muestral.

En general, si los datos se parecen mucho entre si, se
observar una medida de dispersin pequea. Si
entre los datos, existen diferencias grandes entre si,
la medida de dispersin resultar grande.

Para propsitos de inferencia estadstica, es
sumamente importante siempre tener presente la
variabilidad de los datos. No es suficente, solo
considerar alguna medida de tendencia central.

Rango

Es la diferencia entre la dato mayor y el menor
mnima mxima
X X = Rango


Esta medida da una idea de cmo es la dispersin,
ms no es una medida exacta. Podemos tener el caso
de tener muchas observaciones muy parecidas,
excepto una o dos de ellas. Con estas observaciones
diferentes, nos puede resultar un rango grande, sin
tener necesariamente una dispersin grande entre
todos los datos.
26
Var i anza Muest r al

Es el promedio (casi promedio) del cuadrado de las
desviaciones de cada observacin a su media.

1
) (
1
) (
1
2 2
1
2
2

=

= =
n
x n x
n
x x
S
n
i
i
n
i
i


Es una buena medida de dispersin, cuando hay
mucha variabilidad entre los datos, se refleja con una
varianza grande y viceversa.
Una desventaja de usar la varianza es, que est en
unidades de la variable al cuadrado.


La Desvi aci n Est ndar Muest r al

Es la raz cuadrada (positiva) de la varianza.






De las dos frmulas de desviacin estndar dadas
arriba, es ms prctica la segunda f r mul a.


1
) (
1
) (

1
2 2
1
2

= =

= =
n
x n x
n
x x
S
n
i
i
n
i
i
o
27




















En todo anlisis estadstico con datos cuantitativos, es
importante, calcular la varianza y/o desviacin
estndar de los datos.

Ej empl o:

Considere el nmero de artculos defectuosos, de 18
lotes: 10, 5, 10, 6, 10, 8, 14, 2, 14, 10, 7, 10, 6, 11,
4, 10, 12, 7. Calcule el promedio, la mediana, la
moda, la varianza y la desviacin estndar. Los datos
1 2 3 4 5 6 7 8 9
0.0
0.1
0.2
0.3
0.4


1 2 3 4 5 6 7 8 9
0.0
0.1
0.2


Menor varianza
Menor dispersin
Mayor varianza
Mayor dispersin
Ms control
Mejores estimaciones
Menos control
Menos confianza
al estimar
28
ordenados y con sus cuadrados correspondientes se
dan a continuacin:
X
i
X
i
2
X
i
X
i
2

2 4 10 100
4 16 10 100
5 25 10 100
6 36 10 100
6 36 10 100
7 49 11 121
7 49 12 144
8 64 14 196
10 100 14 196

La suma de los datos es igual a 156.

La suma de los cuadrados es igual a 1536.

De aqu, la media es igual a 156/18 = 8.66667.

La mediana es igual a (10+10)/2 = 10.

La moda es igual 10.

La varianza es igual a

.
17
) 66667 . 8 ( 18 1536
2
2
10.82353 =

= S


Por lo tanto, la desviacin estndar es la raz cua-
drada positiva de 10.82353, esto es, 3.28991.

Estos clculos tambin se pueden realizar por medio
de Minitab, seguir las siguientes instrucciones:
29
Abrir Minitab, en la hoja de trabajo en c1, ingresar los
datos.

Stat > Basic Statistics > Display Descriptive Statistics.
En la ventana de variables, seleccionar c1 (se puede
hacer doble clic c1, en la ventana izquierda).
En Statistics, hacer clic y en la ventana resultante
seleccionar: Mean, Standard Desviation, Variance,
Median, Mode, Minimum, Maximum, Range, Sum of
squares > ok > ok.

Descriptive Statistics: C1

Sum of
Variable Mean StDev Variance Squares Minimum Median Maximum Range
C1 8.667 3.290 10.824 1536.000 2.000 10.000 14.000 12.000

N for
Variable Mode Mode
C1 10 6

3. DESCRI PCI N GRFI CA DE LOS DATOS

La descripcin grfica de los datos, se clasifica en
dos, grficas para datos cuantitativos y grficas para
datos cualitativos.

Para dat os cuant i t at i vos, uno de los principales
objetivos de la descripcin grfica es, tener una idea
visual de la variable en estudio, de su patrn de
comportamiento. Esto es, de la di st r i buci n de sus
posibles valores o categoras.

30
Adems, si la muestra obtenida es representativa de
la poblacin, la distribucin de los datos nos dar una
buena idea de cmo se comporta en general, la
variable, de cmo es la distribucin de la variable.
Tambin, la distribucin descriptiva de los datos, nos
da una buena idea (visual) sobre la dispersin de los
diferentes valores de los datos y por lo tanto de la
var i abi l i dad de la variable en estudio.

Existen diferentes formas de representar la
distribucin de los datos, puede ser por medio de una
tabla o por medio de una grfica.

Las grficas de distribucin que se vern son:

Diagrama de Tallo y Hojas.
Histograma.
Diagrama de Caja.


3.1 Di agr ama de Tal l o y Hoj as

Para una variable cuantitativa.

Muestra el patrn de variabilidad mostrado por los
diferentes valores o grupos de una variable. Se
representan las frecuencias de cada valor o de cada
grupo de la variable.

31
Ej empl o: En una empresa se registraron el nmero
de ventas por semana, durante 50 semanas. Los
datos obtenidos se dan a continuacin:

0 5 9 8 2 10 4 12 14 8
3 8 4 4 0 9 3 10 10 9
1 1 2 14 4 9 1 8 2 7
2 6 2 9 8 5 0 18 8 11
4 6 12 1 12 8 6 6 6 11

Este diagrama, consiste de un tallo, el cual es
formado por medio de los diferentes valores que
toma la variable en estudio (nmero de ventas). Por
otra parte, cada hoja, significa una realizacin ms de
un valor particular de la variable, este se representa
por una x.

Es una manera rpida y fcil para representar la
distribucin de los datos, aunque no es la mejor
forma de graficar la distribucin, una desventaja que
tiene esta grfica es, que posiblemente, las
frecuencias de los diferentes valores de las variables,
presentan muchos altibajos, lo cual no nos ayudara
a entender bien la forma de la distribucin.





32
Nmero de
ventas

0 x x x
1 x x x x
2 x x x x x
3 x x
4 x x x x x
5 x x
6 x x x x x
7 x
8 x x x x x x x
9 x x x x x
10 x x x
11 x x
12 x x x
13
14 x x
15
16
17
18 x







33
3.2 Hi st ogr ama

Para una variable cuantitativa.

Es una representacin grfica de las frecuencias o
frecuencias relativas (porcentajes) de los diferentes
valores que toman los grupos, intervalos o clases de
una variable de inters.

A diferencia del diagrama de tallo y hoja, las
frecuencias se calculan para intervalos (tambin
llamados grupos o clases), por ejemplo, si los valores
recolectados, son de 0 a 20, estos se pueden agrupar
de la siguiente manera (no es la nica manera de
agruparlos):

Mayor o igual a 0 y menor a 4.
Mayor o igual a 4 y menor a 8.
Mayor o igual a 8 y menor a 12.
Mayor o igual a 12 y menor a 16.
Mayor o igual a 16 y menor o igual a 20.

Una manera representar los grupos anteriores es:

[0,4)
[4,8)
[8,12)
[12,16)
[16,20]
34
El parntesis ) significa que no incluye al nmero
que esta al lado y el corchete [ ], significa que si
incluye al nmero que est al lado.

El histograma es la grfica ms usual para observar la
distribucin de frecuencias de la variable de inters.

Se grafican las frecuencias o frecuencias relativas por
grupos, clases o intervalos. La frecuencia o frecuencia
relativa de cada intervalo es representada por un
rectngulo. El objetivo del histograma es observar la
forma de la distribucin de los datos y por lo tanto la
forma de la distribucin de la variable en estudio.

Es importante, saber como se construye un
histograma, aqui se presentar una metodologa de
construccin.

12 10 8 6 4 2 0
35
30
25
20
15
10
5
0
Fr ecuencia



35
Const r ucci n de un Hi st ogr ama

La construccin de un buen histograma significa
detectar una forma definida de la distribucin de los
datos. Existen varias posibles formas:


Simtrica Acampanada (Normal)


Sesgada a la Derecha



Sesgada a la Izquierda
36





Uniforme



Exponencial



Bimodal

37
Para lograr observar alguna de las formas anteriores,
es necesario considerar algunos aspectos de cons-
truccin:

El nmero de datos suficientemente grande. Se
sugiere no menos de 25 datos.

Construir el histograma con un nmero de clases
adecuado, ni muy pequeo, ni muy grande. Entre
ms datos ms clases.

Existen varias formas o frmulas para calcular el
nmero de clases en funcin del nmero de datos,
pero no hay una frmula definitiva.

Por ejemplo, una de las frmulas ms conocidas es:

El nmero de clases k ser el pr i mer nmer o
ent er o que cumpla con la siguiente desigualdad:



donde n es el nmero de datos.

Obser vaci n: El nmero de clases calculada como
indica arriba, puede cambiarse ligeramente para
arriba o para abajo. Ms que una regla, es una
recomendacin.

. 2 n
k
>
38
Para construir un histograma, primero se debe de
construir una tabla de frecuencias, una tabla que
indique los intervalos, sus frecuencias, frecuencias
relativas, frecuencias relativas acumuladas y marcas
de clase.

Pr ocedi mi ent o par a const r ui r una
di st r i buci n de f r ecuenci as ( un hi st ogr ama) :

1) Se ordena los datos de menor a mayor.

2) Se calcula el rango, de los datos.

3) Se calcula el nmero de clases, de acuerdo a la
frmula descrita antes de este procedimiento.

4) Se calcula el nmero el ancho de cada clase, de
la siguiente manera (todas las clases tendrn
el mismo ancho):
Ancho = (Rango/k).
En caso necesario, si el ancho no resulta un
nmero exacto, se aproxima a un nmero
ligeramente mayor, evitando usar varios
decimales, solamente uno o dos.

(Para los siguientes pasos, los resultados se
reportan en una tabla, con las siguientes
columnas: Intervalos, frecuencia, frec.
39
Relativa, frec. Rel. Acumulada y Marca de
clase).

5) Se construyen los intervalos, con el ancho
determinado.

6) Se calculan las frecuencias para cada intervalo.
Nmero de elementos que resultan en cada
clase.

7) Se calculan las frecuencias relativas para cada
intervalo. La frecuencia relativa de un intervalo
se calcula como la frecuencia del intervalo
entre el nmero de datos.

8) Se calcula la frecuencia relativa acumulada para
cada intervalo. La frecuencia relativa
acumulada de una clase, se calcula, como la
frecuencia relativa acumulada de la anterior
clase ms la freceuncia relativa de la clase.
Para el caso, de la primera clase, la frecuencia
relativa acumulada, es la frecuencia relativa de
la clase.

9) Se calcula, para cada clase, la marca de clase.
La marca de clase, se calcula como la suma de
los lmites superior e inferior de la clase,
dividido entre 2.

40
Una vez terminada la tabla de distribucin de
frecuencias, se procede a realizar la grfica del
histograma, para cada intervalo, se construye un
rectngulo con dimensiones: ancho igual al ancho de
la clase y altura igual a la frecuencia o frecuencia
relativa del intervalo.

Ej empl o:

Los siguientes datos correponden al tiempo en
minutos de duracin de un servicio que se les brind
a 66 clientes. Construir la tabla de frecuencias,
siguiendo los pasos, del 1 al 9

19.3 25 26.3 21.4 9.6 11.7 5 7 25.4 21.1
18.8 19.9 7.9 2.6 9.8 14.4 31.3 17.9 12 24.5
27.4 13.8 47.7 15.7 12.2 14.7 33.1 20.5 15.3 7
14.4 8.4 22.9 17.8 28.1 26.6 4.8 19 15.9 13.6
11.4 16.5 16 30.6 13.5 2.3 16.7 8 20.8 41
13.5 9.1 14.4 12.7 9.4 20 25.3 35 23.3 30.2
4.8 10.8 19.3 8 8.5 31.6


Paso 1: Se ordenan los datos de menor a mayor

2.3 2.6 4.8 4.8 5 7 7 7.9 8 8
8.4 8.5 9.1 9.4 9.6 9.8 10.8 11.4 11.7 12
12.2 12.7 13.5 13.5 13.6 13.8 14.4 14.4 14.4 14.7
15.3 15.7 15.9 16 16.5 16.7 17.8 17.9 18.8 19
19.3 19.3 19.9 20 20.5 20.8 21.1 21.4 22.9 23.3
24.5 25 25.3 25.4 26.3 26.6 27.4 28.1 30.2 30.6
31.3 31.6 33.1 35 41 47.7


41
Paso 2: Se calcular el rango

Rango= 47.7-2.3=45.4

Paso 3: Se calcula el nmero de clases.

La siguiente tabla, nos ayudar a verificar en que
momento se cumple la frmula

2^2 4
2^3 8
2^4 16
2^5 32
2^6 64
2^7 128

El nmero de clases recomendado es 7. Como se
mencion se puede considerar un nmero
ligeramente menor o mayor. Para propsitos de
tareas del curso, se va a respetar la frmula.

Paso 4: Se calcula el ancho de clase

Ancho de cada clase= Rango/7 =45.4/7 =6.49

Lo aproximaremos a 6.5.

Pasos del 5) al 9)

. 2 n
k
>
42

Cl ases Fr ec. Fr ec.
Rel .
F.R.
Acum.
M.C.
[2.3,8.8) 12 0.182 0.182 5.55
[8.8,15.3) 18 0.273 0.455 12.05
[15.3, 21.8) 18 0.273 0.727 18.55
[21.8,28.3) 10 0.152 0.879 25.05
[28.3,34.5) 5 0.076 0.955 31.55
[34.5,41.3) 2 0.030 0.985 38.05
[41.3,47.8] 1 0.015 1.000 44.55


Ej empl o:

Considerando los mismos datos del ejemplo anterior
construir el histograma por medio de Minitab. Graficar
porcentajes, lo cual es equivalente a frecuencias
relativas.

Seguir las siguientes instrucciones de Minitab

Abrir Minitab y capturar en la columna c1 los datos,
seguir las siguientes instrucciones:
Graph > Histogram > Simple.
En la ventana, en Graph variables seleccionar la
columna: c1 (sobre c1 hacer doble clic).
Scale > y-scale Type > Percent > ok (Para hacer el
histograma con porcentajes).
43
Labels > Data labels > Use y-value labels >ok > ok
(Para escribir arribas de las barras, los porcentajes).

Una vez construida la grfica, sobre las barras del
histograma hacer doble clic, y aparecer la ventana:
Edit bars.

En esta ventana se puede cambiar el nmero de
clases, el color de las barras, en que valores se desea
las marcas de clase (los puntos medios de las clases),
en que momento se quiere comenzar y terminar cada
clase, cambios de ttulos, etc.

Ahora, cambiaremos el nmero de clases a 7 y
ajustaremos los intervalos como fueron calculados en
el anterior ejemplo.

Hacer doble clic sobre las barras del histograma.
En la ventana Edit bars, seleccionar Binning.
En Interval Type, seleccionar Cutpoint.
En Interval definition, seleccionar Midpoint/Cutpoint
positions y escribir en el recuadro de abajo, los lmites
de clase separados por un espacio en blanco, esto es:
2.3 8.8 15.3 21.8 28.3 34.5 41.3 47.8

El histograma resulta ser, con algunas ediciones
adicionales al gusto

44
47.8 41.3 34.5 28.3 21.8 15.3 8.8 2.3
30
25
20
15
10
5
0
Tiempo de ser vicio
P
o
r
c
e
n
t
a
j
e
1.51515
3.0303
7.57576
15.1515
27.2727 27.2727
18.1818
Hi st ogr ama del Ti empo de ser vi ci o


Algunas interpretaciones son, el 18% de las veces
que se otorga este servicio, se otorga en menos de
8.8 minutos. La mayora de las veces que se da este
servicio (ms del 54%) se da en un tiempo de por lo
menos 8.8 minutos pero menos de 21.8 minutos. El
4.5% de las veces, se tardan por lo menos 34.5
minutos.

Obser vaci n: Se puede notar que las
interpretaciones anteriores, no son muy cmodas, ya
que se estn usando fracciones de minutos. Con la
finalidad de tener interpretaciones ms fciles de
asimilar, se puede reconstruir el histograma, donde
los lmites de clase sean nmeros enteros, aunque se
modifique ligeramente el nmero de intervalos.


45
Ej empl o:

Sobre el ltimo histograma cosntruido, modificar este
diagrama a uno con las siguientes 6 clases: [0,8),
[8,16), [16,24), [24,32), [32,40), [40,48].

Hacer doble clic sobre las barras del histograma.
En la ventana Edit bars, seleccionar Binning.
En Interval Type, seleccionar Cutpoint.
En Interval definition, seleccionar Midpoint/Cutpoint
positions y escribir en el recuadro de abajo, los
siguientes lmites de clase separados por un espacio
en blanco: 0 8 16 24 32 40 48.

El histograma se presenta a continuacin:

48 40 32 24 16 8 0
40
30
20
10
0
Tiempo de ser vicio
P
o
r
c
e
n
t
a
j
e
3.0303 3.0303
18.1818
25.7576
37.8788
12.1212


Algunas interpretaciones, el 12% de los servicios
fueron atendidos en menos de 8 minutos. El casi 64%
46
de los servicios se realizaron en por lo menos 8 pero
antes de 24 minutos. El 6% de los servicios, se
reliazaron en 32 minutos o ms.

3.3 Di agr ama de Caj a

Para dos variables, busca la relacin de una variable
cuantitativa (de respuesta) con una variable
cualitativa o por atributos (un factor).

El diagrama de caja, divide a los datos de menor a
mayor, en 4 partes: del 0 al 25% (1er cuartl), del
25% (1er cuartl) al 50% (2do cuartl o mediana), del
50% (2do cuartl o mediana) al 75% (3er cuartl) y
del 75% (3er cuartl) al 100%. La primera y la ltima
parte es representada por una lnea y las otras dos
partes es representada dos rectngulos (ver siguiente
diagrama).













D a t o s Del 0 al 25%
Del 25% al 50%
Del 50% al 75%
Del 75% al 100%
Dato extremo
47
Se usa mucho para comparar dos o ms grupos de
datos, para comparar sus promedios y variaciones.
Este se puede graficar en forma vertical,en lugar de
horizontal.

Ej empl o:

El gerente de una fbrica de camisas est interesado
en maximizar la resistencia a la tensin de una nueva
fibra sinttica (r espuest a), la cual ser empleada en
la manufactura de telas para determinadas camisas
de hombre. El ingeniero de produccin sabe por su
experiencia, que la resistencia es influida por el por-
centaje de algodn en la fibra (f act or : porcentaje de
algodn). El ingeniero considera 5 ni vel es de por-
centajes de algodn: 15%, 20%, 25%, 30% y 35%.
Se obtienen para cada nivel, 5 medidas de tensin (5
r pl i cas). Los datos se encuentran en el archivo de
Minitab porcentajesalgodn.MPJ.

Las instrucciones se dan a continuacin.

File > Open Project
Seleccionar el archivo porcentajesalgodn.MPJ
Graph > Boxplot
Seleccionar: Multiple Ys Simple
Escibir en Graph variables: 15%-35%
Labels > Data Labels > Label > Medians

48
















I nt er pr et aci n:

Es notorio que conforme se va aumentando el
porcentaje de algodn, existe una mejora en la
resistencia a la tensin, hasta el porcentaje del 30%.
Despus de este porcentaje, la resistencia a la
tensin, baja considerablemente.

Esto significa, que para lograr el ptimo de la variable
resistencia, tendremos que poner un cuidado espe-
cial, en el porcentaje de algodn, alrededor del 30%,
un poco menos y un poco ms. Una observacin ms,
para el caso de 25% de algodn, se observa una
35% 30% 25% 20% 15%
25
20
15
10
5
D
a
t
o
s
9
17
18
22
11
49
menor variabilidad (la grfica es ms esbelta). En los
dems casos, la variabilidad es muy similar.

Finalmente, es importante aclarar, que las
interpretaciones dadas en este tipo de diagramas y
cualquier anlisis descriptivo que se realice, no puede
darse como una conclusin formal. Es necesario
despus de lo observado descriptivamente, realizar
una comprobacin estadstica (inferencia estadstica).

A continuacin se presentaran los grficos para
variables cualitativas o por atributos. El objetivo
principal de estas grficas es la comparacin de entre
las diferentes categoras de las variables. En este
caso, no nos interesa encontrar una forma de la
distribucin, como en el caso de las variables
cuantitativas.

3.4 Di agr ama de Bar r as

Para una variable cualitativa o por atributos.

El diagrama de barras se parece al histograma, pero
es propio para datos cualitativos (variables por
atributos). Los grupos sern conformados por las
diferentes categoras de la variable, ya no se trabajan
intervalos. El objetivo es observar algn aspecto
cuantitativo de las diferentes categoras de las
50
variables, promedios, porcentajes. Es muy til para
comparar las diferentes categoras.

Ej empl o:

En una organizacin, se registran el nmero de
errores cometidos al mes al realizar cierta
documentacin de rigor. Los registros de realizan por
empleado. A continuacin se presentan estos datos
por empleado en el mes pasado.

Empl eados # de
Er r or es
Empl eados # de
Er r or es
E1 11 E9 9
E2 4 E10 1
E3 5 E11 17
E4 16 E12 14
E5 5 E13 2
E6 8 E14 6
E7 7 E15 8
E8 10 E16 0

Seguir las siguientes indicaciones en Minitab.

Caputar los datos anteriores. En c1, capturar E1,,
E16; en c2, capturar el nmero de errores, 11,,0. A
la columna c1 dar el nombre de Empleados; a la c2,
dar el nombre de Nmero de errores.

Seguir las instrucciones:

51
Graph > Bar Chart > Values from a table >ok
En Graph variables seleccionar c2: Nmero de
errores, en Categorical variable, seleccionar c1
Empleados.
Hacer clic en labels, y luego clic en Data labels,
seleccionar en Label Type: Use y-value labels, y luego
hacer clic en ok.
El diagrama:

E16 E15 E14 E13 E12 E11 E10 E9 E8 E7 E6 E5 E4 E3 E2 E1
18
16
14
12
10
8
6
4
2
0
Empleados
N

m
e
r
o

d
e

e
r
r
o
r
e
s
0
8
6
2
14
17
1
9
10
7
8
5
16
5
4
11
Di agr ama de Bar r as



Es til para comparar, en este caso la eficiencia de los
diferentes empleados.




52
3.4 Di agr ama de Par et o

Para variables por atributos.

Esta grfica, es un diagrama de barras, donde las
categoras o grupos se ordenan de tal modo que la
categora con la frecuencia ms alta quede a la
izquierda, seguida de la categora con la segunda
frecuencia ms alta, y as sucesivamente.

Este diagrama es utilizado mucho para mejorar la
calidad de los procesos, por ejemplo las categoras
pueden ser los di f er ent es t i pos de def ect o o
er r or . Es una herramienta clave en la metodologa de
Seis Sigma (Metodologa de Mejora Continua).














P
a
r
t
e
s

m
a
l p
e
r
f
il a
d
a
s
P
a
r
t
e
s

s
o
b
r
e
c
o
r
ta
d
a
s
A
g
u
je
r
o
s
f
a
lt a
n
t
e
s
M
a
l
e
n
s
a
m
b
l a
d
o
P
a
r
t
e
s

n
o
l u
b
r
i c
a
d
a
s
A
b
o
ll a
d
u
r
a
s
P
e
r
f o
r
a
c
io
n
e
s
O
t
h
e
r
s
30 21 8 6 5 4 4 3
37.0 25.9 9.9 7.4 6.2 4.9 4.9 3.7
37.0 63.0 72.8 80.2 86.4 91.4 96.3 100.0
0
10
20
30
40
50
60
70
80
0
20
40
60
80
100
Tipos de
Def ectos
Count
Percent
Cum %
P
o
r
c
e
n
t
a
j
e
N

m
e
r
o

d
e

D
e
f
e
c
t
o
s
Diagrama de Pareto para Tipos de Def ectos
53
Ej empl o:

El tipo de quejas en un centro de atencin para
resolver dudas o problemas de carcter fiscal, con el
nmero de ocurrencias al mes, se da a continuacin:



Quejas Frecuencia al mes
Falta de amabilidad 12
Falta de inters 5
Falta de conocimiento 2
Prdida de
documentos
1
Orientacin
equivocada
4
Tiempo de espera
prolongado
23
Tiempo de trmite
prolongado
17

Construir el Diagrama de Pareto por medio de
Minitab.

Capturar los anteriores datos. En la c1, ingresar los
diferentes tipos de quejas; en la c2, capturer las
frecuencias. Asignar a c1, el nombre de Quejas y a
c2, el nombre de Frecuencias.

Stat > Quality Tools > Pareto Chart.
Seleccionar Chart defects table.
En Labels in seleccionar: C1 Quejas.
54
En Frequencies in seleccionar C2 Frecuencias.
Hacer clic en options.
En X axis escribir: Quejas.
ok > ok.

La grfica se da a continuacin

Frecuencia al mes 23 17 12 5 4 3
Percent 35.9 26.6 18.8 7.8 6.3 4.7
Cum % 35.9 62.5 81.3 89.1 95.3 100.0
Quejas
O
t
h
e
r
O
r
i
e
n
t
a
c
i
n

e
q
u
iv
o
c
a
d
a
F
a
lt
a

d
e

in
t
e
r

s
F
a
l
t
a

d
e

a
m
a
b
ili
d
a
d
T
i
e
m
p
o

d
e

t
r

m
it
e

p
r
o
l
o
n
g
a
d
o
T
ie
m
p
o

d
e

e
s
p
e
r
a

p
r
o
l
o
n
g
a
d
o
70
60
50
40
30
20
10
0
100
80
60
40
20
0
F
r
e
c
u
e
n
c
i
a

a
l

m
e
s
P
e
r
c
e
n
t
Par et o de Quej as


I nt er pr et aci n:

Las principales quejas de los usuarios de este servicio,
son el tiempo prolongado de espera y de trmite,
aunado a la falta de amabilidad. Obsrvese que si se
atienden con intensidad estos problemas, se estar
atacando el 81% de las quejas.

Vous aimerez peut-être aussi