Vous êtes sur la page 1sur 47

Descripción de datos:

Medidas de Ubicación
y Dispersión (2/2)

Profesor Antonio Millán A.


Monterrey, N. L.
Enero 16 de 2018

(Cap. 4 p. 102)
Regla empírica
Distribución de
Datos en frecuencias en
bruto no forma gráfica,
organizados histogramas y
polígonos

1. Diagramas de puntos
2. Gráfica de tallo y hojas
3. Percentiles
4. Diagramas de caja
5. Relación de variables
3-25

Cap. 4
1. Diagrama de puntos
2. Gráfica de tallo y hojas
3. Otras medidas de posición
4. Diagramas de caja
5. Coeficiente de sesgo
6. Diagrama de dispersion
7. Tabla de contingencia
Otras medidas de dispersión
 Se le conoce como Diagrama de
puntos.
 Para crear un diagrama de puntos se
coloca un punto que representa a cada
observación a lo largo de una recta
numérica horizontal, la cual indica los valores
posibles de los datos. Si hay observaciones
idénticas o las observaciones se encuentran
muy próximas, los puntos se apilan uno sobre
otro para que se puedan ver de manera
individual.
Ejemplo 1 de un
Diagrama de puntos
Las tablas abajo, muestran las ventas de dos
compañías durante los últimos 24 meses.
Ejemplo 1 de un diagrama
de puntos

Así quedarían agrupados los datos de las dos


Empresas en una línea continua
Diagrama de puntos
Características
Agrupa los datos lo menos posible de tal forma que
la identidad individual de cada observación no se
pierda.
Para desarrollarlo, cada observación es situada
como un punto junto a una línea horizontal
numerada indicando los posibles valores de los
datos.
Si hubiera observaciones idénticas o estuvieran
demasiado cercanas para ser mostradas
individualmente, los puntos se apilan unos con
otros.
Gráfica de tallo y hojas
Gráfica de tallo y hojas: técnica
estadística que permite analizar un
conjunto de datos y en la cual cada
valor numérico se divide en dos
partes: los dígitos principales
constituyen el tallo y los dígitos
secundarios forman las hojas.

 Nota: una ventaja del diagrama de tallos y hojas sobre la


distribución de frecuencia es que no se pierde la
identidad de cada observación.
EJEMPLO 1

El estudiante López obtuvo en doce exámenes


de este semestre las siguientes calificaciones:
86, 79, 92, 84, 69, 88, 91, 83, 96, 78, 82,
85. Construya un diagrama de tallos y hojas
para los datos anteriores.

Tallo Hojas
6 9
7 89
8 234568
9 126
Ejemplo 2
 La tabla de abajo muestra el número de spots
publicitarios de 30 segundos, comprados por cada
uno de los 45 miembros de la Asociación
Automovilística Gran Búfalo, el año pasado.
 1. ¿Alrededor de que valores tienden a agruparse el
número de spots publicitarios?
 2. ¿Cuál es el número de spots más bajo comprado
por un detallista?
 3. ¿Cuál es el número más grande comprado?
Número de anuncios comprados por cada uno de los miembros de la
asociación de automóviles Gran Búfalo
Ejemplo 2

Tallo Hojas
Auto Evaluación 4-1
Auto Evaluación 4-1
Cuartiles, Deciles y Percentiles
Otro método: localización de
valores que dividen al conjunto de
observaciones en partes iguales.
Diferenciar entre el valor de las
observaciones y su localizador.
Por ejemplo; si sabemos que la
observación X15 = 47, entonces el
valor de la observación es 47 y su
localización es la posición 15.
Cuartiles, Deciles y Percentiles
Las medidas para hacer esto se
denominan; cuartiles, deciles y
percentiles.
Los cuartiles dividen a un
conjunto de datos en 4 partes
iguales.
Los deciles los dividen en 10
partes iguales.
Y los percentiles en 100.
Cuartiles, Deciles y Percentiles

Suponga un conjunto de datos


ordenados de mayor a menor.
• Al valor de en medio le llamamos la
mediana, o sea, el 50% de las observaciones
son mayores que la mediana y el 50% son
menores.

• De forma similar los cuartiles dividen al


conjunto de datos en 4 partes iguales.

• Al primer cuartil se le llama Q1 y representa el


valor por debajo del cual se encuentran el
25% de las observaciones.
Cuartiles, Deciles y Percentiles
Al tercer cuartil llamado Q3, es el
valor por debajo del cual se
encuentran el 75% de las
observaciones.
Q2 es la mediana.
Los valores Q1, Q2, Q3, dividen al
conjunto de datos en partes iguales.
Q1 se puede entender como la
mediana de la primera mitad de los
datos y Q3 como la mediana de la
segunda mitad.
Localización de un percentil
Si se desea localizar un percentil, se
utiliza la siguiente formula:

p
Lp  ( n  1)
100
Donde P = percentil deseado.
Cuartiles, Deciles y Percentiles
Ejemplo 2.5

En el curso anterior del Profesor Millán, sus alumnos obtuvieron


las siguientes calificaciones finales:
38 40 41 45 48 48 50 50 51 51 52 53 54 55 55 55 56 56 57 59
59 59 62 62 62 63 64 65 66 67 67 69 69 71 77 78 79 79
a) Determine la mediana de las calificaciones.
b) Determine el primer cuartil.
c) Determine el tercer cuartil.
d) Determine el primer decil.
e) Determine el 9º decil.
f) Determine el 33vo percentil.
Rango intercuartil
El rango intercuartil es
la distancia entre el
tercer cuartil, Q3, y el
primero, Q1.
Rango intercuartil =
tercer cuartil – primer
cuartil = Q3 - Q1
Desviación cuartil
La desviación cuartil es
la mitad de la distancia
entre el tercer cuartil,
Q3, y el primero, Q1.

DQ = [Q3 - Q1]/2


Ejemplo 3

Si el tercer cuartil = 24 y


El primer cuartil = 10,
¿cuál es la desviación
cuartil?
 Si el rango intercuartil es
24 – 10 = 14, entonces la
desviación cuartil es 14/2 =
7.
Diagrama de caja
Un diagrama de caja es una
representación gráfica, basada en
cuartiles que, ayuda a describir un
conjunto de datos.
Para construir un diagrama de caja se
requieren cinco datos:
1. el valor mínimo,
2. el primer cuartil,
3. la mediana,
4. el tercer cuartil y
5. el valor máximo.
Ejemplo 4
 Considerando una muestra de 20
entregas, en la Pizzería de Marco
se encontró la siguiente
información:
valor mínimo= 13 minutos,
Q1 = 15 minutos,
Q2 = mediana = 18 minutos,
Q3 = 22 minutos,
valor máximo = 30 minutos.
 Elabore un diagrama de caja
para los tiempos de entrega y
emita alguna conclusión.
Ejemplo 4
continuación
Asimetría
Otra característica de un conjunto
de datos es la forma de la
distribución
Hay cuatro tipo de formas
comúnmente observadas:
 Simétrica,
 Positivamente sesgada,
 Negativamente sesgada,
 bimodal.
Formulas para calcular la asimetría
El coeficiente de asimetría puede variar de -3
up to 3.
 Un valor cercano a -3, tal como -2.57, indica
una considerable asimetría negativa.
 Un valor de 1.63 indica moderada asimetría
positiva
 Un valor de 0, ocurrirá cuando la media y la
mediana son iguales, e indica que la distribución es
simétrica y que no hay asimetría presente.
Formas de distribución comunes
Actividad

Llevar a cabo el
siguiente ejercicio en
pareja designada
por el profesor
Asimetría – un Ejemplo

Las siguientes son las utilidades por acción de


una muestra de 15 compañías de software en el
año 2007. Las utilidades están arregladas de
menor a mayor.

Calcule la media, mediana y desviación


estándar. Encuentre el coeficiente de asimetría
de Pearson. Cuál es su conclusión acerca de la
forma de la distribución?
Asimetría
usando el coeficiente de Pearson

X
 X

$74.26
 $4.95
n 15

s

 X X 2


($0.09  $4.95) 2  ...  ($16.40  $4.95) 2 )
 $5.22
n 1 15  1
3( X  Median ) 3($4.95  $3.18)
sk    1.017
s $5.22
Relación entre dos Variables
Análisis bi-variable
La técnica gráfica que se usa para
mostrar la relación entre variables, es
llamada diagrama de dispersión.

Para dibujar un diagrama de


dispersión se necesitan dos variables.
Se mide una variable en el eje
horizontal (eje-X ) de una gráfica y la
otra variable en el eje vertical (eje-Y ).
Ejemplos que Describen la relación entre dos
variables Diagrama de dispersión.
Ejemplos que describen la relación entre dos
variables Diagrama de Dispersión.
Ejemplos que describen la relación entre dos
variables Diagrama de Dispersión.
Tablas de contingencia
Un diagrama de dispersión requiere que
ambas variables al menos estén en una
escala de intervalo.
Si se desea estudiar la relación entre dos
variables cuando una o ambas son de
escala nominal u ordinal, se sintetizan los
resultados en una tabla de contingencia.
 Una tabla de contingencia se usa para
clasificar las observaciones de acuerdo a
dos características identificables.
Tablas de contingencia
Un Ejemplo
 Un fabricante de ventanas prefabricadas
produjo 50 ventanas ayer. Esta mañana el
inspector de calidad revisó cada ventana en
todos los aspectos de calidad. Cada una fue
clasificada como aceptable o inaceptable para
cada uno de los turnos en que fue producida. Así
se reportaron dos variables que son calidad y
turno. Los resultados se muestran abajo.
CASO Empleo USA
La siguiente lista muestra el número de
trabajadores empleados y desempleados de 20
años o mayores, de acuerdo con su género en
Estados Unidos.

Número de trabajadores (miles)


Género Empleados Desempleados
Hombres 70415 4209
Mujeres 61402 3314

 a) ¿Cuántos trabajadores se registraron?


 b) ¿Qué porcentaje de trabajadores estaban desempleados?
 c) Compare el porcentaje de desempleados en el caso de
hombres y mujeres.
Gracias

Vous aimerez peut-être aussi