Vous êtes sur la page 1sur 30

Curso: Estadística

6
Instrumentos y matriz
Medidas de de datos
Dispersión

Estadística Descriptiva
Profesor: Gonzalo Fernández
Fecha: 25/09/2018
MOTIVACIÓN

 Video Recuperado el 26 de Agosto de 2018, de:


https://www.youtube.com/watch?v=ubR8rEgSZSU&feat
ure=youtu.be
LOGRO DE LA SESIÓN

Al finalizar la sesión, el
estudiante estará en la
capacidad de calcular e
interpretar medidas de
dispersión de un
conjunto de datos sin
agrupar y agrupados en
tablas de frecuencias.
Introducción

•¿Los promedios proporcionan suficiente información


para una adecuada descripción de los datos?

•¿Por qué estudiar la dispersión?

•¿Qué medida de dispersión es la más adecuada para


comparar variabilidades entre dos conjuntos de datos?
Introducción
•Los estudiantes de Estadística reciben diferentes
calificaciones en la asignatura (variabilidad). ¿A qué puede
deberse?

 Diferencias individuales en el conocimiento de la


materia.

•¿Podría haber otras razones (fuentes de variabilidad)?

•Por ejemplo:
– Dormir poco el día del examen, no desayunaste,...
Diferencias individuales en la habilidad para hacer
un examen.
Medidas Resumen
Descripción Numerica de Datos

Tendencia Central Variación Forma

Media Aritmética Rango Asimetría

Mediana Rango Intercuartílico

Moda Varianza

Desviación Estándar
Cuartiles
Coeficiente de Variación
Percentiles
¿Qué son las Medidas de Dispersión?
¿Cómo sabré si un
•Son las que miden el grado de promedio es confiable?,
concentración o dispersión de los o si los datos están
concentrados.
valores de una variable en torno
de un promedio.
Los más utilizados son:
•Rango o Recorrido
•Recorrido Intercuartílico (RIC)
•Varianza y Desviación estándar
•Coeficiente de Variación
Variabilidad o Dispersión
Baja dispersión = Alta concentración=Datos
homogéneos.
Alta dispersión = Baja concentración=Datos
heterogéneos.
Medidas de Dispersión
Variación

Rango Rango Varianza Desviación Coeficiente


Intercuartílico Estándar de Variación

• Medidas de dispersión
dan información sobre
la dispersión o
variabilidad de los
datos. Mismo centro,
Variación diferente
Variabilidad o Dispersión
Miden el grado de dispersión de los datos.

•Rango (R): R  X max  X min


Es la diferencia entre las observaciónes extremas.
– Ejemplo: Datos; 2,1,4,3,8,4.

Rango  8  1  7
– Es muy sensible a los valores extremos.

•Rango intercuartílico (RIC):


– Es la diferencia entre el tercer y primer cuartil.

Rango Intercuartílico  Q3  Q1
– No es tan sensible a valores extremos.
Ejemplo: DVD - Satisfacción
Niveles de satisfacción de 20 clientes:
1 3 5 5 7 8 8 8 8 8 8 9 9 9 9 9 10 10 10 10
n=20

Me = (8+8)/2 = 8

Q1 = (7+8)/2 = 7.5 Q3 = (9+9)/2 = 9

RIC = Q3  Q1 = 9  7.5 = 1.5

Q1 Q2 Q3
25% 25% 25% 25%
Ejemplo: Rango Intercuartílico (RIC)
Las puntuaciones de un exámen de 15 estudiantes se listan abajo.
Halle el primer, segundo y tercer cuartíl de las puntuaciones, y el RIC.
28 43 48 51 43 30 55 44 48 33 45 37 37 42 38
Datos Ordenados: n=15
Mitad inferior Mitad Superior

28 30 33 37 37 38 42 43 43 44 45 48 48 51 55
Q1 Q2 Q3

RIC  Q3  Q1 Las puntuaciones del exámen en la


parte media de los datos varian al
= 48 – 37 menos en 11 puntos.
= 11
DESVIACIÓN ESTÁNDAR
•Mide la dispersión de los datos con respecto al promedio.
Cuanto menor es la desviación estándar, menos dispersos están
los datos con respecto al promedio.

•Llamada también desviación típica.


•En la práctica, la desviación estándar se utiliza con más
frecuencia que la varianza.
•Una de las razones es que se expresa en las mismas unidades de
medida de la variable.
DESVIACIÓN ESTÁNDAR (s)
Interpretación del valor de “ s ”
• Tomemos como ejemplo las siguientes estadísticas de las
edades de pacientes atendidos en un consultorio médico:
Media = 39,80 años y s = 13,74 años
• La dispersión media de las edades de los pacientes con
respecto al promedio es de 13,74 años, o bien así:
• La variabilidad media de las edades de los pacientes en
relación al promedio es de 13,74 años.
Varianza y Desviación Estándar
n
Var( x)  S 2  1  i
(
(n1) i 1
x  x ) 2

Para facilitar los cálculos de s2 (la varianza)


utilizaremos la ecuación equivalente:

 n
2
S 
2 1

(n1)  i 1
( xi )  n( X ) 
2


Desviación estándar muestral:
Es la raíz cuadrada de la varianza.

S  Var ( x)
Fórmula alternativa para s2
Ejemplo: Los pesos (en libras) de una muestra de cinco
cajas que se envían por UPS (empresa de mensajería)
son los siguientes: 12, 6, 7, 3 y 10. Calcule la varianza y
la desviación estándar.
Varianza muestral S2 :

S 2  1 (338)  5(7.6)2   12,3


(51)
Desviación estándar muestral S:
S  S 2  12,3  3,5071
Interpretación: En promedio, los pesos de las
cajas varian 3,51 libras respecto de la media de 7,6
libras.
Coeficiente de Variación
Es la razón entre la desviación estándar y la media.
S
 También se la denomina variabilidad relativa. CV   100%
 Es frecuente mostrarla en porcentajes. x
• Si la media es 80 y la desviación estándar 20 entonces
CV=20/80=0,25=25% (variabilidad relativa).

 Es una cantidad adimensional. Conveniente para comparar dos o


más conjuntos de datos medidos en unidades diferentes.

 Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos


presentan mayor dispersión relativa en peso que en altura.
Coeficiente de Variación

Estadístico útil para comparar, permite establecer si un


conjunto de datos es homogéneo o heterogéneo.

- Si CV ≤ 30% → los datos son homogéneos


(baja dispersión)

- Si CV > 30% → los datos son heterogéneos.


(alta dispersión)
Ejemplo 1: Variabilidad o Dispersión
¿Cuál de las siguientes variables presenta un menor
grado de dispersión?
¿Cuál de las siguientes variables presenta un mayor
grado de dispersión?
Variabilidad o Dispersión
Procedimientos de Análisis de metabolismo férrico

CV ( Hemoglobina)  0.53%

CV (Transferrina)  5.44%

Interpretación: Como C.V.= 0.53% < 5.44% concluimos


que la componente hemoglobina tiene menor dispersión
relativa que el receptor soluble de la transferrina.
Ejemplo 2: Variabilidad o Dispersión
Ante la pregunta sobre el número de hijos por familia, una
muestra de 12 hogares, marcó las siguientes respuestas:
2 1 2 4 1 3
2 3 2 0 5 1
Calcule el coeficiente de dispersión de los datos

• Solución:
 1,4035 
• Media = 2.1667 CV ( x )     100  64,7759%
• Desv. Estándar = 1.4035  2,1667 

Interpretación: Como C.V.= 64.78% > 30% concluimos


que la distribución del número de hijos por familia es
heterogénea.
Relación entre la media, mediana y moda
• Si media=mediana=moda, la distribución es simétrica.
• Si media<mediana, la distribución es asimétrica negativa.
• Si media>mediana, la distribución es asimétrica positiva.

Media Moda Media Media


Moda
Mediana
Mediana Moda Mediana

Asimétrica Asimétrica
Simétrica
Negativa Positiva
Diagrama de Cajas (Boxplot)
Este diagrama permite determinar, en forma gráfica,
lo siguiente:

 Valores extremos o atípicos (outliers).


 La tendencia central.
 La variabilidad.
 La asimetría de la distribución.

Estos gráficos son bastante útiles para comparar dos


o más conjuntos de datos en cuanto a su tendencia
central y variabilidad.
Estadísticos de Posición
Diagrama de Cajas (Boxplots)
Outlier o
Valor Extremo
Forma de la Distribución y BoxPlot

Asimétrica Asimétrica
Simétrica
Izquierda Derecha

Q1 Q2 Q3 Q1 Q2 Q3 Q1 Q2 Q3
Descriptive Statistics
Medidas de Dispersión y Asimetría:
Ingresar rango de datos que están en Excel
Propiedades de la Varianza
Conclusión: Ahora estamos listos
para describir y
analizar datos
estadísticos
•Las medidas de dispersión son
necesarias para dos propósitos
básicos:

•Para verificar la confiabilidad de


los promedios, y
•Para que sirva como base para el
control de la variación misma.
“Las estadísticas no sustituyen el juicio.”
Henry Clay

Vous aimerez peut-être aussi