Vous êtes sur la page 1sur 44

UNIDAD IV : MEDIDAS DE

DISPERSION
Ing. Roy Donaldo silva
MEDIDAS DE DISPERSION
Se llama dispersión de un conjunto de datos al grado en que
los diferentes valores numéricos de los datos tiende a
extenderse alrededor del valor medio utilizado.
Este grado de dispersión se mide por medio de los
indicadores estadísticos llamados medidas de dispersión,
entre ellas tenemos :
El rango, la varianza, y la desviación típica, El coeficiente de
variación, desviación semi intercuartilica ,etc

Estas se estudian para datos :


a) En Serie o también llamadas no agrupados y
b) Para Datos Agrupados
MEDIDAS DE DISPERSION PARA
DATOS EN SERIE
RANGO, DESVIACION MEDIA, DESVIACION TIPICA,
VARIANZA, COEFICIENTE DE VARIABILIDAD
ING. ROY DONALDO SILVA
Rango:
Es la primera medida que vamos a estudiar, se
define como la diferencia existente entre el valor
mayor y el menor de la distribución,
Lo notaremos como R. Permite obtener una idea
de la dispersión de los datos, cuanto mayor es el
rango, más dispersos están los datos de un
conjunto.
• RANGO : X mayor - X menor
DESVIACION MEDIA
• Para serie de Datos se Puede definir como la
media aritmética de las desviaciones de cada
uno de los valores con respecto a la media
aritmética de la distribución, y de indica así:

DM 
 x x
N
Para encontrar la desviación media , se tiene que
calcular primero la media aritmética
DESVIACION TIPICA
La Desviación Típica : Es una medida de la magnitud en que se
desvían las diversas puntuaciones obtenidas de su valor medio. Si
las puntuaciones se agrupan estrechamente en torno a la media, la
DT será relativamente pequeña; si se extienden en todas
direcciones, la DT será relativamente grande.
La desviación típica para serie de datos:

( X i  X ) 2

n
Usos de la desviación típica
La desviación típica se utiliza generalmente para
completar los indicadores de tendencia central
como la media o la mediana.
• El objetivo es ver si los valores de un conjunto
de datos están más o menos reagrupados
alrededor de la medida de tendencia central.
A mayor dispersión, mayor valor tomará la
desviación típica.
COEFlClENTE DE VARlAClON
• Es una medida de variabilidad relativa, se expresa en
porcentaje, por lo tanto permite la comparación entre
variables medidas en unidades diferentes, por ej. Peso
y altura, o cuando tratándose de la misma unidad de
medida las medias son muy distintas. Cuanto más
próximo a cero sea el valor del CV, será menor la
variabilidad del grupo respecto a la Media es decir mas
confiable su media aritmética. Es el cociente entre el
Desvío Standard y la Media multiplicado por 100:

𝜎
C.V = 100%
𝑋
Grados de representatividad de la
media aritmética para el C.V

VALOR DEL COEFICIENTE DE GRADO EN QUE LA MEDIA REPRESENTA


VARIABILIDAD LOS DATOS
DE 0 A MENOS DE 10% La MEDIA es ALTAMENTE
REPRESENTATIVA
DE 10 A MENOS DE 20% La MEDIA es BASTANTE
REPRESENTATIVA
DE 20 A MENOS DE 30 % La MEDIA TIENE REPRESENTATIVIDAD
DE 30 A MENOS DE 40% La MEDIA tiene REPRESENTATIVIDAD
DUDOSA
DE 40% O MAS MEDIA es CARENTE DE
REPRESENTATIVIDAD
MEDIDAS DE DISPERSION PARA
DATOS AGRUPADOS :
• A) Datos agrupados en frecuencia
• B) Datos agrupados en tablas de
distribución de frecuencias
Desviación media para datos
agrupados en frecuencia
• Para Datos agrupados en frecuencia y en
tabla de distribución se tiene que :

fi X i  X
DM 
N
DESVIACION TIPICA PARA DATOS
AGRUPADOS
• PARA DATOS AGRUPADOS EN DISTRIBUCIONES
DE FRECUENCIAS

fi ( X i  X )2 𝑋 2 𝑖 𝑓𝑖
 𝜎= σ − 𝑋ത 2
N 𝑁
DESVIACION TIPICA PARA DATOS AGRUPADOS
EN TABLAS DE DISTRIBUCION
• METODO SIMPLE O ESTANDAR

fi ( Pm  X ) 2

N
• Primer METODOS ABREVIADO Desviaciones
de media :
fi d  fi d i 
2 2

   i

N  N 
Segundo Método Abreviado

fi d i  fi d i 
2 2

  ic x  
N  N 
METODO alternativos: método abreviado
de media aritmética

fi pm  fi pmi 


2 2

  i
 
N  N 
Método alternativo

fi pm 2
   X 
i 2

N
Ejercicio para resolver por el alumno :

intervalos
Fi pm
li ls lri lrs
Ejercicio para resolver por el alumno : encuentre
las medidas de dispersión vistas en clase (
utilice todos los métodos)

intervalos
Fi pm
li ls lri lrs

150 154 8
155 159 4
160 164 8
165 169 7
170 174 2
175 179 9
total 38
DESVIACION SEMI INTERCUARTILICA
ES LA DISTANCIA ENTRE EL PRIMER Y TERCER CUARTIL DE
UN GRUPO DE DASTOS ORDENADOS O DATOS AGRUPADOS,
SE CALCULA DE LA SIGUIENTE MANERA:
• Q = ( Q3 – Q1)/2
aproximadamente se pude encontrar los cuartiles
• Q1 = Md – Q
• Q3 = Md + Q
• A Mayor dispersión mayor la distancia intercuartilica y
viceversa. Se usa cuando se presentan intervalos
abiertos.
Calculo de la varianza en Tablas de
Distribución
La VARIANZA V(x) =σ2 : Es la media aritmética de la suma de los
cuadrados de las desviaciones de una variable con respecto a su
media. Por tanto, cuanto mayor sea esta medida, menos
representativa de la realidad será la media de dicha variable o
simplemente es elevar la desviación típica al cuadrado.

fi ( pm  X ) 2
 2

N
fi pm  fi pmi 
2 2

 2
 i

N  N 
Propiedades de la varianza
Propiedades de la media
• 𝑀 𝑋+𝐾 =𝑀 𝑋 +𝐾
• M(K) = K
• M(KX) = K M(X)
• M(KX + K) = M(kX) + K

DONDE K = CONSTANTE Y M= MEDIA


Ejemplos de aplicación
• El gobierno de El salvador ha mantenido en las
Instituciones del Nivel central un promedio de $ 600.0,
el ministerio le ha establecido una desviación típica de
$60. El presidente ha decidido presentarle al concejo de
ministro que analicen lo siguiente :
• A) Si se hace un aumento en $ 60.00 que sucede con la
media aritmética y la varianza
• B) Si el gobierno ha establecido que por la inflación se
aumentara un 15% al salario promedio que sucedería con la
media y la desviación típica (tome como 1.15)
• C) Si el Presidente decide realizar los aumentos anteriores
que sucedería?
EJERCICIO
• CON UNA DESVIACION TIPICA DE $80.00 ¿Qué
SUCEDE CON LA VARIANZA SI LOS SALARIOS :
• A) SE AUMENTAN EN $ 40.00
• B) SE AUMENTAN EN UN %25
COEFICIENTE DE VARIACION
• Es una medida de variabilidad relativa, se expresa en
porcentaje, por lo tanto permite la comparación entre
variables medidas en unidades diferentes, por ej. Peso
y altura, o cuando tratándose de la misma unidad de
medida las medias son muy distintas. Cuanto más
próximo a cero sea el valor del CV, será menor la
variabilidad del grupo respecto a la Media es decir mas
confiable su media aritmética. Es el cociente entre el
Desvío Standard y la Media multiplicado por 100:

𝜎
C.V = 100%
𝑋
Grados de representatividad de la
media aritmética para el C.V
VALOR DEL COEFICIENTE DE GRADO EN QUE LA MEDIA REPRESENTA
VARIABILIDAD LOS DATOS
DE 0 A MENOS DE 10% MEDIA ALTAMENTE REPRESENTATIVA
DE 10 A MENOS DE 20% MEDIA BASTANTE REPRESENTATIVA
DE 20 A MENOS DE 30 % MEDIA TIENE REPRESENTATIVIDAD
DE 30 A MENOS DE 40% MEDIA CUYA REPRESENTATIVIDAD ES
DUDOSA
DE 40% O MAS MEDIA CARENTE DE
REPRESENTATIVIDAD
Ejemplo : encuentre el grado de
representatividad de la media
Intervalos fi
60 – 74 8
75 – 89 10
90 – 104 16
105 -119 9
120 - 134 7
50
EJERCICIO
• La defensoría del consumidor en una encuesta de
calidad del producto AAAAA de las empresas
pollo xxxxxxx, y pollo YYYYYY , se encontró la
siguiente calidad de dicho producto, medido en
cantidad de carne utilizada en ella.
• ¿ Si usted tuviera necesidad de comprar el
producto, con que compañía haría la compra,
asumiendo que el precio es igual en ambas
empresas?
Cantidad de gramos encontrados en la pechurricas
de 10 restaurantes
Grs en pollo Grs en pollo
campestre campero
3.6 1.9
3.8 2.1
3.9 3.5
4.0 6.8
4.1 4.2
4.2 4.8
4.5 5.6
4.6 5.9
4.7 7.7
En relación con el aprovechamiento de tres secciones
de estadística de la facultad de economía , se obtiene
información siguiente

Descripción Sección 01 Sección 02 Sección 03


N° de estudiantes 50 60 55
Calificación 8 8.5 7.5
media
Desviación típica 1.2 1.8 2.0
Calific. Mayor 9.5 9.0 8.4
Calific. mener 6.5 6.2 4.6

Se pregunta :
a)Cual es el rango de la Sección de Estadística
01
b)Cual es la sección que presenta la mayor
dispersión absoluta
c) Cuela la sección que tiene media aritmética
mas representativa
d) Que sección cree que usted es la mas
aplicada y por que ?
MEDIDAS DE FORMA
Son indicadores estadísticos que
permiten identificar si una distribución de
frecuencia presenta uniformidad
EL COEFICIENTE DE ASIMETRIA DE PERSON PARA
LOS DATOS AGRUPADOS: a) EN TABLAS DE
DISTRIBUCION DE FRECUENCIAS

3 𝑋ത − 𝑀𝑒
𝐴𝑆𝑃 =
𝑆
< >Si el valor del coeficiente de asimetría es mayor que cero entonces la
distribución presenta una asimetría positiva.
< >Si el valor del coeficiente de asimetría es menor que cero entonces la
distribución presenta una asimetría negativa.
< >Si el valor del coeficiente de asimetría es igual a cero entonces la distribución
es simétrica.
< >El coeficiente varía entre [-3,3] aunque valores fuera de [-1,1] se consideran
excepcionales
El coeficiente de asimetría de Fisher CAF

Si CAF<0: la distribución tiene una asimetría negativa y se


alarga a valores menores que la media.
Si CAF=0: la distribución es simétrica.
Si CAF>0: la distribución tiene una asimetría positiva y se
alarga a valores mayores que la media.
TIPOS DE ASIMETRIA
-Asimetría
MEDIDAS DE FORMA: Coeficientes -Kurtosis o Apuntamiento

Además de la posición y la dispersión de los datos, otra medida de interés en una distribución de frecuencias
es la simetría y el apuntamiento o kurtosis de fisher

 (x
i 1
i  x)3 Si CA=0 si la distribución es simétrica alrededor de la media.
Si CA<0 si la distribución es asimétrica a la izquierda
Coeficiente de Asimetría CA  Si CA>0 si la distribución es asimétrica a la derecha
n  s3

 ( xi  x ) 4
- Si CAp=0 la distribución se dice normal (similar
a la distribución normal de Gauss) y recibe el
i 1
Coeficiente de Apuntamiento CAp  nombre de mesocúrtica.
n  s4 - Si CAp>0, la distribución es más puntiaguda que
la anterior y se llama leptocúrtica, (mayor
concentración de los datos en torno a la media).
- Si CAp<0 la distribución es más plana y se
llama platicúrtica.

35
COEFICIENTE DE CURTOSIS DE FISHER
Encuentre el Coeficiente de curtosis de Fisher para datos
agrupados en tabla de distribución y establezca el tipo de
curtosis: Estas medidas indican el grado de apuntamiento
o achatamiento del gráfico correspondiente a una
distribución de frecuencias
σ 𝒑𝒎 − 𝑿ഥ 𝟒 𝒙 𝑭𝒊
𝖌𝟐 = 𝒏
𝑺𝟒
a) Si el valor del coeficiente de curtosis es mayor que tres
entonces la distribución es leptocúrtica.
b) Si el valor del coeficiente de curtosis es menor que tres
entonces la distribución es platicúrtica.
c) Si el valor del coeficiente de curtosis es igual a tres
entonces la distribución es mesocúrtica
Otra formula para el calcularlo

g2 
 (x i  X ) 4
ni
3
4
ns

Si g2 > 0 la distribución será leptocúrtica o apuntada


Si g2 = 0 la distribución será mesocúrtica o normal
Si g2 < 0 la distribución será platicúrtica o menos
apuntada que lo normal.
INTRODUCCION A
REGRESION : TIPOS DE
REGRESION
regresión lineal simple
La regresión lineal simple se basa en estudiar los cambios en una
variable, no aleatoria, afectan a una variable aleatoria, en el
caso de existir una relación funcional entre ambas variables que
puede ser establecida por una expresión lineal, es decir, su
representación gráfica es una línea recta. Es decir, se esta en
presencia de una regresión lineal simple cuando una variable
independiente ejerce influencia sobre otra variable
dependiente.
REGRESION LINEAL SIMPLE
MODELO ESTIMADO

yˆ  a  bx

DATOS
ESTIMADORES : MINIMOS CUADRADOS

x y a  y  bx
x(1) y( 1 ) n n n
x( 2 ) y( 2 ) n  xy   xi  y i
  b i 1 i 1 i 1
2
x(n ) y( n ) n
  n
n  x    xi 
2

i 1  i 1 

40
Los siguientes datos han sido tomado de la defensoría del consumidor , en
donde se refieren a la demanda de un producto (en miles de unidades) y su
precio (en centavos de dólares) en cinco supermercados diferentes:
Ajuste una función potencial y úsela para estimar la demanda cuando el precio del
producto es de 0,8 centavos.

Precio Demanda
N X y
1 0,02 32
2 0,06 25
3 0,10 12
4 0,11 38
5 0,14 6
Total 41
Ejercicio : Los siguientes datos se refieren al tiempo de
secado de un cierto barniz y a la cantidad de aditivo añadido
para reducir el tiempo de secado: cuando será el tiempo de
secado para nueve gramos
Cantidad de Tiempo de
aditivo agregado secado
(g) (horas)
X y
0 12.0
1 10.5
2 10.0
3 8.0
4 7.0
5 8.0
6 7.5
7 8.5
8 9.0
42
Precio X Demanda y XY X2

20 22 440 400

16 41 656 256

10 120 1200 100

11 89 979 121

14 56 784 196

71 328 4059 1073

43
Cantidad de aditivo Tiempo de secado
agregado (g) (horas)

x y xy X2
0 12.0 0 0
1 10.5 10.5 1
2 10.0 20 4
3 8.0 24 9
4 7.0 28 16
5 8.0 40 25
6 7.5 45 36
7 8.5 59.5 49
8 9.0 72 64
36 81 299 204

44

Vous aimerez peut-être aussi