Vous êtes sur la page 1sur 92

INTRODUCCIN A LA ESTADSTICA MSc IH, Ps.

Pablo Prez Daz


DESCRIPTIVA
QU ES LA ESTADSTICA DESCRIPTIVA?
Se preocupa de describir las caractersticas de un grupo dado (muestra)
No pretende analizar la relacin entre las variables
No pretende obtener anlisis o conclusiones a partir de los datos
Se fundamenta en el uso de las frecuencias, medidas de tendencia central, posicin y
dispersin
Recurre tambin usualmente a las representaciones grficas como una forma de
representar las caractersticas de la poblacin en estudio.
QU ES UNA VARIABLE EN ESTADSTICA?
Una variable describe una caracterstica o atributo de la poblacin de estudio
Se pueden identificar varios tipos de variables
Una forma de categorizarlas es en cuantitativas (escala o intervalo) y cualitativas
(norminal u ordinal)
En relacin a las variables cuantitativas, estas tambin se pueden subdividir en
continuas y discretas.
Por variable continua se entiende una variable que puede tomar cualquier valor
entre dos puntos (e.g. 1,777788885555, mientras que la discreta est limitada por
la unidad de referencia.
EJEMPLOS DE TIPOS DE VARIABLES
Continua: La temperatura en grados Celsius
Continua: Las calificaciones de un curso
Continua: El peso de una persona (cuando pensamos en kilos y gramos al mismo
tiempo)
Discreta: Nmero de piernas que tiene la persona
Discreta: Nmero de alumnos que tengo en la clase
Discreta: Nmero de computadores en el laboratorio Uach
REPRESENTACIONES GRFICAS DE LAS VARIABLES
Un grfico consta de dos ejes:

Eje X: Eje de las abscisas (comnmente conocida como la variable independiente)


Eje Y: Eje de las ordenadas (comnmente conocida como la variable dependiente)

Tal que Y = F(X)

Un eje de coordenadas cuenta con cuatro cuadrantes que ordenaremos desde


izquierda a derecha partiendo por la zona superior, hasta llegar a la zona inferior
derecha
TIPOS DE GRFICOS
Histograma
De barras
De polgono de frecuencia
De lneas (Temporales por ejemplo)
De sectores, torta, pastel, (pie chart)
De dispersin
De reas
De caja
De tallo y hoja (Stemplots)
DIFERENCIA ENTRE POBLACIN Y MUESTRA
Poblacin: Representa a la totalidad de personas que queremos estudiar.
Muestra: Representa una fraccin de la poblacin que queremos estudiar y que
seleccionaremos, ya sea de forma representativa o no de acuerdo a los objetivos y
alcances de nuestra investigacin
Ejemplos de poblaciones: Estudiantes de la Universidad Austral de Chile, de la cual
extraeremos una muestra intencionada (no necesariamente representativa) de los
estudiantes de la escuela de Psicologa que cursan primer ao.
DISTRIBUCIONES DE FRECUENCIAS
Permiten agrupar los datos en categoras, lo que tambin se conoce como frecuencia
de clase. Es el patrn de variacin que presentan las observaciones de una
variable cuantitativa.
Podemos distinguir bsicamente tres tipos de frecuencia:

1) La absoluta: (la cantidad para cada clase)


2) La relativa: (% de la clase)
3) La acumulada: (la frecuencia total de todos los valores menores que el lmite
real).
DISTRIBUCIONES DE FRECUENCIAS
- Se puede identificar el patrn general de la distribucin a travs de su:
FORMA, CENTRO y AMPLITUD.
- Un aspecto importante para poder entender como se distribuyen las observaciones
de una variable y poder por ende, identificar a aquello que se aleja de lo
esperable es el concepto de OUTLIER (Valor errtico, anmalo). Un Outlier es una
observacin que se aleja significativamente del resto de las observaciones.
DISTRIBUCIONES DE FRECUENCIAS
DISTRIBUCIONES DE FRECUENCIAS
LA DISTRIBUCIN NORMAL
EJEMPLOS DE TIPOS DE GRFICOS
Histograma:
EJEMPLOS DE TIPOS DE GRFICOS
Polgono
de frecuencias:
EJEMPLOS DE TIPOS DE GRFICOS
Grfico de barras:
EJEMPLOS DE TIPOS DE GRFICOS
Grfico
de sectores
(pie chart):
EJEMPLOS DE TIPOS DE GRFICOS
Grficos
de dispersin:
EJEMPLOS DE TIPOS DE GRFICOS
Grficos
de lneas:
EJEMPLOS DE TIPOS DE GRFICOS
Grfico
de caja:
GRFICO DE TALLO Y HOJA
2 2 5
3 4 5
4 1 1 6 6 7 9
5 4 4 9
6 0
Nmero de home runs que anot Babe Ruth en cada uno de los aos desde 1920 a 1934
EJEMPLOS DE TIPOS DE GRFICOS
Grfico de reas:
CMO ELABORAR UNA TABLA DE FRECUENCIAS
1- Identificar el lmite inferior y el lmite superior del total de observaciones de la
variable de estudio.
2. Dividir el rango en nmero conveniente de intervalos de clase del mismo tamao
(nmero que usualmente oscila entre 5 y 15). Ejemplo: Rango de Home runs de Babe
Ruth = 60-22: 38
3. Determinar el nmero de observaciones que corresponden para cada Intervalo de
clase
OTROS TIPOS DE DISTRIBUCIN O CURVAS DE
FRECUENCIA
- Sesgada (Skewed) a la izquierda (sesgo negativo):
OTROS TIPOS DE DISTRIBUCIN O CURVAS DE
FRECUENCIA
- Sesgada (Skewed) a la derecha (sesgo positivo):
CURTOSIS (KURTOSIS)
- Es un descriptor de la forma de una distribucin, reflejando el grado de
agrupacin de las observaciones o de dispersin que stas tengan, tomando como
referencia la curva normal.
- Tenemos tres tipos de curtosis que se pueden presentar en una distribucin:
1) Leptocrtica (Agrupamiento alto o alargado, donde K>0)
2) Platicrtica (Agrupamiento bajo o achatado, donde K<0)
3) Mesocrtica (Agrupamiento medio, ni tan bajo ni tan alto, que se corresponde a
la curtosis que presenta la distribucin normal por defecto, donde K=0).
CURTOSIS (KURTOSIS)
OTROS TIPOS DE DISTRIBUCIN O CURVAS DE
FRECUENCIA
Bimodal:
OTROS TIPOS DE DISTRIBUCIN O CURVAS DE
FRECUENCIA
Multimodal:
TABLAS DE FRECUENCIAS
Si establecemos un anlisis ms detallado de los tipos de frecuencias, podemos dividir
a estas de acuerdo a :

1) Su representacin: ABSOLUTA/RELATIVA
2) Su ligazn con la frecuencia de los otras observaciones: SIMPLE/ACUMULADA
3) Su complejidad en relacin con el tamao muestral:
DATOS NO AGRUPADOS/DATOS AGRUPADOS (por intervalo de clase)
TABLAS DE FRECUENCIAS
1) Frecuencia absoluta simple : ni
2) Frecuencia absoluta acumulada: Ni
3) Frecuencia relativa simple: fi
4) Frecuencia relativa acumulada: Fi

* Entenderemos de aqu en adelante que en trminos formales por Xi


estaremos considerando a una observacin de la base de datos.
TABLAS DE FRECUENCIAS
Frecuencia absoluta simple (ni): Nmero de veces que se repite un valor o intervalo de
clase en nuestra muestra
TABLAS DE FRECUENCIAS
Frecuencia absoluta acumulada (Ni): Es la suma de las frecuencias absolutas al valor
considerado.
TABLAS DE FRECUENCIAS
Frecuencia relativa simple (fi) : Resultado de la divisin entre la frecuencia absoluta del
valor o intervalo de clase y el nmero total de observaciones de la muestra. Puede
representarse porcentualmente.
TABLAS DE FRECUENCIAS
Frecuencia relativa acumulada (Fi): Es la divisin entre la frecuencia absoluta acumulada
del valor o intervalo de clase y el nmero total de observaciones de la muestra. Puede
representarse porcentualmente.
TABLAS DE FRECUENCIAS
1 Valor ni NI fi Fi
1 1 3 3 0,3 0,3
1 2 2 5 0,2 0,5
2 3 1 6 0,1 0,6
2 4 1 7 0,1 0,7
3 5 3 10 0,3 1
4 Total 10 1
5
5 1Lograr el objetivo
Resguardar la
5 2 tica Ms del 60% de la
3Sistematizar el proceso muestra prefiere lograr el
4Ninguna de las anteriores objetivo o bien intentar
Todas las cumplir con todas las
5 anteriores condiciones
TABLAS DE FRECUENCIAS
Nmero de HomeRuns ni NI fi fi% Fi Fi%
22 1 1 0,0714 7,14 0,07 7
25 1 2 0,0714 7,14 0,14 14
34 1 3 0,0714 7,14 0,21 21
35 1 4 0,0714 7,14 0,28 28
41 2 6 0,1429 14,29 0,43 43
46 2 8 0,1429 14,29 0,57 57
47 1 9 0,0714 7,14 0,64 64
49 1 10 0,0714 7,14 0,71 71
54 2 12 0,1429 14,29 0,86 86
59 1 13 0,0714 7,14 0,93 93
60 1 14 0,0714 7,14 1,00 100
Total 14 1,00 99,99
TABLAS DE FRECUENCIAS

Puntuaciones de estrs ni NI fi fi% Fi Fi%


10-11,9 14 14 0,09 9 0,09 9
8-9,9 41 55 0,27 27 0,36 36
6-7,9 44 99 0,29 29 0,66 66
4-5,9 34 133 0,23 23 0,88 88
2-3,9 15 148 0,10 10 0,98 98
0-1,9 3 151 0,02 100 1,00 100
Total 151 1,00
TABLAS DE FRECUENCIAS
TABLAS DE FRECUENCIAS (EN SPSS)
nota3
Vlidos Frecuencia Porcentaje Porcentaje vlido Porcentaje acumulado
2,00 1 ,9 ,9 ,9
3,00 1 ,9 ,9 1,9 Tip: En SPSS, Vlidos
3,50 4 3,7 3,7 5,6 representa a las observaciones,
Frecuencia a ni, Porcentaje
4,50 20 18,5 18,5 24,1
a frecuencia relativa simple y
4,70 9 8,3 8,3 32,4 Porcentaje acumulado a
5,00 47 43,5 43,5 75,9 frecuencia relativa acumulada.
5,20 12 11,1 11,1 87,0
5,30 12 11,1 11,1 98,1
7,00 2 1,9 1,9 100,0
Total 108 100,0 100,0
TABLAS DE FRECUENCIAS (EN PSPP)

Tip: dem que en SPSS, con la


nica diferencia que en vez de
hablar de Vlidos, PSPP
plantea como Valores a las
observaciones de la muestra.
ELABORACIN DE REPRESENTACIONES GRFICAS
Recordemos:
- Histograma
- De barras
- De polgono de frecuencia
- De lneas (Temporales por ejemplo)
- De sectores, torta, pastel, (pie chart)
- De dispersin
- De reas
- De caja
- De tallo y hoja (Stemplots)
ELABORACIN DE REPRESENTACIONES GRFICAS
Reglas generales:

1) Debe corresponder a las variables de estudio


2) Debe ser auto-explicativo. En caso de que un grfico no sea comprensible, es
probable que su construccin haya sido deficiente
3) Debe incluir siempre ttulo y una descripcin simple de las variables de estudio
4) Debe ser fiel al objetivo para el cual es diseado. Ej: describir, comparar, reflejar
la diferencia de un valor o categora por sobre otro (s).
5) Debe adecuarse a las normas de grficos establecidas por la APA
EN EXCEL
1) Seleccionar los datos que van a utilizar y que corresponde a la base de datos y
la frecuencia absoluta simple
2) Seleccionar la etiqueta Insertar, luego ir a grficos o grficos recomendados
dentro de esta misma etiqueta.
3) En grficos recomendados, Excel interpretar el tipo de variables con las que
estamos trabajando y nos recomendar opciones grficos que sean adecuadas para
estas variables.
EN EXCEL
4) En base a nuestros objetivos de investigacin seleccionaremos aquel que nos
permita representar ms claramente las caractersticas de la muestra estudiada.
5) Iremos haciendo todos los cambios que consideramos que le brinden mayor
claridad a nuestra representacin grfica (Ej: Ttulo, leyenda, Color, Porcentaje, Lmite
inferior y superior de la variable, Valores como variable discreta o continua, Diseo)
6) En Excel contamos con diversas opciones grficas que nos permitirn modificar
nuestra representacin a un nivel bastante avanzado.
EN SPSS
Tenemos tres opciones desde SPSS,
Comenzar a construirlo desde la etiqueta ANALIZAR o bien desde la etiqueta
GRFICOS
1) En ANALIZAR, luego iremos a ESTADSTICOS DESCRIPTIVOS, FRECUENCIAS,
seleccionaremos las variables de estudio y luego iremos seleccionaremos GRFICOS,
dese este men SPSS nos ofrece la posibilidad de elaborar grficos de BARRA, DE
SECTORES E HISTOGRAMA, ofrecindonos la posibilidad de que los valores del
grficos estn expresados como Frecuencias o como Porcentajes.
EN SPSS
2) En GRFICOS, tenemos dos opciones nuevamente. La primera es Generador de
grficos y la segunda es cuadro de dilogos antiguo.
Si seguimos la primera opcin, nos aparece la primera advertencia antes de generar
los grficos:

Antes de utilizar este cuadro de dilogo, debe establecer correctamente el nivel de medida de cada
una de las variables del grfico. Adems, si el grfico contiene variables categricas, deber definir
las etiquetas de valor correspondientes a cada categora.

Pulse Aceptar para definir el grfico.

Pulse Definir propiedades de variables para establecer el nivel de medida o definir las etiquetas de
valor de las variables del grfico.
EN SPSS
3) En ANALIZAR, luego iremos a ESTADSTICOS DESCRIPTIVOS, EXPLORAR,
seleccionaremos las variables de criterio (dependientes), la (s) independientes en
factores y luego iremos seleccionaremos GRFICOS, dese este men SPSS nos ofrece
la posibilidad de elaborar grficos de CAJA, DE TALLO Y HOJAS E HISTOGRAMAS,
pudiendo ejecutar los grficos con pruebas de normalidad (Kolmogorov-Smirnov o
Shapiro-Wilks) y/o pruebas de homogeneidad de las varianzas (homocedasticidad).
Cabe destacar que en la etiqueta Estadsticos, podemos seleccionar el intervalo de
confianza que vamos a utilizar en nuestra investigacin, adems de poder obtener
estimadores robustos centrales, valores atpicos y percentiles. Se recomienda obtener
en la visualizacin tanto Estadsticos como grficos (ambos).
EN SPSS
La diferencia entre ambas opciones, est dada principalmente
porque en la segunda tenemos que escoger a priori el tipo
de grfico que utilizaremos, mientras que en la primera
seleccionamos las variables y luego el tipo de grficos que
queremos utilizar, habiendo variantes de los distintos tipos de
grficos de barras, de dispersin, histogramas, de caja, etc.
La tercera opcin representa una primera aproximacin hacia
la estadstica inferencial ya que por primera vez se definen
las variables como dependientes o independientes.
EN PSPP
Ac tenemos solo dos opciones:
1) Al igual que en SPSS, vamos a ANALIZAR, luego iremos a ESTADSTICA
DESCRIPTIVA, FRECUENCIAS, seleccionamos las variables de estudio y luego iremos a
GRFICAS. Desde este men, tambin tendremos tres opciones grficas: BARRAS, DE
SECTORES E HISTOGRAMA, ofrecindonos la posibilidad de que los valores del
grficos estn expresados como Frecuencias o como Porcentajes, adems de poder
seleccionar los valores mnimos, mximos y de poder tomar una decisin en relacin a
los valores perdidos.
EN PSPP
2) La segunda opcin en PSPP tiene que ver con la posibilidad de elaboracin de
sintaxis grficas. Esto implica que elaboraremos un comando a travs del cual
nuestro grfico se crear.
Para esto debemos seguir los siguientes pasos: ARCHIVO, NUEVO, SINTAXIS,
introducimos la sintaxis y luego seleccionamos EJECUTAR. Esta opcin tambin est
presente en SPSS y recibe el mismo nombre: SINTAXIS.
EXAMINE
/VARIABLES= (Colocar el nombre de la variable)
/PLOT = (Colocar el tipo de grfico deseado con maysculas de acuerdo a su
nombre en ingls)
MEDIDAS DESCRIPTIVAS
- MEDIDAS DE TENDENCIA CENTRAL O CENTRALIZACIN
- MEDIDAS DE POSICIN O CUANTILES
- MEDIDAS DE DISPERSIN
- MEDIDAS DE FORMA
- MEDIDAS DE CONCENTRACIN
MEDIDAS DE TENDENCIA CENTRAL
- PROMEDIO O MEDIA
(ARITMTICA, ARMNICA, GEOMTRICA, CUADRTICA)
- MEDIANA
- MODA
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO O MEDIA ARITMTICA
Se obtiene mediante:
Datos no agrupados

Datos agrupados

Donde Xm ser la marca Marca de clase: promedio


de clase del intervalo de entre el lmite superior y el
clase y ni la frecuencia lmite inferior del intervalo
absoluta simple de este. de clase.
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO O MEDIA ARITMTICA
Ventajas:
- Es la medida de tendencia central ms utilizada
- Es de fcil comprensin
Desventajas:
- Suele verse fcilmente influida o sesgada en su interpretacin por los valores
extremos
- Puede carecer de utilizar para variables categricas/cualitativas
MEDIDAS DE TENDENCIA CENTRAL
Nicanor Parra (2013):

Hay dos panes. Usted se come dos. Yo ninguno.


Consumo promedio: un pan por persona.
MEDIDAS DE TENDENCIA CENTRAL
Marca de clase: promedio aritmtico entre el lmite
superior y el lmite inferior del intervalo de clase.
PROMEDIO O MEDIA ARMNICA
Se obtiene mediante:
Datos no agrupados Datos agrupados

Donde y ser la marca de clase de cada


intervalo de clase y ni (fi) la frecuencia absoluta
simple de este. Recordemos que la (sumatoria)
de ni es igual a N.
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO O MEDIA ARMNICA
Ventaja:
- Presenta menor grado de sesgo o influencia por valores muy altos de la escala
- Puede arrojar mayor grado de representatividad que la media aritmtica
Desventaja:
- Es ms sensible que la media aritmtica a la presencia de valores muy pequeos en
comparacin con el resto de las observaciones.
MEDIDAS DE TENDENCIA CENTRAL
Marca de clase: promedio aritmtico entre el
lmite superior y el lmite inferior del intervalo
PROMEDIO O MEDIA GEOMTRICA de clase.
Se obtiene mediante:
Datos no agrupados Datos agrupados

Donde y ser la marca de clase de cada


intervalo de clase y ni (fi) la frecuencia absoluta
simple de este. Recordemos que la de ni es
igual a N.
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO O MEDIA GEOMTRICA
Ventajas:
- Presenta menor grado de sesgo o influencia a los valores extremos que la media
aritmtica
- Es til en Economa, debido a que por su estructura, permite evaluar mejor la
temporalidad.
Desventajas:
- Necesita valores positivos, mayores a 0 para ser ejecutada
- Es de difcil clculo y comprensin
MEDIDAS DE TENDENCIA CENTRAL
REGLA ENTRE LAS MEDIAS O PROMEDIOS:
Siempre la media aritmtica ser mayor o igual que la media armnica y esta a su
vez ser mayor o igual que la geomtrica. Esto queda expresado de la siguiente
forma:

H Hg X
MEDIDAS DE TENDENCIA CENTRAL
Li-1: Lmite inferior del Intervalo donde se encuentra la mediana
Ni-1: Ni (Frecuencia absoluta acumulada) del intervalo de clase
MEDIANA anterior al de la mediana.
ai: Amplitud del intervalo de la mediana
Datos no agrupados
Datos agrupados

Primero debemos saber el resultado de la frmula (N/2) para


luego ubicar este valor en la tabla de frecuencias absolutas (Ni)
en el intervalo que se aproxime a su valor superior (En resumen:
Ni > N/2)
MEDIDAS DE TENDENCIA CENTRAL
MODA
Se obtiene mediante:
1) El valor ms frecuente de las observaciones cuando son datos no agrupados,
pudiendo haber 1 o ms modas (recuerden que puede ser unimodal, bimodal o
multimodal)
2) Para datos agrupados, buscaremos primero el intervalo modal (aquel que tenga
la mayor frecuencia absoluta) y luego se calcula de la siguiente forma:
Donde fi ser la frecuencia
absoluta simple (ni) del intervalo.
Recordemos que ai es la amplitud de
este. Fi+1 corresponde al valor de la
ni que toma el intervalo que sigue
MEDIDAS DE POSICIN (CUANTILES)
Cuantiles: Son valores que toma la variable y que permiten dividirla con el fin de
ordenarla de menor a mayor en relacin a las frecuencias de la distribucin. Reciben
como nomenclatura la letra q para identificarlos. Hay 4 tipos de cuantiles:

- PERCENTIL (P)
- CUARTIL (Q)
- DECIL (D)
- QUINTIL (K)
MEDIDAS DE POSICIN (CUANTILES)
- PERCENTIL (P): Dividen a la distribucin en 100 partes iguales. No se recomienda
para distribuciones con observaciones pequeas (inferiores a 100). P1 a P99
- CUARTIL (Q): Dividen a la distribucin en cuatro grupos iguales, cada uno
abarcando un 25% de ella. Q1(25%), Q2(50% = p50 = Me), Q3(75%).
- DECIL (D): Dividen a la distribucin en grupos iguales, abarcando un 10% de la
distribucin cada uno de ellos. D1, D2, D3, D4, D5 (50% = p50 = Me), D6 D10.
- QUINTIL (K): Dividen a la distribucin en cinco grupos iguales, cada uno de ellos
abarcando un 20% de ella. K1(p20), K2(p40), K3(p60), K4(p80).
MEDIDAS DE POSICIN (CUANTILES)
Clculo de cuartiles:
Q1: N*0.25 (1/4*N) Q2: N*0.50 (1/2*N) Q3: N*0.75 (3/4*N)
Clculo de Deciles: Depende del decil.
D1: N*0.1(1/10N) D2: N*0.2(2/10N) D3:N*0.3 (3/10N)
D4:N*0.4(4/10N) D5:N*0.5(5/10N)
Clculo de percentiles: Depende del percentil.
P1: N*0.01 P5: N*0.05 P45: N*0.45 P83: N*0.83 P98: N*0.98
Clculo de quintiles: Depende del quintil.
K1: N*0,20 K2: N*0,40 K3: N*0,60 K4: N*0.80
MEDIDAS DE POSICIN (CUANTILES)
En todos los casos lo que tenemos que buscar es el Ni que el clculo del cuartil,
decil, quintil o percentil que busquemos. Ejemplo: Bsqueda de Q1, D2 y P55

Nmero de HomeRuns ni NI Q1:14*0.25: 3,5. Luego el valor de NI que contiene a 3,5 es 4


22 1 1 que equivale al valor 35 homeruns de la variable criterio. Ac
25 1 2
est el primer cuartil.
34 1 3
35 1 4 D2:14*0.20: 2,8. Luego el valor de NI que contiene a 2,8 es 3
41 2 6 que equivale al valor 34 homeruns de la variable criterio. Ac
46 2 8
est el decil 2.
47 1 9
49 1 10 P55:14*0.55: 7,7. Luego el valor de NI que contiene a 7,7 es 8
54 2 12
que equivale al valor 46 homeruns de la variable criterio. Ac
59 1 13
est el percentil 55.
60 1 14
MEDIDAS DE POSICIN (CUANTILES)
En caso de que el valor que obtengamos de nuestro clculo de cuartil, decil, percentil
o quintil coincida con el valor que toma la Ni, entonces lo que haremos es obtener el
promedio entre el valor que toma la variable para esa Ni y el valor que toma para
Ni+1, es decir, el valor (xi) que toma la siguiente frecuencia. Esto lo haremos de
igual forma que lo hacemos cuando encontramos el mismo valor repetido al centro
de nuestra distribucin en la mediana para datos no agrupados. Recordemos:
MEDIDAS DE POSICIN (CUANTILES)
En bases de datos agrupados, haremos algo parecido que lo que hicimos con la
mediana para datos agrupados, con la diferencia que cambiaremos el N/2 por la
frmula del cuantil que deseemos calcular. Esto pasa a ser reemplazado por la
Lmite inferior del intervalo de frmula del cuartil, decil, percentil
clase donde se encuentra la que deseemos calcular
Puntuaciones de estrs ni NI medida de posicin que deseemos
calcular Ni
10-11,9 14 14
(frecuencia
8-9,9 41 55 absoluta
acumulada)
6-7,9 44 99 del intervalo
4-5,9 34 133 de clase
Frecuencia absoluta anterior al
2-3,9 15 148 de la medida
simple del intervalo Amplitud del intervalo
0-1,9 3 151 de clase donde se de clase donde se
de posicin
encuentra la que busca
Total 151 medida de posicin
encuentra la medida de
posicin que deseemos
que deseemos calcular
calcular
MEDIDAS DE POSICIN (CUANTILES)
Ejemplo 1: Cuartil 3:
N*0.75 (151*0.75)= 113,25. Con este valor buscamos el intervalo de clase que
contiene al cuartil en Ni, que al ver la tabla de frecuencias identificamos como 4-5,9,
luego si seguimos la frmula:
Q3: 4+ (((113,25-99)/34)*1,9) = 4,80
Ejemplo 2: Decil 4:
N*0,4(151*0,4)=60,4. Con este valor buscamos el intervalo de clase que contiene al
decil en Ni, que al ver la tabla de frecuencias identificamos como 6-7,9, luego si
seguimos la frmula:
D4:6+ (((60,4-55)/44)*1,9) = 6,23
MEDIDAS DE DISPERSIN
- AMPLITUD/RANGO/RECORRIDO (ES LO MISMO)
- DESVIACIN ABSOLUTA RESPECTO AL PROMEDIO
- DESVIACIN ABSOLUTA RESPECTO A LA MEDIANA
- VARIANZA
- DESVIACIN ESTNDAR O TPICA
- RANGO SEMI-INTERCUARTLICO
- COEFICIENTE DE VARIACIN (C.V./) DE PEARSON
- TIPIFICACIN DE VARIABLES (DISTRIBUCIN Z)
MEDIDAS DE DISPERSIN
- AMPLITUD/RANGO/RECORRIDO: ES LA DIFERENCIA ENTRE EL MAYOR Y MENOR
VALOR DE LA SERIE.
2,3,5,6,9,10,18 = (18-2: 16)
- DESVIACIN ABSOLUTA (TOTAL) DE LA MEDIA: SE DEFINE COMO LA
DIFERENCIA ENTRE EL VALOR DE CADA VARIABLE Y EL PROMEDIO, DIVIDIDO POR EL
NMERO TOTAL DE CASOS. REPRESENTA LA DISPERSIN EN TORNO AL
PROMEDIO. Puede obtenerse una desviacin absoluta en torno a otras medidas de
tendencia central como la mediana y la moda. Adems pueden usarse otras medias
y no slo la aritmtica.
MEDIDAS DE DISPERSIN
- VARIANZA: PROMEDIO DE LAS DIFERENCIAS AL CUADRADO DE CADA UNA DE
LAS OBSERVACIONES EN RELACIN A LA MEDIA

-1
MEDIDAS DE DISPERSIN
- DESVIACIN TPICA: RAIZ CUADRADA DE LA VARIANZA O DICHO DE OTRA
FORMA, LA RAIZ CUADRADA DE LA MEDIA DE LAS DIFERENCIAS DE LAS VALORES
QUE TOMA LA VARIABLE AL CUADRADO.
MEDIDAS DE DISPERSIN
Propiedades de la desviacin estndar/tpica:
- Mide la dispersin en relacin a la media y slo debe ser usada cuando esta
medida de tendencia central es utilizada.
- S ser igual a 0, solo cuando no hay desviacin entre las observaciones en lo
absoluto. En otras palabras, cuando las observaciones tienen el mismo valor. A
medida que los valores de las observaciones muestren mayores diferencias, entonces
S ser cada vez mayor tambin.
- S al igual que X, se ve fuertemente afectada por los valores extremos.
Fuente: Moore, D.S. & McCabe, G.P. (2000). Introduction to the practice of statistics
(Third Edition). New York: United States: W.H. Freeman and Company.
MEDIDAS DE DISPERSIN

Mayor dispersin, por tanto S ser mayor

Menor dispersin, por tanto S ser menor

Fuente: Moore, D.S. & McCabe, G.P. (2000). Introduction to the practice of statistics (Third
Edition). New York: United States: W.H. Freeman and Company.
MEDIDAS DE DISPERSIN
- RANGO SEMI-INTERCUARTLICO: SE INTERPRETA DE FORMA SIMILAR A LA
DESVIACIN ESTNDAR, CON LA DIFERENCIA QUE COMO ESTADSTICO SE
ENCUENTRA MENOS SESGADO A LA PRESENCIA DE VALORES EXTREMOS. Nos
permite identificar a los outliers. Regla de 1.5XIQR: Este resultado es restado a Q1
(Q1-1.5IQR) y sumado a Q3 (Q3+1.5IQR), luego obtendremos un rango en el cual
no debera caer ningn valor. Si lo hace, entonces estaremos en presencia de un
outlier y podremos observar estos valores individualmente posicionados fuera de
nuestro grfico de caja.

Rango intercuartlico (IQR)


MEDIDAS DE DISPERSIN
- COEFICIENTE DE VARIACIN: A DIFERENCIA DE LA DESVIACIN ABSOLUTA,
MIDE LA DISPERSIN RELATIVA Y SE EXPRESA POR TANTO EN PORCENTAJE AL
IGUAL QUE LA FRECUENCIA RELATIVA. SI C.V. 50%, ENTONCES LA MEDIA NO ES
UNA MEDIDA REPRESENTATIVA PARA LA DISTRIBUCIN.
MEDIDAS DE DISPERSIN
- TIPIFICACIN DE VARIABLES (Z): PERMITE COMPARAR LA UBICACIN DE UN
SUJETO EN RELACIN CON SU POBLACIN EN RELACIN A UNA MISMA VARIABLE
DE ESTUDIO. PUEDE SERVIRNOS PARA COMPARAR A DOS SUJETOS EN RELACIN A
UNA MISMA VARIABLE DE ESTUDIO.
MEDIDAS DE FORMA
- ASIMETRA O SESGO (TRES MTODOS):
COEFICIENTE DE ASIMETRA DE PEARSON (AP)
COEFICIENTE DE ASIMETRA DE FISHER (1)
COEFICIENTE DE ASIMETRA DE BOWLEY (AB)
- CURTOSIS (K):
COEFICIENTE DE APUNTAMIENTO DE FISHER (2)
MEDIDAS DE FORMA
Reglas entre las formas que toma la distribucin:
1) SIMTRICA: Entonces X = Me = Mo
2) ASIMTRICA A LA DERECHA: Entonces Mo Me X
3) ASIMTRICA A LA IZQUIERDA: Entonces Mo Me X

Asimtrica Asimtrica a
la derecha la izquierda
(+) (-)

Simtrica
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA DE PEARSON (3, AP, As): Nos permitir evaluar el sesgo
solo en distribuciones unimodales, uniformes (forma de campana) y con asimetra
moderada. Si la asimetra es positiva, entonces 3 > 0 ((X-Mo/S)>0) y si la asimetra
es negativa, entonces 3 < 0 ((X-Mo/S)<0). Si la distribucin es simtrica, entonces el
valor ser igual o muy cercano a 0. Evaluar la asimetra siguiendo los principios
bsicos de diferencia entre la Moda y la Media que hemos revisado anteriormente.
Datos no agrupados Datos agrupados
MEDIDAS DE FORMA (DATOS NO AGRUPADOS)
COEFICIENTE DE ASIMETRA DE FISHER (1 o G1): Los usaremos en aquellos casos
donde tengamos distribuciones bimodales, multimodales y/o distribuciones con forma
muy irregular. Es ms preciso que el coeficiente de asimetra de Pearson. Evaluar la
asimetra de forma cbica tomando como bases a la media y la desviacin estndar.
La interpretacin ser la misma que para el coeficiente de asimetra de Pearson.
Frecuencia
Datos no agrupados absoluta Datos agrupados
simple
Tamao
muestral

Promedio

Desviacin Tpica al cubo


Marca de clase
MEDIDAS DE FORMA (DATOS NO AGRUPADOS)
COEFICIENTE DE ASIMETRA DE BOWLY (AB): Se basa en evaluar la diferencia entre
el primer y el tercer cuartil en relacin a la mediana. Es menos utilizado que los
anteriores. La interpretacin ser la misma que para el coeficiente de asimetra de
Pearson y de Fisher.
MEDIDAS DE FORMA (DATOS NO AGRUPADOS)
COEFICIENTE DE APUNTAMIENTO DE FISHER (2 o G2):
Datos no agrupados Datos agrupados
Tamao
muestral

Desviacin Tpica
Si G2 > 0 la distribucin ser leptocrtica o apuntada elevada a la
Si G2 = 0 la distribucin ser mesocrtica o normal cuarta potencia
Si G2 < 0 la distribucin ser platicrtica o menos apuntada que lo normal.
MEDIDAS DE CONCENTRACIN
Nos permite evaluar la equidad en la asignacin de los valores (reparticin) de una
variable de estudio a travs de los elementos/categoras o intervalos de clase que
tenga nuestra variable criterio. Hay una medida ampliamente utilizada para medir
la concentracin que denominamos INDICE O COEFICIENTE DE GINI (G). Su
representacin grfica por excelencia es la CURVA DE LORENZ.
Tambin podremos ver
esta ecuacin graficada
como A/(A-B), en cuanto
A sera la parte de la
curva que se encuentra
sobre la curva de Lorenz
y la B la parte que se
encuentra bajo ella.
MEDIDAS DE CONCENTRACIN
Recuerden:
- Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por
persona (Parra, N. 2013). Esto es un ejemplo de concentracin mxima.
- Un ejemplo de concentracin mnima sera que en el prximo certamen, todos
ustedes obtengan la misma nota. Esto sera un ejemplo de concentracin mnima.
- Esta dicotoma es la base detrs de las medidas de concentracin, donde los
valores de concentracin oscilarn entre 0 (mnima) y 1 (mxima).
MEDIDAS DE CONCENTRACIN

Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
Pi se obtiene mediante la divisin entre (Ni/n) por 100, por ejemplo para el
intervalo de clase (0-50), (23/260) * 100 = 8,85 y para el intervalo de clase (150-
200), (205/260) * 100 = 78,85.
qi se obtiene mediante la divisin entre Ui, que corresponde a la de Un del
intervalo de clase que queremos y la de Xini, para luego ser multiplicado este
valor por 100. Ej1:
qi del intervalo de clase (0-50), (575/38850) * 100 = 1,48
Ej2:
qi del intervalo de clase (150-200), (22500/38850) * 100 = 56,95
Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
Siguiendo la frmula:

Esto indica que en esta muestra hay una baja concentracin, ms bien cercano al
mnimo.

Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN

Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
- Mientras la curva est ms cerca de la diagonal, entonces hablaremos de que la
concentracin se acerca a lo mnimo y su la curva se aleja de la diagonal, entonces
diremos que se acerca a la concentracin mxima.
- Un ndice de Gini por sobre 0,50 indica una alta inequidad en la reparticin
- Es por ello que este indicador es de vital importancia en la Economa, Sociologa,
Salud Pblica y Ciencias polticas.
Saben cul es el nivel de desigualdad de ingresos medido por el coeficiente de
Gini de acuerdo lo que determin el programa de desarrollo de las naciones unidad
(UNDP)?

Chile: Ruanda: Noruega: Hait: Suecia: Etiopa: USA:


0.52 0.51 0.26 0.59 0.25 0.34 0.41
:
MEDIDAS DE
CONCENTRACIN

Prez, P. (2009) The relationship between


anxiety disorders and income inequality in
Santiago, Chile. A secondary analysis of
household survey data. Masters thesis
submitted to the Charit
Universittsmedizin Berlin.

Vous aimerez peut-être aussi