Académique Documents
Professionnel Documents
Culture Documents
1) Su representacin: ABSOLUTA/RELATIVA
2) Su ligazn con la frecuencia de los otras observaciones: SIMPLE/ACUMULADA
3) Su complejidad en relacin con el tamao muestral:
DATOS NO AGRUPADOS/DATOS AGRUPADOS (por intervalo de clase)
TABLAS DE FRECUENCIAS
1) Frecuencia absoluta simple : ni
2) Frecuencia absoluta acumulada: Ni
3) Frecuencia relativa simple: fi
4) Frecuencia relativa acumulada: Fi
Antes de utilizar este cuadro de dilogo, debe establecer correctamente el nivel de medida de cada
una de las variables del grfico. Adems, si el grfico contiene variables categricas, deber definir
las etiquetas de valor correspondientes a cada categora.
Pulse Definir propiedades de variables para establecer el nivel de medida o definir las etiquetas de
valor de las variables del grfico.
EN SPSS
3) En ANALIZAR, luego iremos a ESTADSTICOS DESCRIPTIVOS, EXPLORAR,
seleccionaremos las variables de criterio (dependientes), la (s) independientes en
factores y luego iremos seleccionaremos GRFICOS, dese este men SPSS nos ofrece
la posibilidad de elaborar grficos de CAJA, DE TALLO Y HOJAS E HISTOGRAMAS,
pudiendo ejecutar los grficos con pruebas de normalidad (Kolmogorov-Smirnov o
Shapiro-Wilks) y/o pruebas de homogeneidad de las varianzas (homocedasticidad).
Cabe destacar que en la etiqueta Estadsticos, podemos seleccionar el intervalo de
confianza que vamos a utilizar en nuestra investigacin, adems de poder obtener
estimadores robustos centrales, valores atpicos y percentiles. Se recomienda obtener
en la visualizacin tanto Estadsticos como grficos (ambos).
EN SPSS
La diferencia entre ambas opciones, est dada principalmente
porque en la segunda tenemos que escoger a priori el tipo
de grfico que utilizaremos, mientras que en la primera
seleccionamos las variables y luego el tipo de grficos que
queremos utilizar, habiendo variantes de los distintos tipos de
grficos de barras, de dispersin, histogramas, de caja, etc.
La tercera opcin representa una primera aproximacin hacia
la estadstica inferencial ya que por primera vez se definen
las variables como dependientes o independientes.
EN PSPP
Ac tenemos solo dos opciones:
1) Al igual que en SPSS, vamos a ANALIZAR, luego iremos a ESTADSTICA
DESCRIPTIVA, FRECUENCIAS, seleccionamos las variables de estudio y luego iremos a
GRFICAS. Desde este men, tambin tendremos tres opciones grficas: BARRAS, DE
SECTORES E HISTOGRAMA, ofrecindonos la posibilidad de que los valores del
grficos estn expresados como Frecuencias o como Porcentajes, adems de poder
seleccionar los valores mnimos, mximos y de poder tomar una decisin en relacin a
los valores perdidos.
EN PSPP
2) La segunda opcin en PSPP tiene que ver con la posibilidad de elaboracin de
sintaxis grficas. Esto implica que elaboraremos un comando a travs del cual
nuestro grfico se crear.
Para esto debemos seguir los siguientes pasos: ARCHIVO, NUEVO, SINTAXIS,
introducimos la sintaxis y luego seleccionamos EJECUTAR. Esta opcin tambin est
presente en SPSS y recibe el mismo nombre: SINTAXIS.
EXAMINE
/VARIABLES= (Colocar el nombre de la variable)
/PLOT = (Colocar el tipo de grfico deseado con maysculas de acuerdo a su
nombre en ingls)
MEDIDAS DESCRIPTIVAS
- MEDIDAS DE TENDENCIA CENTRAL O CENTRALIZACIN
- MEDIDAS DE POSICIN O CUANTILES
- MEDIDAS DE DISPERSIN
- MEDIDAS DE FORMA
- MEDIDAS DE CONCENTRACIN
MEDIDAS DE TENDENCIA CENTRAL
- PROMEDIO O MEDIA
(ARITMTICA, ARMNICA, GEOMTRICA, CUADRTICA)
- MEDIANA
- MODA
MEDIDAS DE TENDENCIA CENTRAL
PROMEDIO O MEDIA ARITMTICA
Se obtiene mediante:
Datos no agrupados
Datos agrupados
H Hg X
MEDIDAS DE TENDENCIA CENTRAL
Li-1: Lmite inferior del Intervalo donde se encuentra la mediana
Ni-1: Ni (Frecuencia absoluta acumulada) del intervalo de clase
MEDIANA anterior al de la mediana.
ai: Amplitud del intervalo de la mediana
Datos no agrupados
Datos agrupados
- PERCENTIL (P)
- CUARTIL (Q)
- DECIL (D)
- QUINTIL (K)
MEDIDAS DE POSICIN (CUANTILES)
- PERCENTIL (P): Dividen a la distribucin en 100 partes iguales. No se recomienda
para distribuciones con observaciones pequeas (inferiores a 100). P1 a P99
- CUARTIL (Q): Dividen a la distribucin en cuatro grupos iguales, cada uno
abarcando un 25% de ella. Q1(25%), Q2(50% = p50 = Me), Q3(75%).
- DECIL (D): Dividen a la distribucin en grupos iguales, abarcando un 10% de la
distribucin cada uno de ellos. D1, D2, D3, D4, D5 (50% = p50 = Me), D6 D10.
- QUINTIL (K): Dividen a la distribucin en cinco grupos iguales, cada uno de ellos
abarcando un 20% de ella. K1(p20), K2(p40), K3(p60), K4(p80).
MEDIDAS DE POSICIN (CUANTILES)
Clculo de cuartiles:
Q1: N*0.25 (1/4*N) Q2: N*0.50 (1/2*N) Q3: N*0.75 (3/4*N)
Clculo de Deciles: Depende del decil.
D1: N*0.1(1/10N) D2: N*0.2(2/10N) D3:N*0.3 (3/10N)
D4:N*0.4(4/10N) D5:N*0.5(5/10N)
Clculo de percentiles: Depende del percentil.
P1: N*0.01 P5: N*0.05 P45: N*0.45 P83: N*0.83 P98: N*0.98
Clculo de quintiles: Depende del quintil.
K1: N*0,20 K2: N*0,40 K3: N*0,60 K4: N*0.80
MEDIDAS DE POSICIN (CUANTILES)
En todos los casos lo que tenemos que buscar es el Ni que el clculo del cuartil,
decil, quintil o percentil que busquemos. Ejemplo: Bsqueda de Q1, D2 y P55
-1
MEDIDAS DE DISPERSIN
- DESVIACIN TPICA: RAIZ CUADRADA DE LA VARIANZA O DICHO DE OTRA
FORMA, LA RAIZ CUADRADA DE LA MEDIA DE LAS DIFERENCIAS DE LAS VALORES
QUE TOMA LA VARIABLE AL CUADRADO.
MEDIDAS DE DISPERSIN
Propiedades de la desviacin estndar/tpica:
- Mide la dispersin en relacin a la media y slo debe ser usada cuando esta
medida de tendencia central es utilizada.
- S ser igual a 0, solo cuando no hay desviacin entre las observaciones en lo
absoluto. En otras palabras, cuando las observaciones tienen el mismo valor. A
medida que los valores de las observaciones muestren mayores diferencias, entonces
S ser cada vez mayor tambin.
- S al igual que X, se ve fuertemente afectada por los valores extremos.
Fuente: Moore, D.S. & McCabe, G.P. (2000). Introduction to the practice of statistics
(Third Edition). New York: United States: W.H. Freeman and Company.
MEDIDAS DE DISPERSIN
Fuente: Moore, D.S. & McCabe, G.P. (2000). Introduction to the practice of statistics (Third
Edition). New York: United States: W.H. Freeman and Company.
MEDIDAS DE DISPERSIN
- RANGO SEMI-INTERCUARTLICO: SE INTERPRETA DE FORMA SIMILAR A LA
DESVIACIN ESTNDAR, CON LA DIFERENCIA QUE COMO ESTADSTICO SE
ENCUENTRA MENOS SESGADO A LA PRESENCIA DE VALORES EXTREMOS. Nos
permite identificar a los outliers. Regla de 1.5XIQR: Este resultado es restado a Q1
(Q1-1.5IQR) y sumado a Q3 (Q3+1.5IQR), luego obtendremos un rango en el cual
no debera caer ningn valor. Si lo hace, entonces estaremos en presencia de un
outlier y podremos observar estos valores individualmente posicionados fuera de
nuestro grfico de caja.
Asimtrica Asimtrica a
la derecha la izquierda
(+) (-)
Simtrica
MEDIDAS DE FORMA
COEFICIENTE DE ASIMETRA DE PEARSON (3, AP, As): Nos permitir evaluar el sesgo
solo en distribuciones unimodales, uniformes (forma de campana) y con asimetra
moderada. Si la asimetra es positiva, entonces 3 > 0 ((X-Mo/S)>0) y si la asimetra
es negativa, entonces 3 < 0 ((X-Mo/S)<0). Si la distribucin es simtrica, entonces el
valor ser igual o muy cercano a 0. Evaluar la asimetra siguiendo los principios
bsicos de diferencia entre la Moda y la Media que hemos revisado anteriormente.
Datos no agrupados Datos agrupados
MEDIDAS DE FORMA (DATOS NO AGRUPADOS)
COEFICIENTE DE ASIMETRA DE FISHER (1 o G1): Los usaremos en aquellos casos
donde tengamos distribuciones bimodales, multimodales y/o distribuciones con forma
muy irregular. Es ms preciso que el coeficiente de asimetra de Pearson. Evaluar la
asimetra de forma cbica tomando como bases a la media y la desviacin estndar.
La interpretacin ser la misma que para el coeficiente de asimetra de Pearson.
Frecuencia
Datos no agrupados absoluta Datos agrupados
simple
Tamao
muestral
Promedio
Desviacin Tpica
Si G2 > 0 la distribucin ser leptocrtica o apuntada elevada a la
Si G2 = 0 la distribucin ser mesocrtica o normal cuarta potencia
Si G2 < 0 la distribucin ser platicrtica o menos apuntada que lo normal.
MEDIDAS DE CONCENTRACIN
Nos permite evaluar la equidad en la asignacin de los valores (reparticin) de una
variable de estudio a travs de los elementos/categoras o intervalos de clase que
tenga nuestra variable criterio. Hay una medida ampliamente utilizada para medir
la concentracin que denominamos INDICE O COEFICIENTE DE GINI (G). Su
representacin grfica por excelencia es la CURVA DE LORENZ.
Tambin podremos ver
esta ecuacin graficada
como A/(A-B), en cuanto
A sera la parte de la
curva que se encuentra
sobre la curva de Lorenz
y la B la parte que se
encuentra bajo ella.
MEDIDAS DE CONCENTRACIN
Recuerden:
- Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por
persona (Parra, N. 2013). Esto es un ejemplo de concentracin mxima.
- Un ejemplo de concentracin mnima sera que en el prximo certamen, todos
ustedes obtengan la misma nota. Esto sera un ejemplo de concentracin mnima.
- Esta dicotoma es la base detrs de las medidas de concentracin, donde los
valores de concentracin oscilarn entre 0 (mnima) y 1 (mxima).
MEDIDAS DE CONCENTRACIN
Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
Pi se obtiene mediante la divisin entre (Ni/n) por 100, por ejemplo para el
intervalo de clase (0-50), (23/260) * 100 = 8,85 y para el intervalo de clase (150-
200), (205/260) * 100 = 78,85.
qi se obtiene mediante la divisin entre Ui, que corresponde a la de Un del
intervalo de clase que queremos y la de Xini, para luego ser multiplicado este
valor por 100. Ej1:
qi del intervalo de clase (0-50), (575/38850) * 100 = 1,48
Ej2:
qi del intervalo de clase (150-200), (22500/38850) * 100 = 56,95
Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
Siguiendo la frmula:
Esto indica que en esta muestra hay una baja concentracin, ms bien cercano al
mnimo.
Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
Mauteu, J. (2015). Estadstica D37. Medidas de forma y concentracin (Tema 4). Recuperado de:
www3.uji.es/~mateu/tema4-d37.doc
MEDIDAS DE CONCENTRACIN
- Mientras la curva est ms cerca de la diagonal, entonces hablaremos de que la
concentracin se acerca a lo mnimo y su la curva se aleja de la diagonal, entonces
diremos que se acerca a la concentracin mxima.
- Un ndice de Gini por sobre 0,50 indica una alta inequidad en la reparticin
- Es por ello que este indicador es de vital importancia en la Economa, Sociologa,
Salud Pblica y Ciencias polticas.
Saben cul es el nivel de desigualdad de ingresos medido por el coeficiente de
Gini de acuerdo lo que determin el programa de desarrollo de las naciones unidad
(UNDP)?