Académique Documents
Professionnel Documents
Culture Documents
De Wikipedia, la enciclopedia libre Saltar a: navegacin, bsqueda Para otros usos de este trmino, vase mediana. En el mbito de la estadstica, la mediana, representa el valor de la variable de posicin central en un conjunto de datos ordenados. De acuerdo con esta definicin el conjunto de datos menores o iguales que la mediana representarn el 50% de los datos, y los que sean mayores que la mediana representarn el otro 50% del total de datos de la muestra. La mediana coincide con el percentil 50, con el segundo cuartil y con el quinto decil.
Contenido
[ocultar]
1 Clculo o 1.1 Datos sin agrupar o 1.2 Datos agrupados 2 Ejemplos para datos sin agrupar o 2.1 Ejemplo 1: Cantidad (N) impar de datos o 2.2 Ejemplo 2 : Cantidad (N) par de datos 3 Ejemplo para datos agrupados 4 Mtodo de clculo general 5 Mtodo proyectivo 6 Vase tambin 7 Enlaces externos
[editar] Clculo
Es el valor medio en un conjunto de valores ordenados. Corresponde al percentil 50 o segundo cuartil (P50 o Q2). Los pasos son: 1) Arregla los valores en orden del menor al mayor 2) Cuenta de derecha a izquierda o al revs hasta encontrar el valor o valores medios. Ejemplo: tenemos el sig conjunto de nmeros 8,3,7,4,11,2,9,4,10,11,4 oredenamos: 2,3,4,4,4,7,8,9,10,11,11 En esta secuencisa la mediana es 7, que es el nmero central. Y si tuvisemos: 8,3,7,4,11,9,4,10,11,4, entonces ordenamos: 3,4,4,4,7,8,9,10,11,11 y la mediana (Md) est en: los nmeros centrales son 7 y 8, lo que haces es sumar 7 + 8 y divides entre 2 y Md= 7.5. Existen dos mtodos para el clculo de la mediana: 1. Considerando los datos en forma individual, sin agruparlos. 2. Utilizando los datos agrupados en intervalos de clase.
Dnde Ni y Ni 1 son las frecuencias absolutas acumuladas tales que , ai 1 y ai son los extemos, interior y exterior, del intervalo donde se alcanza la mediana y Me = ai 1
es la abscisa a calcular, la moda. Se observa que ai ai 1 es la amplitud de los intervalos seleccionados para el diagrama. xi fi Ni
1 2 2 2 3 4 4 5 6 9 7 3 8 4
2 4 8 13 30 33 37 39
5 8 21 > 19.5
Nmero de alumnos 2 2 4 5 8 9 3 4 2
Primero se hallan las frecuencias absolutas acumuladas Ni. As, aplicando la 9 2 formula asociada a la mediana para n impar, se obtiene X(39 + 1) / 2 = X20.
Por tanto la mediana ser el valor de la variable que ocupe el vigsimo lugar.En este ejemplo, 21 (frecuencia absoluta acumulada para Xi = 5) > 19.5 con lo que Me = 5 puntos, la mitad de la clase ha obtenido un 5 o menos, y la otra mitad un 5 o ms.
Nmero de alumnos 2 2 4 5 6 9 4 4 2
xi fi Ni+w 1 2 2 2 3 4 2 4 8
13 Primero se hallan las frecuencias absolutas acumuladas Ni. Ni. As, aplicando 4 5 la frmula asociada a la mediana para n par, se obtiene Formula: X = n / 2 = = 5 6 19 = 19 > X = (38 / 2) = > X = 19 (Donde n= 38 alumnos divididos entre dos). 6 9 28
7 4
32 36 38
8 4 Con lo cual la mediana ser la media aritmtica de los valores de la variable 9 2 que ocupen el decimonoveno y el vigsimo lugar. En el ejemplo el lugar decimonoveno lo ocupa el 5 y el vigsimo el 6 con lo que Me = (5+6)/2 = 5,5 puntos, la mitad de la clase ha obtenido un 5,5 o menos y la otra mitad un 5,5 o ms.
1. El nmero total de frecuencias es de; (3+5+2)/2 = 10/2 = 5 2. El total de frecuencias anteriores es 2; (5 - 2) = 3 3. Hacemos el cambio de escalas:
Resolviendo:
la mediana es la suma de todos los datos dividido entre el nmero de datos 4. Se suma la distancia parcial al lmite inferior:
La mediana de un conjunto finito de valores es aquel valor que divide al conjunto en dos partes iguales, de forma que el nmero de valores mayor o igual a la mediana es igual al nmero de valores menores o igual a estos. Su aplicacin se ve limitada ya que solo considera el orden jerrquico de los datos y no alguna propiedad propia de los datos, como en el caso de la media.
A continuacin se muestran los criterios para construir la mediana. Se puede construir los siguientes criterios:
Lo primero que se requiere es ordenar los datos en forma ascendente o descendente, cualquiera de los dos criterios conduce al mismo resultado.
Si el nmero de valores es impar, la mediana es el valor medio, el cual corresponde al xn dato 2 . Cuando el nmero de valores en el conjunto es par, no existe un solo valor medio, si no que existe dos valores medios, en tal caso, la mediana es el promedio de los valores, es decir, la mediana es numricamente igual a xn + xn Md =
2 2 +1
1.- Es nica. 2.- Es simple. 3.- Los valores extremos no tienen efectos importantes sobre la mediana, lo que si ocurre con la media.
Ejemplo:
Dados los siguientes datos: 1, 2, 3, 4, 0, 1, 4, 3, 1, 1, 1, 1, 2, 1, 3 para la obtencin de la mediana se debern de ordenar. Tomemos el criterio de orden ascendente con lo que, tendremos:
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4,
por otro lado el nmero de datos es igual a 15 datos, siendo el nmero de datos impar se elige el dato que se encuentra a la mitad, una vez ordenados los datos, en este caso es 1.
n f acum ( i 1) 2 Md = Li + A f mediana
Donde: Md = Mediana. Li = Limite inferior o frontera inferior de donde se encuentra la mediana, la forma de calcularlo es a travs de encontrar la posicin n / 2 . En ocasiones en el intervalo donde se encuentra la mediana de conoce como intervalo mediano. n = Nmero de observaciones o frecuencia total.
f acum ( i 1)
f mediana = Frecuencia del intervalo mediano. A = Amplitud del intervalo en el que se encuentra la mediana .
Geomtricamente la mediana se encuentra en el valor X que divide al histograma en dos partes de reas iguales.
Ejemplo:
Retomemos la tabla del ejemplo mostrado para determinar la media de atenciones mdicas brindadas por el hospital, adicionando la columna de la frecuencia acumulada
Tabla de frecuencias reportadas por la clnica Clases Punto medio Frecuencias de (Datos en aos) de cada cada clase xi fi clase Frecuencias acumulada f acumulada 8 28 42 50 52
10 x < 20
15 25 35 45 55
8 20 14 8 2
20 x < 30
30 x < 40
40 x < 50
50 x < 60
60 x < 70
65 75
2 1 55 enfermos atendidos
54 55
70 x < 80
Determinemos el dato medio de los datos, como n = 55 entonces n/2=27.5 El intervalo mediano o la clase donde se encuentra la mediana se encuentra en la segunda clase.
por lo que se puede concluir que el 50% de las personas atendidas en un fin de semana por el hospital tienen una edad inferior a los 29.75 aos.
Moda estadstica
La moda estadstica es el valor que ms se repite en un grupo de nmeros. Para averiguar la moda en un grupo de nmeros:
Ordena los nmeros segn su tamao. Determina la cantidad de veces de cada valor numrico.
El valor numrico que ms se repite es la moda. Puede haber ms de una moda cuando dos o ms nmeros se repiten la misma cantidad de veces y adems este es el mximo nmero de veces del conjunto. No hay moda si ningn nmero se repite ms de una vez.
Ejemplo: La moda de 2, 4, 5, 5, 5, 7, 8, 8, 9, 12 es 5.
Introduccin Medidas de centralizacin, parmetros estadsticos que marcan, bajo de distintos criterios, los valores en torno a los cuales se disponen los datos de una distribucin. Tambin de medidas de tendencia central, pues en torno a ella se disponen los elementos de las distribuciones. La ms imponente son la media, mediana y moda. La medida aritmtica, promedio o, simplemente, media, de los valores x1, x2,..., xn, se designa por x y se obtiene as:
La mediana (Me), es un numero que supera a la mitad de los valores de la distribucin y es superada por la otra mitad. Si el numero de trminos de la distribucin es impar, la mediana es el valor del individuo que ocupa el valor central cuando los datos estn ordenados de menor a mayor. Por ejemplo, la distribucin de edades 4,6,6,7,9,11,13, la mediana es Me = 7, pues hay tres datos menores que 7 y tres mayores que 7. Si el numero de termino de la distribucin es par, la mediana es el valor medio de los datos centrales. As, en la distribucin 4,6,7,8,9,11,13, los valore 7 y8 son los valores centrales. La mediana es Me = 7,5. La moda (Mo), de una distribucin estadstica es el valor que ms se repite. Una distribucin puede tener mas de una moda o no tener ninguna. En la distribucin 4,6,6,7,9,11,13, la moda es Mo = 6. Historia de la Estadstica Desde los comienzos de la civilizacin han existido formas sencillas de estadstica, pues ya se utilizaban representaciones grficas y otros smbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmero de personas, animales o ciertas cosas. Hacia el ao 3000 a. C. los babilonios usaban ya pequeas tablillas de arcilla para recopilar datos en tablas sobre la produccin agrcola y de los gneros vendidos o cambiados mediante trueque. Los egipcios analizaban los datos de la poblacin y la renta del pas mucho antes de construir las pirmides en el siglo XXXI a. C. Los libros bblicos de Nmeros y Crnicas incluyen, en algunas partes, trabajos de estadstica. El primero contiene dos censos de la poblacin de Israel y el segundo describe el bienestar material de las diversas tribus judas. En China existan registros numricos similares con anterioridad al ao 2000 a. C. Los griegos clsicos realizaban censos cuya informacin se utilizaba hacia el 594 a. C. para cobrar impuestos. El Imperio romano fue el primer gobierno que recopil una gran cantidad de datos sobre la poblacin, superficie y renta de todos los territorios bajo su control. Durante la edad media slo se realizaron algunos censos exhaustivos en Europa. Los reyes caloringios Pipino el Breve y Carlomagno ordenaron hacer estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762 respectivamente. Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y defunciones comenz en
Inglaterra a principios del siglo XVI, y en 1662 apareci el primer estudio estadstico notable de poblacin, titulado Observations on the Condn Bies Of. Mortalita (Comentarios sobre las partidas de defuncin en Londres). Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley como base para la primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientfico para estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir la informacin a valores numricos para evitar la ambigedad de las descripciones verbales. En nuestros das, la estadstica se ha convertido en un mtodo efectivo para describir con exactitud los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve como herramienta para relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste ya slo en reunir y tabular los datos, sino sobre todo en el proceso de interpretacin de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden aproximar, con gran exactitud, utilizando determinadas distribuciones probabilsticas; los resultados de stas se pueden utilizar para analizar datos estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias estadsticas y para predecir el tipo y la cantidad de datos necesarios en un determinado estudio estadstico. Media aritmtica o promedio Llamando xl, ..., xk a los datos distintos de un carcter en estudio, o las marcas de clase de los intervalos en los que se han agrupado dichos datos, y ni,..., nk a las correspondientes frecuencias absolutas de dichos valores o marcas de clase, llamaremos media aritmtica de la distribucin de frecuencias a
es decir, las familias encuestadas tienen un nmero medio de hijos de 1'68. Ejemplo 2: Se midieron los niveles de colinesterasa en un recuento de eritrocitos en μmol/min/ml de 34 agricultores expuestos a insecticidas agrcolas, obtenindose los siguientes datos: Individuo 1 2 3 Nivel 10,6 12,5 11,1 Individuo 13 14 15 Nivel 12,2 10,8 16,5 Individuo 25 26 27 Nivel 11,8 12,7 11,4
4 5 6 7 8 9 10 11 12
16 17 18 19 20 21 22 23 24
28 29 30 31 32 33 34
La distribucin de frecuencias las marcas de clase ser: Intervalo Frecuencia Ii 7'5-9 9-10'5 10'5-12 12-13'5 13'5-15 15-16'5 9'75 8 11'25 10 12'75 10 14'25 1 15'75 2 ?ni=25 ni 3
Mediana La mediana es otra medida de posicin, la cual se define como aquel valor de la variable tal que, supuestos ordenados los valores de sta en orden creciente, la mitad son menores o iguales y la otra mitad mayores o iguales As, si en la siguiente distribucin de frecuencias, xi 0 1 2 ni 3 2 2 7 ordenamos los valores en orden creciente, 0 0 0 1 1 2 2 el 1 ser el valor que cumple la definicin de mediana. Lgicamente, en cuanto el valor de la frecuencia total sea ligeramente mayor, este procedimiento resulta inviable. Por esta razn, daremos a continuacin una frmula que permita calcularla. No obstante, ser necesario distinguir los casos en los que los datos vengan agrupados de aquellos en los que vengan sin agrupar. Ni 3 5 7
Las grficas siguientes, correspondientes a un diagrama de frecuencias absolutas acumuladas, recogen las dos situaciones que se pueden presentar:
Si la situacin es como la de la figura de la derecha, es decir, si Si la situacin que se presenta es como la de la figura de la izquierda, entonces la mediana queda indeterminada, aunque en este caso se toma como mediana la media aritmtica de los dos valores entre los que se produce la indeterminacin; as pues, si Nj-1 = n/2 < Nj entonces la mediana es
Ejemplo 1: La distribucin de frecuencias acumuladas del ejemplo del nmero de hijos era N de hijos(xi) Frecuencias Acumuladas(Ni) y como es n/2=12'5 y en consecuencia 11 < 12'5 < 19 la mediana ser Me= 2. 0 5 1 11 2 19 3 23 4 25
Datos Agrupados
Las grficas siguientes, correspondientes a polgonos de frecuencias absolutas acumuladas, nos plantea de nuevo dos situaciones diferentes a considerar:
El ms sencillo, el de la derecha, en el que existe una frecuencia absoluta acumulada Nj tal que n/2 = Nj, la mediana es Me = xj. Si la situacin es como la que se representa en la figura de la izquierda, en la que Nj-l < n/2 < Nj entonces, la mediana, est en el intervalo [xj-1, xj), es decir entre xj-1 y xj, tomndose en ese caso, por razonamientos de proporcionalidad, como mediana el valor
siendo cj la amplitud del intervalo [xj-1, xj). Ejemplo: La distribucin de frecuencias del ejemplo de los niveles de colinesterasa es: Intervalo Frecuencia Frecuencia Acumulada Al ser n/2 = 17 y estar 11 < 17 < 21 la mediana estar en el intervalo [10'5 , 12), y aplicando la frmula anterior, ser Ii ni Ni 7'5-9 3 3 9-10'5 8 11 10'5-12 10 21 12-13'5 10 31 13'5-15 1 32 15-16'5 2 34
Moda La moda se define como aquel valor de la variable al que corresponde mxima frecuencia (absoluta o relativa). Para calcularla, tambin ser necesario distinguir si los datos estn o no agrupados.
Para datos sin agrupar, la determinacin del valor o valores (ya que puede haber ms de uno) modales es muy sencilla. Basta observar a que valor le corresponde una mayor ni. Ese ser la moda. As en el ejemplo del nmero de hijos, la simple inspeccin de la tabla siguiente proporciona como valor para la moda el Md = 2.
N de hijos(xi) N de familias(ni)
0 5
1 6
2 8
3 4
4 2 ?ni=25
Datos agrupados:
Si los datos se presentan agrupados en intervalos es necesario, a su vez, distinguir si stos tienen o no igual amplitud. Si tienen amplitud constante c, una vez identificado el intervalo modal [xj-1, xj), es decir el intervalo al que corresponde mayor frecuencia absoluta nj = max{nl, ..., nk}, la moda se define, tambin por razones geomtricas, como
Ejemplo: Este ejemplo presenta un caso de distribucin bimodal, ya que tanto el intervalo [10'5 - 12) como el [12 13'5) tienen frecuencia absoluta mxima. Deberamos aplicar, por tanto, para cada uno de los dos intervalos la frmula anterior, determinando as las dos modas de la distribucin. No obstante, este ejemplo presenta adems la peculiaridad adicional de ser ambos intervalos modales contiguos. En esta situacin se considera la distribucin unimodal, eligiendo como moda el extremo comn, Md = 12. Si los intervalos tuvieran distinta amplitud cj, primeros debemos normalizar las frecuencias absolutas nj, determinando los cocientes
y luego aplicar la regla definida para el caso de intervalos de amplitud constante a los lj. Es decir, primero calcular el lj = max{l1,...., lk} para determinar el intervalo modal [xj-1, xj) y luego aplicar la frmula
siendo cj la amplitud del intervalo modal [xj-1, xj). Ejemplo: Las frecuencias normalizadas correspondientes al ejemplo de intervalos con distinta amplitud sern, Ii 0-20 20-30 30-40 40-45 45-50 50-60 60-80 80-100 ni 8 9 12 10 9 10 8 4 li 0'4 0'9 1'2 2 1'8 1 0'4 0'2
A diferencia de lo que ocurre con la media o con la mediana, s es posible determinar la moda en el caso de datos cualitativos. As, en el ejemplo del tratamiento de radiacin seguido de ciruga puede afirmarse que la causa modal por la que no fue completado el tratamiento es Md = rehusaron ciruga.
Moda
La moda es el valor que tiene mayor frecuencia absoluta.
2, 3, 3, 4, 4, 4, 5, 5 Mo= 4
Si
en
un
grupo
hay
dos
varias
puntuaciones
con
la
misma
frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9
Cuando
todas
las
puntuaciones
de
un
grupo
tienen
la
misma
2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes.
0, 1, 3, 3, 5, 5, 7, 8Mo = 4
en clase
fi-+1 modal.
es
la
frecuencia
absoluta
inmediatamente
posterior
la
clase
ai es la amplitud de la clase.
Tambin
se
utiliza
otra
frmula
de
la
moda
que
da
un
valor
aproximado de sta:
Ejemplo
Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla:
fi
[60, 5 63)
[63, 18 66)
[66, 42 69)
[69, 27 72)
[72, 8 75)
100
La
frmula
de
la
moda
aproximada
cuando
existen
distintas
amplitudes es:
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor.
Clculo de la mediana
1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la
puntuacin central de la misma.
2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5
La
mediana
se
encuentra
en
el
intervalo
donde
la
frecuencia
ai es la amplitud de la clase.
Ejemplo
Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla:
fi
Fi
[60, 63)
[63, 66)
18
23
[66, 69)
42
65
[69, 72)
27
92
[72, 75)
100
100
100 / 2 = 50
Media aritmtica
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos.
Ejemplo
Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Si
los
datos
vienen
agrupados
en
una
tabla
de
frecuencias,
la
En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media.
xi
fi
xi fi
[10, 20)
15
15
[20, 30)
25
200
[30,40)
35
10
350
[40, 50)
45
405
[50, 60
55
440
[60,70)
65
260
[70, 80)
75
150
42
1 820
Las suma de las desviaciones de los nmeros 8, 3, 5, 12, 10 de su media aritmtica 7.6 es igual a 0:
= 0. 4 4.6 2.6 + 4. 4 + 2. 4 = 0
1 La media se puede hallar slo para variables cuantitativas. 2 La media es independiente de las amplitudes de los intervalos. 3 La media es muy sensible a las puntuaciones extremas. Si tenemos
una distribucin con los siguientes pesos:
La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la distribucin.
ESTADISTICA
Por: Dra. Luz M. Rivera
Qu es estadstica? Estadstica Descriptiva Estadstica inferencial Poblacin y muestra Elemento La media La mediana La moda
Por mucho tiempo, la palabra estadstica se refera a informacin numrica sobre los estados o territorios polticos. La palabra viene del latn statisticus que significa del estado. Las estadsticas como las conocemos hoy da tomaron en desarrollarse varios siglos y muchas mentes privilegiadas. John Graunt (1620-1674), un ingls que estudiaba los expedientes de los nacimientos y muertes descubri que nacan ms nios que nias, pero tambin encontr que por estar los hombres ms expuestos a accidentes ocupacionales , a enfermedades y la guerra, el nmero de hombres y mujeres en la edad de casarse era ms o menos la misma. Graunt fue el primero en publicar sobre el anlisis estadstico y su trabajo llev al desarrollo de las ciencias actuariales utilizadas por las compaas de seguros. Qu es estadstica? La estadstica es una coleccin de mtodos para planificar y realizar experimentos, obtener datos y luego analizar, interpretar, y formular una conclusin basada en esos datos. Es la ciencia encargada de recopilar,
organizar, analizar e interpretar informacin numrica o cualitativa, de manera que pueda llevar a conclusiones vlidas. La estadstica se puede definir como la ciencia que recopila, organiza, analiza e interpreta la informacin numrica o cualitativa, mejor conocida como datos, de manera que pueda llevar a conclusiones vlidas. La estadstica descriptiva es la ciencia que recopila , organiza e interpreta la informacin numrica cualitativa. Los peridicos, revistas, radio y televisin usan la estadstica descriptiva para informar y persuadirnos acerca de ciertas acciones a tomar y en la formacin de opiniones. La estadstica inferencial es la ciencia que interpreta informacin de manera que pueda llevar a conclusiones vlidas. Los gobiernos y las organizaciones utilizan la estadstica para tomar decisiones que afectan directamente nuestras vidas. Tarea: Contesta las siguientes preguntas: 1.Dnde en nuestras vidas encontramos las estadsticas? 2. Cmo me pueden afectar? 3. Cmo se utiliza la estadsticas en la industria? 4. Cmo se utiliza en el mercadeo de productos?
Qu es un elemento? Un elemento es cada unidad utilizada para un estudio estadstico. Por ejemplo,el conjunto de los datos 3, 5, 5, 3, 7, 2, 4, 1 contiene 8 elementos.
Una muestra es un subconjunto de una poblacin. Las muestras representativas de una poblacin son tiles ya que facilitan el manejo de los datos. Una muestra es representativa de la poblacin si al escogerla
Poblacin vs. Muestra Poblacin es la totalidad de los elementos del grupo particular que se estudia. Como por ejemplo, una empresa que est llevando a cabo un estudio a todos los 350 empleados de la empresa. Esto es poblacin ya que se estudiar cada elemento de la poblacin; en este caso la poblacin es todos los empleados de la empresa,sus 350 empleados. Muestra es una parte de la poblacin seleccionada de forma que puedan hacerse inferencias de ella con respecto a la poblacin completa. Por ejemplo, la empresa del ejemplo anterior escoger 100 empleados de los 350 para hacerles un estudio. Esto es una muestra ya que el total de empleados es 350, se escogi a 100 para hacerse inferencias del resto.
Medidas de Tendencia Central Las medidas de tendencia central son la media, la mediana y la moda.
La media es la suma de los valores de los elementos dividida por la cantidad de stos. Es conocida tambin como promedio, o media aritmtica. Frmula de la media: Media Poblacional = = X N
Media Muestral:
x =
x n
Ejemplo: Calcule la media de los siguientes nmeros: 10 , 11 , 12 , 12 , 13 1. Sumar las cantidades < 10 + 11 + 12 + 12 + 13 = 58> 2. Dividir la suma por la cantidad de elementos < 58/5> 3. El resultado es la media <11.6> Por lo tanto, la media de los 5 nmeros es 11.6. Note que la media resulta un nmero que est entre el rango de elementos; en este caso, 11.6 est entre 10,11,12 y 13.
La mediana es el valor del elemento intermedio cuando todos los elementos se ordenan. Frmula de la mediana: Mediana = X[n/2 +1/2]
La parte de [n/2 + 1/2] representa la posicin.
Donde X es la posicin de los nmeros y n es el nmero de elementos. Ejemplo: Buscar la mediana de los siguientes nmeros: 2 4 1 3 5 6 3 Primero, hay que ordenarlos:
1 2 X1 X2
3 X3
3 X4
4 5 6 X5 X 6 X 7
Mediana = X[7/2 + ] X[3.5 + .5] X4 < Se cambi el a .5> < La mediana est en la posicin 4>
Por lo tanto, la mediana es 3. Ejemplo: Buscar la mediana del ejemplo anterior de la media. Nmeros del ejemplo anterior: 10,12,13,12,11 1. Hay que ordenarlos, en este caso de forma ascendente; aunque tambin puede ser descendente. 10 , 11 , 12 , 12 , 13 2. Buscar el elemento intermedio. 10 , 11 , 12 , 12 , 13 El elemento del medio es 12. Por lo tanto, la mediana es 12. Nota: Si el nmero de elementos es impar, la mediana es el nmero del elemento intermedio. Si el nmero de elementos es par, se hace el cmputo mostrado en el ejemplo siguiente: Buscar la mediana de : 15 , 13 , 11 , 14 , 16 , 10 , 12 , 18
Como el nmero de elementos es par, hay que utilizar los dos nmeros intermedios. 10 , 11 , 12 , 13 , 14 , 15 , 16, 18 ( ordenados)
13 y 14 Ahora, para buscar la mediana: 1. Sumar ambos nmeros. <13 + 14 = 27> 2. Dividirlo entre 2. < 27/2 = 13.5> 3. El resultado es la mediana. < 13.5>
La moda es el valor que se presenta el mayor nmero de veces. Ejemplo 1: Buscar la moda de: 5 12 9 5 8 7 1
Como la moda es el nmero que ms se repite, la moda es 5. Ejemplo 2: Buscar la moda de: 14 16 18 16 15 12 14 14 16 18 20 16 16
El 14 se repite 3 veces. El 18 se repite 2 veces. El 16 se repite 5 veces. Por lo tanto, la moda es 16. Ejemplo 3: Buscar la moda de : 23 35 45 33 47 31 29 22
CUANTILES
Sabemos que la mediana divide a los datos en dos partes iguales, tambin tiene inters estudiar otros parmetros , llamados cuantiles, que dividen los datos de la distribucin en funcin de otras cantidades. Los ms importantes son los cuartiles, quintiles, deciles y percentiles. Cuartiles: son tres valores que divides la serie de datos en cuatro partes iguales. Se representan por Q1(cuartil primero), Q2 (cuartil segundo) y Q3 (cuartil tercero) Quintiles: son cuatro valores que dividen la serie de datos en cinco partes iguales: K1, K2, K3 y K4. Deciles: Son nueve valores que dividen la serie de datos en 10 partes iguales: D1, D2, ..., D9. Percentiles: son 99 valores que dividen la serie de datos en 100 partes iguales: P1, P2, ..., P99. Se puede observar una relacin grfica entre los cuantiles en el enlace: Relacin grfica entre los cuantiles.
2. Algunos de ellos no estn cerca del centro de la distribucin, a pesar de ser considerados medidas de centralizacin por su analoga con la mediana. Tambin se les llama parmetros de posicin.
3. El cuartil primero coincide con el percentil de orden 25, y el cuartil tercero con el percentil de orden 75.
MEDIDAS DE CENTRALIZACIN
Los datos dados en las tablas estadsticas o en las representaciones grficas hay que simplificarlos mediante unos valores numricos llamados parmetros. A algunos de ellos
tambin se les llama medidas de centralizacin porque tienden a situarse, en general, en el centro del conjunto de datos ordenados. Sinnimos: medidas de tendencia central y promedios. Las ms importantes son: de tamao, media aritmtica; de frecuencia, moda, y de posicin: mediana, cuartiles, deciles y percentiles.
MEDIA ARITMTICA
Definicin: media aritmtica de una variable estadstica (v.e.) es la suma de todos los valores de dicha variable dividida entre el nmero total de valores. Se representa por . Clculo: Si X es una v.e. que toma los valores absolutas frmula: con frecuencias
Si los datos son simples (no se repiten) entonces Si la variable X es continua, o discreta con muchos datos agrupados en clases se toman como valores las marcas de cada clase.
MODA
Definicin: Moda de una v.e. es el valor de la variable que presenta mayor frecuencia absoluta. Se representa por M0. Puede no ser nica, en caso de que haya 2, 3, etc. valores con mayor frecuencia igual se dice que la distribucin es bimodal, trimodal, etc.
Clculo de la moda
Variable discreta: se mira en la tabla en la columna de las frecuencias absolutas, el valor de la variable que la tiene mayor es la moda. Variable continua: primero hay que determinar la clase modal como en el caso de la variable discreta. El valor del intervalo que se presume tiene mayor frecuencia no se conoce, se podra tomar la marca de clase de la clase modal, o bien con mayor exactitud habr que aplicar la frmula:
Li = lmite inferior de la clase modal C = amplitud de los intervalos. D1= diferencia entre la frec. abs. de la clase modal y la frec. abs. de la clase anterior. D2= diferencia entre la frec. abs. de la clase modal y la frec. abs. de la clase siguiente.
Este mtodo se utiliza para las distribuciones cuyos datos estn agrupados en intervalos. El resultado siempre ser aproximado. Primero se representa el histograma de frecuencias absolutas (mejor en papel milimetrado) A continuacin se unen, con lneas de puntos, los extremos de la clase modal con las contiguas. La moda M0 es la abcisa del punto de corte.
Se puede observar la grfica correspondiente en el siguiente enlace: Clculo de la moda por el mtodo grfico.
Observaciones a la moda
i.Hay distribuciones que no tienen moda, esto sucede cuando las frecuencias de todos los datos son iguales. ii. La moda es menos representativa que la media aritmtica, pero a veces es ms til, como en el caso de datos cualitativos. iii. En la moda no intervienen todos los datos. iv. Aunque se considera una medida de centralizacin algunas veces no est en la zona central. v. La moda representa el valor dominante, en las elecciones la moda es el partido ms votado.
MEDIANA
Definicin: mediana de una v.e. es un valor de la variable, tal que el nmero de observaciones menores que l es igual al nmero de observaciones mayores que l.. Se representa por M.
Clculo de la mediana
Si el nmero de datos es par no existe trmino central, y por ello se dice que hay dos medianas: los dos valores centrales. Aunque se acostumbra a tomar como mediana la semisuma de los dos valores centrales.
Variable estadstica discreta. Datos agrupados Se ordenan los datos como si fueran simples y se elige el valor central. Como esto es muy laborioso se hace normalmente de otra forma.
Se calculan las frecuencias absolutas acumuladas Fi, la mediana es el primer valor de la variable cuya frecuencia absoluta acumulada excede a la mitad del nmero total de datos. Si la mitad del nmero de datos coincide con la Fi de un valor, la mediana es la semisuma de ese valor y el siguiente
xi 3 6 7 8 9
fi 15 20 15 40 10 100
Fi 15 35
90>50 100
Como la mitad del nmero de datos es 50 y la Fi de 7 coincide con 50 la mediana viene dada por la semisuma de 7 y el valor siguiente, 8.
Por tanto,
Variable estadstica continua Se procede de forma anloga al caso anterior y se determina cul es la clase mediana, pero para obtener el valor concreto aplicamos la frmula:
Li= lmite inferior de la clase mediana. c= amplitud del intervalo. N= nmero total de datos. Fi-1 =frecuencia absoluta acumulada de la clase anterior a la clase mediana. Fi= frecuencia absoluta de la clase mediana.
Observaciones a la mediana
1. Es muy til en los siguientes casos: a)Cuando entre los datos existe alguno muy extremo que afecta a la media. b)Cando los datos estn agrupados en clases y alguna de ellas es abierta. 2. El 50% de los datos son menores o iguales a ella, y el 50% restante son mayores o iguales. 3. Es el primer parmetro de centralizacin que depende del orden de los datos y no de su valor. 4. Geomtricamente, y para distribuciones que se pueden representar mediante un histograma de frecuencias, la mediana es un valor de la variable, tal que la vertical levantada sobre el mismo divide al histograma en dos partes de igual rea.
Media Moda = 3 (Media Mediana) Gracias a esta relacin se puede obtener, con un cierto error, alguno de estos parmetros en funcin de los otros dos si la distribucin es como se ha dicho. En el siguinte enlace se puede observar tres distribuciones estadsticas, en las que se situan los parmetros de centralizacin: Tipos de sesgos.
MEDIDAS DE DISPERSIN
A veces, el estudio de una distribucin queda incompleto si slo se estudian las medidas de centralizacin, siendo imprescindible saber si los datos numricos estn agrupados o no alrededor de los valores centrales. A esto es a lo que se le llama dispersin, y a los parmetros que miden estas desviaciones respecto a la media medidas de dispersin o parmetros de dispersin. Las ms importantes son: el recorrido, la varianza y la desviacin tpica.
RANGO O RECORRIDO
Definicin: se llama recorrido de una distribucin a la diferencia entre el mayor y el menor valor de la variable estadstica.
Observaciones al recorrido
1.<![endif]>Cuanto menor es el recorrido mayor es el grado de representatividad de los valores centrales. 2.<![endif]>Cuanto mayor es, la distribucin est menos concentrada o ms dispersa. 3.<![endif]>Tiene la gran ventaja de su sencillez de clculo. 4.<![endif]>Tiene gran aplicacin en procesos de control de calidad,
5.<![endif]>Tiene el inconveniente de que slo depende de los valores extremos. De esta forma basta que uno de ellos se separe mucho para que el recorrido se vea sensiblemente afectado. 6.Para paliar este inconveniente a veces se utilizan otros dos rangos:
Estos rangos son algo ms estables, ya que tienden a eliminar aquellos valores extremadamente alejados.
1. Las diferencias di dan una idea de la proximidad del valor de xi respecto a la media. 2. Pueden ser positivas, negativas o nulas. 3. La suma de las desviaciones respecto ala media siempre vale 0. Por tanto, no podemos usar esta suma para medir la dispersin. Para evitarlo, se recurre a dos procedimientos: a)Utilizar el valor absoluto de las desviaciones respecto a la media, lo que dar lugar a la desviacin media. b)Utilizar el cuadrado de las desviaciones respecto a la media, lo que dar lugar a la varianza.
DESVIACIN MEDIA
Definicin: Se llama desviacin media a la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Clculo de la desviacin media: Sea X una v.e. que toma los valores frecuencias absolutas por la expresin: con
O bien:
Cuanto mayor es la desviacin media ms dispersos o menos concentrados estn los datos.
Definicin: Se llama desviacin tpica de una v.e. a la raz cuadrada positiva de la varianza. Se representa por s o .
A veces no es un nmero entero, entonces las desviaciones (xi - ) suelen ser nmeros decimales. Las operaciones de elevar al cuadrado cada una de las desviaciones y multiplicarlas por las frecuencias respectivas pueden resultar sumamente laboriosas; por ello se utiliza otra expresin equivalente a la anterior en la que se evitan estos clculos:
Como consecuencia de la definicin de varianza, la definicin tpica viene dada por las siguientes expresiones:
Observaciones a la varianza
1. Tanto la varianza como la desviacin tpica dependen de todos los valores de la distribucin, as como de la media. 2. En los casos en los que no sea posible calcular la media aritmtica, no ser posible tampoco obtener la varianza y la desviacin tpica, por ser funciones de la media. 3. La varianza tiene el inconveniente de que no viene expresada en las mismas unidades que los datos, debido a que las desviaciones estn elevadas al cuadrado. Si los datos fueran en metros, la varianza vendra dada en metros cuadrados. En cambio, la desviacin tpica s viene expresada en las mismas unidades que los datos, de ah que resulte ms interesante que la varianza. UTILIZACIN CONJUNTA DE Ys
La media aritmtica, , de un conjunto de datos se encuentra, aproximadamente, hacia el centro de la distribucin. La desviacin tpica s nos informa sobre la dispersin de los datos respecto a la media. Utilizando ambos parmetros conjuntamente podemos obtener resultados muy importantes sobre la distribucin. As, por ejemplo, en las distribuciones unimodales, simtricas o ligeramente asimtricas se demuestra que: 1 En el intervalo ( - s, + s) se encuentra el 68% de los datos. + 2s) se encuentra el 95% de los datos.
2 En el intervalo ( - 2s,
3 En el intervalo (
- 3s,
Estos resultados son consecuencia de lo que estadstica matemtica se conoce con el nombre de desigualdad de Tchebicheff. Se puede observar un grfico bastante repredentativo en el enlace:Utilizacin conjunta de media y desviacin tipica.
y y
En cul de los dos test ha obtenido, comparativa-mente con el grupo, mejor resultado el alumno?
Para poder contestar a esta pregunta tendremos que comparar las puntuaciones del alumno con las del grupo; para ello restamos a cada una de las puntuaciones del alumno la media del grupo y dividimos entre la desviacin tpica, obteniendo:
TEST A:
TEST B:
As pues, si bien la puntuacin directa del test A ha sido mayor que la obtenida en el B, comparativamente con el grupo es mucho mayor la puntuacin obtenida en el test B que en el A. De ah que se haga totalmente imprescindible definir estas puntuaciones comparadas. Definicin: Sea X una v.e. que toma los valores llamados puntuaciones
directas; y sean y s, respectivamente, la media y la desviacin tpica de dicha variable. Se llama puntuaciones tpicas de la variable X a los siguientes valores
Cuantiles
La funcin cuantil de una ley de probabilidad es la inversa (generalizada) de su funcin de distribucin. Si denota la funcin de distribucin, la funcin cuantil corresponder: es la funcin que a hace
La funcin cuantil emprica de una muestra es la funcin cuantil de su distribucin emprica. Definicin 2.4 Sean una muestra y el vector de sus estadgrafos de orden. La funcin cuantil emprica de la muestra es la funcin intervalo . que , para todo , vale en el
Mediana
,
La mediana es el valor central de la muestra: hay tantos valores inferiores a ella como valores superiores a ella. Si la distribucin emprica de la muestra es poco disimtrica, como por ejemplo para una muestra simulada a partir de una ley uniforme o normal, la media y la mediana estn cercanas. Si la muestra es asimtrica, con una distribucin muy dispersa hacia la derecha, la mediana podr ser mucho ms pequea que la media. A diferencia de la media, la mediana no es sensible a los valores aberrantes. Ella satisface una propiedad de optimalidad con respecto a la desviacin absoluta media. Proposicin 2.5 Sea una muestra donde los son reales. Sea (desviacin absoluta) la funcin que a un nmero asocia:
Esta funcin alcanza un mnimo absoluto para (la mediana). Al valor de este mnimo se le denomina desviacin absoluta media. Demostracin: Para evitar complicar las notaciones, supondremos que los valores son todos diferentes. El grfico de la funcin
), y despus
). Si es impar la mediana es el es par, el mnimo se alcanza en todo el intervalo y en el cual la pendiente se anula.
, que contiene a
Hay algo arbitrario en la definicin de la funcin cuantil para una distribucin emprica: para todos los puntos del intervalo funcin de distribucin vale que nos hacen seleccionar a , la
. Son sobre todo razones tericas las en lugar de otro punto como valor de
. Puede ser una seleccin bastante mala en la prctica. Consideremos la muestra siguiente, de tamao .
La mediana, tal y como la hemos definido, vale . Sin embargo como valor central se impone claramente el punto medio del intervalo es decir . En el caso de las muestras de tamao par, el intervalo , se llama intervalo mediano. A veces la mediana se define como el punto medio del intervalo mediano. ,
Este problema se presenta en el caso de muestras pequeas y para los cuantiles en los cuales es de la forma (ms frecuente la mediana). Nosotros no lo tomaremos en cuenta y conservaremos la definicin 2.4. An en muestras muy grandes, los cuantiles son poco complicados de calcular, pues es suficiente ordenar la muestra en orden creciente para calcular sus estadgrafos de orden y por tanto a la vez obtener todos los cuantiles. Ellos nos proveen una visualizacin fcil de la distribucin emprica. Hemos visto que la mediana es un valor central. Para medir la dispersin, podemos calcular el recorrido, que es la diferencia entre el mayor y el menor valor. Pero este recorrido refleja ms los valores extremos que la localizacin de la mayor parte de los valores. Comprendemos mejor la dispersin de una muestra por los intervalos inter-cuartiles e inter-deciles. Definicin 2.6 Llamamos intervalo inter-cuartiles al intervalo , el cual contiene la mitad central de los valores de la muestra. Llamamos intervalo inter-deciles al intervalo el cual contiene de los valores de la muestra. ,
Estos intervalos forman la base de una representacin muy compacta de la distribucin emprica: el diagrama en caja (o caja y bigotes, box plot, box-and-whisker plot). No existe una definicin general de esta representacin. Ella consiste en una caja rectangular cuyos dos extremos son los cuartiles. Estos extremos se prolongan por trazos que terminan con segmentos ortogonales (los bigotes). La longitud de estos segmentos vara segn el autor. Nosotros proponemos fijarlos en los deciles extremos. Representamos tambin la mediana por un trazo en la caja y a veces se representan tambin los valores extremos de la muestra. (ver la figura 8).
Grfico 9: Estaturas de nios de 6 aos. La zona sombreada corresponde a el intervalo inter-cuartiles. La mediana est en trazo continuo, los deciles en punteado. y
1. 2. 3. 4. 5. 6. 7.
1. Las Medidas de Posicin, tambin conocidas como Otras Medidas de Dispersin, son otras medidas o mtodos que resultan ser ms prcticos para precisar ciertas situaciones en las que se busca describir la variacin o dispersin en un conjunto de datos.
2. 3. INTRODUCCIN CUANTILES
Los cuantiles son medidas de posicin que se determinan mediante un mtodo que determina la ubicacin de los valores que dividen un conjunto de observaciones en partes iguales. Los cuantiles son los valores de la distribucin que la dividen en partes iguales, es decir, en intervalos que comprenden el mismo nmero de valores. Cuando la distribucin contiene un nmero alto de intervalos o de marcas y se requiere obtener un promedio de una parte de ella, se puede dividir la distribucin en cuatro, en diez o en cien partes. Los ms usados son los cuartiles, cuando dividen la distribucin en cuatro partes; los deciles, cuando dividen la distribucin en diez partes y los centiles o percentiles, cuando dividen la distribucin en cien partes. Los cuartiles, como los deciles y los percentiles, son en cierta forma una extensin de la mediana. Para algunos valores u , se dan nombres particulares a los cuantiles, Q (u):
u 0.5 0.25, 0.75 0.1, ... , 0.99 0.01, ..., 0.99 Q(u) Mediana Cuartiles Deciles Centiles
CUARTILES Los cuartiles son los tres valores que dividen al conjunto de datos ordenados en cuatro partes porcentualmente iguales. Hay tres cuartiles denotados usualmente Q1, Q2, Q3. El segundo cuartil es precisamente la mediana. El primer cuartil, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la sucesin (ordenada); el tercer cuartil, es el valor en el cual o por debajo del cual quedan las tres cuartas partes (75%) de los datos. Datos Agrupados
Como los cuartiles adquieren su mayor importancia cuando contamos un nmero grande de datos y tenemos en cuenta que en estos casos generalmente los datos son resumidos en una tabla de frecuencia. La frmula para el clculo de los cuartiles cuando se trata de datos agrupados es la siguiente: k= 1,2,3 Donde: Lk = Lmite real inferior de la clase del cuartil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del cuartil k. fk = Frecuencia de la clase del cuartil k c = Longitud del intervalo de la clase del cuartil k Si se desea calcular cada cuartil individualmente, mediante otra frmula se tiene lo siguiente:
El primer cuartil Q1, es el menor valor que es mayor que una cuarta parte de los datos; es decir, aquel valor de la variable que supera 25% de las observaciones y es superado por el 75% de las observaciones. Frmula de Q1, para series de Datos agrupados:
Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase
El segundo cuartil Q2, (coincide, es idntico o similar a la mediana, Q2 = Md), es el menor valor que es mayor que la mitad de los datos, es decir el 50% de las observaciones son mayores que la mediana y el 50% son menores. Frmula de Q2, para series de Datos agrupados:
Donde:
L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase
El tercer cuartil Q3, es el menor valor que es mayor que tres cuartas partes de los datos, es decir aquel valor de la variable que supera al 75% y es superado por el 25% de las observaciones. Frmula de Q3, para series de Datos agrupados:
Donde: L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Otra manera de verlo es partir de que todas las medidas no son sino casos particulares del percentil, ya que el primer cuartil es el 25% percentil y el tercer cuartil 75% percentil. Para Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: - El primer cuartil: Cuando n es par:
Cuando n es impar:
Cuando n es par:
Cuando n es impar:
DECILES Los deciles son ciertos nmeros que dividen la sucesin de datos ordenados en diez partes porcentualmente iguales. Son los nueve valores que dividen al conjunto de datos ordenados en diez partes iguales, son tambin un caso particular de los percentiles. Los deciles se denotan D1, D2,..., D9, que se leen primer decil, segundo decil, etc. Los deciles, al igual que los cuartiles, son ampliamente utilizados para fijar el aprovechamiento acadmico. Datos Agrupados Para datos agrupados los deciles se calculan mediante la frmula.
k= 1,2,3,... 9 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k Otra frmula para calcular los deciles:
El cuarto decil, es aquel valor de la variable que supera al 40%, de las observaciones y es superado por el 60% de las observaciones.
Donde (para todos): L1 = limite inferior de la clase que lo contiene P = valor que representa la posicin de la medida f1 = la frecuencia de la clase que contiene la medida solicitada. Fa-1 = frecuencia acumulada anterior a la que contiene la medida solicitada. Ic = intervalo de clase. Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas:
Cuando n es par:
Cuando n es impar: Siendo A el nmero del decil. CENTILES O PERCENTILES Los percentiles son, tal vez, las medidas ms utilizadas para propsitos de ubicacin o clasificacin de las personas cuando atienden caractersticas tales como peso, estatura, etc. Los percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en cien partes porcentualmente iguales. Estos son los 99 valores que dividen en cien partes iguales el conjunto de datos ordenados. Los percentiles (P1, P2,... P99), ledos primer percentil,..., percentil 99. Datos Agrupados Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante la frmula:
k= 1,2,3,... 99 Donde: Lk = Lmite real inferior de la clase del decil k n = Nmero de datos Fk = Frecuencia acumulada de la clase que antecede a la clase del decil k. fk = Frecuencia de la clase del decil k c = Longitud del intervalo de la clase del decil k
Primer percentil, que supera al uno por ciento de los valores y es superado por el noventa y nueve por ciento restante.
El 60 percentil, es aquel valor de la variable que supera al 60% de las observaciones y es superado por el 40% de las observaciones.
Frmulas Datos No Agrupados Si se tienen una serie de valores X1, X2, X3 ... Xn, se localiza mediante las siguientes frmulas: Para los percentiles, cuando n es par:
Cuando n es impar: Siendo A, el nmero del percentil. Es fcil ver que el primer cuartil coincide con el percentil 25; el segundo cuartil con el percentil 50 y el tercer cuartil con el percentil 75. 3. EJEMPLO Determinacin del primer cuartil, el sptimo decil y el 30 percentil, de la siguiente tabla:
Salarios No. De fa
120 70 62 36
Siendo,
El 7 decil:
El percentil 30 Posicin:
138.9 85 = 53.9 fi = 90
Estos resultados nos indican que el 25% de los empleados ganan salarios por debajo de $ 334; que bajo 541.57 gana el 57%de los empleados y sobre $359.88, gana el 70% de los empleados.
Yyyyyyyyyyyyyyyyyyyyy
Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
1 Ordenamos los datos de menor a mayor. 2 Buscamos el lugar que ocupa cada cuartil mediante la expresin
.
2, 5, 3, 6, 7, 4, 9
2, 5, 3, 4, 6, 7, 1, 9
En
primer
lugar
buscamos
la
clase
donde
se
encuentra
ai es la amplitud de la clase.
Ejercicio de cuartiles
fi
Fi
[50, 60)
[60, 70)
10
18
[70, 80)
16
34
[80, 90)
14
48
[90, 100)
10
58
[100, 110)
63
[110, 120)
65
65