Vous êtes sur la page 1sur 4

Cuantiles

Los cuantiles son puntos tomados a intervalos regulares de la funcin de distribucin acumulada (CDF) de una variable aleatoria. La divisin ordenada de datos en q esencialmente subconjuntos de datos del mismo tamao es la motivacin para q-cuantiles, los cuantiles son los valores de los datos ue marcan los l!mites entre los subconjuntos consecutivos. Dic"o de otra manera, el k# q-cuantil de una variable aleatoria es el valor x de tal manera ue la probabilidad de ue la variable aleatoria ser$ menor ue x es a lo sumo k%q & la probabilidad de ue la variable aleatoria ser$ ma&or ue x es a lo sumo (q-k) %q. 'a& q-( q- cuantiles, con un entero k ue cumpla ) *k*q.

Cuantiles especiales:
+lgunos cuantiles tienen nombres especiales,

-l .- cuantil se llama mediana -l /- cuantiles se llaman terciles 0 1 -l 2- cuantiles se llaman cuartiles 1 3 -l 4- cuantiles se llaman uintiles 1 35 -l 6- cuantiles se llaman se7tiles 1 8 -l ()- cuantiles se llaman deciles D 1 -l (.- cuantiles se llaman duo- deciles 1 Dd -l .)- cuantiles se llaman vigintiles 1 9 -l ()) se llaman cuantiles percentiles 1 : -l ())) se llaman cuantiles permilles 1 :r

-n t;rminos m$s generales, se puede considerar la funcin cuantil para cual uier distribucin. -sto est$ definido para las variables reales entre cero & uno & es matem$ticamente la inversa de la funcin de distribucin acumulada.

Cuantiles de una poblacin:


:ara una poblacin de valores discretos o para una densidad de poblacin permanente de k# q-cuantil es el valor de los datos cuando la funcin de distribucin acumulada k % q. 3ue x es un k# q- cuantil de una variable X si, (<, e uivalentemente, & (<, e uivalentemente, ). )

:ara una poblacin finita de

valores inde7ados (,...,

de menor a ma&or, el

k# q-cuantil de esta poblacin se puede calcular a trav;s del valor de . 8i Yop no es un entero, redondear al siguiente entero para obtener el !ndice adecuado, el valor de datos correspondiente es el k# q-cuantil. :or otra parte, si Yop es un entero,
entonces cual uier n=mero entre el valor de datos en ese !ndice, puede ser tomado como el cuantil, & es convencional (aun ue arbitrario) para tomar la media de los dos valores. 8i, en lugar de utili>ar n=meros enteros k & q, -l ?p-cuantil ?se basa en una n=mero real p de manera ue ) * p *(, a continuacin, p reempla>a k % q en las frmulas anteriores. +lgunos programas de soft@are (inclu&endo Aicrosoft -7cel) Consideran el m!nimo & m$7imo como el percentil ) B & ()), respectivamente, sin embargo, esta terminolog!a es una e7tensin m$s all$ de las definiciones estad!sticas tradicionales.

Ejemplos:
Considere una poblacin de () valores de datos C/, 6, D, E, E, (), (/, (4, (6, .)F.

-l primer cuartil se determina () G (( % 2) H .,4I ue se redondea a /, lo ue significa ue / es el rango en la poblacin (de menor a ma&or valor), en la ue apro7imadamente ( % 2 de los valores son menos a este valor en tercer lugar, ue, en este caso, es de D. -l segundo valor cuartil (igual ue la media) se determina () G (. % 2) H 4, ue es un n=mero entero, mientras ue el n=mero de valores (()) es un n=mero par, por lo ue la media tanto de la uinta & se7ta los valores se toman, es decir (E J()) % . H K, a pesar de cual uier valor a partir del E "asta el () podr!a ser tomado como la mediana. 8i el n=mero de valores de datos es impar, entonces el valor de la mediana (o segundo cuartil) es el valor ue se encuentra en el !ndice igual al n=mero de valores m$s uno, entre dosI es decir, H(nJ()%.. +s!, para este ejemplo, si "ubiera "abido tambi;n un valor de K entre los valores de E & (), "aciendo (( valores totales, entonces ((( J() % . H 6. -sto significar!a ue el valor se7to (en este caso, el valor K) ser!a el segundo cuartil, donde ( % . de los valores son superiores a este valor (m$s de K- el valor en el !ndice 6 de ((), & ( % ., de los valores son menores ue el valor en este !ndice. -l tercer valor alto para el ejemplo original es determinada por () G (/%2) H D.4, ue se redondea a E, & el valor es (4.

La motivacin de este m;todo es ue el primer cuartil debe dividir los datos entre el cuarto inferior & superior de tres cuartas partes. Ldealmente, esto significar!a .,4 de las muestras est$n por debajo del primer cuartil & est$n por encima de D,4I ue a su ve> significa ue la muestra de datos tercera es ? dividir en dos ?, "aciendo ue la parte tercera muestra tanto el primer & segundo trimestres de los datos, por lo ue el l!mite cuartil se encuentra justo en esa muestra.

Discusin:

Mesultados de pruebas estandari>adas son interpretados de manera incorrecta como estudiante de puntuacin ?en el E)N percentilO, por ejemplo, como si el percentil E)N es un intervalo de forma ?en?, ue no lo esI uno puede anotar en alg=n percentil o entre dos percentiles, pero no en algunos percentiles. 0al ve> por este ejemplo se uiere decir ue las puntuaciones de los estudiantes entre los E)N & E(N percentiles. 8i una distribucin es sim;trica, la mediana es igual a la media (siempre & cuando ;sta e7ista)I pero, en general, la mediana & la media son diferentes. :or ejemplo, con una variable aleatoria ue tiene una distribucin e7ponencial, una muestra particular de esta variable aleatoria tendr$ una probabilidad del 6/P de ser menos ue la media. -sto se debe a la distribucin e7ponencial tiene una cola larga para los valores positivos, pero es igual a cero para los n=meros negativos. Cuantiles son medidas =tiles por ue son menos susceptibles a las distribuciones de cola larga & valores at!picos. -mp!ricamente, si los datos ue se est$n anali>ando en realidad no son repartidos de acuerdo a su distribucin supuesta, o si tiene otras fuentes potenciales de valores anmalos ue est$n mu& alejados de la media, entonces pueden ser cuantiles en estad!stica descriptiva m$s =til ue los medios & otros relacionados con valores estad!sticos. Au& relacionado es el tema de desviaciones absolutas. 5n m;todo de regresin ue es m$s fuerte a los valores at!picos ue por lo menos es cuadrado, en el ue se utili>a la suma del valor absoluto de los errores observados en el lugar del error al cuadrado. La cone7in es ue la media es la =nica estimacin de una distribucin ue minimi>a el error cuadr$tico esperado mientras ue la mediana minimi>a el error absoluto. Aenos desviaciones absolutas cuotas de la capacidad de ser relativamente insensibles a las grandes desviaciones en las observaciones perif;ricas. Los cuantiles de una variable aleatoria se conservan bajo transformaciones en aumento, en el sentido de ue , por ejemplo, si m es la mediana de una variable aleatoria X, a continuacin, .m es la mediana de .X, a menos ue una eleccin arbitraria se "a "ec"o de un rango de valores para especificar un cuantil determinado. Cuantiles tambi;n se puede utili>ar en casos en ue slo se presentan datos ordinarios.

Estimacin de los cuantiles de una poblacin:


'a& varios m;todos para estimar los cuantiles. La amplitud de los m;todos m$s completa est$ disponible en el lenguaje de programacin, ue inclu&e nueve muestras de los m;todos de cuantiles. 8+8 % 80+0 inclu&e cuatro m;todos de muestreo & cuantiles Aicrosoft -7cel inclu&e una. -n efecto, los m;todos de c$lculo Qp, la estimacin para el k# q- cuantil, donde pHk%q, + partir de una muestra de tamao N mediante el c$lculo de un !ndice de valores reales h. QCu$ndo h es un entero, el h# m$s pe ueo de los N valores, xh, es la estimacin de cuantiles. De lo contrario un redondeo o interpolacin plan se utili>a para calcular la estimacin de cuantiles h, xh, R xh. +lgunos tipos inclu&en,

0enga en cuenta ue M-/ & M 2- no dan hH (NJ () % . cuando pH ( % ..

Vous aimerez peut-être aussi