Vous êtes sur la page 1sur 4

Quantile

Quantile
Cet article est une bauche concernant les probabilits et la statistique. Vous pouvez partager vos connaissances en lamliorant (comment ?) selon les recommandations des projets correspondants.

Dfinitions en langage commun


Les quantiles d'une variable alatoire univarie, discrte (ex.: entire) ou continue (relle), sont les valeurs que prend la variable pour des valeurs de probabilit sous le quantile considr, valant une valeur remarquable, par exemple 3 dizimes, ou 5 centimes, etc. On les appelle encore fractiles, synonyme complet sinon le contexte d'usage, et ce sont les valeurs rciproques de la fonction de rpartition de la loi de probabilit considre. On s'intresse plus particulirement quelques jeux de valeurs de quantile correspondant aux multiples de fractions simples du 100% de la probabilit totale. Par exemple, on peut scinder les 100% de probabilit totale en 4 masses de probabilits gales chacune 1/4 = 25%, correspondant, pour les valeurs de la variable alatoire, quatre intervalles adjacents. Les trois valeurs intermdiaires dfinissent ainsi, respectivement les fractiles de =0,25, =0,5 et =0,75, ou encore en terme de fractions, les quantiles d'un quart, un demi et trois quarts (les deux limites extrmes, l'infrieure correspondant au quantile de 0 et la suprieure pour le quantile de 1, sont les bornes du domaine de dfinition de la variable alatoire. Les quantiles d'un chantillon statistique de nombres sont des valeurs remarquables permettant de diviser le jeu de ces donnes ordonnes (i.e. tries) en intervalles conscutifs contenant le mme nombre de donnes ( la justesse de la division entire du nombre total de donnes, prs). Par exemple, un chantillon de 90 donnes pourra tre dcoup selon 10 sous-intervalles conscutifs au moyen d'un jeu de 9 quantiles (plus les limites infrieure et suprieure du domaine d'chantillonnage). Certains jeux de quantiles ont reu des noms particuliers : les quantiles des multiples du centime sont appels centiles, ou percentiles selon un anglicisme frquent. Ainsi, le 5 centile partage l'chantillon en 5% des donnes sous lui, et les 95% restant au-dessus de lui. Le dernier centile (le 99 !) joue frquemment un rle de seuil d'alerte extrme pour des mesures qui traduisent l'intensit d'un phnomne sujet des volutions critiques et en permettent ainsi le suivi (cf. ci-aprs l'exemple en hydrologie de la dfinition de la crue centennale) ; les quantiles des multiples du dixime sont des dciles. Ils sont d'usage frquent en gologie minire (tude des caractristiques granulomtriques de matriaux diviss), en hydrologie (dfinition des hauteurs d'eau, notamment pour les crues, le 9 dcile du dbit d'une rivire dfinissant son niveau de crue dcennale), ainsi que dans nombre de statistiques mdicales ; les quantiles des multiples du quart sont les quartiles. Le premier quartile est la statistique note gnrale q1 ; le second quartile n'est autre que la mdiane ; le troisime quartile est not q3 et son cart au 1er quartile dfinit l'cart interquartile, qui est une des mesures classiques de la dispersion de l'chantillon de donnes, nanmoins plus robuste que l'cart-type. Ont encore t dfinis, les quatre quintiles, et les deux terciles, d'usage rare[1]. Nota Bene : certains programmes informatiques dfinissent un quantile minimum et un quantile maximum par, respectivement, le quantile de 0 et le quantile de 100%. Toutefois, une telle terminologie va au-del des dfinitions traditionnelles de la statistique.

Quantile

Plus formellement
On note q-quantiles l'ensemble des quantiles des multiples de la fraction 1/q. Il y a q-quantile d'une variable alatoire X est donc dfini comme la ou, de faon quivalente, C'est donc la valeur rciproque de la fraction entre 0 et 1=100%, le fractile pour la valeur
[2]

q-quantiles. Le p-ime

valeur

telle que : .

pour la fonction de rpartition associe. pris , ou encore le -fractile, est la


[2]

La gnralisation au-del des valeurs p et q prises comme entiers dfinit les fractiles : pour un nombre rel la variable alatoire pour laquelle la fonction de rpartition vaut encore avec le langage mathmatique des fonctions, le rpartition en .

valeur du domaine de dfinition de -fractile est de . Ou

. Autrement dit, la probabilit (on dit aussi pour

tre plus explicite encore, la masse de probabilit) de la variable alatoire sous le

-fractile est la valeur rciproque de la fonction de

Quelques remarques
Note sur un abus de langage
Dans les rsultats standardiss de tests statistiques, nous pouvons lire communment l'expression dans le 80 centile . Les centiles tant, non pas des intervalles, mais des valeurs, il serait plus juste de dire quelque chose comme dans l'intervalle entre le 80 et le 81 centile , ou dans l'intervalle de probabilit 1% qui suit le 80 centile .

Cas d'une variable alatoire distribution symtrique


Si une distribution est symtrique par rapport une valeur particulire, alors la mdiane et la moyenne sont gales cette valeur particulire. En pratique, c'est le cas de toutes les variables alatoires gaussiennes. Par contre, les exemples d'usage courant abondent aussi o ce n'est pas le cas.

Autres notes
Les quantiles sont des mesures utiles parce qu'elles sont moins sensibles aux distributions allonges et aux valeurs aberrantes. Par exemple, avec une valeur alatoire qui suit une distribution exponentielle, n'importe quel chantillon particulier de cette variable alatoire aura approximativement une chance de 63 % d'tre infrieur la moyenne. Ceci est d la prsence d'une longue queue de la distribution exponentielle dans les valeurs positives, qui est absente dans les valeurs ngatives. Empiriquement, si les donnes que vous analysez ne sont pas distribues comme la distribution que vous attendiez, ou si une autre source de valeurs aberrantes influe sur la valeur de la moyenne, alors les quantiles sont des statistiques bien plus utiles que la moyenne ou autres types de moments statistiques. La rgression robuste est fortement lie ce sujet. Elle utilise la somme des valeurs absolues des valeurs observes, au lieu des erreurs au carr. La connexion se situe sur le fait que la moyenne est parmi les estimateurs lis une distribution le seul qui minimise l'esprance du carr des erreurs, tandis que la mdiane minimise l'esprance de l'erreur absolue. La rgression robuste partage la capacit d'tre relativement insensible aux larges dviations dues certaines observations aberrantes. Les quantiles d'une variable alatoire sont prservs lors de transformations croissantes, ce qui signifie par exemple que si m est la mdiane d'une variable alatoire X alors 2m est la mdiane de 2X, moins qu'un choix arbitraire ait t fait partir d'une plage de valeurs, pour spcifier un quantile particulier. Les quantiles peuvent aussi tre utiliss dans les cas o seulement des donnes ordinales sont disponibles.

Quantile

Calcul des quantiles


Il existe diffrentes mthodes pour estimer les quantiles : Soit N le nombre de valeurs non manquantes de la population chantillonne, et soit ordonnes de la mme population, telles que . Fonction de distribution empirique les valeurs est la plus petite valeur, etc. Pour la k-ime q-quantile, nous avons

est la partie entire de

et

la partie fractionnelle.

Fonction de distribution empirique avec mise la moyenne

est la partie entire de Moyenne pondre

et

est la partie fractionnelle.

est la partie entire de

et

est la partie fractionnelle. Cette mthode est utilise, par exemple, dans la

fonction PERCENTILE de Microsoft Excel. chantillon de numro le plus proche de (N-1)p+1

est la partie entire de

et

est la partie fractionnelle.

Notes et rfrences
[1] ainsi que le pas-si-rare 1-quantile :-) [2] En fait, ces dfinitions ne dfinissent pas "le" quantile, ou fractile, de faon univoque. En effet, si sur un intervalle du domaine de dfinition, la densit de probabilit est strictement nulle, la fonction de rpartition sur cet intervalle est constante, et la valeur rciproque de cette constante n'est donc pas une valeur unique, mais au moins cet intervalle particulier. C'est prcisment le cas pour les variables alatoires discrtes, qui, grce l'utilisation de l'outil "distribution" invent par Laurent Schwartz et l'introduction des masses ponctuelles de probabilit, s'unifient sous un mme formalisme avec les variables alatoires continues. La non-univocit de ces dfinitions apparat alors entre chaque masse ponctuelle de probabilit, et toutes ces dfinitions de quantiles, fractiles, centiles, dciles, quartiles, etc. doivent tre compltes pour lever l'indtermination. Le choix usuel consiste retrancher un epsilon de probabilit aux masses ponctuelles, et la rpartir de faon continue et uniforme entre les masses ponctuelles de probabilit. Dit plus simplement, cela revient faire une interpolation linaire bien choisie. Il faut nanmoins remarquer que certains logiciels choisissent, ou ont choisi, d'autres faons de lever cette indtermination, ce qui fait que les rsultats de calcul de quantiles peuvent diffrer d'un programme l'autre.

Sources et contributeurs de larticle

Sources et contributeurs de larticle


Quantile Source: https://fr.wikipedia.org/w/index.php?oldid=92922747 Contributeurs: ADM, Akabob, Arnaud.Serander, Badmood, Cham, Dirrival, Ediacara, El Caro, Erasmus, Eric Kvaalen, Eric.LEWIN, Ggal, HB, Ipipipourax, JujuTh, Karl1263, Mirmillon, Moa18e, Pautard, Rems4, Savant-fou, Ste281, Valvino, Witoki, 21 modifications anonymes

Source des images, licences et contributeurs


Image: Logo proba 4.svg Source: https://fr.wikipedia.org/w/index.php?title=Fichier:Logo_proba_4.svg Licence: Creative Commons Attribution-Sharealike 3.0 Contributeurs: User:Ipipipourax

Licence
Creative Commons Attribution-Share Alike 3.0 Unported //creativecommons.org/licenses/by-sa/3.0/