Boîte à moustaches
Dans les représentations graphiques de données statistiques, la boîte à moustaches (aussi appelée diagramme en
boîte, boîte de Tukey ou box plot) est un moyen rapide de figurer le profil essentiel d'une série statistique
quantitative. Elle a été inventée en 1977 par John Tukey, mais peut faire l'objet de certains aménagements selon les
utilisateurs. Son nom est la traduction de Box and Whiskers Plot.
Principe
La boîte à moustaches résume seulement quelques caractéristiques de position du caractère étudié (médiane,
quartiles, minimum, maximum ou déciles). Ce diagramme est utilisé principalement pour comparer un même
caractère dans deux populations de tailles différentes.
Il s'agit de tracer un rectangle allant du premier quartile au troisième quartile et coupé par la médiane. Ce rectangle
suffit pour le diagramme en boîte. On ajoute alors des segments aux extrémités menant jusqu'aux valeurs extrêmes,
ou jusqu'aux premier et neuvième déciles ( ), voire aux 5e et 95e centiles. On parle alors de diagramme en
boîte à moustaches ou de diagramme à pattes.
Historique
Dans les diagrammes en boîte de Tukey, la longueur des « moustaches » vaut 1,5 fois l’écart interquartile. Ces
diagrammes de Tukey étaient utilisés dans des secteurs où les données peuvent le plus souvent être modélisées en
utilisant une loi normale ; dans ce cas, la théorie montre que les extrémités des « moustaches » sont voisines du
premier et 99e centile : ces diagrammes étaient surtout utilisés pour détecter la présence de données exceptionnelles.
Les boîtes à moustaches sont actuellement en vogue dans l'enseignement français, puisqu'elles font partie des
programmes de mathématiques en collège et lycée[réf. nécessaire]. On les y désigne aussi sous le vocable de boîtes à
pattes ainsi que Box Plot.
Sources et contributeurs de l’article 2
Licence
Creative Commons Attribution-Share Alike 3.0 Unported
//creativecommons.org/licenses/by-sa/3.0/