Académique Documents
Professionnel Documents
Culture Documents
Présentation formelle
On considère deux populations X et Y de tailles respectives et . On suppose les observations
indépendantes et disposant d'une relation d'ordre. On souhaite tester l'hypothèse suivante :
En général l'hypothèse plus forte « les deux distributions sont égales » est utilisée.
Si nous ordonnons les éléments de par ordre croissant, nous pouvons définir, pour
chaque individu, son rang dans la séquence ainsi formée. Soit la somme des rangs des éléments de
X.
On montre que, sous H0, l'évènement suit une distribution connue, tabulée pour de petits
échantillons et qui peut être approchée par une loi de probabilité gaussienne de moyenne et
Le test est construit en confrontant la valeur effectivement obtenue à cette moyenne et cet écart type : on
peut ainsi estimer la probabilité de cette valeur sous l'hypothèse nulle et ainsi décider ou non de rejeter cette
hypothèse nulle.
On calculera la valeur : , qui, si elle est supérieure à 1,96 (risque de 5 %), permet de
rejeter l'hypothèse nulle H0 d'égalité des deux échantillons.
Implémentation
wilcox.test avec R et la bibliothèque "stats"
scipy.stats.mannwhitneyu avec Python3 et le module "scipy.stats"
pingouin.mwu avec Python3 et le module "pingouin"
Notes et références
1. (en) Frank Wilcoxon, « Individual comparisons by ranking methods », Biometrics
Bulletin (en), vol. 1, no 6,1945, p. 80–83
(DOI 10.2307/3001968 (https://dx.doi.org/10.2307/3001968),
JSTOR 3001968 (https://jstor.org/stable/3001968)).
2. (en) Henry B. Mann et Donald R. Whitney, « On a test of whether one of two random
variables is stochastically larger than the other », Ann. Math. Stat., vol. 18, no 1,1947, p. 50–
60 (DOI 10.1214/aoms/1177730491 (https://dx.doi.org/10.1214/aoms/1177730491)).