Académique Documents
Professionnel Documents
Culture Documents
1
11/03/2024
Il permet donc, sans aucune hypothèse sur la loi de probabilité suivie par la
variable aléatoire impliquée, de donner des conclusions.
Lorsque les données sont quantitatives, les tests non paramétriques transforment
les valeurs en rangs. L’appellation tests de rangs est souvent rencontrée.
2
11/03/2024
1. Avec un échantillon
Test binomial : Savoir si l’échantillon suit une loi binomiale
•
En effet, l’étape qui consiste à estimer les paramètres des distributions avant de faire un test
d’hypothèse n’est plus nécessaire (test de conformité en loi). Donc les hypothèses sont plus
générales, c’est-à-dire, par exemple :
3
11/03/2024
En résumé
Ces tests de rangs ne vont pas prendre en compte les valeurs des échantillons mais uniquement
voir comment les échantillons sont mélangés quand on les réunit et qu’on les ordonne.
A contrario, les variables dites qualitatives, seuls les tests non paramétriques sont utilisables.
L’idée est que sous H0, les deux échantillons devraient être fortement mélangés.
Si les valeurs de l’un sont inférieures aux valeurs de l’autre, alors il y a une différence significative.
4
11/03/2024
Hypothèse nulle : il n'y a pas de différence (en termes de tendance centrale) entre les deux groupes de la population.
Hypothèse alternative : il existe une différence (en termes de tendance centrale) entre les deux groupes de la
population.
Test U de Mann-Whitney
https://datatab.fr/tutorial/mann-whitney-u-test
Le test U de Mann-Whitney est donc le pendant non paramétrique du test t pour échantillons indépendants ; il est soumis à des
hypothèses moins strictes que le test t. Par conséquent, le test U de Mann-Whitney est toujours utilisé lorsque la condition de
distribution normale du test t n'est pas remplie.
5
11/03/2024
Test U de Mann-Whitney
https://datatab.fr/tutorial/mann-whitney-u-test Hypothèses du test U de Mann-Whitney
Pour pouvoir calculer un test U de Mann-Whitney, il faut disposer
Si les données sont disponibles par paires,
de deux échantillons aléatoires indépendants présentant au moins
le test de Wilcoxon doit être utilisé à la place du
des caractéristiques à échelle ordinale. Les variables ne doivent
test U de Mann-Whitney.
satisfaire à aucune courbe de distribution.
Calculer le test U de Mann-Whitney
Pour calculer le test U de Mann-Whitney pour deux échantillons indépendants, il faut d'abord déterminer les rangs des
valeurs individuelles (un exemple avec des rangs égaux suit ci-dessous).
Test U de Mann-Whitney
Ces classements sont ensuite additionnés pour les deux groupes. Dans l'exemple ci-dessus, la somme des rangs T1 des
femmes est de 37 et la somme des rangs T2 des hommes est de 29. La valeur moyenne des rangs est donc R̄1= 6,17 pour
les femmes et R̄1= 5,80 pour les hommes. La différence entre R̄1 et R̄2 indique maintenant s'il existe des différences
possibles entre les temps de réaction. Dans l'étape suivante, les valeurs U sont calculées à partir des sommes de rangs T1
et T2.
6
11/03/2024
Test U de Mann-Whitney
où n1, n2 sont le nombre d'éléments dans le premier et le second
groupe respectivement. Si les deux groupes proviennent de la même
population, c'est-à-dire que les groupes ne diffèrent pas, la valeur des
deux valeurs U est la valeur attendue de U. Une fois que la moyenne et
la dispersion ont été estimées, z peut être calculé. Pour la valeur U de
Mann-Whitney, la plus petite valeur de U1 et U2 est utilisée.
Test U de Mann-Whitney
7
11/03/2024
8
11/03/2024
9
11/03/2024
Test de Wilcoxon
https://datatab.fr/tutorial/wilcoxon-test
Le test de Wilcoxon vérifie si les valeurs moyennes de deux groupes dépendants diffèrent
significativement l'une de l'autre. Le test de Wilcoxon est un test non paramétrique et est donc
soumis à beaucoup moins d'hypothèses que son homologue paramétrique, le test t pour
échantillons dépendants. Par conséquent, dès que les conditions limites du test t pour échantillons
dépendants ne sont plus remplies, le test de Wilcoxon est utilisé.
Exemple médical:
Il convient de vérifier si les performances de la mémoire sont meilleures le matin ou le soir.
Exemple technique:
Un fabricant de courroies trapézoïdales a des temps d'arrêt très élevés sur ses 5 lignes de production. Il faut
maintenant déterminer si un paramètre du système a une influence sur les temps d'arrêt.
Mesure répétée: Une caractéristique d'une personne, par exemple son poids, a été mesurée à deux moments
différents.
Couples naturels: Les valeurs ne doivent pas nécessairement provenir de la même personne, mais de
personnes qui vont ensemble, par exemple avocat/client, épouse/mari et psychologue/patient. Bien entendu, il
ne s'agit pas nécessairement de personnes.
Indépendance: Le test de Wilcoxon suppose l'indépendance, c'est-à-dire que les observations appariées sont
tirées au hasard et de manière indépendante.
En outre, la forme de la distribution des différences entre les deux échantillons dépendants doit être approximativement
symétrique.
Si les données ne sont pas disponibles par paires, le test U de Mann-Whitney est utilisé à la place du test de Wilcoxon.
10
11/03/2024
•Hypothèse nulle: Il n'y a pas de différence (en termes de tendance centrale) entre les deux groupes de la population.
•Hypothèse alternative: Il existe une différence (par rapport à la tendance centrale) entre les deux groupes de la
population.
La question qui se pose est la suivante: pourquoi ne pas toujours utiliser le test de Wilcoxon au lieu du test t pour les
échantillons dépendants? Dans ce cas, je n'ai pas besoin de tester la distribution normale! Les tests paramétriques
comme le test t sont généralement plus puissants!
Avec un test paramétrique, une différence plus faible ou un échantillon plus petit suffit généralement à rejeter
l'hypothèse nulle. Les deux sont, bien sûr, très pratiques. C'est pourquoi, dans la mesure du possible, il faut
toujours utiliser des tests paramétriques!
11
11/03/2024
KRUSKAL - WALLIS
Test de Kruskal Wallis
Ce test correspond au test de Mann-Whitney pour plus de deux échantillons, on peut le considérer
comme la version non paramétrique de l’Anova (modèles statistiques qui permettent de montrer si
des groupes appartiennent à la même population).
Cas d’utilisation :
Exemple :
La compagnie ferroviaire cherche à comparer le nombre de retards maintenant pour quatre types
de trains : les trains A, B, C, et D. Dans le tableau ci-dessous est listé le nombre de retards par type
de trains. Notre but est de déterminer s’il y a des différences significatives de retards entre les
différents types de trains.
L’hypothèse nulle Ho : « tous les types de trains ont des retards similaires » et
l’hypothèse alternative H1 : « L’un des types de trains a plus/moins de retards que les autres ».
12
11/03/2024
Une autre fonction importante de l'ANOVA à un facteur contrôlé est d'estimer les
différences entre des groupes spécifiques.
13
11/03/2024
Le test de Kruskal-Wallis est un test non paramétrique à utiliser lorsque vous êtes en présence de k
échantillons indépendants, afin de déterminer si les échantillons proviennent d'une même population ou si au
moins un échantillon provient d'une population différente des autres.
Le test de Kruskal-Wallis est souvent utilisé comme une alternative à l'ANOVA dans le cas où l'hypothèse de
normalité n'est pas acceptable.
Il permet de tester si k échantillons (k>2) proviennent de la même population, ou de populations ayant des
caractéristiques identiques, au sens d'un paramètre de position (le paramètre de position est conceptuellement
proche de la médiane,
mais le test de Kruskal-Wallis prend en compte plus d'information que la position au seul sens de la médiane).
https://fr.wikipedia.org/wiki/Test_de_Kruskal-Wallis
14
11/03/2024
où ni est la taille de l'échantillon i, N la somme des ni, et Ri la somme des rangs pour l'échantillon i parmi
l'ensemble des échantillons.
Lorsque k=2 le test de Kruskal-Wallis est équivalent au test de Mann-Whitney, et la statistique K est équivalente à
la statistique Ws.
Lorsqu'il y a des ex aequo, on utilise les rangs moyens pour les observations correspondantes, comme dans le cas
du test de Mann-Whitney
•Méthode asymptotique : la p-value est obtenue grâce à une approximation de la loi de K par une loi du
Khi² à (k-1) degrés de liberté. Cette approximation est fiable, sauf lorsque N est petit.
•Méthode exacte : le calcul de la p-value exacte repose sur la distribution réelle de K. Ce calcul est très
intensif numériquement.
•Méthode Monte Carlo : ce calcul est basé sur un rééchantillonnage aléatoire. L'utilisateur doit choisir le
nombre de simulations (ou rééchantillonnages) à réaliser. Un intervalle de confiance autour de la p-value
obtenue est fourni. Cet intervalle sera bien entendu d'autant plus resserré que le nombre de simulations
est important.
Si la p-value est telle que l'on doit rejeter l'hypothèse H0, alors au moins un échantillon (ou groupe) est
différent d'un autre. Afin d'identifier quels échantillons sont responsables du rejet de H0, il est possible
d'utiliser une procédure de comparaisons multiples.
15
11/03/2024
https://fr.wikipedia.org/wiki/Test_de_Kruskal-Wallis
•Analysis of variance (ANOVA, parametric):
• One-Way ANOVA Test in R
• Two-Way ANOVA Test in R
• MANOVA Test in R: Multivariate Analysis of Variance
Références
https://fr.wikipedia.org/wiki/Test_de_Kruskal-Wallis
https://datatab.fr/tutorial/kruskal-wallis-test
https://www.datanovia.com/en/fr/lessons/test-de-kruskal-wallis-dans-r/
https://biodatascience-course.sciviews.org/sdd-umons-2018/test-de-kruskal-wallis.html
https://www.normalesup.org/~carpenti/tdm-stats/tdm22222.html
16