Académique Documents
Professionnel Documents
Culture Documents
Les Tests de Khi-Deux
Les Tests de Khi-Deux
U : 2020/2021
Pr. Y.BENGHABRIT
y.benghabrit@umi.ac.ma
Rappel : Notion des tests
❖ Soit X un caractère mesurable de loi de probabilité , paramètre inconnu. On a n
observations de X.
❖ Un bon test est tel que l’erreur du premier espèce est petite et la puissance est
grande.
Pr Y.BENGHABRIT
Rappel : Notion des tests
Procédure à suivre pour faire un test sur le paramètre inconnu
2. Sous H0, on doit avoir une idée sur la loi ou la loi limite de l’estimateur.
4. Si c’est le cas on accepte H0 au seuil pour l’échantillon observé sinon on rejette H0.
6. Si est grande, la décision est bonne sinon la décision prise n’est pas confiante.
❖ Le test d'homogénéité qui teste si des populations données sont homogènes ou pas.
Pr Y.BENGHABRIT
Test d’ajustement
❖ Soit X un caractère mesurable qu’on observe, X est une variable aléatoire de loi de
probabilité inconnue.
❖ Problématique : Trouver une loi f0 qui peut remplacer d’une manière rigoureuse la loi f
inconnue de X. Pour ce faire deux étapes s’imposent :
❖ Il faut ainsi tester l'ajustement de la loi inconnue f à une loi connue f0 retenue comme
étant un modèle convenable. Ce qui revient à tester l’hypothèse nulle :
contre l’hypothèse :
Pr Y.BENGHABRIT
Test d’ajustement
❖ Soit un échantillon empirique réalisation de échantillon aléatoire
non exhaustif (avec remise). Les sont i.i.d de même loi que X.
Pr Y.BENGHABRIT
Test d’ajustement
❖ Théorème 1 : (Pearson 1929)
Si (80% des cas) et si f0 est complètement spécifiée (on a rien à estimer pour
connaître f0), alors sous H0
Pr Y.BENGHABRIT
Test d’ajustement
❖ Théorème 2 :
Pr Y.BENGHABRIT
Test d’ajustement : Etude de cas
Suite à une étude sur des bébés normaux, on a pu déterminer qu’à un âge donné, la
probabilité que :
On aimerait savoir si on peut tirer les mêmes conclusions sur les bébés prématurés. Pour ce
faire, 80 d’eux à l’âge donné ont été observés :
❖ n = 80 la taille de l’échantillon.
❖ Le risque = 5%.
Pr Y.BENGHABRIT
Test d’ajustement : Etude de cas
❖ On calcule la statistique associée :
Pr Y.BENGHABRIT
Test d’indépendance
❖ Soient X et Y deux caractères mesurables à étudier sur une population P. Observant X et
Y sur la population P, on obtient un échantillon de dimension deux
tel que le caractère X présente I modalités (I classes si X est quantitatif et I valeurs
ordonnées sans répétition si valeurs discrètes). De même pour Y qui présente J modalités.
❖On appelle Nij l'effectif observé de la modalité conjointe Ai f Bj dans l'échantillon étudié
de taille n = n i j . , réalisation de la variable aléatoire Nij . est l'effectif marginal de
la modalité Ai réalisation de la variable aléatoire ans.
Pr Y.BENGHABRIT
Test d’indépendance
L’échantillon étudié est représenté dans un tableau de contingence.
Y B1 …. Bj … BJ Y B1 …. Bj … BJ
X X
A1 A1
… …
… …
AI AI
n.j n P.j 1
Pr Y.BENGHABRIT
Test d’indépendance : Etude de cas
❖ Pour tester si le sexe est indépendant du niveau d'éducation, un échantillon aléatoire de
395 personnes a été interrogé et chaque personne a été invitée à déclarer le niveau
d'éducation le plus élevé qu'elle a obtenu. Les données issues de l'enquête sont résumées
dans le tableau suivant :
Baccalauréat Licence Master Doctorat Total
Femme 60 54 46 41 201
Homme 40 44 53 57 194
Total 100 98 99 98 395
❖ On cherche donc 𝐘 = 𝛂 𝐗 + 𝛃. y
𝒔𝑿𝒀
❖ Le coefficient de corrélation est défini par : 𝒓𝑿𝒀 =
𝒔𝑿 𝒔𝒀
❖ 𝐫𝐗𝐘 ≤ 𝟏
❖ N.B. Pour un modèle donné par exemple Y = g(X), l’erreur est 𝒆𝒊 = 𝒚𝒊 −g(𝒙𝒊 ) et les
coefficients sont déterminés par la méthode des moindres carrées.
Pr Y.BENGHABRIT
Droite de régression linéaire
❖ Application :
X 1 1 1 2 2 2 3 3 3
Y 1 2 3 1 2 3 1 2 3
❖Exercice : Chercher la droite de régression si elle existe des données relatives au niveau
d’éducation et le genre.
Pr Y.BENGHABRIT
Test d’indépendance avec d’autres modèles
❖ Modèle 1 : Y = a 𝑿𝒌 + b, on posant Z = 𝑿𝒌 on se retrouve avec le modèle de la droite
de régression : Y = a Z + b.
Pr Y.BENGHABRIT
Test d’homogénéité
❖ Dans une population formée d’individus répartis en différentes catégories
(hommes/femmes, classes d’âges, niveaux socio-économiques, etc...), on observe une
variable (effet d’un médicament, présence d’un comportement à risque, performances
...).
❖ Solution : Effectuer un test d’homogénéité sur les différentes populations filles pour la
suite les considérer comme une seule population. Pr Y.BENGHABRIT
Test d’homogénéité
❖ Soit X un caractère mesurable présentant I modalités (I classes si X est quantitatif), à
étudier sur J populations . Le problème est de savoir si la répartition du
caractère X dépend ou non de la population. Autrement dit tester l'hypothèse nulle H0 :
la répartition du caractère X est indépendante de la population (homogéniété), contre :
l'hypothèse alternative H1 : la répartition du caractère X est dépendante de la population.
A1 A1
… …
… …
AI AI
nj n 1
contre :
contre :
contre :
Pr Y.BENGHABRIT
Test d’homogénéité
❖ Soit la statistique réalisation de la v.a