Académique Documents
Professionnel Documents
Culture Documents
Partie 2 : statistiques analytiques
Cette partie, contrairement aux statistiques descriptives, ne se contente pas de
la simple description des observations, mais aide à tester des hypothèses, à
concevoir des constatations et de prendre des décisions.
Deux hypothèses sont posées soit H0 et H1, le test statistique va être l’outil
qui permet de trancher ; une seule qui est vraie.
H0 est appelée l’hypothèse nulle, H1 est l’hypothèse alternative La décision
consiste à retenir H0 ou H1.
Cette partie sera abordée comme suit
A. Comparaison de deux moyennes
B. Analyse de variance à un facteur
C. Analyse de variance à facteurs multiples
A. Comparaison de deux moyennes
A.1. Tests paramétriques (Test de Student)
a. Comparaison d’une moyenne à une valeur référence ou moyenne théorique
b. Comparaison de moyenne sur deux échantillons appariés
c. Comparaison de moyenne de deux échantillons indépendants
A.2. Tests non paramétriques (Test de Chi 2)
a. Comparaison de moyennes observes sur échantillons indépendants
b. Comparaison de moyenne sur échantillons appariés
A.1. Test de Student
Conditions dʹapplication:
Le caractère de lʹéchantillon étant supposé aléatoire, lʹhypothèse de normalité
de la variable doit être vérifiée.
Le test de Student est utilisé dans trois cas différents :
a. Comparaison d’une moyenne à une valeur référence
b. Comparaison de moyennes sur deux échantillons appariés (liés)
c. Comparaison de moyennes de deux échantillons indépendants
Quelque sois le cas, la réalisation suit les mêmes étapes :
‐ L’hypothèse nulle H0 : démarrer avec l’hypothèse qu’il n’ya pas de
différences significatives entre les deux moyennes comparées
L’hypothèse alternative :H1 : il y a une différence significative entre les
deux échantillons
‐ Calcul du t.cal calculé selon une formule spécifique à chaque cas
‐ Calcul de t.tab (t de table) : cette valeur est lue dans une table de Student a
l’aide de deux valeur(=0.05, ddl=(voir le ddl dans chaque cas))
‐ Comparaison entre t.cal et t.tab
‐ Conclusion (accepter H0 et rejeter H1 ou le contraire)
Cas n°1 : Comparaison d’une moyenne à une valeur référence ou moyenne théorique
Calcul :
Soit X une variable aléatoire distribuée selon une loi normale, la variable
aléatoire définie ci‐dessus suit une loi de Student avec n ‐ 1 degrés de liberté.
t cal =
‐ : la moyenne de l’échantillon
‐ μ : la moyenne théorique ou la valeur spécifiée
‐ S² : la variance de lʹéchantillon
‐ n : est la taille de lʹéchantillon
la valeur t tab correspondant au risque alpha = 5% pour un degré de liberté : ddl= n−1
On compare la valeur calculée de t (cal) avec la valeur critique appropriée de
t‐table avec n ‐ 1 degrés de liberté.
‐ Si t cal est inferieur à t tab : H0 est acceptée
‐Si t cal est supérieure à t tab : H0 est rejetée et on accepte H1.
Cas n° 2 : Comparaison de moyenne sur deux échantillons appariés
dont chaque élément de lʹune est en relation avec un élément de lʹautre.
Par exemple 30 patients ont reçu un traitement pendant1 mois. On se pose la
question à savoir si le traitement a un impact sur le poids des patients ou pas.
Le poids des sont donc été mesuré avant et après traitement. Ce qui nous
donne 30 séries de valeurs avant traitement et 30 après traitement provenant
des mêmes individus.
Il s’agit bien dans cet exemple, d’un test de Student apparié car les deux
séries de valeurs ont un lien (les souris). Pour chaque souris, on a deux
mesures (l’une avant et l’autre après traitement).
Calcul :
Soit xij lʹobservation j pour la paire i (j = 1,2 et i = 1,2,...,n). Pour chaque paire
dʹobservations on calcule la différence di = xi2 ‐ xi1. Le test statistique est
défini par :
tcal =
‐ n est le nombre de paires dʹobservations
‐ d est la moyenne des différences entre les observations et
‐ Sd² la variance des différences.
d.d.l=n−1
Cas n°3 : Comparaison de moyennes de deux échantillons indépendants
Etant donné deux échantillons de taille n1 et n2. Dans ce cas les deux
échantillons sont indépendants entre eux.
Calcul :
On calcule la valeur t cal comme suit
T cal =
‐ x1 et x2 sont les moyennes des deux échantillons
‐ Sp² la variance commune.
‐ n 1 : est la taille de lʹéchantillon 1
‐ n 2 : est la taille de lʹéchantillon 2
La valeur t tab correspondant au risque alpha = 5% pour un degré de liberté :
ddl= n1+n2−2
*Si la valeur de t calculé (|t|) est supérieure à la valeur de t de table, alors la
différence est significative. Dans le cas contraire, elle, ne l’est pas. Le degré de
Student pour la valeur |t|.
A .2. Le Test non paramétrique Chi 2 ou Khi 2
Le test d’indépendance du Chi 2 sert à apprécier l’existence ou non d’une
relation entre deux caractères au sein d’une population, lorsque ces caractères
sont qualitatifs où lorsqu’un caractère est quantitatif et l’autre qualitatif, ou
bien encore lorsque les deux caractères sont quantitatifs mais que les valeurs
ont été regroupées.
Pour les caractères qualitatifs la notion de moyenne n ‘existe pas donc il faux
prendre e compte la distribution dans son ensemble
Par exemple si on veut vérifier si la répartition des groupes sanguins dépend
du sexe
Les étapes à suivre sont comme suit :
sanguins et le sexe
2‐ Calcul :
chi2 cal= (effectifs observes‐effectifs théoriques)2/ effectifs théoriques
3‐ On détermine le chi2 table, Cette valeur est lue dans une table du test du Chi-2 a
l’aide de deux valeur(=0.05, ddl=n‐1)
4‐ comparer chi2 cal et chi 2 tab
‐si chi2 cal inferieur à chi 2 tab : y’a une indépendance entre la répartition des
groupes sanguins et le sexe
‐si chi2 cal supérieur à chi 2 tab : y’a une dépendance entre la répartition des
groupes sanguins et le sexe
Avec un risque d'erreur de =5%.
5‐ explication de la signification
Ce test permet de déterminer la dépendance mais ne donne pas la puissance
de cette dépendance.
Le Chi 2 aussi peut aussi être un test d’ajustement pour comparer la
distribution de fréquences d’un échantillon par rapport à la distribution de
obtenez lors d’une expérience sont bien ajusté aux données théoriques
attendus.