Outils Statistiques Et Informatiques Belkasmi F

Partie 2 : statistiques analytiques
Cette partie, contrairement aux statistiques descriptives, ne se contente pas de
la simple description des observations, mais aide à tester des hypothèses, à
concevoir des constatations et de prendre des décisions.
Deux hypothèses sont posées soit H0 et H1, le test statistique va être l’outil
qui permet de trancher ; une seule qui est vraie.
H0 est appelée l’hypothèse nulle, H1 est l’hypothèse alternative La décision
consiste à retenir H0 ou H1.
Cette partie sera abordée comme suit
A. Comparaison de deux moyennes
B. Analyse de variance à un facteur
C. Analyse de variance à facteurs multiples

A. Comparaison de deux moyennes
A.1. Tests paramétriques (Test de Student)
a. Comparaison d’une moyenne à une valeur référence ou moyenne théorique
b. Comparaison de moyenne sur deux échantillons appariés
c. Comparaison de moyenne de deux échantillons indépendants
A.2. Tests non paramétriques (Test de Chi 2)
a. Comparaison de moyennes observes sur échantillons indépendants
b. Comparaison de moyenne sur échantillons appariés
A.1. Test de Student
Conditions dʹapplication:
Le caractère de lʹéchantillon étant supposé aléatoire, lʹhypothèse de normalité
de la variable doit être vérifiée.
Le test de Student est utilisé dans trois cas différents :
a. Comparaison d’une moyenne à une valeur référence
b. Comparaison de moyennes sur deux échantillons appariés (liés)
c. Comparaison de moyennes de deux échantillons indépendants
Quelque sois le cas, la réalisation suit les mêmes étapes :
‐ L’hypothèse nulle H0 : démarrer avec l’hypothèse qu’il n’ya pas de
différences significatives entre les deux moyennes comparées
L’hypothèse alternative :H1 : il y a une différence significative entre les
deux échantillons

‐ Calcul du t.cal calculé selon une formule spécifique à chaque cas
‐ Calcul de t.tab (t de table) : cette valeur est lue dans une table de Student a
l’aide de deux valeur(=0.05, ddl=(voir le ddl dans chaque cas))
‐ Comparaison entre t.cal et t.tab
‐ Conclusion (accepter H0 et rejeter H1 ou le contraire)
Cas n°1 : Comparaison d’une moyenne à une valeur référence ou moyenne théorique
Il s’agit de comparer une moyenne d’un échantillon à une moyenne

théorique (μ).Le but est de vérifier si notre échantillon provient bien dʹune
population avec la moyenne théorique, μ, ou non
Calcul :
Soit X une variable aléatoire distribuée selon une loi normale, la variable
aléatoire définie ci‐dessus suit une loi de Student avec n ‐ 1 degrés de liberté.
t cal =
‐ : la moyenne de l’échantillon
‐ μ : la moyenne théorique ou la valeur spécifiée
‐ S² : la variance de lʹéchantillon
‐ n : est la taille de lʹéchantillon

la valeur t tab correspondant au risque alpha = 5% pour un degré de liberté : ddl= n−1
On compare la valeur calculée de t (cal) avec la valeur critique appropriée de
t‐table avec n ‐ 1 degrés de liberté.
‐ Si t cal est inferieur à t tab : H0 est acceptée
‐Si t cal est supérieure à t tab : H0 est rejetée et on accepte H1.
Cas n° 2 : Comparaison de moyenne sur deux échantillons appariés
Le test de Student sert aussi à comparer les moyennes de deux populations,
dont chaque élément de lʹune est en relation avec un élément de lʹautre.
Par exemple 30 patients ont reçu un traitement pendant1 mois. On se pose la
question à savoir si le traitement a un impact sur le poids des patients ou pas.
Le poids des sont donc été mesuré avant et après traitement. Ce qui nous
donne 30 séries de valeurs avant traitement et 30 après traitement provenant
des mêmes individus.
Il s’agit bien dans cet exemple, d’un test de Student apparié car les deux
séries de valeurs ont un lien (les souris). Pour chaque souris, on a deux
mesures (l’une avant et l’autre après traitement).
Calcul :
Soit xij lʹobservation j pour la paire i (j = 1,2 et i = 1,2,...,n). Pour chaque paire
dʹobservations on calcule la différence di = xi2 ‐ xi1. Le test statistique est
défini par :
tcal =
‐ n est le nombre de paires dʹobservations
‐ d est la moyenne des différences entre les observations et
‐ Sd² la variance des différences.
d.d.l=n−1

Cas n°3 : Comparaison de moyennes de deux échantillons indépendants
Etant donné deux échantillons de taille n1 et n2. Dans ce cas les deux
échantillons sont indépendants entre eux.
Calcul :
On calcule la valeur t cal comme suit
T cal =
‐ x1 et x2 sont les moyennes des deux échantillons
‐ Sp² la variance commune.
‐ n 1 : est la taille de lʹéchantillon 1
‐ n 2 : est la taille de lʹéchantillon 2
La valeur t tab correspondant au risque alpha = 5% pour un degré de liberté :
ddl= n1+n2−2
*Si la valeur de t calculé (|t|) est supérieure à la valeur de t de table, alors la
différence est significative. Dans le cas contraire, elle, ne l’est pas. Le degré de
significativité (ou p‐value) correspond au risque indiqué par la table de
Student pour la valeur |t|.

A .2. Le Test non paramétrique Chi 2 ou Khi 2
Le test d’indépendance du Chi 2 sert à apprécier l’existence ou non d’une
relation entre deux caractères au sein d’une population, lorsque ces caractères
sont qualitatifs où lorsqu’un caractère est quantitatif et l’autre qualitatif, ou
bien encore lorsque les deux caractères sont quantitatifs mais que les valeurs
ont été regroupées.
Pour les caractères qualitatifs la notion de moyenne n ‘existe pas donc il faux
prendre e compte la distribution dans son ensemble
Par exemple si on veut vérifier si la répartition des groupes sanguins dépend
du sexe
Les étapes à suivre sont comme suit :
1‐ On pose l'hypothèse H0 : "Il n'y a pas de relation entre la répartition des groupes
sanguins et le sexe
2‐ Calcul :
On détermine la valeur du chi2 calculé (chi2 cal)comme suit
chi2 cal=  (effectifs observes‐effectifs théoriques)2/ effectifs théoriques
3‐ On détermine le chi2 table, Cette valeur est lue dans une table du test du Chi-2 a
l’aide de deux valeur(=0.05, ddl=n‐1)
4‐ comparer chi2 cal et chi 2 tab
‐si chi2 cal inferieur à chi 2 tab : y’a une indépendance entre la répartition des
groupes sanguins et le sexe
‐si chi2 cal supérieur à chi 2 tab : y’a une dépendance entre la répartition des
groupes sanguins et le sexe
Avec un risque d'erreur de =5%.
5‐ explication de la signification
Ce test permet de déterminer la dépendance mais ne donne pas la puissance
de cette dépendance.
 Le Chi 2 aussi peut aussi être un test d’ajustement pour comparer la
distribution de fréquences d’un échantillon par rapport à la distribution de
fréquences attendu c.a.d évaluer à quel point les données que vous
obtenez lors d’une expérience sont bien ajusté aux données théoriques
attendus.

Outils Statistiques Et Informatiques Belkasmi F

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Outils Statistiques Et Informatiques Belkasmi F

Transféré par

Droits d'auteur :

Formats disponibles

Il s’agit de comparer une moyenne d’un échantillon à une moyenne

Le test de Student sert aussi à comparer les moyennes de deux populations,

significativité (ou p‐value) correspond au risque indiqué par la table de

1‐ On pose l'hypothèse H0 : "Il n'y a pas de relation entre la répartition des groupes

On détermine la valeur du chi2 calculé (chi2 cal)comme suit

fréquences attendu c.a.d évaluer à quel point les données que vous

Vous aimerez peut-être aussi