Vous êtes sur la page 1sur 53

MASTER GNIE

FACULTE DES SCIENCES


UNIVERSITE IBN TOFAIL
DES MATRIAUX ET
TECHNOLOGIE DES
CIMENTS ET
CRAMIQUES
Test d'hypothse

Ralis par: Encadr par:


Aboulouafa Khalid LATIFI Mohammed
Ouadid Oussama
Bendadesse Ezzoubair
Boutakrida Ayoub
Touite Azeddine
Plan
Introduction
Principe des tests
1. Mthodologie
2. Hypothse nulle (H0 ) et hypothse alternative (H1 )
3. Risques derreur
4. Puissance dun test
Test de comparaison de deux moyennes
( test Z)
1. Comparaison dune moyenne observe une moyenne thorique.
2. Comparaison de 2 moyennes observes sur 2 chantillons
indpendants.
3. Comparaison de 2 moyennes observes sur 2 chantillons apparis.
Test de comparaison de plusieurs
moyennes(Analysis Of Variance-ANOVA)
Test de student
1. Le test de student pour chantillon unique.
2. Le test de student comparant deux groupes dchantillon indpendants.
3. Le test de student comparant deux groupes dchantillons dpendants.

test du 2
1. Le test du 2 d'ajustement
2. Le test du 2 d'homognit
3. Le test du 2 d'indpendance

. Procdure spss : cas de deux chantillons

indpendants.
introduction
Un test dhypothse est un procd dinfrence permettant
de contrler (accepter ou rejeter) partir de ltude dun ou
plusieurs chantillons alatoires.

la validit dhypothses relatives une ou plusieurs


populations.

On distinguera deux classes de tests :


-Les tests paramtriques
-Les tests non paramtriques
Principe des tests

1- Mthodologie
Le principe des tests dhypothse est de poser une hypothse de travail et
de prdire les consquences de cette hypothse pour la population ou
lchantillon.

On compare ces prdictions avec les observations et lon conclut en


acceptant ou en rejetant lhypothse de travail partir de rgles de dcisions
objectives.

Direntes tapes doivent tre suivies pour tester une hypothse

1) dnir lhypothse nulle, note H0 , contrler .


2) choisir une statistique pour contrler H0 .
3) dnir la distribution de la statistique sous lhypothse H0 est ralise
.
4) dnir le niveau de signication du test et la rgion
critique associe ;
5) calculer, partir des donnes fournies par lchantillon,
la valeur de la statistique ;
6) prendre une dcision concernant lhypothse pose .

2- Hypothse nulle (H0 ) et hypothse alternative (H1 )

Lhypothse nulle note H0 est lhypothse que lon dsire


contrler : elle consiste dire quil nexiste pas de
dirence entre les paramtres compars ou que la
dirence observe nest pas signicative et est due aux
uctuations dchantillonnage. Cette hypothse est
formule dans le but dtre rejete.
Lhypothse alternative note H1 est la "ngation" de H0, elle est
quivalente dire H 0 est fausse . La dcision de rejeter H0
signie que H1 est ralise ou H 1 est vraie.

3- Risques derreur

rejeter l'hypothse nulle alors qu'elle est vraie. On appelle ce risque le


risque de premire espce et on note la probabilit de se tromper
dans ce sens

retenir l'hypothse nulle alors qu'elle est fausse. On appelle ce risque


le risque de deuxime espce et on note la probabilit de se tromper
dans ce sens.
4- Puissance dun test

Rappelons que les tests ne sont pas faits pour dmontrer H


0 mais pour rejeter H 0 . Laptitude dun test rejeter H 0
alors quelle est fausse constitue la puissance du test.

On appelle puissance dun test, la probabilit de rejeter H0 et


daccepter H1 alors que H1 est vraie. Sa valeur est 1
Test de comparaison
de deux moyennes
( test Z)
1. Comparaison dune moyenne observe une
moyenne thorique.
2. Comparaison de 2 moyennes observes sur 2
chantillons indpendants.
3. Comparaison de 2 moyennes observes sur 2
chantillons apparis.
Comparaison dune moyenne observe une
1.
moyenne thorique
Comparer une moyenne observe (m) sur un chantillon issu dune
population de moyenne inconnue () une valeur thorique ou
moyenne thorique connue (H0) dune population de rfrence

population population de
, rfrence

chantillon H0
m, s

1. Formulation des hypothses


H0 : = H0
H1 : H0
population
, population de
rfrence
chantillon
m, s
H0

m
(fluctuations
dchantillonnage)

Sous H0 : = H0 - H0 = 0

Si n > 30 : m N (, /n)

Rappel : m est une ralisation de la V.A. moyenne empirique dun chantillon de


taille n de moyenne et dcart type /n (cf cours Pr Cinquin, chap 5, diapo 8)
m - H0 N (0, /n)

(on a centr m en lui retranchant sa moyenne . Or tant inconnue, on lui


substitue H0 qui est connue et dont on sait sous H0 que = H0)

(on a rduit (m - H0) en la divisant par son cart-type /n)


La variance dans la population tant le plus souvent
inconnue, on lui substitue son estimateur s (s = estimation
de partir de lchantillon)
Densit de probabilit de loi normale centre
rduite N(0,1)

- 0 +
valeurs peu valeurs peu
probables de valeurs probables de Z probables
Z de Z

Abscisse : valeurs possibles de Z sous H0


Densit de probabilit de loi normale centre
rduite (0,1) = 5% (0,05)

P(Z <- 1,96) = 2,5% P(Z > 1,96) = 2,5%

- -Z = - 1,96 +Z = 1,96 +
0

Abscisse : valeurs possibles de Z sous H0

Z = valeur de Z pour le risque


1
(non-rejet de H0)

/2
/2
(rejet de H0 = acceptation
(rejet de H0 = acceptation
de H1)
de H1)

-z z
0
|Zo| > Z |Zo| Z |Z| > Z

Abscisse : valeurs possibles de Z sous H0

Z = valeur de Z pour le risque


Zo = valeur observe de Z pour
lchantillon
Z est la variable alatoire

Z est une valeur particulire


de la variable
alatoire Z telle que P(Z >
Z) =
(Z est la valeur de Z pour le
risque )
(en sant et biologie, =
0.05)
Zo est une ralisation de la
variable alatoire Z
Dtermination de la valeur de Z
correspondant un risque = 0.05 (5%)
Table de lcart rduit

La table donne la probabilit pour que l'cart-rduit


dpasse en valeur absolue une valeur donne , c'est--
dire la probabilit extrieure l'intervalle [-,]. La
probabilit s'obtient par addition des nombres inscrits
en marge

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09

2,576 2,326 2,170 2,054 1,960 1,881 1,812 1,751 1,695


0,0
0,1 1,645 1,598 1,555 1,514 1,476 1,440 1,405 1,372 1,341 1,311

0,2 1,282 1,254 1,227 1,200 1,175 1,150 1,126 1,103 1,080 1,058

0,3 1,036 1,015 0,994 0,974 0,954 0,935 0,915 0,896 0,878 0,860

0,4 0,842 0,824 0,806 0,789 0,772 0,755 0,739 0,722 0,706 0,690

0,5 0,674 0,659 0,643 0,628 0,613 0,598 0,583 0,568 0,553 0,539

0,6 0,524 0,510 0,496 0,482 0,468 0,454 0,440 0,426 0,412 0,399

0,7 0,385 0,372 0,358 0,345 0,332 0,319 0,305 0,292 0,279 0,266

0,8 0,253 0,240 0,228 0,215 0,202 0,189 0,176 0,164 0,151 0,138

0,9 0,126 0,113 0,100 0,088 0,075 0,063 0,050 0,038 0,025 0,013
Dtermination du degr de signification associ Zo
(P- value)

0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
2,576 2,326 2,170 2,054 1,960 1,881 1,812 1,751 1,695
0,0
0,1 1,645 1,598 1,555 1,514 1,476 1,440 1,405 1,372 1,341 1,311
0,2 1,282 1,254 1,227 1,200 1,175 1,150 1,126 1,103 1,080 1,058
0,3 1,036 1,015 0,994 0,974 0,954 0,935 0,915 0,896 0,878 0,860
0,4 0,842 0,824 0,806 0,789 0,772 0,755 0,739 0,722 0,706 0,690
0,5 0,674 0,659 0,643 0,628 0,613 0,598 0,583 0,568 0,553 0,539
0,6 0,524 0,510 0,496 0,482 0,468 0,454 0,440 0,426 0,412 0,399
0,7 0,385 0,372 0,358 0,345 0,332 0,319 0,305 0,292 0,279 0,266
0,8 0,253 0,240 0,228 0,215 0,202 0,189 0,176 0,164 0,151 0,138
0,9 0,126 0,113 0,100 0,088 0,075 0,063 0,050 0,038 0,025 0,013

Exemple : Zo = 1.37 P-value = 0.17


II. Comparaison de deux moyennes
observes (chantillons indpendants)
population1 population 2
1, 1 2 , 2
chantillon chantillon
m1, s1
m2, s2

Indpendant signifie que lchantillon 1 est constitu de


manire indpendante de lchantillon 2 (par opposition aux
chantillons apparis) :
Les sujets de lchantillon 1 ne sont pas les mmes que
ceux de lchantillon 2
Les 2 chantillons peuvent tre deffectifs diffrents.
population1 population 2
1, 1 2, 2
chantillon chantillon
m1, s1
m2, s2

1.Formulatin des hypothses H0 : 1 = 2


H1 : 1 2
2. Risque = 0.05 (5%) a priori
3. Choix du test
Test Z de lcart rduit (n1 30 et n2 30 )
Test t de Student (hypothse de normalit,
variances comparables)
Sous H0 : 1 - 2 = 0

Rappel : m1 est une ralisation de la V.A. moyenne empirique dun chantillon de

taille n1 de moyenne 1 et dcart type 1/n1 : m1 N(1, 1/n1)

idem : m2 N(2, 2/n2)

var (m1-m2) = var (m1) + var (m2) 2 cov (m1,m2)

NB : var(a-b) = var(a) + var(b) 2 cov(a,b) cf analogie avec (a-b) = a + b - 2a.b


Test Z de lcart rduit

Si n1 30 et n2 30

Sous H0 : 1 = 2 1 - 2 = 0

s est un estimateur de
III. Comparaison de deux moyennes observes
(chantillons apparis)

Obs 1 Obs1
Obs1 1 Obs2 1
Obs 2 Obs 2
Obs 3 Obs1 2 Obs2 2
Obs 3
Obs1 3 Obs2 3
Obs n2
Obs n1
Obs1 n1 Obs2 n2

m1 m2

chantillons indpendants chantillons apparis


sujet pris comme son propre
tmoin 2 membres dune fratrie
(n1 = n2 ou n1 n2)
(n1 = n2 = n)
Les mesures PAS1 et PAS2 du sujet 1 ne sont
Avant Aprs pas indpendantes

Les 2 mesures ont t effectues sur le mme


PAS1 1 PAS2 1
sujet : si PAS1 tait trs leve, il est probable
PAS1 2 PAS2 2
que PAS2 restera leve
PAS1 3 PAS2 3
(mais moins que PAS1 si le traitement est

efficace)
PAS1 n PAS2 n
Le test doit prendre en compte cette
dpendance des observations PAS1 et PAS2
Traitement anti-
(En revanche, les mesures PAS2 du sujet
hypertenseur
1 et PAS2 du sujet 2 sont indpendantes)
H0 : mPASavant = mPASaprs
Z pour chantillons indpendants
m1 m 2
var (m1 m2) = var (m1) + var (m2) 2 cov(m1, m2) = var (m1) + var (m2)

Z pour chantillons apparis


m1 m2
var (m1 m2) = var (m1) + var (m2) 2 cov (m1, m2)

m1 m2
Z
var m1 var m 2 2 cov m1 , m 2

Zappari > Zindpendant gain de puissance
Echantillons apparis

m1 m2
Z
var m1 var m 2 2 cov m1 , m 2

ne peut pas tre estime


directement car on ne
dispose que dune mesure
de m1 et une mesure de m2

Il faut estimer var(m1 - m2) dune autre faon


Echantillons apparis

(m1 - m2) = md, avec

var (md) = sd / n, avec

md est une ralisation de la V.A. moyenne empirique des diffrences dun


chantillon de taille n de moyenne d et dcart type d/n
Echantillons apparis

Lunit danalyse devient la diffrence di entre lobservation 1 et


lobservation 2 pour chaque sujet

di = (Obs1 i Obs2 i)

d1
Obs1 1 d2 Obs2 1

Obs1 2 di Obs2 2
Obs1 i Obs2 i

dn
Obs1 n Obs2 n

m1 m2
Test Z de lcart rduit pour chantillons apparis

H0 : d = 0 (1 = 2)

H1 : d 0 (1 2)
Si n 30 paires
1
(non-rejet de H0)

/2 (rejet de /2 (rejet de H0)


H0)

-z z

|Zo| > Z |Zo| Z |Zo| > Z


TEST DE COMPARAISON DE PLUSIEURS
MOYENNES (ANalysis Of Variance-ANOVA)
Pourquoi le nom analyse de variance?

Quand et pourquoi faut-il faire une analyse de variance ?

Quand? Si votre recherche comporte plus de deux groupes (indpendants ou non) et que votre
variable dpendante est quantitative.

Pourquoi faire une analyse de variance ?

-Pour comparer la variance de ces groupes (variable x) afin d'infrer une relation entre X et Y

-Les tests statistiques comme l'analyse de variance permettent au chercheur de rejeter ou non l'hypothse null
,donc de prendre une dcision quant la valeur de cette hypothse.

-Avant de procder une analyse de variance , il faut formuler vos hypothses statistiques (H o et H1).
Comment formuler les hypothses statistiques dune ANOVA
-Dans la logique de tout test d'hypothse - test t, khi-carr, analyse de variance, etc. - il y a toujours
deux hypothses statistiques.
Lhypothse nulle

L'hypothse alternative :
Habituellement l'hypothse du chercheur

-X est bien la cause de Y


-L'hypothse alternative d'une analyse de variance est toujours bidirectionnelle.
-Le rle d'un test dhypothse est de permettre aux chercheurs de prendre une dcision
-Transformation de l'hypothse ou l'objectif de sa recherche, selon le cas, en hypothse statistique
-Une hypothse bilatrale ou bidirectionnelle est formule lorsque le chercheur se contente de formule
un objectif de recherche.
Une analyse de variance 1 facteur
-Dans l'analyse de variance, il y a deux tableaux importants
Le F et le ddl permettent de calculer la valeur de p ou Signification.

La valeur de p ou Signification est l'erreur alpha, soit la probabilit ou le risque de


commettre une erreur en dclarant qu'il existe une diffrence entre les 3 groupes ou les 3
mesures.

La valeur de p ou Sig. permet de confirmer ou d'infirmer votre hypothse alternative (H1).

Le seuil de signification est de 0,05.

Si Signification ou valeur de p est suprieure 0,05 Accepter l'hypothse nulle


Il n'y a pas de diffrence significative entre vos groupes

Si la signification ou la valeur de p de votre test est infrieure 0,05


1) d'abord rejetez l'hypothse nulle ( H0 ) Il y a une diffrence significative
entre les trois groupes.
2) procdez un test post-hoc
Test Post-Hoc
Le rsultat significatif de ce test indique que certains groupes ou chantillons pris deux deux sont
significativement diffrents; mais lorsque le test est effectu avec trois groupes et plus, il ne prcise par quelle
paire de groupes prsente un cart significatif.

Faire un test supplmentaire ou test post-hoc, qui nous indiquera laquelle des trois paires de groupes sont
diffrents
La taille de leffet
- Il est possible de calculer la taille de leffet pour lANOVA. La formule est trs simple
puisquelle implique des lments dj calculs.
Test de student
Le test de student est un test statistique permettant de comparer les
moyennes de deux groupes dchantillons.

Il existe plusieurs variantes du test de student :


Le test de student pour chantillon unique.

Le test de student comparant deux groupes dchantillon

indpendants.
Le test de student comparant deux groupes dchantillons dpendants.
Les conditions dapplication du test de student :

La population suite une courbe normale.

La taille de lchantillon est de 30 ou moins.

La variance est inconnue et est estim grce a la variance de lchantillon.


I. Le test de student pour chantillon unique :
Soit X, une variable alatoire observe sur une population,
suivant une loi normale et un chantillon extrait de cette
population.
les hypothses tester sont :
hypothse nulle H0 : = 0
hypothse alternative :
o H1 : > 0 (test unilatral droite )
o H1 : < 0 (test unilatral gauche)
o H1 : 0 ( test bilatral )
on calcule t de la manire suivante :

avec :

t suit une loi de student n-1 degrs de libert.

- si t(obs) > t(seuil ) lhypothse H0 est rejete au risque derreur .

- si t(obs ) t(seuil) lhypothse H0 est accepte.

Les valeurs critiques pour diffrents degrs de libert et diffrents seuils de


signification sont donnes par la table de Student.

Pour un test unilatral, nous prendrons la valeur t(n-1,1- ) de la table et pour un test
bilatral, nous prendrons t(n-1,1- /2).
II- Test de Student pour deux chantillons indpendants :

soit la distribution dchantillonnage de la moyenne dans la populations 1


suit une loi normale tels que :
et de mme pour

les variances des populations ntant pas connues, on fait lhypothse


que les deux populations prsentent la mme variance :

donc suit une loi normale :

on calcule t de la manire suivante :

avec :

t suit une loi de student a n1+n2-2 degrs de libert.


les hypothses tester sont :
hypothse nulle H0 : 1 = 2
hypothse alternative qui prend trois formes :
H1 : 1 > 2 (test unilatral droite)
H1 : 1 < 2 ( test unilatral gauche)
H1 : 1 2 (test bilatral)
si t(obs) > t( seuil) on rejette H0.
- Si le test est unilatral, nous prendrons la valeur t(n 1 + n2 - 2,1- ) .
- S'il est bilatral, nous prendrons la valeur t(n 1+n2-2,1- /2).
III- Test de student pour chantillons apparis :

Le test de Student pour observations paries est un test bilatral.


Les hypothses tester sont :
H0 : 1 - 2 = 0
H1 : 1 - 2 0
on calcule t de la manire suivante :

On rejette l'hypothse nulle au seuil de signification si :


|t obs| > t(n-1,1- /2) o t (n-1,1- /2) est la valeur de la table de Student avec
n - 1 degrs de libert.
test du 2
Les tests du 2 (chi-deux, chi-carre, ...) sont bass sur la statistique du
L'objectif de ces tests est principalement de comparer des distributions
entre elles.
Ces tests peuvent tre appliques a des variables de nature qualitative
(binaire, nominale, ordinale, quantitative regroupe en classes).
Trois types de test du 2 peuvent tre distingues :

I. Le test du 2 d'ajustement dont l'objectif est de comparer une distribution


observe sur un chantillon a une distribution thorique (binomiale,
Poisson, normale, ...) ou a une distribution connue dans la population sous-
jacente.
II.Le test du 2 d'homognit dont l'objectif est deux comparer deux ou
plusieurs distributions observes sur des chantillons.

III.Le test du 2 d'indpendance qui est utilise pour tudier sur un mme
chantillon la liaison entre deux variables qualitatives.
Tableau de contingence
Le test du 2 se base sur la notion d'effectifs synthtiss au sein d'un tableau
de contingence. La forme de ce dernier dpend du type de test qui est utilis.

1. Dans le cadre du test du 2 d'ajustement

Variable Effectifs observs

Modalit 1 o1

Modalit 2 o2
. .
. .
. .

Modalit p op

Total N
2. Dans le cas du test du 2 d'homognit,

Effectifs observs

Variable Echantillon Echantillon Echantillon Total


1 2 k

Modalit 1 O11 O12 O1k tp

Modalit 2 O21 O22 O2k tp

. . . . .
. . . . .
. . . . .
Opk
Modalit p Op1 Op2 tp

Total n2 n2 nk N
3. Dans le cadre du test du 2 d'indpendance

Variable X2
Variable X1 Modalit 1 Modalit 2 Modalit k Total
Modalit 1 O11 O12 O1k t1
Modalit2 O21 O21 O2k t2
. . . . .
. . . . .
. . . . .

Modalit p Op1 Op2 Opk tp


Total n1 n2 nk N
Calcul de la statistique de test : cas gnral

Effectifs observs
Variable Echantill Echantill Echantill Total
on 1 on2 on k
Modalit O11 O12 O1k t1
1
Modalit O21 O22 O2k t2
2
. . . . .
. . . . .
. . . . .
Modalit Op1 Op2 Opk tp
p
Total n1 n2 nk N
On dfinit l'effectif thorique eij associ la case {i,j} du tableau par la quantit
suivante :

Effectifs thoriques
Variable Echantillo Echantillo Echantillo Total
n1 n2 nk
Modalit e11 e12 e1k t1
1
Modalit e21 e22 e2k t2
2
. . . . .
. . . . .
. . . . .
Modalit ep1 ep2 epk tp
p
Sous H0, le test du 2 a pour
Total n1 statistique
n2 de test : nk N
Interprtation du test du 2

Dans le cadre du test du 2 d'ajustement et du test du 2 d'homognit, l'interprtation est


la suivante :

Si la valeur de la statistique de test 2 est infrieure a la valeur seuil 2(1 );(p 1)(k 1) ddl alors on
conserve l'hypothse nulle. On ne peut pas affirmer que les chantillons sont issus de
population diffrente (i.e. les distributions semblent identiques).

Si la valeur de la statistique de test 2 est suprieure a la valeur seuil 2(1 );(p 1)(k 1) ddl alors on
rejette l'hypothse nulle. Les chantillons sont issus de populations diffrentes (i.e. les
distributions sont significativement diffrentes entre les chantillons).
Dans le cadre du test du 2 d'indpendance, l'interprtation est la suivante :

Si la valeur de la statistique de test 2 est infrieure la valeur seuil

alors on conserve l'hypothse nulle. Les variables X1 et X2 sont indpendantes. (i.e. leur
distribution est Indpendante).

Si la valeur de la statistique de test 2 est suprieure la valeur seuil

alors on rejette l'hypothse nulle. Il existe une liaison significative entre X1 et X2 (i.e. leurs
distributions sont dpendantes).
Merci
de
votre