Vous êtes sur la page 1sur 5

Loi de Fisher

!
!

!
!
!

Famille de distributions F.
Chaque membre de la famille est dtermin par
deux paramtres: le nombre de degrs de libert du
numrateur et le nombre de degrs de libert du
dnominateur.
F est continue et positive.
F est positivement asymtrique.
Ses valeurs vont de 0 . Quand F , la courbe
se rapproche de l axe des abscisses.
1

Guy Cucumel 2001

P
r
o
b
a
b
i
l
i
t

df = (29, 28)
df = (19, 6)
df = (6, 6)

Test de Fisher
!

Exemple

Pour un test bilatral, la statistique de test est


donne par:
2

F = Max(S21,S22)
Min(S1,S2)
!

L'hypothse nulle est rejete si la statistique de test


est plus grande qu'une valeur critique lue dans une
table de Fisher.
Pour un test unilatral, la statistique de test est
donne par:
F=

Guy Cucumel 2001

Un courtier rapporte que le taux de rendement


moyen pour un chantillon dactions de 10
compagnies ptrolire est de 12.6% avec un carttype de 3.9%. Le taux de rendement moyen des
actions de 8 compagnies de service est de 10.9%
avec un cart-type de 3.5%. Avec un risque de 5%
peut-on conclure que les actions des compagnies
ptrolires sont plus volatiles que celles de
compagnies de service?

2
2
S1
2 si H1 : 1 > 2
S2

!
!
!
!
!
!
!

ANOVA un facteur

Etape 1: Etablir l hypothse nulle et lhypothse


alternative.
H0: p = s
H1: p > s
Etape 2: Etablir la rgle de dcision.
H0 est rejete si F > 3.68, dl= (9, 7), = 0.05.
Etape 3: Calculer la statistique de test.
F = (3.9)2/(3.5)2 = 1.2416.
Etape 4: Dcision sur H0?
H0 n est pas rejete.

Guy Cucumel 2001

Guy Cucumel 2001

Solution
!

Guy Cucumel 2001

1. Test d'galit de deux moyennes ou plus


2. Variables
"

une variable indpendante nominale

"

une variable dpendante de niveau


intervalle ou proportionnel

2 catgories ou plus

3. Gnralisation du test de Student

Guy Cucumel 2001

Conditions d'application
de l'ANOVA

Hypothses de l'ANOVA
H0: 1 = 2 = 3 = ... = k

1. Les chantillons sont tirs alatoirement


et sont indpendants

"

2. Les populations sont normalement


distribues (ou approximativement
normalement)

f(X)

1 = 2 = 3

H1: Les moyennes des


populations ne sont pas
toutes gales
"

3. Les populations ont mme variance


s

Toutes les moyennes


des poulations sont
gales

Le test de Fisher est sensible la violation de


ces hypothses - il n'est pas robuste.

"

Guy Cucumel 2001

f(X)

Au moins une des


moyennes est diffrente
Ne signifie pas:
1 2 ... k

1 = 2 3

X
8

Guy Cucumel 2001

Dcomposition de la
variation totale

Principe
On estime la variance selon deux approches:
1.

Variation totale

La variance intra-groupes (MCE) qui demeure correcte


que les moyennes des populations soient gales ou
pas

Base sur la moyenne des estimations des cart-types


des populations
La variance inter-groupes (MCF) qui est sans biais si et
seulement si l'hypothse d'galit des moyennes est
vraie
s Base sur la variation des moyennes chantillonnales
3. Si l'hypothse nulle est vraie, les deux estimations
devraient tre proches

Variation interclasses

Variation intraclasses

2.

Guy Cucumel 2001

Somme des carrs du


modle
" Somme des carrs due au
facteur
" Sum of Squares Between
"

Somme
Moyenne
Des carrs des carrs
(Variance)

Formules (1)
k

Facteur

k-1

SCF

MCF =
MCF
SCF/(k - 1) MCE

Erreur

n-k

SCE

MCE =
SCE/(n - k)

10

Guy Cucumel 2001

Tableau d'analyse de la
variance
Source de Degrs
variation
de
libert

Guy Cucumel 2001

n-1

ni

SCT =
i =1 j=1

(x x )
ij

ni

SCF = (xi x )
k

i=1 j =1

Total

Somme des carrs des


erreurs
" Sum of Squares Within
"

SCT =
SCF+SCE

s
11

Guy Cucumel 2001

ni

SCE =
i=1 j=1

(x x )
ij

12

Formules (2)

Exemple

2
2
k

SCF = Ti T
i=1 n
i n

Un manufacturier souhaite voir


si trois machine remplissage
ont des rendements diffrents.
Il assigne alatoirement 15
travailleurs entrans de la
mme manire aux trois
machines (5 par machine).
Avec un risque de 5%, les trois
machines ont-elles un
rendement diffrent?

2
SCE = xij Ti
i=1 n
i=1 j=1
i
ni

SCT = SCF + SCE


Ti reprsente la somme des observations de lchantillon i
(i=1,,k), ni la taille de lchantillon i et T le nombre total
s
dobservations.
13

Guy Cucumel 2001

F=

MCE

23.58

14

. 92

Source de Degrs de
variation
libert

= 25.6

Facteur

Dcision:
Rejet = 0.05

= 0.05

Conclusion:
Au moins une des moyennes
0

3.89

Guy Cucumel 2001

diffre des autres.

15

1.

"

ex : 1 = 2 3

"

faite aprs le rejet


de l'hypothse nulle

Total

15 - 1 = 14 58.2172

.9211

16

Lorsqu'on fait plusieurs comparaisons impliquant les


mmes moyennes, la probabilit qu'une comparaison
indique un test de Student statistiquement significatif
croit avec le nombre de comparaisons

2.

2 groupements
Guy Cucumel 2001

15 - 3 = 12 11.0532

ex: 5 groupes, 10 paires de moyennes. Si l'hypothse


nulle de l'ANOVA n'est pas rejete, la probabilit qu'au
moins un des 10 tests soit significatif avec un risque de
5% est de 0,29.

f(X)

1 = 2 3

Erreur

Tests de Bonferroni
et de Scheff

1. Quelles sont les moyennes qui sont


significativement diffrentes
2. Analyse Post Hoc

3-1=2

Somme Moyenne
F
des
des carrs
(variance)
carrs
47.1640 23.5820 25.60

Guy Cucumel 2001

Quelle moyenne diffre

"

M3
20.00
22.20
19.75
20.60
20.40

Calculs

Statistique de test:

MCF

M2
23.40
21.80
23.50
22.75
21.60

Guy Cucumel 2001

Solution
H0: 1 = 2 = 3
H1: pas toutes gales
= .05
dl1= 2 dl2 = 12
Valeurs critiques:

M1
25.40
26.31
24.10
23.74
25.10

17

Le test de Bonferroni permet de corriger le problme.


Pour 5 comparaisons la correction de Bonferroni
s indiquera que le test est significatif 5% si on est un
degr de significativit de moins de 0.05/5 soit 0.01.
3. Le test de Scheff est encore plus conservateur
Guy Cucumel 2001

18

Hypothses de lANOVA
deux facteurs

ANOVA deux facteurs


1. Test de lgalit de la moyenne pour 2
populations ou plus pour plusieurs
variables indpendantes (facteurs).

1. Normalit
"

2. Hypothses - Diffrences entre:

2. Homognit des variances

(1) les moyennes selon le premier facteur, (2) les


moyennes selon le deuxime facteur

"

"

19

Guy Cucumel 2001

Dcomposition de la variation totale


dans une ANOVA deux facteurs

Les populations ont des variances gales

3. Indpendance des termes derreurs

et (3) les interactions entre les facteurs (1) et (2)

Les chantillons sont alatoires et


indpendants

Tableau danalyse de la variance


deux facteurs sans interaction
Source de Degrs de
Somme Moyenne
F
variation
libert
des carrs des carrs
F1
k-1
SCF1
MCF1 MCF1
MCE
(lignes)

SCT =

F2
(colonnes)

Variation due au
facteur 2

n-1

SCF2

MCF2

Erreur

(k-1)(n-1)

SCE

MCE

Total

kn - 1

SCT

MCF2
MCE

SCF2 +

SCF1 +
Variation due
linteraction

Variation due
lerreur

SCI +

SCE
21

Guy Cucumel 2001

Modle dANOVA un
facteur

Source de Degrs de
Somme Moyenne
F
variation
libert
des carrs des carrs
F1
k-1
SCF1
MCF1 MCF1
MCE
(lignes)
F2
(colonnes)

n-1

SCF2

MCF2

F1xF2
(interaction)

(k-1)(n-1)

SCI

MCI

Erreur

kn(r-1)

SCE

MCE

Total

knr - 1

SCT

22

Guy Cucumel 2001

Tableau danalyse de la variance


deux facteurs avec interaction

Guy Cucumel 2001

20

Guy Cucumel 2001

Variation totale

Variation due au
facteur 1

Les populations sont normalement


distribues

Xij = + i + ij

MCF2
MCE
MCI
MCE

s
23

Guy Cucumel 2001

= 0
i=1

24

Modle dANOVA deux


facteurs sans interaction

Modle dANOVA deux


facteurs avec interaction

Xij = + i + j + ij
k

Xijh = + i + j + ij + ijh
k

i = j = 0
s

i=1

Guy Cucumel 2001

= = =

i=1

j=1

j=1

i=1

ij

j=1

ij

=0

s
25

Guy Cucumel 2001

26