Vous êtes sur la page 1sur 116

19/09/2012

1
Statistique et Probabilit
Michel TENIKUE

FUNDP Namur(michel.tenikue@fundp.ac.be )
CEPS/INSTEAD Luxembourg (michel.tenikue@ceps.lu)

Manuel
Statistique
Economie-Gestion-Sciences-Medecine
(avec exercices dapplication)

Thomas H. Wonnacott et Ronald J. Wonnacott
4e Edition ( traduction en Franais)
Economica

Notes: Photocopies disponibles au secrtariat
19/09/2012
2
TPs
Par Fabienne Mathot(fmathot@fundp.ac.be)

Dbut : 18 septembre 2012
Fin: 6 novembre




Evaluation
Examen crit livre ferm sauf
4 pages de format A4 de notes


Examen: 9 janvier 2013


19/09/2012
3
Plan du cours
Le cours est un cours d'introduction la statistique. Il se
compose de trois parties/modules essentielles:

1. les statistiques descriptives
2. l'analyse des probabilits
3. l'infrence statistique sur les moyennes et les
proportions

Plan du cours: 3 modules
Module 1: Statistique descriptive
Chap. 1: Nature de la statistique
Chap. 2: Statistique descriptive
Module 2: Probabilits
Chap. 3: Probabilits
Chap. 4: Distributions de probabilit
Chap. 5: Couple de variables alatoires
Module 3: Infrence statistique
Chap. 6: L'chantillonnage
Chap. 7: L'estimation ponctuelle
Chap. 8: L'estimation par intervalle
Chap. 9: Tests d' hypothse


19/09/2012
4
Chapitre 1: Nature de la statistique
Nature de la statistique
Social or economic
problem
Policy / solution
Ideas / theories / paradigms
Try to resolve
is based on
are validated by
Logically / deductively
Empirically /
inductively
Models
Statistical tests
Population ou chantillon?
19/09/2012
5
Echantillonnage au hasard
Quest ce quun chantillon?

Echantillonnage
Population
Echantillon
Echantillonnage au hasard
Un chantillon doit tre fiable, reprsentatif de la
population. Ceci impose que:

- Chaque individu a une probabilit non nulle dy
appartenir

- Si deux individus ont des probabilits diffrentes
dappartenir l chantillon , cela doit tre pris en
compte pendant le tirage de l chantillon
( Si un groupe est surreprsent dans la population, il
devrait tre surreprsent dans lchantillon )

19/09/2012
6
Echantillonnage au hasard
Mthodes de tirage dun chantillon :

- Echantillon alatoire simple ( probabilit dinclusion
identique pour tous, quiprobabilit)

- Echantillonnage en cascade ( plusieurs degrs)
Pour ce cours, uniquement Echantillon alatoire simple
Echantillonnage au hasard
Pourquoi un chantillon?

- Ressources limites

-Raret des processus observs (jumeaux, etc.)

- Essais destructeurs (ampoules dfectueuses)

- Echantillon peut tre plus exacte (si erreur de
mesure, travailler sur chantillon peut tre prfrable)
19/09/2012
7
Echantillonnage au hasard
chantillon et infrence statistique:

On part des informations observes sur un chantillon
pour tirer des rsultats/conclusions qui sappliquent
lensemble de la population.

On parle aussi de raisonnement inductif.

Comment: Intervalle de confiance et test hypothse

Intervalle de confiance (Chap. 8)
Test d hypothse (Chap. 9)

Exemple dintervalle de confiance
: valeur dune proportion dans la population

P: valeur de la proportion sur l chantillon


= P + - marge d chantillonnage


La hasard garantit une absence de biais
19/09/2012
8
Exemple dintervalle de confiance
: valeur dune proportion dans la population

P: valeur de la proportion sur l chantillon

Pour un chantillon simple au hasard de taille n, on
peut affirmer avec environ 5% de chance de se
tromper que ( IC 95%):
n
P) P(1
* 1.96 P

=
Exercice 1.2 page 10
M F
Moins de 25 ans 19 26
25-50 38 34
50 et plus 48 60
Auditeurs prfrant la musique classique
M F
Moins de 25 ans 63 45
25-50 38 33
50 et plus 44 52
Auditeurs prfrant les varits
500 auditeurs
19/09/2012
9
Expriences alatoires: test de
linfluence dune habitude hospitalire
Problme: Est-ce que le lien affectif entre une mre et
son enfant nouveau-n dpend de lhabitude
hospitalire consistant permettre la jeune maman
de jeter un coup dil sur son enfant aprs la
dlivrance, puis le tenir loigne delle pendant prs
de 8 heures?

Comment choisir lchantillon?
Rappel: chantillon alatoire Absence de biais

A: Etude Cas-Tmoin
? Doit-on laisser les individus sauto slectionner
dans le groupe des cas et le groupe des tmoins?

Rponse: non problme dauto-slection
Solution: Affectation au hasard (randomisation)

Note: Pour certaines tudes, test dun mdicament par
ex, un protocole aveugle et double aveugle est
souvent ncessaire.

19/09/2012
10
Comment choisir lchantillon?
Rappel: chantillon alatoire Absence de biais

A: Etude Cas-Tmoin

Diviser la population en 2 groupes:

- Cas (respect de lhabitude)

- Tmoins (non respect de lhabitude)


Comment choisir lchantillon?
A: Etude Cas-Tmoin
Diviser la population en 2 groupes
- Cas (respect de lhabitude)
- Tmoins (non respect de lhabitude)

? Doit-on laisser les individus sauto slectionner dans
le groupe des cas et le groupe des tmoins?

Rponse: non problme dauto-slection
Solution: Affectation au hasard (randomisation)


19/09/2012
11
Comment choisir lchantillon?
B: Aveugle et Double Aveugle

Pour certaines tudes, test dun mdicament par ex,
un protocole aveugle et double aveugle est
souvent ncessaire.


Comment choisir lchantillon?
B: aveugle et double aveugle

But: maintenir cas et tmoins gaux lors de la slection
et pendant lexprimentation

Le mdecin ignore qui est cas et qui est tmoin
(aveugle)

Le malade ne connait pas son statut de cas ou de
tmoin( placebo ou mdicament) (double aveugle)



19/09/2012
12
Echantillonnage au hasard
Peut on toujours avoir un chantillon au hasard?

- Souvent impossible salaire = f(sexe)
- Souvent impraticable criminalit=f(urbain .rural)
- Souvent problme thique effet subside

En labsence de randomisation complte, une analyse de
rgression permet souvent dattnuer linfluence des biais
Exercice 1.9 page 20
19/09/2012
13
Exercice 1.16 page 25
Exercice 1.18 a et b
19/09/2012
14
Chapitre 2: Statistique descriptive
Echantillons et variables alatoires
Si on rpte un tirage dchantillon , lon obtient des chantillons diffrents

les mesures sur un chantillon sont des variables alatoires

Echantillonnage
Population
4 Echantillons

1
X
2
X
3
X
4
X
19/09/2012
15
Types de variables alatoires
2 types de variables alatoires (VA)

Variables discrtes

Variables continues
Types de variables alatoires
Variables alatoires discrtes:
X est une VA discrte si X ne peut prendre que
des valeurs entires dnombrables ( 0, 1, 2,
3)

Exemples: nombre de jours dabsence, nombre
dentreprises, nombre de personnes, etc.
19/09/2012
16
Variables alatoires discrtes
nombre de jours d'absence Frquence
0 3
1 2
2 5
3 8
4 7
5 2
6 13
7 2
8 4
9 0
10 1
11 2
12 0
13 1
Variables alatoires discrtes:
Frquence
Commande stata: hist nombredejoursdabsence [ fweight =f], discrete freq
3
2
5
8
7
2
13
2
4
1
2
1
0
5
1
0
1
5
F
r
e
q
u
e
n
c
y
0 5 10 15
nombre de jours d'absence
19/09/2012
17
Variables alatoires discrtes:
Frquence relative
Commande stata : hist nombredejoursdabsence [ fweight =f], discrete
.06
.04
.1
.16
.14
.04
.26
.04
.08
.02
.04
.02
0
.
0
5
.
1
.
1
5
.
2
.
2
5
D
e
n
s
i
t
y
0 5 10 15
nombre de jours d'absence
Types de variables alatoires
Variables alatoires continues:
X est une VA continue si X peut prendre des
valeurs qui varient de faon continue, des
valeurs relles (IR)

Exemples: taille en cm, poids en gramme
19/09/2012
18
Variables alatoires continues
Cration des classes/groupes
Limites classes Centre de classe frquence
58.5-61.5 60 4
61.5-64.5 63 12
66 44
69 64
72 56
73.5-76.5 75 16
76.5-79.5 78 4
Variables alatoires continues
Frquences
4
12
44
64
56
16
4
0
2
0
4
0
6
0
F
r
e
q
u
e
n
c
y
60 63 66 69 72 75 78
Centre de classe
Commande stata : hist centredeclasse [ fweight =frequence], freq dis addlabels xlabel(60(3)78, grid)
19/09/2012
19
Variables alatoires continues
Frquences relatives
Commande stata: hist centredeclasse [ fweight =frequence], dis addlabels xlabel(60(3)78, grid)
.0067
.02
.0733
.1067
.0933
.0267
.0067
0
.
0
2
.
0
4
.
0
6
.
0
8
.
1
D
e
n
s
i
t
y
60 63 66 69 72 75 78
Centre de classe
Variables alatoires continues
utilisation des percentiles
Un percentile de la variable continue X est chacune des
99 valeurs qui divise les donnes sur x en 100 parts
gales. Le n-ime percentile est la n-ime de ces
valeurs.
19/09/2012
20
Variables alatoires continues
utilisation des percentiles
limites
classes
Centre de
classe Frquence
Frquence
relative
Frquence
cumule
58.5-61.5 60 4 0,02 0,02
61.5-64.5 63 12 0,06 0,08
66 44 0,22 0,3
69 64 0,32 0,62
72 56 0,28 0,9
73.5-76.5 75 16 0,08 0,98
76.5-79.5 78 4 0,02 1
Le 8eme percentile est 63
Le 90eme percentile est 72
Variables alatoires continues
les quartiles
Percentiles qui partagent les donnes en 4 parts gales

1
er
quartile = 25
e
percentile

2
e
quartile = mdiane = 50
e
percentile

3
e
quartile = 75
e
percentile
19/09/2012
21
Variables alatoires continues
les quartiles et Box-Plots
Le graphique box-plot met en vidence les quartiles dune VA.
60 65 70 75 80
Centre de classe
1
er
quartile = 67

2
e
quartile = mdiane = 69.5

3
e
quartile = 72

Commande stata: graph hbox centredeclasse [ fweight =frequence]
Exercice 2.4 page 35
19/09/2012
22
Centre dune distribution
1. Mode : valeur la plus frquente

2. Mdiane: 50e percentile
N
X . .......... X X
X Moyenne
N 2 1
+ + +
= =
3 indicateurs: Mode , Mdiane et moyenne

= =
i
i i
X f
N
1
X pondere Moyenne
avec f
i
frquence absolue
3. Moyenne
Centre dune distribution
Tab 2.3
a) avaries pour
5 expditions b) taille
X X f
10 60 4
20 63 12
30 66 44
50 69 64
90 72 56
75 16
78 4
Calculer la moyenne des deux sries.
19/09/2012
23
Centre dune distribution
Positionnement relatif
0
.
0
5
.
1
D
e
n
s
i
t
y
60 63 66 69 72 75 78
Centre de classe
Mode = 69
Mdiane = 69
Moyenne = 69.3
Centre dune distribution
Positionnement relatif
Mode = 63
Mdiane = 66
Moyenne = 65
0
.
0
2
.
0
4
.
0
6
.
0
8
.
1
D
e
n
s
i
t
y
60 63 66 69 72 75 78
Centre de classe
19/09/2012
24
Centre dune distribution
Positionnement relatif
Mode = 75
Mdiane = 72
Moyenne = 72.5
0
.
0
2
.
0
4
.
0
6
.
0
8
.
1
D
e
n
s
i
t
y
60 63 66 69 72 75 78
Centre de classe
Exercice 2.8 page 43
19/09/2012
25
Exercice 2.10 et 2.11 page 43
Dispersion dune distribution
1. Etendue: Max Min

2. Etendue interquartile (EIQ): 3
e
quartile -1
er
quartile
5 indicateurs:

= X Xi
N
1
EAM
) X (X
N
1
EQM
i
=

) X (X
1 N
1
s
2
i
2

=

3. Ecart absolu moyen (EAM):
4. Ecart quadratique moyen (EQM):
5. Variance (s
2
):
On peut aussi utiliser lEcart type: s
19/09/2012
26
Dispersion dune distribution
Diffrence entre Variance et EQM

EQM sur population

Variance sur chantillon ( rle de d.d.l)
Pour la variance il y a N-1 lments dinformation

(sommes des carts la moyenne nulle)
Dispersion dune distribution
Rq: Si des frquences absolues fi

= X Xi f
N
1
EAM
i
) X (X f
N
1
EQM
i i
=

) X (X f
1 N
1
s
2
i i
2

=

3. Ecart absolu moyen (EAM):
4. Ecart quadratique moyen (EQM):
5. Variance (s
2
):
19/09/2012
27
Voir Tableau 2.5 page 49
Exercice 2.16 page 50
19/09/2012
28
Transformations linaires de VA
On considre une VA X et 2 nombres a et b

On dfinit Y par un changement dorigine et d chelle
de X:
Y = a + b X
a: changement dorigine
b :changement d chelle
X
2
Y Y
s b s s
X b a Y
= =
+ =
Exercice 2.21 page 57
19/09/2012
29
USAGE DES GRAPHES
Exemples

Voir fichier

Chapitre 3: Probabilits
19/09/2012
30
Quest ce quune probabilit
Exemples: jet dun d 6 faces n fois Combien de
fois obtient-on chaque face? (frquence relative)
= N lorsque ),
N
f
lim( Pr
X n=10 n=50 n= inf
1 .10 .22 .167
2 0 .12 .167
3 .10 .14 .167
4 .20 .14 .167
5 .30 .14 .167
6 .30 .24 .167
Quest ce quune probabilit
Exemples: jet dun d 6 faces n fois. Combien
de fois obtient-on chaque face? (freq relative)

X n=10 n=50 n= inf
1 0,1 0,22 0,167
2 0 0,12 0,167
3 0,1 0,14 0,167
4 0,2 0,14 0,167
5 0,3 0,14 0,167
6 0,3 0,24 0,167
Total 1 1 1
Total =1 donc tous les rsultats possibles sont
pris en compte besoins de modles

19/09/2012
31
Quest ce quun modle probabilit
Un modle est une exprience imaginaire et/ou
hypothtique qui permet de dcrire tous les
rsultats lmentaires possibles dun
processus.
Exemple: arbre de probabilit

Nombre de garons et filles possible pour
une famille de 3 enfants
Arbre de probabilit pour une famille
de 3 enfants
19/09/2012
32
Quest ce quun vnement
Un vnement est un sous ensemble de
lensemble des rsultats possibles.
Exemple: Dans le cas du nombre de garons et
filles possibles pour une famille de 3 enfants

Un vnement: avoir au moins 2 filles
Probabilit dun vnement
Considrons lvnement E: } {
7 4 1
, e , e E e =
} {
8 1
........., , e e S =
Notons S lensemble des rsultats possibles.
) P(e ) e p( ) P(e P(E)
7 4 1
+ + =
On a:
19/09/2012
33
Evnements composes
} {
7 4 1 1
, e , e E e = } {
8 1
........., , e e S = } {
7 5 2 2
, e , e E e =
} {
} {
7 5 4 2 1 2 1
7 2 1
, , , , E E
E E
e e e e e
e
=
=
Nous avons alors
) E P(E ) P(E ) P(E ) E P(E
2 1 2 1 2 1
+ =
Evnements complmentaires
} {
7 4 1 1
, e , e E e = } {
8 1
........., , e e S = } {
7 5 2 2
, e , e E e =
} {
8 6 3 2 1
e , e , e , e E =
Nous avons aussi
) P(E 1 ) E P(
1 1
=
Remarque
1 ) P(e P(S)
8
1
i
= =

19/09/2012
34
Figure 3.2 page 83
Exemple 3.2 page 84
19/09/2012
35
Exemple 3.3 page 87
Probabilit conditionnelle
) P(E
) E P(E
) E / P(E
2
2 1
2 1

=
) .P(E ) E / P(E ) E P(E
2 2 1 2 1
=
On peut aussi crire
Si E
1
et E
2
sont 2 vnements
19/09/2012
36
Evnements indpendants
E
1
et E
2
sont indpendants si
) (
) P(E
) E P(E
) E / P(E
1
2
2 1
2 1
E P =

=
E
1
et E
2
sont aussi indpendants si
) .P(E ) P(E ) E P(E
2 1 2 1
=
Exercice 3.5 page 93
19/09/2012
37
Exercice 3.6 page 89
Exercice 3.12 page 95
19/09/2012
38
Exercice 3.16 page 99
Exercice 3.24 page 104
19/09/2012
39
Thorme de Bayes
E et F sont 2 vnements
) E P(F E) P(F
P(F/E)P(E)
P(F)
P(F/E)P(E)

P(F)
F) P(E
F) / P(E
+
= =

=
Exemple 3.10 page 104
19/09/2012
40
Exercices 3.27a et 3.28a page 109
Exercices 3.40 et 3.41 page 119
19/09/2012
41
Chapitre 4: Distribution de probabilit
Variable alatoire discrte
X: X prend la valeur x avec la probabilit p(x)

Exemple: # de filles dans une famille de 3 enfants

= =
= =
i
i
2
i
2
i
i i
) p(x ) (x Varience
) p(x x Moyenne
Moyenne et variance dune variable alatoire discrte
19/09/2012
42
Voir Tab 4-2 page 128
Exercice 4.1a et 4.7 a et b
19/09/2012
43
Exemple de VA discrte
Loi Binomiale
4 proprits caractristiques

1. n preuves rptes
2. Deux rsultats possibles chaque preuve (Vrai/FAUX)
3. Indpendance des preuves
4. La probabilit de succs (Vrai) est constante =

Soit S la VA dfinie par le nombre de succs (vrai). S suit un
loi binomiale
( )
s n s s n s s
S
) (1
s)! (n s!
n!
) (1 s) p(S

= = =
Loi Binomiale
S suit un loi binomiale


) 1 (

2
t t
t
=
=
n
n
( )
s n s s n s s
S
) (1
s)! (n s!
n!
) (1 s) p(S

= = =
Moyenne et variance de S
19/09/2012
44
Loi Binomiale
S suit un loi binomiale


( )
s n s s n s s
S
) (1
s)! (n s!
n!
) (1 s) p(S

= = =
Valeurs de P(S=s) voir Tableau IIIa et IIIb
Exemple 4.2 page 133
19/09/2012
45
Exercice 4.11 et 4.15
Variable alatoire continue
- En un point donn x, p(X=x) = 0

- On travaille alors avec des intervalles

- Exemple: si X dsigne la taille dune personne

quelle est la probabilit que la taille soit comprise
en 1.7 m et 1.8 m.

P( 1.7 < X < 1.8) = P( 1.7 X 1.8)


19/09/2012
46
Variable alatoire continue
classe de amplitude
relative frquence
relative frquence de Densit =
Classe Centre de classe Frquence relative
.75- 1.25 1 0,25
1.25-1.75 1,5 0,5
1.75-2.25 2 0,25
Variable alatoire continue
classe de amplitude
relative frquence
relative frquence de Densit =
1 1,5 2
,25
,5
f
1 1,5 2
,5
1
densit
Amplitute = .5
19/09/2012
47
Variable alatoire continue
1 1,5 2
,25
,5
f
1 1,5 2
,5
1
densit
Amplitute = .5
}
= = = < <
1,25
.75
25 . ) 75 . 25 , 1 ( 2 / 1 2 / 1 1.25) X P(.75 dx
}
= = = < <
1,75
1,25
5 . 25 , 1 75 , 1 1 1.75) X P(1.25 dx
Exercice 4.17a
19/09/2012
48
Exemple de VA continue
Loi normale standard rduite
Loi normale standard rduite Z suit N(0,1)
2
z
2
1
e
2
1
f(z)

=
1 ; 0 = = o
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4 5
Srie1
Loi normale standard rduite
Loi normale standard rduite Z suit N(0,1)
2
z
2
1
e
2
1
f(z)

=
1 ; 0 = = o
Grand intrt en Statistique
Dispose dune table ( voir table T IV appendice)
19/09/2012
49
Loi normale standard rduite
Loi normale standard rduite Z suit N(0,1)
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4 5
Srie1
P(Z <2) =?
Loi normale standard rduite
Loi normale standard rduite Z suit N(0,1)
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4 5
Srie1
P(Z> 2) =?
19/09/2012
50
Loi normale standard rduite
Loi normale standard rduite Z suit N(0,1)
0
0,1
0,2
0,3
0,4
0,5
-4 -3 -2 -1 0 1 2 3 4 5
Srie1
P(-1<Z <1) = P(Z>-1) P(Z>1)
Loi normale gnrale
X suit N(,)
2
)
- x
(
2
1
e
2
1
f(x)
o

o

=
1 ; 1 = = o
0
0,1
0,2
0,3
0,4
0,5
-5 -4 -3 -2 -1 0 1 2 3 4 5
N(1,1)
N(1,1)
19/09/2012
51
Loi normale
X suit N(,)
1 ; 1 = = o
0
0,1
0,2
0,3
0,4
0,5
-5 -4 -3 -2 -1 0 1 2 3 4 5
N(0,1) N(1,1)
2
)
- x
(
2
1
e
2
1
f(x)
o

o

=
Loi normale
X suit N(,)
0
0,1
0,2
0,3
0,4
0,5
-5 -4 -3 -2 -1 0 1 2 3 4 5
N(0,1) N(0,2)
2
)
- x
(
2
1
e
2
1
f(x)
o

o

=
19/09/2012
52
Loi normale
X suit N(,)
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0,4
0,45
-5 -4 -3 -2 -1 0 1 2 3 4 5
N(0,1) N(1,1)
N(2,1) N(1,2)
2
)
- x
(
2
1
e
2
1
f(x)
o

o

=
Loi normale
X suit N(,)
2
)
- x
(
2
1
e
2
1
f(x)
o

o

=
o
- x
Z =
Z suit N(0,1)
Si on transforme X en Z par :
Alors
19/09/2012
53
Loi normale
Exemple


X suit N(50,10)

Calculer P(40 < X < 60)
Fonctions linaires de VA
On considre une VA X et 2 nombres a et b

On dfinit Y par un changement dorigine et d chelle
de X:
Y = a + b X
a: changement dorigine
b :changement d chelle
X
2
Y Y
s b s s
X b a Y
= =
+ =
On a :
19/09/2012
54
Exercice 4.20 page 149
Exercice 4.22 page 149
19/09/2012
55
Exercice 4.26 page 156
Exercice 4.40 page 167
19/09/2012
56
Chapitre 5: Couple de variables
alatoires
Couple de variables alatoires
Un exemple:
On place 5 boules dans une urne: 3 noires et 2 blanches

On tire 2 boules au hasard de lurne ( tirage avec remise)

On dfinit 2 variables alatoires X et Y par:

X: nombre de boules noires

Y: nombre de boules blanches

19/09/2012
57
Couple de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches
Distribution conjointe de X et Y
Couple de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches
Les valeurs possibles du couple (X, Y) sont:

NN (2,0)

NB (1,1)
BN (1,1)
BB (0,2)


19/09/2012
58
Couple de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches
La distribution conjointe de probabilit du couple (X, Y) est:

NN (2,0) P(2,0) = (3/5)
2
NB (1,1) P(1,1) = 3/5 * 2/5
BN (1,1) P(1,1) = 2/5 *3/5 = 3/5 * 2/5
BB (0,2) P(0,2) = (2/5)
2


Rq : (3/5)
2
+ 3/5 * 2/5 + 3/5 * 2/5 + (2/5)
2
= 1


Couple de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches
La distribution conjointe de probabilit du couple (X, Y) est:
X/Y 0 1 2
0 0 0 4/25
1 0 12/25 0
2 9/25 0 0
19/09/2012
59
Couple de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tires 2 boules X: # noires Y: # blanches
Distributions marginale de X p(X)
Distributions marginale de Y p(Y)
X/Y 0 1 2 P(x)
0 0 0 4/25 4/25
1 0 12/25 0 12/25
2 9/25 0 0 9/25
P(Y) 9/25 12/25 4/25 1
p(X=0)=p(0,2) + p(0,1) + p(0,0)
p(Y=2) =p(0,2) + p(1,2) + p(2,2)
Couple de variables alatoires
X et Y sont indpendantes si pour tout x et tout y
p(X=x,Y=y)=p(X=x)p(Y=y)
? Le nombre de boules noires et le nombre de boules blanches
sont elles 2 VA indpendantes?


P(x=0, y=2) = 4/25
p(x=0) = 4/25 et p(y=2) = 4/25 p(x=0) * p(y=2) = 16/625

X et Y ne sont pas indpendantes
19/09/2012
60
Fonction de variables alatoires
Si X et Y deux VA, on dfinit par R=g(X,Y)

=
=
x y
i
i i
y) y)p(x, g(x, E(R)
) p(r r E(R)
Alors
Fonction de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches



Si boule noire = 2 euro et boule blanche= 5 euro

Soit R le gain obtenu. Que vaut R? quelle est lesprance
du gain?



19/09/2012
61
Fonction de variables alatoires
5 boules dans une urne: 3 noires et 2 blanches
On tire 2 boules X: # noires Y: # blanches
Si boule noire = 2 euro et boule blanche= 5 euro
Soit R le gain obtenu. Que vaut R? quel est lesprance du gain?
R P(R)
4 9/25
7 12/25
10 4/25
R = 2*X + 5* Y
P(R=4) = P(X=2, Y=0) = 9/25
Fonction de variables alatoires
Soit R le gain obtenu. Que vaut R? quel est lesprance du gain?
R P(R)
4 9/25
7 12/25
10 4/25
R = 2*X + 5* Y
E(R) = 4* 9/25 + 7 * 12/25 + 10* 4/25 = 1/25( 36 + 84 + 40)
= 6.4 euro
19/09/2012
62
Covariance et corrlation de 2 VA
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
Y
Y
Que dire de la relation entre X et Y?
) )(Y E(X Covariance
Y X XY
= =o
Y X XY
E(XY) Covariance = =o
X et Y augmentent simultanment
Covariance et corrlation
0
1
2
3
4
5
6
7
8
9
0 2 4 6 8 10
Y
Y
type ecart produit
Covariance

n Correlatio
Y X
XY
Y X

= = =
X et Y augmentent simultanment mais avec quelle intensit?
1 1 -
Y X
s s
19/09/2012
63
Exercice 5-12a page 189
Fonctions linaires de VA
On considre 2 VA X et Y, 3 nombres a , c et d

On dfinit S par: S = aX + b Y + d
E(S) = E(aX+bY+d) = aE(X) + b E(Y) + d
Var(S) = var(aX+bY+d)
= a
2
var(X) + b
2
var(Y)+ 2ab cov(X,Y)
Si X et Y sont indpendantes, Var(S) = a
2
var(X) + b
2
var(Y)
19/09/2012
64
Exercice 5-20 page 198


Dfinition de la covariance dchantillon:


| |

=

+ + =
n
i
i i
n n
Y Y X X
n
=
Y Y X X Y Y X X
n
X,Y
1
1 1
) )( (
1
) )( ( ... ) )( (
1
) Cov(
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
65


Dfinition de la covariance dchantillon:

COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Considrons un chantillon de n observations de deux variables X et Y, la covariance dchantillon est la
moyenne des produits de leur cart autour de la moyenne de leur chantillon.
| |

=

+ + =
n
i
i i
n n
Y Y X X
n
=
Y Y X X Y Y X X
n
X,Y
1
1 1
) )( (
1
) )( ( ... ) )( (
1
) Cov(
Observation S Y

1 15 17.24
2 16 15.00
3 8 14.91
4 6 4.50
5 15 18.00
6 12 6.29
7 12 19.23
8 18 18.69
9 12 7.21
10 20 42.06


19 12 7.50
20 14 8.00


COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
La table ci-dessus montre S, le nombre dannes dducation (le plus haut niveau accompli = highest
grade completed) et Y, le salaire horaire (= hourly earnings) en 1992, en dollars, pour un sous-
ensemble de 20 individus provenant de lenqute United States National Longitudinal Survey of Youth.

19/09/2012
66
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Observation S Y S - Y - (S - ) (Y - )

1 15 17.24
2 16 15.00
3 8 14.91
4 6 4.50
5 15 18.00
6 12 6.29
7 12 19.23
8 18 18.69
9 12 7.21
10 20 42.06
... ... ...
... ... ...
19 12 7.50
20 14 8.00
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
67
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Les pointills indiquent les moyennes dchantillon de S et Y.
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75
2 16 15.00
3 8 14.91
4 6 4.50
5 15 18.00
6 12 6.29
7 12 19.23
8 18 18.69
9 12 7.21
10 20 42.06
... ... ...
... ... ...
19 12 7.50
20 14 8.00
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
68
Observation S Y S - Y - (S - ) (Y - )

1 15 17.24 1.75
2 16 15.00 2.75
3 8 14.91 -5.25
4 6 4.50 -7.25
5 15 18.00 1.75
6 12 6.29 -1.25
7 12 19.23 -1.25
8 18 18.69 4.75
9 12 7.21 -1.25
10 20 42.06 6.75
... ... ... ...
... ... ... ...
19 12 7.50 -1.25
20 14 8.00 0.75
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Observation S Y S - Y - (S - ) (Y - )

1 15 17.24 1.75 3.016
2 16 15.00 2.75 0.776
3 8 14.91 -5.25 0.686
4 6 4.50 -7.25 -9.725
5 15 18.00 1.75 3.776
6 12 6.29 -1.25 -7.935
7 12 19.23 -1.25 5.006
8 18 18.69 4.75 4.466
9 12 7.21 -1.25 -7.015
10 20 42.06 6.75 27.836
... ... ... ... ...
... ... ... ... ...
19 12 7.50 -1.25 -6.725
20 14 8.00 0.75 -6.225
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
69
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776
3 8 14.91 -5.25 0.686
4 6 4.50 -7.25 -9.725
5 15 18.00 1.75 3.776
6 12 6.29 -1.25 -7.935
7 12 19.23 -1.25 5.006
8 18 18.69 4.75 4.466
9 12 7.21 -1.25 -7.015
10 20 42.06 6.75 27.836
... ... ... ... ...
... ... ... ... ...
19 12 7.50 -1.25 -6.725
20 14 8.00 0.75 -6.225
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49
Average 13.25 14.225
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
70
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Le signe positif de la covariance indique un lien positif entre S et Y, ce qui est bien entendu ce quoi nous
nous attendions.
19/09/2012
71
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
14
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Les points dans le quadrant A du diagramme de dispersion ont un cart positif pour, la fois, S et Y, ils
apportent donc une contribution positive la covariance. Lindividu 10 apporte une contribution
particulirement grande.
C
D A
B
individual 10
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19/09/2012
72
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Lindividu 20 fournit un exemple dobservation dans le quadrant B. Il a termin 2 annes de son master
de 4 ans en communication mais il a ensuite arrt et ne gagne dsormais que $8.00 de lheure pour la
rparation de voitures.
C
D A
B
individual 20
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Il fait donc un contribution ngative la covariance.
19/09/2012
73
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Lindividual 4, qui est n Mexico et na suivi que 6 annes dcole, est un ouvrier dans un jardin
maracher o il reoit un salaire trs bas.
C
D A
B
individual 4
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
19
Avec un cart ngatif pour la fois S et Y, elle procure une contribution positive la covariance.
19/09/2012
74
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
20
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Enfin, les individus dans le quadrant D ont un nombre dannes dtude accomplies infrieur la moyenne
mais un salaire horaire suprieur la moyenne. Lindividu 3, par exemple, travaille comme ouvrier en
construction, ce qui lui rapporte un salaire lgrement plus lev que la moyenne malgr quil nait que
termin lcole primaire.
C
D A
B
individual 3
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Les individus dans ce quadrant contribuent ngativement la covariance.
21
19/09/2012
75
0
5
10
15
20
25
30
35
40
45
0 2 4 6 8 10 12 14 16 18 20
S (highest grade completed)
Y

(
h
o
u
r
l
y

e
a
r
n
i
n
g
s
,

$
)
22
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Pour des raisons videntes, les observations ont tendance se trouver dans les quadrants A et C. Les
contributions positives sont donc plus nombreuses que les contributions ngatives et elles ont aussi
tendance tre plus grandes.
C
D A
B
Observation S Y S - Y - (S - )(Y - )

1 15 17.24 1.75 3.016 5.277
2 16 15.00 2.75 0.776 2.133
3 8 14.91 -5.25 0.686 -3.599
4 6 4.50 -7.25 -9.725 70.503
5 15 18.00 1.75 3.776 6.607
6 12 6.29 -1.25 -7.935 9.918
7 12 19.23 -1.25 5.006 -6.257
8 18 18.69 4.75 4.466 21.211
9 12 7.21 -1.25 -7.015 8.768
10 20 42.06 6.75 27.836 187.890
... ... ... ... ... ...
... ... ... ... ... ...
19 12 7.50 -1.25 -6.725 8.406
20 14 8.00 0.75 -6.225 -4.668
Total 265 284.49 305.888
Average 13.25 14.225 15.294
S Y S Y
COVARIANCE DECHANTILLON: EXEMPLE DE CALCUL
Par consquent, la covariance de lchantillon est positive, indiquant un lien positif entre lducation et le
salaire, ce qui est videmment ce quoi nous nous attendrions.
23
19/09/2012
76
Chapitre 6: Echantillonnage
Echantillonnage
Chaque observation individuelle dans un chantillon alatoire a la mme
distribution de probabilit p(x) que la population
Echantillonnage
Population
Tirage alatoire
Probabilit dinclusion identique
X variable mesure sur la population
Sur un chantillon, la valeur de X est
une VA de mme distribution
Exemple P(.5 < X < 1.75) =.5 P(.5 < X < 1.75) =0.5
Population
Echantillon
19/09/2012
77
Echantillonnage
Echantillon alatoire trs simple (EATS):

- n observations

- X1, X2, ., Xn sont indpendants

- La loi de chaque Xi est la mme que celle de la population

- Chaque observation a la mme moyenne et le mme cart type


Echantillonnage
Chaque observation individuelle dans un chantillon alatoire a la mme
distribution de probabilit p(x) que la population
Echantillonnage
Population

X
Echantillon
Si Echantillon alatoire trs simple (EATS) alors

La valeur de tend vers .

X

=
i
X
N
X
1
19/09/2012
78
Les moments de la moyenne de
lchantillon
est une variable alatoire. Pourquoi? X
Si il y a un biais.
Si n alors
) X E( =
n
o
o =
X


X
X
o
Population
Echantillon
) X E( =
X
o
Exemple 6.1 page 221
19/09/2012
79
Thorme central limite
Forme de la distribution de

Pour un chantillon de taille n, (EATS), varie autour de la
moyenne et son cart type est


X
X
n /
X
o o =
Thorme:
) ; N normale loi la suit X
X
(
Exemple 6.2 page 226
19/09/2012
80
Exemple 6.3 page 228
Exemple 6.4 page 229
19/09/2012
81
Thorme central limite
Cas dune proportion P

Pour un chantillon de taille n, (EATS), P varie autour de la
proportion de population avec un cart type de


n
P
) 1 ( t t
o

=
Thorme:
) N(( normale loi la suit P
P
Exemple 6.5 et 6.6 page 234
19/09/2012
82
Exercice 6.12a page 231
Exercice 6.15 page 240
19/09/2012
83
Exercice 6.16 page 240
Exercice 6.20 a et b page 241
19/09/2012
84
Exercice 6.36
Chapitre 7: Lestimation ponctuelle
19/09/2012
85
Lestimation ponctuelle
Les paramtres de la population et sont fixes. En gnral, ils
sont inconnus
) X E( =
n
s
o
=


X
X
o
Population
Echantillon
n /
X
o o =
est inconnue et lon calcule s
2
sur un chantillon

X
o
Lestimation ponctuelle
Les paramtres de la population et sont fixes. En gnral, ils
sont inconnus
) X E( =
n
s
o
=


X
s
Population
Echantillon
et s sont des VA car varient avec les chantillons

et s sont des statistiques d chantillon

X
X
19/09/2012
86
Lestimation ponctuelle
Les paramtres de la population et sont fixes. En gnral, ils
sont inconnus
X
Comment estimer les paramtres de la population partir des
donnes de l chantillon?

varie autour de
On peut construire un intervalle de partir

X
Lestimation ponctuelle
Proprits souhaitables dun estimateur

1. Absence de biais

2. Variance minimale ( efficacit dun estimateur)

19/09/2012
87
Lestimation ponctuelle
1. Absence de biais
U estimateur sans biais de si E(U)=
Valeur du biais: E(U) -
P(U)
U
P(U)
U
E(U) =
E(U)
E(U)
Lestimation ponctuelle
2. Variance dun estimateur
V et W 2 estimateurs sans biais de et var(V) et Var(W) les variances

P(V)
U
E(V) =
P(W)
E(W) =
Var(V) < Var(W)
V est lestimateur le plus efficace
Lefficacit de V compare celle
de W est le ratio Var(W)/var(V)
19/09/2012
88
Exemple 7.1 page 263
Exemple 7.2 page 266
19/09/2012
89
Lestimation ponctuelle
Erreur quadratique moyenne: efficacit dun estimateur quelconque
ERQM = E(V-)
2
P(W)
W
P(U)

U
U non biais mais pas efficace
W biass mais efficace
Que choisir?
Lestimation ponctuelle
Erreur quadratique moyenne: efficacit dun estimateur quelconque
ERQM = E(V-)
2
U non biais mais pas efficace
W biass mais efficace
ERQM = E(V-)
2
= (variance de lestimateur) + ( biais)
2

= (variance de lestimateur) + (E(V)-)
2
Choisir lestimateur qui minimise ERQM
Lefficacit de V compare celle de W est le ratio ERQM(W)/ERQM(V)
19/09/2012
90
Exemple 7.3 page 270
Lestimation ponctuelle
La consistance

Un estimateur U de est consistant si ERQM = E(U-)
2
tend vers
zro lorsque n tend vers linfini

ERQM = E(V-)
2
= (variance de lestimateur) + ( biais)
2


Si estimateur sans biais, la condition devient variance tend vers zro
lorsque n tend vers linfini
19/09/2012
91
Lestimation ponctuelle
Estimateur asymptotiquement sans biais

Un estimateur U est asymptotiquement sans biais si son biais

tend
vers zro lorsque n tend vers linfini


Exemple 7.4 a et b page 276
19/09/2012
92
Exercice 7.2 page 267
Exercice 7.8 page 273
19/09/2012
93
Exercice 7.14 page 280
Chapitre 8: Intervalle de confiance
19/09/2012
94
Intervalle de confiance dune moyenne
Les paramtres de la population et sont inconnus.
) X E( =


X
s
Population
Echantillon
est un estimateur sans biais de

X

Intervalle de confiance dune moyenne
) , N( normale loi la suit X
X
On sait par ailleurs que
P( )
X
X
95% 1,96) Z 1,96 P( 1,96)

- X
P(-1,96
X
= < < = < <
o
On a par exemple
19/09/2012
95
Intervalle de confiance dune moyenne
Nous pouvons donc crire
n

z X

=
) 1,96 X 1,96 X P(
) 1,96 X - 1,96 X P(-
95% ) 1,96 - X 1,96 P(- 1,96)

- X
P(-1,96
X X
X X
X X
X
o o
o o
o o
o
+ < < =
+ < < =
= + < < = < <
Et donc
Intervalle de confiance dune moyenne
Dans cette expression
n

z X

=
traduit le degr de confiance

Z pour une loi normale

Par exemple pour =.025 ; Z

= 1,96
On construit alors un intervalle de
confiance 95%
suppos connue
Erreur d chantillonnage
19/09/2012
96
Intervalle de confiance dune moyenne
Dans cette expression
n

z X

=
est souvent inconnue
Intervalle de confiance dune moyenne
n

z X

=
est souvent inconnue

Remplacer pas la l cart-
type d chantillon s
n
s
z X

=
n
s
t X

=
Deux cas
possibles
n grand
n petit
Loi Normale
Loi de Student
n-1 ddl
19/09/2012
97
Exemple 8.1 page 292
Exemple 8.2 page 296
19/09/2012
98
Exercice 8.2 page 293; a et b
Exercice 8.4 page 294 a, b et c
19/09/2012
99
Exercice 8.6 page 297
Intervalle de confiance dune
diffrence de 2 moyennes
Cas de 2 chantillons indpendants
2
2
2
1
2
1
2 1 2 1
z ) X X ( ) - (
n n
o o
+ =
Variances connues
2 1
2 1 2 1
1 1
z ) X X ( ) - (
n n
+ = o
Si
1
=
2
on alors
Pour intervalle de confiance 95% ; Z

= 1.96
19/09/2012
100
Intervalle de confiance dune
diffrence de 2 moyennes
Cas de 2 chantillons indpendants
Variances inconnues mais gales
2 1
2 1 2 1
1 1
t ) X X ( ) - (
n n
s
p
+ =
) 1 ( ) 1 (
) ( ) (
2 1
2
2 2
2
1 1 2
+
+
=

n n
X X X X
s
i i
p
Loi de Student avec ddl= (n
1
-1) + (n
2
-1)
Intervalle de confiance dune
diffrence de 2 moyennes
Cas de 2 chantillons apparis
Construire la distribution des diffrences D et calculer un IC de D
n
s
t D
D

= A

Notez la diffrence avec 2 chantillons indpendants
Student avec ddl = n-1
19/09/2012
101
Exercice 8.10 a page 302
Exemple 8.4 page 305
19/09/2012
102
Intervalle de confiance dune
proportion
On suppose grands chantillons
2
2 2
1
1 1
2 1 2 1
) 1 ( ) 1 (
z ) P (P ) - (
n
P P
n
P P
+

= t t
n
P) - P(1
P

z = t
Pour une proportion
Pour une diffrence de proportions
Pour intervalle de confiance 95% ; Z

= 1.96
Exercice 8.18 a page 312
19/09/2012
103
Chapitre 9: Test dhypothses
Test dhypothses
Hypothse statistique
Une assertion/proposition au sujet dune
population que lon peut tester au moyen dun
chantillon alatoire
19/09/2012
104
Test dhypothses
Hypothse statistique
Hypothse peu vraisemblable (pouvant tre
rejete) toute hypothse situe hors de lintervalle
de confiance

Hypothse vraisemblable (possible, acceptable)
toute hypothse situe dans un intervalle de
confiance
Intervalle de confiance: lensemble des hypothses
acceptables
Test dhypothses
Hypothse statistique
Seuil

Si seuil de confiance 95% ( comprendre comme
dans un IC)

seuil derreur 5% ( comprendre comme dans un
test)
19/09/2012
105
Exemples 9.1 et 9.2 page 327-330
Test dhypothses
Test unilatrale
Il sagit de tester une hypothse du type:
H
0
: = C
H
1
: > C ou bien H
1
: < C

: paramtre (moyenne) de la population inconnu
C: est une constante relle

La question est de savoir dans quelle mesure H
0
est
compatible avec les donnes
19/09/2012
106
Test dhypothses
Test unilatrale
H
0
: = C
H
1
: > C
Le test peut aussi porter sur une proportion
Test dhypothses
Test unilatrale
3 tapes dans un test dhypothse

1. Formulation des hypothses H0 et H1
2. Calcule des statistiques du test sous hypothse H
0
( valeur
et probabilit critique)
3. Prise de dcision laide dune rgle de dcision
19/09/2012
107
Test unilatrale
Calcule des valeurs critiques du test
H
0
: = C
H
1
: > C
Valeur de Z ou de T sous H
0

n /
- X
Z
c
=
n s/
- X
T
c
=
n
P) - P(1
- P
T
c
=
Z car est connue et donc une loi normale
inconnue, on utilise s calcule sur l chantillon
On a une loi de Student
Cas dune proportion, la variance d chantillon
P(1-P)/n
On a une loi de Student
Test unilatrale
Calcule des valeurs critiques du test
H
0
: = C
H
1
: > C
Probabilit critique du test ( sous H0)
)
n /
c - X
( ) Z Z P( .
c
> = > = Z P c p
)
n s/
c - X
( ) T P(T .
c
> = > = T P c p
)
n
P) - P(1
c - P
( ) T P(T p.c
c
> = > = T P
Loi normale
Loi de Student
Loi de Student
19/09/2012
108



p.c
hypothse nulle: H
0
: = c

hypothse alternative: H
1
: > c

41
TESTS UNILATERAUX
Fonction de densit de
probabilit de sous H0
X
=c
p.c est la probabilit que, soit suprieur ou gale la valeur rellement observe
sous H
0
note . Cest donc la probabilit que H
0
soit rejete alors que sommes
sous H
0 .
Une probabilit de rejet tort de lhypothse nulle H
0
.
X
0
X
0
X



p.c
hypothse nulle: H
0
: = c

hypothse alternative: H
1
: > c

41
TESTS UNILATERAUX
Fonction de densit de
probabilit de sous H0
X
=c
0
X
) T P(T )
n s
X
n s
X
P( ) X X P(
c
0
0
> =

>

= >
Il faut bien noter que est une varaible aletoire
X
19/09/2012
109



0
Zc ou Tc
p.c
hypothse nulle: H
0
: = c

hypothse alternative: H
1
: > c

41
TESTS UNILATERAUX
Fonction de densit de
probabilit de la
Normal ou de students
En rcrivant avec la normal (Z) ou la student (T)



0
= 1.65
5%
hypothse nulle: H
0
: |
2
= c

hypothse alternative: H
1
: |
2
> c

Choisir un seuil de significativit pour le test . Par exemple = 5%. Lire la
valeur ou correspondante sur la table de la loi de Z ou de student
T. Ce seuil reprsente aussi le maximum tolr de la probabilit du rejet a tort de
H
0
. 41
REGLE DE DECISION
o
Z
o
T
o
T
Fonction de densit de
probabilit la loi normale
ou de student
19/09/2012
110



c
rejeter H
0
ne pas rejeter H
0

= 1.65
=5%
hypothse nulle: H
0
: |
2
= c

hypothse alternative: H
1
: |
2
> c

= 5%. Si p.c < alors rejet de H
0

Si Tc > alors rejet H
0

41
REGLE DE DECISION
Fonction de densit de
probabilit la loi normale
ou de student
o
T
p.c
Zc ou Tc
o
T
Exemple 9.3 page 333
19/09/2012
111
Exemple 9.5 page 339
Exercice 9.2 page 332
19/09/2012
112
Exercice 9.6 page 340
Exercice 9.12 page 348
19/09/2012
113
Test dhypothses
Test bilatrale
Il sagit de tester une hypothse du type:
H
0
: = C
H
1
: C

: paramtre (moyenne) de la population inconnu
C: est une constante relle

La question est toujours de savoir dans quelle
mesure H
0
est compatible avec les donnes
Test dhypothses
Test unilatrale
H
0
: = C
H
1
: C
Le test peut aussi porter sur une proportion
19/09/2012
114
Test dhypothses
Test bilatrale
3 tapes dans un test dhypothse

1. Formulation des hypothse H0 et H1
2. Calcule des statistiques du test sous hypothse H
0
( valeur
et probabilit critique)
3. Prise de dcision laide dune rgle de dcision
Test bilatrale
Calcule des valeurs critiques du test
H
0
: = C
H
1
: C
Valeur de Z ou de T sous H
0

n /
- X
Z
c
=
n s/
- X
T
c
=
n
P) - P(1
- P
T
c
=
Z car est connue et donc un loi normale
inconnue, on utilise s calcule sur l chantillon
On a une loi de Student
Cas dune proportion, la variance d chantillon
P(1-P)/n
On a une loi de Student
19/09/2012
115
Test bilatrale
Calcule des valeurs critiques du test
H
0
: = C
H
1
: C
Probabilit critique du test ( sous H0)
)
n /
c - X
( * 2 ) Z Z P( * 2 .
c
> = > = Z P c p
)
n s/
c - X
( * 2 ) T P(T * 2 .
c
> = > = T P c p
)
n
P) - P(1
c - P
( * 2 ) T P(T * 2 p.c
c
> = > = T P
Loi normale
Loi de Student
Loi de Student



26
Probabilit critique
p.c/2 p.c/2
b
2

TESTS BIILATERAUX
Zc ou Tc -Zc ou -Tc
0
Fonction de densit de
probabilit de la
Normal ou de students
hypothse nulle: H
0
: = c

hypothse alternative: H
1
: c

19/09/2012
116



c
rejeter H
0
ne pas rejeter H
0

= 1.65
=2.5%
hypothse nulle: H
0
: |
2
= c

hypothse alternative: H
1
: |
2
c

= 5%. Si p.c < alors rejet de H
0

Si Tc > alors rejet H
0

41
REGLE DE DECISION
Fonction de densit de
probabilit la loi normale
ou de student
2 / o
T
p.c/2
Zc ou Tc
o
T
=2.5%
p.c/2
rejeter H
0