Cours Echantillonnage Et Estimation S3

Probablités et Statistiques
Année Universitaire
2020-2021
************** Polycopié du cours **************
par
Raby GUERBAZ
Chapitre 1
Loi Normale et applications
1.1 Loi Normale (ou de Laplace-Gauss)

Définition 1. Une variable aléatoire est dite Normale (ou parfois normalement dis-
tribuée) de paramètres µ et σ si sa densité est donnée par :
1 1 (x−µ)
2
f (x) = √ e− 2 σ2 , ∀ x ∈ R.
2πσ
La loi Normale est notée N (µ, σ) ; Si X suit une loi N (µ, σ) alors E(X) = µ et
V ar(X) = σ 2 .
Le graphe de la densité d’une loi Normale est une courbe en cloche ( voir la figure qui
suit). La courbe de f est symétrique par rapport à l’axe x = µ.
1.1.1 Loi Normale centrée réduite

Définition 2. Une variable aléatoire est dite centrée et réduite si sa moyenne est nulle
est sa variance est 1. C à d X ∼ N (0, 1).
L’usage s’est établi de noter la fonction de répartition d’une variable normale centrée
réduite par le symbole Φ. En clair
Z a
Φ(a) = P(X ≤ a) = f (x)dx.
−∞
Remarque : Comme la loi Normale est continue alors, Φ(a) = P(X ≤ a) = P(X < a).
Calclul de probabilité pour la loi N(0,1)
Proposition 3. Soit X une variable aléatoire de loi normale N (0, 1), alors
P(a ≤ X ≤ b) = Φ(b) − Φ(a).
1
Pr. Raby Guerbaz Université Hassan II
Figure 1.1 – Courbe de la densité de la loi Normale
Figure 1.2 – Densité de la loi Normale N(0,1)
2
Figure 1.3 – Fonction de répartition de la loi Normale
Figure 1.4 – P(Z < −1) = φ(−1) est l’aire sous la courbe de f
Ceci est vrai pour les inégalités strictes ( < au lieu ≤) car la loi N(0,1) est continue.
La fonction de répartition de la loi normale est déficile à exploité sous sa forme intégral,
par suite on fait recourt à l’utilisation des tables statistiques.
Remarque : φ(a) = P(Z < a) est l’aire comprit entre la courbe de la densité f de Z,
l’axe des absisses et la droite vérticale x = a.
Propriétés :
– La loi normale N (0, 1) est symétrique autour de 0. C à d φ(−a) = 1 − φ(a)
– Soit X de loi normale N (µ, σ), alors le mode=mediane = moyenne=µ.
– 95% des valeurs de la loi normale N (0, 1) sont concentrées dans l’intervalle [µ −
3σ, µ + 3σ].
3
Calcul de probabilité pour la loi N (µ, σ).
Proposition 4. Si X est une variable aléatoire Normale N (µ, σ) alors la variable Z =

X−µ
σ
suit une loi Normale N (0, 1).
Par conséquent, on peut exprimer la fonction de répartition de X de la manière suivante :
FX (a) = P(X ≤ a)
X −µ a−µ
= P( )≤ )
σ σ
a−µ
= Φ( )
σ
Application : Soit X une variable aléatoire de loi N (3, 2). Pour calculer la probabilité
P(3 ≤ X ≤ 7), on procède comme suit : Soit Z la variable aléatoire Z = X−3 2
. Comme
X ∼ N (µ, σ) alors par la proposition précédente Z ∼ N (0, 1). En plus
3−3 X −3 7−3
P(3 ≤ X ≤ 7) = P( ≤ ≤ )
2 2 2
= P(0 ≤ Z ≤ 2)
= φ(2) − φ(0).
On utilise maintenant la table de la loi centrée et réduite qui donne les valeurs de φ.
Théorème central limite
On a vu dans le chapitre précédent que les lois discrètes tendent les une vers les autres
sous certaines conditions de type la taille de la population est grande.
Proposition 5. Soient X1 , ..., Xn des variables aléatoires ( discrètes ou continues) indépendantes,

de même loi, d’espérance µ et de variance σ. Alors lorsque la taille de l’échantillon n de-
vient grande
X1 + X2 + ... + Xn − nµ
√ suit approximativement une loi N (0, 1).
σ n
Application 1 : Approximation normale de la loi Binomiale :

Soit X une variable aléatoire de loi Binomiale B(n, p), alors si n ≥ 18 la loi de X peut
être approchée par une loi Normale de la manière suivante
X − np
p suit une loi normale N (0, 1)
np(1 − p)
p
on peut aussi écrire X ∼ N (np, np(1 − p)).
4
Application 2 : Approximation normale de la loi de Poisson :

Soit X une variable aléatoire de loi de Poisson P(λ), alors si λ ≥ 30 la loi de X peut être
approchée par une loi Normale de la manière suivante
X −λ
√ suit une loi normale N (0, 1)
λ
√
on peut aussi écrire X ∼ N (λ, λ).
1.2 Lois issues de la loi Normale

1.2.1 Loi Khi-deux à n degré de liberté χ2(n)
Cette loi joue un rôle important dans la théorie des tests statistiques. La loi Khi-deux
est obtenue en additions des carrées de variables aléatoires Gaussiennes, alors elle ne prend
que des valeurs positives.
Définition 6. Soient X1 , ..., Xn n variables aléatoires indépendantes de loi normale N (0, 1).
Alors
X12 + X22 + X32 + ... + Xn2
suit une loi Khi-deux de n degrés de liberté. Cette loi est notée χ2(n) , et elle possède la
fonction de densité suivante
f (x) = Cn xn/2−1 e−x/2 ,
R
ou Cn est telle que R f (x)dx = 1.
Propriétés :
1. Si n > 2, alors le mode de la loi χ2(n) est égal à n − 2.
2. E(X) = n et V ar(X) = 2n.
3. Additivités : Soient X1 ∼ χ2(n1 ) ,...,Xk ∼ χ2(nk ) k variables aléatoires indépendantes,
alors
X = X1 + X2 + ... + Xk
suit une χ2(n) de degré de libérté n = n1 + n2 + ... + nk .
Proposition 7. Soit X une variable aléatoire de loi χ2(n) , alors, quand n devient grand
(n → +∞),
X −n
√ −→ N (0, 1),
2n
5
ou bien
√
X ≈ N (n, 2n).
(en pratique l’approximation est satisfaisante quand n > 30)
1.2.2 Loi de Student à n degré de liberté T (n)

Cette loi joue un rôle important dans l’estimation par intervalle de confiance. Elle est
symétrique, de moyenne nulle et dépend d’un seul paramètre n appelé nombre de degrés
de liberté.
L’aspect de la courbe variera selon le nombre de degrés de liberté n (de façon générale,
elle est plus aplatie que N (0, 1) et quand n augmente (n > 30) les 2 courbes se confondent)
Définition 8. Soit X ∼ N (0, 1) et Y ∼ χ2(n) , alors la variable
X
T =p ,
Y /n
suit une loi dite de Student, notée tn , de fonction densité
t2 − n+1
ftn (x) = cn (1 + ) 2 ,
n
R
où cn est telle que R
ftn (x)dx = 1.
Propriétés :
1. Si X suit une loi de Student tn . Alors E(X) = 0 si n > 1.
n
2. V ar(X) = n−2
, si n > 2
Proposition 9. Soit X une variable aléatoire de loi tn , alors, quand n devient grand
(n → +∞),
X −→ N (0, 1),
(en pratique l’approximation est satisfaisante quand n > 30)
1.2.3 La loi de Fischer-Snedecor (F (n1 , n2 ))

Définition 10. Soient Y1 ∼ χ2(n1 ) et Y2 ∼ χ2(n2 ) deux variables aléatoires indépendantes.
Alors
Y1 /n1
F = ,
Y2 /n2
suit une loi de Fischer-Snedecor notée F (n1 , n2 ), de fonction de densité
fF (n1 ,n2 ) (x) = cn1 ,n2 tn1 /2−1 (n1 t + n2 )(n1 +n2 )/2 , t > 0.
Les paramètres n1 et n2 de loi F (n1 , n2 ) sont appelé aussi degrés de liberté.
6
Propriétés : Si X suit une loi de Fischer-Snedecor, alors

n1
1. E(X) = n2 −2
, si n2 > 2.
2n22 (n1 +n2 −2)
2. V ar(X) = n1 (n2 −2)2 (n2 −4)
, si n > 4
7
Chapitre 2
Echantillonnage et Estimation :
2.1 Techniques d’échantillonnage

2.1.1 Echantillonnage non aléatoire
Ces méthodes sont beaucoup moins coûteuses, plus rapides et plus simples. Il est par
contre, peu recommandé de généraliser les résultats provenant de ces méthodes à l’en-
semble de la population, puisque toutes les unités statistiques n’ont pas la même chance
d’être choisi ce qui influence la représentativité de l’échantillon.
Exemples de méthodes d’échantillonnage non aléatoire :
L’ échantillonnage à l’aveuglette
est une technique simple et peu coûteuse. Cet échantillonnage n’est pas normalement
représentatif de la population cible, parce qu’on ne sélectionne des unités d’échantillonnage
dans son cas que si on peut y avoir facilement et commodément accès. Les reporters des
stations de télévision sont, en outre, souvent à la recherche de soi-disant interviews de
gens de la rue pour déterminer comment la population perçoit un enjeu ou une question.
Au volentariat
C’est une des méthodes les plus utilisées actuellement sur le marché des médicaments.
Les compagnies pharmaceutiques sont les pionnières en la matière. Les unités statistiques
décident de faire partie de l’étude de leur propre gré.
2.1.2 Echantillonnage aléatoire

Pour qu’un échantillon soit représentatif de la population, il faut que chaque individus
de la population ait la même chance d’être choisit dans cet échantillon. On dit que dans
8
Figure 2.1 – Echantillonnage aléatoire
ce cas on a un échantillonnage aléatoire.
Définition 11. Une base de sondage est une liste des individus à partir de laquelle on
prélève un échantillon. Cette liste détermine la population observée. L’annuaire téléphonique
est un bon exemple de base de sondage.
Définition 12. Un échantillonnage est dit non exhaustif si tout élément extrait de la
population, pour effectuer l’échantillonnage, est remis dans cette population après avoir
relevé de ses caractéristiques. Sinon l’échantillonnage est exhaustif.
Remarque 2.1.1. Notez qu’en pratique, il est plus courant de prélever un échantillon sans
remise mais dans la plupart des applications, on a affaire à de très grandes populations.
En pareil cas, la probabilité que la même unité statistique soit sélectionnée plus d’une fois
est très faible. Il n’y aura alors pratiquement plus de différence entre les deux méthodes
On distingue généralement quatre techniques d’échantillonnage aléatoire différentes.

Nous verrons pour chacune d’entre elles la procédure à employer afin de constituer un
échantillon représentatif.
Echantillonnage aléatoire simple
Il consiste simplement à choisir des individus au hasard parmi ceux de la base de

sondage. Les étapes sont les suivantes
1. Numéroter les unités statistiques de 1 à N.
2. Tirer au hasard des unités statistiques de la population qui feront partie de l’échantillon.
9
Echantillonnage systématique
C’ est une technique où les unités statistiques sont choisis à intervalle régulier dans la
base de sondage.
1. Numéroter les unités statistiques de 1 à N.
2. Calculer l’intervalle de sélection que l’on appelle aussi le pas de sondage. On le cal-
cule en divisant la taille totale de la population obsérvée par la taille de l’échantillon
recherchée k = Nn .
3. Tirer au hasard une unité statistique entre la première et la k ime unité. Par exemple
la ieme unité avec 1 ≤ i ≤ k.
4. Pour complèter l’échantillon, on choisit la (i+k)ime unité, et la (i+2k)ime .....jusqu’a
(i + (n − 1)k)ime . On constitut ainsi un échantillon de taille (n-1+1=n) unités.
Echantillonnage par grappe
Il consiste à choisir des groupes (toute une grappe de raisin) plutôt que de choisir des
unités statistiques isolées (un seul raisin).
Définition 13. Une grappe est un sous-ensemble non homogènes de la population défini
selon la proximité. Il est plus facile de faire une liste des groupes et de choisir au hasard
parmi ces dizaines de groupes et d’interroger toutes les unités statistiques du groupe.
Par exemple : un groupe d’élèves faisant partie de la même classe, des habitants du
même immeuble, des habitants du même quartier ou même des équipes sportives d’une
ligne amateur.
Cette méthode permet de sauver beaucoup de temps en déplacement.

1. Diviser la population en grappes.
2. Dresser la liste la plus complète possible (base de sondage) des unités statistiques
formant chacune des grappes.
3. Choisir de façon aléatoire simple un certain nombre de grappes.
4. L’échantillon sera alors composé de toutes les unités statistiques appartenant aux
grappes choisies
Echantillonnage statifié
On segmente la population en des groupes distincts selon un critère ( Caractère quali-

tatif ou quantitatif : le sexe, l’âge, l’ethnie, chiffre d’affaire, secteur d’activité .... ) lié à la
nature et aux objetifs de l’étude. Ces différents groupes sont appelés des strates.
10
Définition 14. Les startes sont des sous-ensembles de la population ayant des caractéristiques
communes. Donc ce sont des groupes homogènes.
Par exemple, on peut classer des individus par leurs âges , regrouper des produits par leur
types, des étudiants par diplôme préparé, des entreprises pas secteur d’activité.
1. Diviser la population en strates.

2. Dresser la liste la plus complète possible (base de sondage) constituant chacune des
strates.
3. Pour chaque strate, choisir de façon aléatoire simple un nombre d’unités statistiques
pour constituer l’échantillon de telle sorte que le pourcentage d’unités dans chacune
des strates de l’échantillon soit le plus près possible du pourcentage d’unités dans
chacune des strates de la population.
2.2 Distributions d’échantillonnage

L’objectif de cette partie est de répondre à la problématique suivante : comment, à
partir d’informations ( moyenne-écart-type ou proportion) connues sur une population,
peut-on prévoir celles d’un échantillon ?
2.2.1 Modèlisation d’échantillonnage aléatoire simple

Dans la suite du chapitre, on traite le cas de l’échantillonnage aléatoire simple, car les
concepts fondamentaux et les formules importantes découlent de cette méthode.
Ce type d’échantillonnage consiste à extraire un échantillon de taille n dans une popu-
lation de taille N par des tirages aléatoires équiprobables et indépendants (tirages avec
remise). On introduit le modèle suivant :
Soit Ω = {w1 , ..., wN } la population constituée d’éléments appelés unités d’observation.
Soit X le caractère que l’on voudrait étudier sur l’ensemble de cette population.
Xk , le résultat aléatoire du k ièm tirage, est une v.a qui suit la même loi que X.
On note xk le résultat du k ièm tirage.
On note (X1 , ..., Xn ) les résultats aléatoires de ces tirages.
Définition 15. X1 , ..., Xn sont n v.a. indépendantes et de même loi (celle de X) ; il est
appelé n-échantillon ou échantillon de taille n de X. Après tirage au sort, (X1 , ..., Xn )
prend les valeurs (x1 , ..., xn ).
La réalisation unique (x1 , ..., xn ) de l’échantillon (X1 , ..., Xn ) est l’ensemble des valeurs
observées.
11
Définition 16. Une statistique Y sur un échantillon (X1 , ..., Xn ) est une v.a., fonction
mesurable des Xk ; Y = f (X1 , ..., Xn ). Après réalisation, la v.a. Y (statistique) prend la
valeur f (x1 , ..., xn ).
La principale statistique connue est la moyenne de l’échantillon,

Pn
Xi
X = i=1 .
n
Cette moyenne est appelée moyenne empirique. Sa réalisation sur un échantillon particulier
lors d’une étude statistique est appelée moyenne observée.
Remarque 2.2.1. La moyenne empirique est une variable aléatoire qui prend des valeurs
différentes sur chaque échantillon. Ces valeurs sont dites : moyennes observées.
2.2.2 Distribution d’échantillonnage d’une moyenne

Propriétés : Soit X le caractère quantitatif que l’on voudrait étudier sur l’ensemble
de cette population. Si E(X) = µ ( la moyenne de X est µ), et V ar(X) = σ 2 , alors
– E(X) = µ, ( la moyenne de la moyenne empirique X est exactement celle de la
population.
2
– V ar(X) = σn , si la taille de la population est très grande (cas non exhaustif)
Proposition 17. La distribution d’échantillonnage de la moyenne est donnée par

– Si X suit une loi normale N (µ, σ), alors X ∼ N (µ, √σn ).
– Si n ≥ 30, par le théorème central limite, X suit approximativement une N (µ, √σn ).
Exemple : 1) La taille des marocains suit une loi normale N (1, 6; 0, 2). Alors la taille
0,2
moyenne de 8 personnes prise au hasard X suit une loi normale N (1, 6; √ 8
).
2) Dans une entreprise A, les salaires sont distribués suivant une loi inconnue de moyenne
10000 et d’écart type 1200 DH. Alors la moyenne des salaires de 150 salariés pris au hasard
suit une loi normale N (10000, √1200
150
).
2.2.3 Distribution d’échantillonnage d’une proportion

Soit une population comportant deux modalités A et B. Soit p la proportion d’individus
de la population possédant la modalité A. 1 − p est donc la proportion des individus de la
population possédant la modalité B. On extrait de la population un échantillon de taille
n.
Soit Kn la v.a qui représente le nombre d’individus dans l’échantillon ayant la modalité
A.
12
Définition 18. La variable aléatoire pb = Knn s’appelle la fréquence empirique. Sa réalisation

f est la proportion d’individus dans l’échantillon ayant la modalité A.
Proposition 19. La distribution d’échantillonnage de la proportion est détérminée comme

suit
– Si n ≥ 30, np ≥ 5, et n(1 − p) ≥ 5, alors par le théorème central limite
r
p(1 − p)
pb ∼ N (p, ).
n
– Sinon ( le cas ou n < 30), la variable Kn suit une loi binomiale B(n, p), et les calculs
pour pb
Exemple : On suppose que la distribution des salaires dans une entreprise est telle
que 20 % touchent moins que 2000 DH. On tire un échantillon de 1000 salariés, alors
par le théorème central limite ( comme n > 30, np > 5, et n(1 − p) > 5) la proportion
pb des salariés
q parmi les 1000 qui touchent moins que 2000 DH suit une loi Normale
0,2×0,8
N (0, 2, 1000
).
2.2.4 Distribution d’échantillonnage d’une variance

On définit la variable aléatoire
n
1X
S2 = (Xi − X)2 ,
n i=1
Cette statistique désigne la variance dans l’échantillon. On remarque que
n
!
1X
E(S 2 ) = E (Xi − X)2
n i=1
n
1 X 2
= E X − E(X)2
n i=1 i
n
1X
= E(Xi2 ) − E(X)2
n i=1
On utilise le fait que
E(Xi2 ) = V ar(Xi ) + (E(Xi ))2 , et E(X)2 = V ar(X) + (E(X))2 ,
On obtient
σ2
E(Xi2 ) = σ 2 + µ2 , et E(X)2 = + µ2 ,
n
13
On remplace en haut,
1 σ2
E(S 2 ) = n(σ 2 + µ2 ) − ( + µ2 )
n n
1 2
= (1 − )σ .
n
Comme 1 − n1 < 1 ; alors E(S 2 ) < σ 2 .
Interprétation : En moyenne, la variance dans l’échantillon est plus faible que dans la
population-mère.
2
Proposition 20. Si le caractère X à étudier suit une loi normale N (µ, σ) alors n Sσ2 suit
une loi de khi-deux à (n-1) degrés de liberté, notée χ2(n−1) .
2
Attention, si X n’est pas normale, il n’est pas du tout sûr que n Sσ2 suive, même ap-
proximativement, une loi du khi-deux. Nous n’avons pas ici l’analogue du théorème central
limite.
2.2.5 Cas exhaustif ( Taille de la population connue :

Dans le cas exhausutif, l’echantillon est obtenu par un tirage sans remise dans une
population de taille N finie et connue. On peut établire des formules analogues aux cas
non exhaustif :
σ2 N − n
E(X) = µ et V ar(X) = × .
n N −1
N −n
Le facteur appelé facteur d’exhaustivité est inférieur à 1. Alors la variance
N −1
σ2 N − n σ2
dans le cas exhaustif × est plus faible que celle dans le cas non exhaustif .
n N −1 n
Interprétation : Le fait que la taille de la population est petite et le tirage est effectué
sans remise rend les résultats plus précis car la variance est plus petite.
2.3 Estimation ponctuelle

Nous nous intéresserons dans la suite à l’estimation des principales caractéristiques (ou
paramètres) d’un caractère dans une population, à savoir la moyenne, la variance et la
fréquence, à partir des valeurs calculées sur les échantillons.
Cependant un même paramètre peut être estimé de différentes manières. Par exemple
on sait que pour une variable aléatoire de Poisson, la moyenne est λ et la variance est
λ. Donc on peut estimer le paramètre λ, en utilisant la moyenne ou la variance dans
14
l’échnatillon. Une question naturelle se pose : Quelle est l’estimation la plus bonne ? Et
bonne dans quel sense ?
Les paramètres à estimer seront notés les par des lettres grecques minuscules
– µ pour la moyenne de la population.
– σ pour l’écart type de la population.
– σ 2 pour la variance de la population.
– p pour la proportion dans la population.
Les estimateurs ( v.a. ou statistiques) seront notés par des majuscules
– X pour la moyenne empirique.
– S 2 pour la variance de la population.
– pb pour la proportion empirique.
Les réalisations d’échantillon seront notées par des lettres latines minuscules
– x pour la moyenne de l’échantillon.
– s pour l’écart type de l’échantillon.
– σ 2 pour la variance de l’échantillon.
– f pour la proportion dans l’échantillon.
Définition 21. Un estimaeur T = f (X1 , ..., Xn ) d’un paramètre θ est une statistique, et
sa réalisation f (x1 , ..., xn ) sera appelée estimation ponctuelle de θ.
Définition 22. On appelle erreur d’estimation la diference entre l’etimateur et le pa-

ramètre : Erreur = T − θ.
Cette Erreur peut être décomposer de la façon suivante :
fluctuation autour de la moyenne

z }| {
T −θ = T − E(T ) + E(T ) − θ
| {z }
Biais
1. Le terme T − E(T ) traduit la fluctuation de T autour de son espérance.
2. Le terme E(T ) − θ = B(T ) représente l’erreur systématique et s’appelle BIAIS de
l’ESTIMATEUR
Définition 23. 1. Si le biais B(T ) est nul ( E(T ) = θ), alors on dit que T est un
estimateur sans biais.
2. Si le biais B(T ) est positif, ( E(T ) > θ), alors l’estimateur surestime la valeur
du paramètre.
3. Si le biais B(T ) est négatif, ( E(T ) < θ), alors l’estimateur sousestime la valeur
du paramètre.
15
Exemple : Soit X une variable aléatoire qui suit une loi de Poisson de paramètre λ,
alors
E(X) = V ar(X) = λ.
On désire estimer λ, on tire un échantillon (X1 , X2 , ..., Xn ) de taille n de même loi que X.
1. Nous avons E(X) = E(X) = λ, alors la moyenne empirique X est un estimateur
sans biais du paramètre λ d’une loi de Poisson.
2. Cependant E(S 2 ) = (n−1)
n
V ar(X) = (n−1)
n
λ < λ. Par suite la variance empirique S 2
est estimateur biaisé du même paramètre. Le biais est négatif (B(S 2 ) = − n1 ,) alors
l’estimateur sousestime la valeur du paramètre.
2.3.1 Estimation ponctuelle d’une moyenne

Soit X une caractère ( une variable aléatoire) dont on veut estimer la moyenne µ à
partir d’un échantillon (X1 , ..., Xn ) de même loi que X. La loi de X est inconnue.
X1 + X2 + ... + Xn
Théorème 24. La moyenne empirique X = est un estimateur effi-
n
cace de la moyenne µ.
En effet, l’etimateur X est sans biais car E(X) = µ. De plus il est convergeant car
V ar(X)
V ar(X) = → 0, quand n tend vers l’infinit.
n
On peut montrer qu’il est de variance minimale.
2.3.2 Estimation ponctuelle d’une variance

Soit X une vairable aléatoire qui suit une loi normale N (µ, σ). On veut estimer la
variance de X. Deux cas de figure se présentent :
La moyenne µ de la population est connue :
Si la moyenne de la population est connue alors

n
1X
Proposition 25. La statistique T = 2
(Xi − µ)2 est un estimateur efficace de la
n j=1
variance σ 2 .
16
En effet, T 2 est un estimateur sans biais, car

n
2 1 X
E(T ) = E (Xi − µ)2
n j=1
n
1X
= E(Xi − µ)2 , avec E(Xi ) = µ,
n j=1
σ 2 + ... + σ 2
= = σ2 On rappel que V ar(Xi ) = E(Xi − µ)2 = σ 2
n
On peut aussi montrer que l’estimateur est convergeant et de variance minimale. (Ceci
reste en dehors du cadre de ce cours)
La moyenne µ est inconnue :
Si la moyenne de la population est inconnue alors

n
1X
Proposition 26. La statistique Se2 = (Xi − X)2 est un estimateur biaisé de la
n j=1
variance σ 2 .
En effet,
n
1X n−1 2
E(Se2 ) = E(Xi − X)2 = σ .
n j=1 n
Alors pour corriger le biais on prend l’estimateur
n e2
S2 = S .
n−1
On remarque que
n n n−1 2
E(S 2 ) = E(S 2 ) = σ = σ2.
n−1 n−1 n
Proposition 27. La statistique ( la variance corrigée )
n
2 n 1 X
Ś = S2 = (Xi − X)2
n−1 n − 1 j=1
est un estimateur de la variance σ 2 qui est sans biais et convergeant.
2.3.3 Estimation ponctuelle d’une proportion

Soit une population ayant des individus possédant une certaine caractéristique A. On
veut estimer à partir d’un échantillon de taille n la proportion d’individus possédant cette
caractéristique A. Soit K la v.a qui représente le nombre d’individus dans l’échantillon
possédant la caractéristique A.
17
K
Proposition 28. La fréquence empirique pb = n
est l’estimateur efficace de p.
En effet, pb = Kn est un estimateur sans biais car, comme X1 , X2 , ..., Xn sont des variables
de Bernoulli, alors
E(X1 ) + E(X2 ) + ... + E(Xn )
p) =
E(b
n
p + p + ... + p
=
n
n×p
= = p.
n
En plus pb est un estimateur convergeant, car
V ar(X1 ) + V ar(X2 ) + ... + V ar(Xn )
V ar(b
p) =
n2
p(1 − p) + p(1 − p) + ... + p(1 − p)
=
n2
p(1 − p)
= .
n
alors V ar(bp) −→ 0, quand n → +∞.
Exemple d’application : On s’interesse à la proportion p des étudiants ayant un
Baccalauréat Sciences-économiques inscrit en S4 à la FSJES Aı̈n Sebaâ. On a prélevé
indépendamment deux échantillons de tailles n1 = 120 et n2 = 150. On constate que 48
étudiants du premier échantillon et 66 du second ont une un bac Sciences économiques.
Calculer 3 estimations ponctuelles de p.
Solution : Une première estimation utilise le premier échantillon de taille 120. Comme 48
étudiants parmi les 120 sont scientifiques, alors une première estimation ponctuelle de la
48
proportion est f1 = 120 = 0, 4. La deuxième estimation est calculée à partir du deuxième
66
échantillon f2 = 150 =. Maintenant, en regroupant les deux échantillons, on construit un
échantillon de taille 270. Sur cet échantillon on trouve 114 étudiants Scientifiques, alors
48+66
la fréquence des scientifiques dans l’échantillon global est f3 = 120+150 = 114
270
.
2.4 Estimation par intervalle de confiance

L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante,
on prefere souvent donner un intervalle de valeurs. On cherche des intervalles dit ”intervalle
de confiance” qui, generalement, a 95% ou 99% des cas, contiennent la moyenne µ inconnue
ou le pourcentage p d’une certaine propriété que possède la population.
Définition 29. Soit X une v.a. dont la loi dépend d’un paramètre inconnu θ ; on appelle
INTERVALLE DE CONFIANCE pour un de niveau 1 − α (ou de seuil α), un intervalle
qui a la probabilité 1 − α de contenir la vraie valeur de θ.
18
Dire qu’on aie sur à 95 % que la durée moyenne d’attente des clients dans une grande
distribution est entre 1 minute et 3 minutes, revient à dire que [1 ; 3] est un intervalle de
confiance pour la durée moyenne d’attente avec un niveau de confiance de 95 %.
Autrement dit, P(1 < µ < 3) = 0, 95).
Comment construire un intervalle de confiance ?
Remarque 2.4.1. Plus le niveau de confiance est élevé, plus la certitude est grande que
la méthode d’estimation produira une estimation contenant la vraie valeur de θ).
– Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%.
– α est appelé le seuil ou le risque, et 1 − α est le niveau de confiance.
2.4.1 Intervalle de confiance pour une moyenne

Nous avons vu que la moyenne X d’un échantillon aléatoire permet d’estimer la vraie
moyenne de la population.
Nous voudrions estimer également la précision de cette moyenne, c’est-à-dire donner

une marge d’erreur ou un intervalle de confiance
Si la taille de l’échantillon est petite n < 30
Il faut que le caractère quantitatif X étudié ( Salaire, loyer, PIB,...) suit une loi normale
N (µ, σ). On distingue de cas :
a) L’écart type σ est connu : On se fixe le risque α et on cherche dans la table de la
loi normale la valeur u1−α , telle que

X −µ
P −u1− α2 ≤ √ ≤ u1− α2 = 1 − α,
σ/ n
Ceci est équivalent à

σ σ
P X − u1− 2 √ ≤ µ ≤ X + u1− 2 √
α α = 1 − α,
n n
u1− α2 est le fractile d’ordre 1 − α2 de la loi normale centrée réduite.
Résultat : Si x est une réalisation de X, l’intervalle de confiance de la moyenne µ de
seuil 1 − α est
σ σ
IC = x − u1− α2 √ ≤ µ ≤ x + u1− α2 √
n n
b) L’écart type σ est inconnu : Si l’écart type σ est inconnu, alors on l’estime par
celui de l’échantillon corrigé noté s. Mais dans ce cas on a recours à une nouvelle loi de
probabilité : La loi de Student.
19
Théorème 30. Dans le cas d’un échantillon Gaussien,
X −µ
√S
n
suit une loi de Student de degré de libérté n − 1
En appelant tn−1 le fractile d’ordre 1 − α2 , on peut écrire

!
X −µ
P −tn−1 ≤ S ≤ tn−1 = 1 − α.
√
n
Par suite
S S
P X − tn−1 √ ≤ µ ≤ X + tn−1 √ = 1 − α.
n n
En remplaçant x et S par leurs valeurs calculées sur l’échantillon, on obtient l’intervalle
de confiance sur la moyenne µ :

s s
IC = x − tn−1 √ , x + tn−1 √
n n
Cas ou n ≥ 30, et X de loi quelconque
Lorsque la taille n de l’échantillon est grande (pratiquement dès que n > 30), on
appliquera les formules de l’intervalle de confiance sur µ, même si l’échantillon n’est pas
issu d’une population normale. En effet, le théorème central limite nous permet de dire
20
que X est approximativement de loi N (µ, √σn ) lorsque n est grand.

Dans ce cas, un intervalle de confiance de la moyenne est donné par

σ σ
IC = x − u √ , x + u √ si σ est connu, et
n n

s s
IC = x − u √ , x + u √ si σ est inconnu, sest l’écart type corrigé
n n
Remarque 2.4.2. Dans le cas ou n > 30, on fait recours à la loi Normale dans les deux
cas σ connu et inconnu.
Exemple : La taille moyenne d’un échantillon de 51 filles de S4 est de 167,9 cm.

L’écart type de cet échantillon est de 5,3 cm. Si nous supposons que cet échantillon est
représentatif de la taille des filles belges âgées d’une vingtaine d’années, nous pouvons
calculer la taille moyenne de cette population, avec sa marge d’erreur :
s
e = u√ .
n
Cas d’un tirage exhaustif
Dans une population de N individus (taille de la population est connue), dont la

moyenne est µ et l’écart-type σ, nous utilisant les mêmes formules pour les intervalles
21
σ s q
−n
de confiance on multiplie seulement √ et √ par le facteur N N −1
.
n n
C’est à dire " r r #
σ N −n σ N −n
x − u√ , x + u√
n N −1 n N −1
" r r #
s N −n s N −n
x − u√ , x + u√
n N −1 n N −1
" r r #
s N −n s N −n
x − tn−1 √ , x + tn−1 √
n N −1 n N −1
N −n
Remarque 2.4.3. Si N est très grand devant n, le facteur d’exhaustivité devient
N −1
proche de 1, donc on le néglige. On principe, on juge N grand par rapport à n, si le taux de
sondage n/N < 5% ; c’est à dire si l’échantillon constitue moins de 5% de la population.
2.4.2 Intervalle de confiance pour la variance d’une variable

Gaussienne
On désire estimer la variance σ 2 d’un caractère quantitatif X, qui suit une loi normale
de moyenne µ et de variance σ 2 . D’après le chapitre précédent, S 2 est un estimateur sans
biais de la variance σ 2 , c à d
n
21 X
E(S ) = E(Xi − X)2 = σ 2 .
n − 1 i=1
(n−1)×S 2
En plus σ2
suit une loi khi-deux de (n-1) degrés de libérté. On écrit
(n − 1) × S 2
∼ χ2n−1 .
σ2
Soient k1− α2 et k α2 les quantiles d’ordre 1 − α/2 et α/2 de la loi χ2n−1 . C’est à dire
(n − 1) × S 2 (n − 1) × S 2

P ≤ k α2 = α/2, et P ≤ k1− α2 = 1 − α/2
σ2 σ2
Alors
(n − 1)S 2

P k α2 < < k1− α2 = F (k1− α2 ) − F (k α2 )
σ2
= 1 − α/2 − α/2
= 1 − α.
22
Ceci est équivalent à

!
(n − 1)S 2 (n − 1)S 2
P < σ2 < = 1 − α.
k1− α2 k α2
Alors l’intervalle de confiance pour la variance σ 2 de la population est de la forme

" #
(n − 1)s2 (n − 1)s2
;
k1− α2 k α2
et par suite un intervalle de confiance pour l’ecart type σ est donné par
" √ √ #
s n−1 s n−1
p ; p .
k1− α2 k α2
2.4.3 Intervalle de confiance pour une proportion

Si n est grand (et f pas trop proche de 0q
ou 1), en pratique n ≥ 30, nf > 5 et
n(1−f ) > 5, alors pb suit une loi normale N p, p(1−p)
n
. Alors un intervalle de confiance
de risque α pour une proportion p inconnue est donné par
" r r #
f (1 − f ) f (1 − f )
f −u , f +u , ou f est la fréquence obsérvée
n n
Exemple : Si 37 personnes ont voté pour le candidat aux élections, sur 136 électeurs
sondé, les bornes d’un intervalle de confiance sur p la proportion des élécteurs dans tout
le pays qui voteront pour ce candidat, au niveau de confiance 0.95, est dans comprie entre
" r r #
f (1 − f ) f (1 − f )
f −u , f +u
n n
37
avec u = 1, 96, et f = 136
.
2.4.4 Taille d’échantillon

Durant la préparation de l’enquête, le chercheur doit à un moment décider de la taille
de l’échantillon. Cette décision est importante car elle a une incidence sur
– Les coûts de l’étude.
– La précision des résultats.
Une première approche consiste à utiliser le Budget disponible :
Budget= Coûts fixes + taille de l’échantillon x Coût d’un Questionnaire
23
On trouve ainsi la taille de l’échantillon n imposée par la contrainte budgétaire. Mais est
ce que cet échantillon est suffisant pour représenter la population entière ? ? ? ! ! ! !. Aucun
moyen de répondre.
Cependant une deuxième approche ( Plus rationnelle) consiste à utiliser la marge d’erreur
tolérée ( la précision de l’étude) pour calculer la taille minimale de l’échantillon afin qu’il
représente la population.
Taille d’échantillon pour estimer une moyenne
On distigue deux cas :

a) Ecart type connu : Pour trouver la taille d’échantillon in faut résoudre l’équation
σ
u √ ≤ e,
n
ou e est la marge d’erreur fixé à l’avance, u le fractile d’ordre 1 − α2 de la loi normale et

σ l’écart type de la population.
Ceci peut être écrit
√ σu
n≥ ,
e
alors uσ 2
n≥ .
e
b) Ecart type inconnu :
Solution 1 : On utilise une étude pilote. On distribut un questionnaire d’essai et on
calcul l’écart type corrigé sur l’échantillon. Ensuite, on fixe la marge d’erreur qu’on peut
tolérée et le reste resemble au premier cas :
s
u √ ≤ e,
n
α
ou e est la marge d’erreur fixé à l’avance, u le fractile d’ordre 1 − 2
de la loi normale et
s l’estimation de l’écart type.
Ceci peut être écrit
√ s×u
n≥ ,
e
alors 2
u×s
n≥ .
e
Solution 2 : On utilise le fait que les valeur de la loi normale ne s’étendent pas plus loin
que 4σ ; alors
étendu des données
σ= .
4
24
Exemple : Un magasin réalise un chiffre d’affaire d’au moins 1000 euros et d’au plus
2000 euros par jour. Pour estimer le chiffre d’affaire moyen on peut utiliser un écart type
de
2000 − 1000
σ= = 250 euros
4
Donc pour une marge erreur maximale e = 25 euros et un niveau de confiance de 95%, la
taille de l’échantillon doit être
2
1, 96 × 250
n≥ = 384, 16.
e
Alors il faut éffectuer l’étude sur 385 jours pour estimer le chiffre d’affaire moyen avec une
marge d’erreur petite e=25 euros. Une étude très précise demande une taille d’échantillon
très grande.
Remarque 2.4.4. La marge d’erreur e est toujours donnée par

σ σ
e = u√ , ou e = u√ (si l’écart type est inconnu)
n n
Alors si je veux diminuer la marge d’erreur il suffit d’augmenter la taille de l’échantillon.
Ce qui est naturel ! !
Cependant, si on augmente 4 fois la taille de l’échantillon l’erreur est réduite seulement
à la moitié. En effet, si on utilise un échantillon 4 fois plus grand pour l’enquête. Alors
au lieu de n on travail sur n0 = 4n individus, la nouvelle marge d’erreur est maintenant
σ σ σ e
e0 = u √ = u √ = u √ = .
n0 4n 2 n 2
On augmente 4 fois les dépences et on récupère un léger gain en erreur, ceci montre que
l’augmentation de la taille de l’échantillon n’est pas la meilleur manière d’augmenter la
précision.
Taille d’échantillon pour estimer une proportion
De la même manière que dans le cas de la moyenne, si l’on se fixe la marge d’erreur e
à ne pas dépasser (avec une probabilité 1 − α), on cherche n tel que
r
f (1 − f )
u = e.
n
ou bien
u2 f (1 − f )
n= .
e2
Mais comme on n’a pas encore tiré l’échantillon, la fréquence dans l’échantillon est incon-
nue. Alors comment peut-on procéder ?
25
Premier cas : Si l’on n’a au préalable aucune information sur f, on prend la valeur de f
qui nous donne la plus grande taille d’échantillon n. Ceci est réalisé si f (1 − f ) prend sa
valeur maximale qui est 0,25.
En effet, pour chercher la valeur de f qui maximise la fonction g(f ) = f (1 − f ) = f − f 2 ,
on dérive la focntion g, on obtient g 0 (f ) = 1 − 2f , et g 0 (f ) = 0 si f = 1/2 = 0, 5
En conclusion, la valeur maximale de f (1 − f ) est atteinte en f = 0, 5. ( f (1 − f ) =
0, 25 = 1/4)
Résultat : La taille d’échantillon est donnée par la formule
u2 × 0, 25 u2
n= = .
e2 4e2
Exemple : Pour mener une enquête ( un sondage ) tel que le pourcentage soit connu
(estimé) avec une marge d’erreur maximale de 10%, et ce pour un niveau de confiance de
95%, il faut interroger au moins
1, 96 × 0, 25
n≥ = 96
(0, 1)2
Deuxième cas : Si on sait à l’avance que la proportion qu’on désir estimer est inférieur
à 0,5. Par si on sait que la proportion ne peut pas dépasser 23%, alors la taille de
l’échantillon qu’il faut prendre est
1, 96 × 0, 23 × 0, 77
n≥
(0, 1)2
Troisième cas : Si on sait à l’avance que la proportion qu’on désir estimer est supperieur
à 0,5. Par si on sait que la proportion dépasse 80 %, alors la taille de l’échantillon qu’il
faut prendre est
1, 96 × 0, 8 × 0, 2
n≥
(0, 1)2
2.4.5 Cas exhaustif (taille de la population connue)

On sait que q dans le cas exhaustif, l’intervalle de confiance change par l’ajout du facteur
−n
d’exhaustivité N N −1
.
C’est à dire que la recherche d’un intervalle de
q confiance seqfait alors comme
q précédemment,
f (1−f ) f (1−f ) N −n
mais en remplaçant dans la marge d’erreur : n
par n
× N −1
Exemple : Un contrôleur de réception a reçu un lot de 5000 pièces. Pour estimer

le diamètre moyen d’une pièce, il utilise un échantillon de 60 pièces. Sur l’échantillon il
trouve un diamètre moyen de 2 cm. Supposons que la loi du diamètre est normale d’écart
26
type σ = 0, 1 cm. Un intervalle de confiance de risque 5% est donnée par :

" r r #
0, 1 5000 − 60 0, 1 5000 − 60
2 − 1, 96 √ × ; 2 + 1, 96 √ ×
60 5000 − 1 60 5000 − 1
Si la proportion des pièces défectueuses dans l’échantillon de taille 60 est de 77%, alors
un intervalle de confiance pour la proportion dans la population de taille 5000 est
" r r r r #
0, 77 × 0, 23 5000 − 60 0, 77 × 0, 23 5000 − 60
0, 77 − 1, 96 × ; 0, 77 + 1, 96 × ×
60 5000 − 1 60 5000 − 1
A partir de la marge d’erreur e on calcul toujours les tailles d’échantillons. Dans le cas de
la moyenne la marge d’erreur est :
r
σ N −n
e = u√
n N −1
La formule de n en fonction de σ, N, e, et u sera déficile à retenir. Mais heureusement, il

y a une astuce simple :
– On calcul la taille de l’échantillon n en faisant comme si la taille de la population
n’est pas donnée.
– Puis on calcul la vraie taille d’échantillon n’ qu’on cherche avec une petite correction
N
n0 = N −1
n
+1
Exemple : Sur une population de 5000 habitant, on veut estimer une proportion avec une
marge d’erreur de 10% et un niveau de confiance de 95%. Donnez la taille de l’échantillon
nécessaire ?
Solution : On calcul la taille de l’échantillon sans prendre en compte la taille de la
population
u2 (1, 96)2
n= 2 = = 97
4e 4(0, 1)2
et maintenant on corrige
n = ...
27
Chapitre 3
Tests d’hypothèse :
Un test statistique est un mécanisme visant à trancher entre deux hypothèses à partir de
résultats observés sur un ou plusieurs échantillon(s). On formule une hypothèse de départ,
appelée hypothèse nulle et souvent notée (H0 ) et il s’agit de décider si on rejette ou non
cette hypothèse par opposition à une contre-hypothèse appelée hypothèse alternative et
souvent notée (H1 ).
Exemple : Un contrôleur de réception a reçu un lot de pièces sensées être de 5 mm de
diamètre ; mais il se demande si, par suite d’un étiquetage douteux, on ne lui a pas livré
par erreur des pièces de 6 mm de diamètre.
On sait que la machine fournie une légères variation et que le diamètre des pièces est en
fait distribué selon une loi normale N(m ; 0, 6). Le problème est de savoir si on a bien
m = 5, et pas plutôt m = 6.
1. Si une pièce prise au hasard dans le lot mesure exactement 5 mm, est-on sûr que le
lot est bon ?
2. Si elle fait exactement 5.8 mm, est-on sûr que le lot est mauvais ?
3. Est-ce la même chose si, sur 10 pièces prises au hasard, on a un diamètre moyen de
5.8 mm ?
4. A partir de quelle valeur du diamètre moyen peut on dire que le lot est mauvais ?
Procédure des tests d’hypothèse Pour réaliser un test d’hypothèse, il y a un enchai-
nement strict d’actions à effectuer. Cela commence par la formulation de l’hypothèse dans
le domaine considéré (médical, économique, social...) et sa traduction en événèments pro-
babilistes liés à H0 . On doit ensuite considérer la statistique d’écart (la loi théorique de
la différence) et choisir un seuil (alpha) de décision. On calcule la valeur de la statistique
d’écart pour nos valeurs puis il faut la comparer à la valeur théorique de la statistique
d’écart pour le seuil choisi ( α = 5% par exemple )et en déduire si on accepte H0 ou
non. Enfin, le calcul (ou la lecture) de la ”p-value” associé au dépassement de la valeur
28
de la statistique d’écart permet de conclure de façon fine sur le fait que la différence est
significative ou non.
3.1 Tests de conformité

Les tests de conformité sont destinés à vérifier si un échantillon peut être considéré
comme extrait d’une population donnée ou représentatif de cette population, vis-à-vis
d’un paramètre comme la moyenne, la variance ou la fréquence observée. Ceci implique
que la loi théorique du paramètre est connue au niveau de la population.
Les étapes d’un test :
1. Il s’agit d’abord de formuler les hypothèses (H0 ) et (H1 ).
2. On choisit en général le risque de type I ( le seuil ), α. (souvent donné dans l’énoncé).
3. On détermine la variable de décision Z ou T (qui est une statistique) dont on connaı̂t
la loi si (H0 ) est vraie.
4. On détérmine la région critique ou région de rejet Irejet qui est l’ensemble des valeurs
de Z qui conduiront à rejeter (H0 ).
5. Le complémentaire de Irejet est appelé région d’acceptation Iaccept . Les points de
jonction entre les deux régions sont les points critiques.
6. On calcul la valeur de Z à partir de l’observation de l’échantillon.
7. Conclusion du test : acceptation ou rejet de (H0 ) selon que la valeur de Z est ou
non dans la région d’acceptation.
3.1.1 Les différentes catégories d’hypothèses
3.1.2 Test de conformité sur une moyenne

Cas d’une variable Normale
On suppose que X suit une loi normale de moyenne µ et d’écart type σ.

A) Cas ou σ est connu : La variable X étudiée au niveau de la population suit une loi
normale N (µ, σ) avec σ connu. Ainsi la distribution de X au niveau de l’échantillon sera :
σ X −µ
X ∼ N (µ, √ ), on peut aussi écrire Z = ∼ N (0, 1).
n √σ
n
a) Test Unilateral à droite :

Les hypothèses du test se présentent sous la forme :
29
(
H0 : µ = µ0
H1 : µ > µ0
On considère comme variable de décision X. La région critique ( de rejet ) du test est
de la forme :
Irejet =]c, +∞[,
ou la frontière de la région critique aura pour expression :
σ
c = µ0 + z1−α √ .
n
et on détermine la valeur de z1−α à partir de la table de la loi normale centrée et réduite
tel que φ(z1−α ) = 1 − α.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone de rejet, alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte H0 ).
Remarque 3.1.1. Si on prend comme variable de décision

X − µ0
Z=
√σ
n
alors la région de rejet sera de la forme :
Ierejet = [z1−α , +∞[.
c’est à dire on rejette H0 si la valeur observée

x − µ0
z= ∈ Ierejet .
√σ
n
avec x la valeur de la moyenne obsérvée sur l’échantillon.
a) Test Unilateral à gauche :

(
H0 : µ = µ0
H1 : µ < µ0
de la forme :
Irejet =] − ∞, c[,
σ
c = µ0 − z1−α √ .
n
30
et on détermine la valeur de z1−α à partir de la table de la loi normale centrée et réduite

tel que φ(z1−α ) = 1 − α.
X − µ0
Z= ,
√σ
n
Ierejet =] − ∞, −z1−α [.

x − µ0
z= ∈ Ierejet .
√σ
n
a) Test bilateral :
(
H0 : µ = µ0
H1 : µ 6= µ0
On considère comme variable de décision X. La région d’acceptation du test comme
un intervalle symètrique autour de µ0 de la forme :
Iaccept = [c1 , c2 ],
ou :
La marge d0 erreur e e
z }| { z }| {
σ σ
c1 = µ 0 − z1− α2 √ et c2 = µ0 + z1− α2 √
n n
et on détermine la valeur de z1− α2 à partir de la table de la loi normale centrée et réduite
tel que φ(z1− α2 ) = 1 − α2 = N iveau de conf
2
iance+1
comme dans les intervalles de confiance.
zone d’acceptation ( x ∈ [c1 , c2 ],) alors on accepte (H0 ), sinon, on rejette H0 .
X − µ0
Z=
√σ
n
31
alors la région d’acceptation est :
Ieaccept = [−z1− α2 , +z1− α2 ].
c’est à dire on accept H0 si la valeur observée

x − µ0
z= ∈ Ieaccept .
√σ
n
A) Cas ou σ est inconnu : La démarche est la même que pour le test précédent mais
la variance de la population n’étant pas connue, elle est estimée par la variance corrigée
S 2 . La variable X étudiée au niveau de la population suit une loi normale N (µ, σ) avec σ
inconnu.
X − µ0
T = suit une loi de Student de (n-1) degrés de liberté.
√S
n
a) Test Unilateral à droite :

(
H0 : µ = µ0
H1 : µ > µ0
de la forme :
Irejet =]c, +∞[,
s
c = µ0 + t(n−1,1−α) √ .
n
| {z }
e
ou s est l’écart type corrigé et et on détermine la valeur de t(n−1,1−α) à partir de la table

de la loi de Student.
zone de rejet ( càd x ≥ c), alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte
H0 ).
X − µ0
T =
√S
n
32
Ierejet =]t(n−1,1−α) , +∞[.

x − µ0
t= ∈ Ierejet .
√s
n
avec x la valeur de la moyenne obsérvée sur l’échantillon et s l’écart type corrigé.
a) Test Unilateral à gauche :

(
H0 : µ = µ0
H1 : µ < µ0
de la forme :
Irejet =] − ∞, c[,
σ
c = µ0 − e = µ0 − t(n−1,1−α) √ .
n

X − µ0
T =
√S
n
Ierejet = [−t(n−1,1−α) , +∞[.

x − µ0
z= ∈ Ierejet .
√s
n
33
c) Test bilateral :
(
H0 : µ = µ0
H1 : µ 6= µ0
On considère comme variable de décision X. La région d’acceptation du test comme
un intervalle sypetrique autour de µ0 de la forme :
Iaccept = [c1 , c2 ],
ou :
La marge d0 erreur e e
z }| { z }| {
s s
c1 = µ0 − t(n−1,1− α2 ) √ et c2 = µ0 + t(n−1,1− α2 ) √
n n
et on détermine la valeur de t(n−1,1− α2 ) à partir de la table de Student comme pour les
intervalles de confiance.
zone d’acceptation ( x ∈ [c1 , c2 ],) alors on accepte (H0 ), sinon, on rejette H0 .
X − µ0
T =
√S
n
alors la région d’acceptation est :

h i
Iaccept = −t(n−1,1− 2 ) , +t(n−1,1− 2 ) .
e α α
c’est à dire on accept H0 si la valeur observée

x − µ0
t= ∈ Ieaccept .
√s
n
Cas d’un échantillon de grande taille
Si la taille de l’échantillon est grande en pratique n ≥ 30, alors

a) Si σ est connu : Les résultats du paragraph précédent restent valables.
b) Si σ est inconnu, alors on l’estime par s, mais les résultats du paragraph précédent
restent valables en remplaçant tn−1 par z le fractile de la loi normale.
34
3.2 Tests de conformité sur une variance d’une v.a

Gaussienne
Si X suit une loi normale N (µ, σ), alors on peut les tests suivants
( ( (
H0 : σ 2 = σ02 H0 : σ 2 = σ02 H0 : σ 2 = σ02
ou ou
H1 : σ 2 6= σ02 H1 : σ 2 > σ02 H1 : σ 2 < σ02
On se fixe α, le risque de type I et on connaı̂t la taille de l’échantillon.

A) cas ou la moyenne µ est connue : On prend comme variable de décision :
n
1X
T2 = (Xi − µ)2
n i=1
2
si σ 2 = σ02 , alors (n−1)T
σ2
suit une loi χ2n de n degrés de liberté.
Détémination de la région critique :
a) Pour le test bilatéral H1 de la forme σ 6= σ02 : On cherche la région d’acceptation
sous la forme [c1 , c2 ].
Soient kn ( α2 ) et kn les réels déterminés dans la table de la loi χ2n , tels que

 P nT22 < kn(1−α/2) = 1 − α/2
σ
2
 P nTσ2
< kn(α/2) = α/2
si σ 2 = σ02 , alors
nT 2

P kn(α/2) < 2 < kn(1−α/2) = 1 − α
σ0
Alors
σ02 kn(α/2) σ 2 kn(1−α/2)

P < T2 < 0 = 1 − α.
n n
L’intervalle d’acceptation pour T 2 au risque α est
2
σ0 kn(α/2) σ02 kn(1−α/2)

Iaccept = ,
n n
Conclusion :
Si t2 , la réalisation de T 2 ∈ Iaccept , on accept (H0 ), sinon, on rejette (H0 ).
a) Pour Unilatéral à droite : H1 de la forme σ > σ02 .
On cherche la région critique sous la forme ]t1 , +∞[.
Soit kn,(1−α) le réel déterminé dans la table de la loi χ2n par
2
nT
P < kn,(1−α) = 1 − α.
σ02
35
La région critique (ou intervalle de rejet) pour T 2 au risque α est

2
σ0 kn,(1−α)
Irejet = , +∞ .
n
Conclusion :
Si t2 , la réalisation de T 2 ∈ Irejet , on rejette (H0 ), sinon on ne rejette pas H0 .
Remarque : Si on choisit comme variable de décision Z, l’intervalle d’acceptation
pour Z au risque α pour un test bilatéral est

Irejet = kn,(α) , kn,(1−α)
.
L’intervalle de rejet pour Z au risque α, pour une test unilateral à droite et à gauche est
respectivement
[kn,(1−α) , +∞[ et ] − ∞, kn,α ].
B ) cas ou la moyenne µ est inconnue : On a
(n − 1)S 2
∼ χ2n−1 .
σ2
On reprend les résultats de a) en remplaçant T 2 par S 2 et χ2n par χ2n−1 .
Résumé :
Intervalle d’acceptation pour S 2 dans un test bilatéral :
2
σ02

σ0
Iaccept = kn−1, α2 ; kn−1,1− α2 .
n−1 n−1
Intervalle de rejet pour S 2 dans un test unilatéral à droite :

2
σ0
Irejet = kn−1,1−α ; +∞ .
n−1
Intervalle de rejet pour S 2 dans un test unilatéral à gauche :
σ02

Irejet = −∞, kn−1,α .
n−1
3.3 Tests de conformité sur une proportion

Soit p la proportion de la population possédant le caractère considéré. On veut effectuer
un test (
H0 : p = p0
H1 : p > p0 , p 6= p0 , p < p0 .
36
On q
prend comme variable de décision pb. Si p = p0 , alors la loi de pb est normale
N (p0 , p0 (1−p
n
0)
).
On se fixe α, le risque de type 1 et on connait la taille de l’échantillon.
On détérmine la région critique du test :
(a) Test bilateral p 6= p0
L’intervalle d’acceptation pour pb au risque α est
" r r #
p0 (1 − p0 ) p0 (1 − p0 )
Iaccept = p0 − u1−α/2 ; p0 + u1−α/2 .
n n
Conclusion :
Si la fréquence f sur l’échantillon, appartient à Iaccept , on accept (H0 ), sinon, on rejette
(H0 ).
(a) Test Unilateral à droite p > p0
L’intervalle de rejet de pb au risque α est
# r #
p0 (1 − p0 )
Irejet = p0 + u1−α ; 1 .
n
Conclusion :
Si la fréquence f sur l’échantillon, appartient à Irejet , on rejette (H0 ) en faveur de H1 ,
sinon, on accepte (H0 ).
(a) Test Unilateral à gauche p < p0
L’intervalle de rejet de pb au risque α est
" r "
p0 (1 − p0 )
Irejet = 0, p0 − u1−α .
n
Conclusion :
Si la fréquence f sur l’échantillon, appartient à Irejet , on rejette (H0 ) en faveur de H1 ,
sinon, on accepte (H0 ).
Tests de choix entre deux valeurs du paramètre
Ce type de test est appelé souvent : test d’une hypothèse simple contre une
hypothèse simple.
Soit X une variable aléatoire qui dépend d’un paramètre θ inconnu. Le problème est de
choisir entre deux valeurs numériques θ0 et θ1 du paramètre θ.
(
H0 : θ = θ0
H1 : θ = θ1
37
Le risque de type I est donné, ainsi que la taille de l’échantillon. Calcul de la région
critique W, Z étant la variable de décision. Si θ1 > θ0 le test est traité le la même manière
qu’un test unilateral à droite.
Alors la région de rejet est de la forme Irejet = [θ0 + e, ∞[.
Conclusion : Si θ1 ∈ Irejet , alors on rejette (H0 ) en faveur de H1 et on dit que θ = θ1 .
Sinon on accepte (H0 ) est on décide que θ = θ0 .
3.3.1 Notion d’erreur et de puissance de test :

Lorsqu’on effectue un test d’hypothèse, deux types d’erreur sont susceptibles de surve-
nir :
Risque d’erreur de type I : (ou Erreur de première espèce)
α = P(rejeter H0 avec le test|H0 vraie dans la réalité).
Risque d’erreur de type II ( ou erreur de deuxième espèce) :
β = P(ne pas rejeter H0 avec le test |H1 vraie)
La puissance d’un test statistique est :
Puissance = 1-Risque de deuxième espèce=1-β.
Le seuil de signification d’un test statistique est le plus petit risque pour lequel la
valeur observée de la statistique du test permet le rejet de H0 . En anglais, le seuil de
signification se nomme ”p-value”. Il s’agit d’une quantité qui est toujours calculée dans
les logiciels spécialisés qui permettent d’effectuer des tests d’hypothèses.
Règle de décision en fonction du seuil de signification αs : Si le risque suppérieur au
seuil de signification, alors on rejette H0 . (Voir la solution de l’examen de l’année dernière)
38
Remarque 3.3.1. Il n’est pas possible de calculer la puissance d’un test si on ne spécifie
pas préciséement H1 . Par exemple, on ne peut pas effectuer des calculs sous l’alternative
µ > 11000. Il faut spécifier une valeur simple, par exemple µ = 13000F r.
3.4 Tests de comparaison

Soient X1 et X2 deux variables aléatoires définies sur deux populations mères compa-
rables (éventuellement égales). La loi de X1 (resp. X2 ) dépend d’un paramètre inconnu
θ1 (resp. θ2 ). On souhaite tester l’hypothèse ”ces deux paramètres sont égaux” contre
l’hypothèse complémentaire ”ces deux paramètres son différents”, soit
(
H0 : θ1 = θ2
H1 : θ1 6= θ2 ou θ1 > θ2 ouθ1 < θ2 .
Pour effectuer ce test, on dispose d’un échantillon de taille n1 (resp. n2 ) de X1 (resp.
X2 ) permettant une estimation ponctuelle Tn1 (resp. Tn2 ) de θ1 (resp. θ2 ). On suppose de
plus que les v.a. X1 et X2 sont normales ou approximativement normales.
En supposant vraie, on détermine un risque de première espèce α, une zone de rejet
associée aux valeurs critiques.
3.4.1 Test de comparaison de deux moyennes :

Soient deux populations P1 et P2 et deux v.a X1 et X2 définies respectivement sur P1
et P2 , X1 et X2 étant indépendantes.
On pose µ1 = E(X1 ), µ2 = E(X2 ), σ1 = V ar(X1 ), et σ22 = V ar(X2 )
On veut tester l’hypothèse
(
H0 : µ1 = µ2
H1 : µ1 6= µ2 ou µ1 > µ2 ouµ1 < µ2 .
On dispose d’un échantillon de taille n1 issu de la population 1 qui donne une moyenne x1
et un écart type s1 et un deuxième échantillon de taille n2 de la population 2 qui donne
une moyenne x2 et un écart type s2 .
39
Cas ou σ1 et σ2 sont connus
On supposera que X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 ) et que n1 , n2 > 30.

La variable de décision est la suivante
X1 − X2
Z=q 2 .
σ1 σ22
n1
+ n2
Si µ1 = µ2 , alors
X − X2
q1 2 ∼ N (0, 1)
σ1 σ22
n1
+ n2
(a) test bilatéral µ1 6= µ2 : Soit u1−α/2 le réel déterminé comme habituellement dans
la table de la loi centrée réduite N (0, 1).
L’intervalle d’acceptation pour Z au risque α est

Iaccept = −u1−α/2 ; +u1−α/2
Conclusion : Si
x1 − x2
z=q 2 ∈ Iaccept .
σ1 σ22
n1
+ n2
on accepte H0 , sinon on rejette H0 en faveure de H1 .
(b) test Unilatéral à droite µ1 > µ2 : Soit u1−α le réel déterminé comme habituelle-
ment dans la table de la loi centrée réduite N (0, 1).
L’intervalle de rejet est de la forme
Irejet = [u1−α ; ∞[
Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
σ1 σ
n1
+ n22
on rejette H0 , sinon on accepte H0 .
(c) test Unilatéral à gauche µ1 < µ2 : Soit u1−α le réel déterminé comme habituel-
lement dans la table de la loi centrée réduite N (0, 1).
Irejet = ]−∞, −u1−α ]
Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
σ1 σ
n1
+ n22
40
Cas où σ1 et σ2 sont inconnus et n1 et n2 > 30

X1 − X2
Z=q 2 .
s1 s22
n1
+ n2
X − X2
q 12 ∼ N (0, 1)
s1 s22
n1
+ n2
(a) test bilatéral µ1 6= µ2 :

Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).

Conclusion : Si
x1 − x2
z=q 2 ∈ Iaccept .
s1 s22
n1
+ n2

(b) test Unilatéral à droite µ1 > µ2 :
Soit u1−α le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
s1 s
n1
+ n22
(c) test Unilatéral à gauche µ1 < µ2 :
N (0, 1).
Irejet = ]−∞, −u1−α ]
41
Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
s1 s
n1
+ n22
Cas où σ1 et σ2 sont inconnus avec σ1 = σ2 et n1 et n2 < 30

X1 − X2
Z=q 2 2
q .
n1 s1 +n2 s2 1 1
n1 +n2 −2 n1
+ n2
X1 − X2
q q ∼ tn1 +n2 −1
n1 s21 +n2 s22 1 1
n1 +n2 −2 n1
+ n2
(a) test bilatéral µ1 6= µ2 :

Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1.

Iaccept = −t1−α/2 ; +t1−α/2
Conclusion : Si
x1 − x2
z=q q ∈ Iaccept .
n1 s21 +n2 s2
2
1 1
n1 +n2 −2 n1
+ n2

(b) test Unilatéral à droite µ1 > µ2 :
Soit t1−α le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1
Irejet = [t1−α ; ∞[
Conclusion : Si
x1 − x2
q q ∈ Irejet .
n1 s21 +n2 s22 1 1
n1 +n2 −2 n1
+ n2

(c) test Unilatéral à gauche µ1 < µ2 :
42
Soit u1−α le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1
Irejet = ]−∞, −t1−α ]
Conclusion : Si
x1 − x2
q q ∈ Irejet .
n1 s21 +n2 s2
2
1 1
n1 +n2 −2 n1
+ n2
3.5 Tests de comparaison de deux variances

On dispose d’un n1 -échantillon de X1 qui donne un écart type corrigé s1 et d’un n2 -
échantillon de X2 qui donne un écart type corrigé s2 .

(
H0 : σ1 = σ2
H1 : σ1 6= σ2 ou σ1 > σ2 ouσ1 < σ2 .

s22
F = .
s22
Si σ12 = σ22 , alors

F ∼ F(n1 − 1, n2 − 1)
Pour calculer la région critique, on détermine dans la table de la loi de Fischer-Snedecor
F(n1 − 1, n2 − 1) les réels fα/2 et f1−α/2 tels que
(
P F < fα/2 = α/2

P F < f1−α/2 = 1 − α/2.
L’intervalle d’acceptation pour F au risque α est

Iaccept = f1−α/2 ; fα/2
Conclusion : Si
s21
f= ∈ Iaccept .
s22
43

Remarque importante
Si α est tel que l’on ne puisse pas lire dans la table de Fischer-Snedecor les valeurs f1−α/2
et fα/2 , on cherchera un intervalle d’acceptation pour F de la forme [fα1 , fα2 ], fα1 étant
définie par P(F < fα1 ) = α1 et fα2 étant définie par P(F > fα2 ) = α2 avec α = α1 + α2 .
3.6 test de comparaison de deux proportions

Soient p1 la proportion d’individus possédant le caractère considéré A dans la popula-
tion I et p2 la proportion d’individus possédant le même caractère dans la population II.
On dispose d’un n1 -échantillon de I et un n2 -échantillon de II. Soient F1 la fréquence empi-
rique associée à l’échantillon de I et F2 la fréquence empirique associée à léchantillon de II.

(
H0 : p1 = p2
H1 : p1 6= p2 ou p1 > p2 ou p1 < p2 .
On note le risque de type I par α.
Dans le cas ou p1 = p2 = p, on considère la variable de décision :
F1 − F2
Z=p ∼ N (0, 1).
p(1 − p) n11 + 1
n2
Pour réaliser le test on remplace p (inconnue) par son estimation
n1 f 1 + n2 f 2
f= .
n1 + n2
Alors, la statistique de test devient
F1 − F2
Z=p ∼ N (0, 1).
f (1 − f ) n11 + 1
n2
(a) test bilatéral p1 6= p2 :

Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).

44
Conclusion : Si
f1 − f2
z=p ∈ Iaccept .
f (1 − f ) n11 + 1
n2

(b) test Unilatéral à droite p1 > p2 :
N (0, 1).
Conclusion : Si
f1 − f2
p ∈ Irejet .
f (1 − f ) n11 + 1
n2

(c) test Unilatéral à gauche p1 < p2 :
N (0, 1).
Irejet = ]−∞, −u1−α ]
Conclusion : Si
f1 − f2
p ∈ Irejet .
f (1 − f ) n11 + 1
n2
45

Cours Echantillonnage Et Estimation S3

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Echantillonnage Et Estimation S3

Transféré par

Droits d'auteur :

Formats disponibles

Probablités et Statistiques

************** Polycopié du cours **************

Loi Normale et applications

1.1 Loi Normale (ou de Laplace-Gauss)

1.1.1 Loi Normale centrée réduite

Calclul de probabilité pour la loi N(0,1)

P(a ≤ X ≤ b) = Φ(b) − Φ(a).

Figure 1.1 – Courbe de la densité de la loi Normale

Figure 1.2 – Densité de la loi Normale N(0,1)

Figure 1.3 – Fonction de répartition de la loi Normale

Calcul de probabilité pour la loi N (µ, σ).

Proposition 4. Si X est une variable aléatoire Normale N (µ, σ) alors la variable Z =

Théorème central limite

Proposition 5. Soient X1 , ..., Xn des variables aléatoires ( discrètes ou continues) indépendantes,

Application 1 : Approximation normale de la loi Binomiale :

Application 2 : Approximation normale de la loi de Poisson :

1.2 Lois issues de la loi Normale

1.2.2 Loi de Student à n degré de liberté T (n)

1.2.3 La loi de Fischer-Snedecor (F (n1 , n2 ))

Les paramètres n1 et n2 de loi F (n1 , n2 ) sont appelé aussi degrés de liberté.

Propriétés : Si X suit une loi de Fischer-Snedecor, alors

2.1 Techniques d’échantillonnage

2.1.2 Echantillonnage aléatoire

Figure 2.1 – Echantillonnage aléatoire

ce cas on a un échantillonnage aléatoire.

On distingue généralement quatre techniques d’échantillonnage aléatoire différentes.

Echantillonnage aléatoire simple

Il consiste simplement à choisir des individus au hasard parmi ceux de la base de

Echantillonnage par grappe

Cette méthode permet de sauver beaucoup de temps en déplacement.

On segmente la population en des groupes distincts selon un critère ( Caractère quali-

1. Diviser la population en strates.

2.2 Distributions d’échantillonnage

2.2.1 Modèlisation d’échantillonnage aléatoire simple

La principale statistique connue est la moyenne de l’échantillon,

2.2.2 Distribution d’échantillonnage d’une moyenne

Proposition 17. La distribution d’échantillonnage de la moyenne est donnée par

2.2.3 Distribution d’échantillonnage d’une proportion

Définition 18. La variable aléatoire pb = Knn s’appelle la fréquence empirique. Sa réalisation

Proposition 19. La distribution d’échantillonnage de la proportion est détérminée comme

2.2.4 Distribution d’échantillonnage d’une variance

Cette statistique désigne la variance dans l’échantillon. On remarque que

On utilise le fait que

E(Xi2 ) = V ar(Xi ) + (E(Xi ))2 , et E(X)2 = V ar(X) + (E(X))2 ,

2.2.5 Cas exhaustif ( Taille de la population connue :

2.3 Estimation ponctuelle

Définition 22. On appelle erreur d’estimation la diference entre l’etimateur et le pa-

fluctuation autour de la moyenne

2.3.1 Estimation ponctuelle d’une moyenne

2.3.2 Estimation ponctuelle d’une variance

La moyenne µ de la population est connue :

Si la moyenne de la population est connue alors

En effet, T 2 est un estimateur sans biais, car

La moyenne µ est inconnue :

Si la moyenne de la population est inconnue alors

est un estimateur de la variance σ 2 qui est sans biais et convergeant.

2.3.3 Estimation ponctuelle d’une proportion

2.4 Estimation par intervalle de confiance

Comment construire un intervalle de confiance ?

2.4.1 Intervalle de confiance pour une moyenne

Nous voudrions estimer également la précision de cette moyenne, c’est-à-dire donner

Si la taille de l’échantillon est petite n < 30

Figure 2.2 – Echantillonnage aléatoire

Polycopié du cours