Vous êtes sur la page 1sur 46

Probablités et Statistiques

Année Universitaire
2020-2021

************** Polycopié du cours **************

par

Raby GUERBAZ
Chapitre 1

Loi Normale et applications

1.1 Loi Normale (ou de Laplace-Gauss)


Définition 1. Une variable aléatoire est dite Normale (ou parfois normalement dis-
tribuée) de paramètres µ et σ si sa densité est donnée par :
1 1 (x−µ)
2
f (x) = √ e− 2 σ2 , ∀ x ∈ R.
2πσ
La loi Normale est notée N (µ, σ) ; Si X suit une loi N (µ, σ) alors E(X) = µ et
V ar(X) = σ 2 .
Le graphe de la densité d’une loi Normale est une courbe en cloche ( voir la figure qui
suit). La courbe de f est symétrique par rapport à l’axe x = µ.

1.1.1 Loi Normale centrée réduite


Définition 2. Une variable aléatoire est dite centrée et réduite si sa moyenne est nulle
est sa variance est 1. C à d X ∼ N (0, 1).

L’usage s’est établi de noter la fonction de répartition d’une variable normale centrée
réduite par le symbole Φ. En clair
Z a
Φ(a) = P(X ≤ a) = f (x)dx.
−∞

Remarque : Comme la loi Normale est continue alors, Φ(a) = P(X ≤ a) = P(X < a).

Calclul de probabilité pour la loi N(0,1)

Proposition 3. Soit X une variable aléatoire de loi normale N (0, 1), alors

P(a ≤ X ≤ b) = Φ(b) − Φ(a).

1
Pr. Raby Guerbaz Université Hassan II

Figure 1.1 – Courbe de la densité de la loi Normale

Figure 1.2 – Densité de la loi Normale N(0,1)

2
Pr. Raby Guerbaz Université Hassan II

Figure 1.3 – Fonction de répartition de la loi Normale

Figure 1.4 – P(Z < −1) = φ(−1) est l’aire sous la courbe de f

Ceci est vrai pour les inégalités strictes ( < au lieu ≤) car la loi N(0,1) est continue.

La fonction de répartition de la loi normale est déficile à exploité sous sa forme intégral,
par suite on fait recourt à l’utilisation des tables statistiques.
Remarque : φ(a) = P(Z < a) est l’aire comprit entre la courbe de la densité f de Z,
l’axe des absisses et la droite vérticale x = a.
Propriétés :
– La loi normale N (0, 1) est symétrique autour de 0. C à d φ(−a) = 1 − φ(a)
– Soit X de loi normale N (µ, σ), alors le mode=mediane = moyenne=µ.
– 95% des valeurs de la loi normale N (0, 1) sont concentrées dans l’intervalle [µ −
3σ, µ + 3σ].

3
Pr. Raby Guerbaz Université Hassan II

Calcul de probabilité pour la loi N (µ, σ).

Proposition 4. Si X est une variable aléatoire Normale N (µ, σ) alors la variable Z =


X−µ
σ
suit une loi Normale N (0, 1).
Par conséquent, on peut exprimer la fonction de répartition de X de la manière suivante :

FX (a) = P(X ≤ a)
X −µ a−µ
= P( )≤ )
σ σ
a−µ
= Φ( )
σ
Application : Soit X une variable aléatoire de loi N (3, 2). Pour calculer la probabilité
P(3 ≤ X ≤ 7), on procède comme suit : Soit Z la variable aléatoire Z = X−3 2
. Comme
X ∼ N (µ, σ) alors par la proposition précédente Z ∼ N (0, 1). En plus

3−3 X −3 7−3
P(3 ≤ X ≤ 7) = P( ≤ ≤ )
2 2 2
= P(0 ≤ Z ≤ 2)
= φ(2) − φ(0).

On utilise maintenant la table de la loi centrée et réduite qui donne les valeurs de φ.

Théorème central limite

On a vu dans le chapitre précédent que les lois discrètes tendent les une vers les autres
sous certaines conditions de type la taille de la population est grande.

Proposition 5. Soient X1 , ..., Xn des variables aléatoires ( discrètes ou continues) indépendantes,


de même loi, d’espérance µ et de variance σ. Alors lorsque la taille de l’échantillon n de-
vient grande
X1 + X2 + ... + Xn − nµ
√ suit approximativement une loi N (0, 1).
σ n

Application 1 : Approximation normale de la loi Binomiale :


Soit X une variable aléatoire de loi Binomiale B(n, p), alors si n ≥ 18 la loi de X peut
être approchée par une loi Normale de la manière suivante
X − np
p suit une loi normale N (0, 1)
np(1 − p)
p
on peut aussi écrire X ∼ N (np, np(1 − p)).

4
Pr. Raby Guerbaz Université Hassan II

Application 2 : Approximation normale de la loi de Poisson :


Soit X une variable aléatoire de loi de Poisson P(λ), alors si λ ≥ 30 la loi de X peut être
approchée par une loi Normale de la manière suivante
X −λ
√ suit une loi normale N (0, 1)
λ

on peut aussi écrire X ∼ N (λ, λ).

1.2 Lois issues de la loi Normale


1.2.1 Loi Khi-deux à n degré de liberté χ2(n)
Cette loi joue un rôle important dans la théorie des tests statistiques. La loi Khi-deux
est obtenue en additions des carrées de variables aléatoires Gaussiennes, alors elle ne prend
que des valeurs positives.

Définition 6. Soient X1 , ..., Xn n variables aléatoires indépendantes de loi normale N (0, 1).
Alors
X12 + X22 + X32 + ... + Xn2
suit une loi Khi-deux de n degrés de liberté. Cette loi est notée χ2(n) , et elle possède la
fonction de densité suivante
f (x) = Cn xn/2−1 e−x/2 ,
R
ou Cn est telle que R f (x)dx = 1.

Propriétés :
1. Si n > 2, alors le mode de la loi χ2(n) est égal à n − 2.
2. E(X) = n et V ar(X) = 2n.
3. Additivités : Soient X1 ∼ χ2(n1 ) ,...,Xk ∼ χ2(nk ) k variables aléatoires indépendantes,
alors
X = X1 + X2 + ... + Xk
suit une χ2(n) de degré de libérté n = n1 + n2 + ... + nk .

Proposition 7. Soit X une variable aléatoire de loi χ2(n) , alors, quand n devient grand
(n → +∞),
X −n
√ −→ N (0, 1),
2n

5
Pr. Raby Guerbaz Université Hassan II

ou bien

X ≈ N (n, 2n).
(en pratique l’approximation est satisfaisante quand n > 30)

1.2.2 Loi de Student à n degré de liberté T (n)


Cette loi joue un rôle important dans l’estimation par intervalle de confiance. Elle est
symétrique, de moyenne nulle et dépend d’un seul paramètre n appelé nombre de degrés
de liberté.
L’aspect de la courbe variera selon le nombre de degrés de liberté n (de façon générale,
elle est plus aplatie que N (0, 1) et quand n augmente (n > 30) les 2 courbes se confondent)
Définition 8. Soit X ∼ N (0, 1) et Y ∼ χ2(n) , alors la variable
X
T =p ,
Y /n
suit une loi dite de Student, notée tn , de fonction densité
t2 − n+1
ftn (x) = cn (1 + ) 2 ,
n
R
où cn est telle que R
ftn (x)dx = 1.
Propriétés :
1. Si X suit une loi de Student tn . Alors E(X) = 0 si n > 1.
n
2. V ar(X) = n−2
, si n > 2
Proposition 9. Soit X une variable aléatoire de loi tn , alors, quand n devient grand
(n → +∞),
X −→ N (0, 1),
(en pratique l’approximation est satisfaisante quand n > 30)

1.2.3 La loi de Fischer-Snedecor (F (n1 , n2 ))


Définition 10. Soient Y1 ∼ χ2(n1 ) et Y2 ∼ χ2(n2 ) deux variables aléatoires indépendantes.
Alors
Y1 /n1
F = ,
Y2 /n2
suit une loi de Fischer-Snedecor notée F (n1 , n2 ), de fonction de densité

fF (n1 ,n2 ) (x) = cn1 ,n2 tn1 /2−1 (n1 t + n2 )(n1 +n2 )/2 , t > 0.

Les paramètres n1 et n2 de loi F (n1 , n2 ) sont appelé aussi degrés de liberté.

6
Pr. Raby Guerbaz Université Hassan II

Propriétés : Si X suit une loi de Fischer-Snedecor, alors


n1
1. E(X) = n2 −2
, si n2 > 2.
2n22 (n1 +n2 −2)
2. V ar(X) = n1 (n2 −2)2 (n2 −4)
, si n > 4

7
Chapitre 2

Echantillonnage et Estimation :

2.1 Techniques d’échantillonnage


2.1.1 Echantillonnage non aléatoire
Ces méthodes sont beaucoup moins coûteuses, plus rapides et plus simples. Il est par
contre, peu recommandé de généraliser les résultats provenant de ces méthodes à l’en-
semble de la population, puisque toutes les unités statistiques n’ont pas la même chance
d’être choisi ce qui influence la représentativité de l’échantillon.
Exemples de méthodes d’échantillonnage non aléatoire :

L’ échantillonnage à l’aveuglette

est une technique simple et peu coûteuse. Cet échantillonnage n’est pas normalement
représentatif de la population cible, parce qu’on ne sélectionne des unités d’échantillonnage
dans son cas que si on peut y avoir facilement et commodément accès. Les reporters des
stations de télévision sont, en outre, souvent à la recherche de soi-disant  interviews de
gens de la rue  pour déterminer comment la population perçoit un enjeu ou une question.

Au volentariat

C’est une des méthodes les plus utilisées actuellement sur le marché des médicaments.
Les compagnies pharmaceutiques sont les pionnières en la matière. Les unités statistiques
décident de faire partie de l’étude de leur propre gré.

2.1.2 Echantillonnage aléatoire


Pour qu’un échantillon soit représentatif de la population, il faut que chaque individus
de la population ait la même chance d’être choisit dans cet échantillon. On dit que dans

8
Pr. Raby Guerbaz Université Hassan II

Figure 2.1 – Echantillonnage aléatoire

ce cas on a un échantillonnage aléatoire.

Définition 11. Une base de sondage est une liste des individus à partir de laquelle on
prélève un échantillon. Cette liste détermine la population observée. L’annuaire téléphonique
est un bon exemple de base de sondage.

Définition 12. Un échantillonnage est dit non exhaustif si tout élément extrait de la
population, pour effectuer l’échantillonnage, est remis dans cette population après avoir
relevé de ses caractéristiques. Sinon l’échantillonnage est exhaustif.

Remarque 2.1.1. Notez qu’en pratique, il est plus courant de prélever un échantillon sans
remise mais dans la plupart des applications, on a affaire à de très grandes populations.
En pareil cas, la probabilité que la même unité statistique soit sélectionnée plus d’une fois
est très faible. Il n’y aura alors pratiquement plus de différence entre les deux méthodes

On distingue généralement quatre techniques d’échantillonnage aléatoire différentes.


Nous verrons pour chacune d’entre elles la procédure à employer afin de constituer un
échantillon représentatif.

Echantillonnage aléatoire simple

Il consiste simplement à choisir des individus au hasard parmi ceux de la base de


sondage. Les étapes sont les suivantes
1. Numéroter les unités statistiques de 1 à N.
2. Tirer au hasard des unités statistiques de la population qui feront partie de l’échantillon.

9
Pr. Raby Guerbaz Université Hassan II

Echantillonnage systématique

C’ est une technique où les unités statistiques sont choisis à intervalle régulier dans la
base de sondage.
1. Numéroter les unités statistiques de 1 à N.
2. Calculer l’intervalle de sélection que l’on appelle aussi le pas de sondage. On le cal-
cule en divisant la taille totale de la population obsérvée par la taille de l’échantillon
recherchée k = Nn .
3. Tirer au hasard une unité statistique entre la première et la k ime unité. Par exemple
la ieme unité avec 1 ≤ i ≤ k.
4. Pour complèter l’échantillon, on choisit la (i+k)ime unité, et la (i+2k)ime .....jusqu’a
(i + (n − 1)k)ime . On constitut ainsi un échantillon de taille (n-1+1=n) unités.

Echantillonnage par grappe

Il consiste à choisir des groupes (toute une grappe de raisin) plutôt que de choisir des
unités statistiques isolées (un seul raisin).

Définition 13. Une grappe est un sous-ensemble non homogènes de la population défini
selon la proximité. Il est plus facile de faire une liste des groupes et de choisir au hasard
parmi ces dizaines de groupes et d’interroger toutes les unités statistiques du groupe.
Par exemple : un groupe d’élèves faisant partie de la même classe, des habitants du
même immeuble, des habitants du même quartier ou même des équipes sportives d’une
ligne amateur.

Cette méthode permet de sauver beaucoup de temps en déplacement.


1. Diviser la population en grappes.
2. Dresser la liste la plus complète possible (base de sondage) des unités statistiques
formant chacune des grappes.
3. Choisir de façon aléatoire simple un certain nombre de grappes.
4. L’échantillon sera alors composé de toutes les unités statistiques appartenant aux
grappes choisies

Echantillonnage statifié

On segmente la population en des groupes distincts selon un critère ( Caractère quali-


tatif ou quantitatif : le sexe, l’âge, l’ethnie, chiffre d’affaire, secteur d’activité .... ) lié à la
nature et aux objetifs de l’étude. Ces différents groupes sont appelés des strates.

10
Pr. Raby Guerbaz Université Hassan II

Définition 14. Les startes sont des sous-ensembles de la population ayant des caractéristiques
communes. Donc ce sont des groupes homogènes.
Par exemple, on peut classer des individus par leurs âges , regrouper des produits par leur
types, des étudiants par diplôme préparé, des entreprises pas secteur d’activité.

1. Diviser la population en strates.


2. Dresser la liste la plus complète possible (base de sondage) constituant chacune des
strates.
3. Pour chaque strate, choisir de façon aléatoire simple un nombre d’unités statistiques
pour constituer l’échantillon de telle sorte que le pourcentage d’unités dans chacune
des strates de l’échantillon soit le plus près possible du pourcentage d’unités dans
chacune des strates de la population.

2.2 Distributions d’échantillonnage


L’objectif de cette partie est de répondre à la problématique suivante : comment, à
partir d’informations ( moyenne-écart-type ou proportion) connues sur une population,
peut-on prévoir celles d’un échantillon ?

2.2.1 Modèlisation d’échantillonnage aléatoire simple


Dans la suite du chapitre, on traite le cas de l’échantillonnage aléatoire simple, car les
concepts fondamentaux et les formules importantes découlent de cette méthode.
Ce type d’échantillonnage consiste à extraire un échantillon de taille n dans une popu-
lation de taille N par des tirages aléatoires équiprobables et indépendants (tirages avec
remise). On introduit le modèle suivant :
Soit Ω = {w1 , ..., wN } la population constituée d’éléments appelés unités d’observation.
Soit X le caractère que l’on voudrait étudier sur l’ensemble de cette population.
Xk , le résultat aléatoire du k ièm tirage, est une v.a qui suit la même loi que X.
On note xk le résultat du k ièm tirage.
On note (X1 , ..., Xn ) les résultats aléatoires de ces tirages.

Définition 15. X1 , ..., Xn sont n v.a. indépendantes et de même loi (celle de X) ; il est
appelé n-échantillon ou échantillon de taille n de X. Après tirage au sort, (X1 , ..., Xn )
prend les valeurs (x1 , ..., xn ).
La réalisation unique (x1 , ..., xn ) de l’échantillon (X1 , ..., Xn ) est l’ensemble des valeurs
observées.

11
Pr. Raby Guerbaz Université Hassan II

Définition 16. Une statistique Y sur un échantillon (X1 , ..., Xn ) est une v.a., fonction
mesurable des Xk ; Y = f (X1 , ..., Xn ). Après réalisation, la v.a. Y (statistique) prend la
valeur f (x1 , ..., xn ).

La principale statistique connue est la moyenne de l’échantillon,


Pn
Xi
X = i=1 .
n
Cette moyenne est appelée moyenne empirique. Sa réalisation sur un échantillon particulier
lors d’une étude statistique est appelée moyenne observée.

Remarque 2.2.1. La moyenne empirique est une variable aléatoire qui prend des valeurs
différentes sur chaque échantillon. Ces valeurs sont dites : moyennes observées.

2.2.2 Distribution d’échantillonnage d’une moyenne


Propriétés : Soit X le caractère quantitatif que l’on voudrait étudier sur l’ensemble
de cette population. Si E(X) = µ ( la moyenne de X est µ), et V ar(X) = σ 2 , alors
– E(X) = µ, ( la moyenne de la moyenne empirique X est exactement celle de la
population.
2
– V ar(X) = σn , si la taille de la population est très grande (cas non exhaustif)

Proposition 17. La distribution d’échantillonnage de la moyenne est donnée par


– Si X suit une loi normale N (µ, σ), alors X ∼ N (µ, √σn ).
– Si n ≥ 30, par le théorème central limite, X suit approximativement une N (µ, √σn ).

Exemple : 1) La taille des marocains suit une loi normale N (1, 6; 0, 2). Alors la taille
0,2
moyenne de 8 personnes prise au hasard X suit une loi normale N (1, 6; √ 8
).
2) Dans une entreprise A, les salaires sont distribués suivant une loi inconnue de moyenne
10000 et d’écart type 1200 DH. Alors la moyenne des salaires de 150 salariés pris au hasard
suit une loi normale N (10000, √1200
150
).

2.2.3 Distribution d’échantillonnage d’une proportion


Soit une population comportant deux modalités A et B. Soit p la proportion d’individus
de la population possédant la modalité A. 1 − p est donc la proportion des individus de la
population possédant la modalité B. On extrait de la population un échantillon de taille
n.
Soit Kn la v.a qui représente le nombre d’individus dans l’échantillon ayant la modalité
A.

12
Pr. Raby Guerbaz Université Hassan II

Définition 18. La variable aléatoire pb = Knn s’appelle la fréquence empirique. Sa réalisation


f est la proportion d’individus dans l’échantillon ayant la modalité A.

Proposition 19. La distribution d’échantillonnage de la proportion est détérminée comme


suit
– Si n ≥ 30, np ≥ 5, et n(1 − p) ≥ 5, alors par le théorème central limite
r
p(1 − p)
pb ∼ N (p, ).
n
– Sinon ( le cas ou n < 30), la variable Kn suit une loi binomiale B(n, p), et les calculs
pour pb

Exemple : On suppose que la distribution des salaires dans une entreprise est telle
que 20 % touchent moins que 2000 DH. On tire un échantillon de 1000 salariés, alors
par le théorème central limite ( comme n > 30, np > 5, et n(1 − p) > 5) la proportion
pb des salariés
q parmi les 1000 qui touchent moins que 2000 DH suit une loi Normale
0,2×0,8
N (0, 2, 1000
).

2.2.4 Distribution d’échantillonnage d’une variance


On définit la variable aléatoire
n
1X
S2 = (Xi − X)2 ,
n i=1

Cette statistique désigne la variance dans l’échantillon. On remarque que

n
!
1X
E(S 2 ) = E (Xi − X)2
n i=1
n
1 X 2
= E X − E(X)2
n i=1 i
n
1X
= E(Xi2 ) − E(X)2
n i=1

On utilise le fait que

E(Xi2 ) = V ar(Xi ) + (E(Xi ))2 , et E(X)2 = V ar(X) + (E(X))2 ,

On obtient
σ2
E(Xi2 ) = σ 2 + µ2 , et E(X)2 = + µ2 ,
n
13
Pr. Raby Guerbaz Université Hassan II

On remplace en haut,

1 σ2
E(S 2 ) = n(σ 2 + µ2 ) − ( + µ2 )
n n
1 2
= (1 − )σ .
n
Comme 1 − n1 < 1 ; alors E(S 2 ) < σ 2 .
Interprétation : En moyenne, la variance dans l’échantillon est plus faible que dans la
population-mère.
2
Proposition 20. Si le caractère X à étudier suit une loi normale N (µ, σ) alors n Sσ2 suit
une loi de khi-deux à (n-1) degrés de liberté, notée χ2(n−1) .
2
Attention, si X n’est pas normale, il n’est pas du tout sûr que n Sσ2 suive, même ap-
proximativement, une loi du khi-deux. Nous n’avons pas ici l’analogue du théorème central
limite.

2.2.5 Cas exhaustif ( Taille de la population connue :


Dans le cas exhausutif, l’echantillon est obtenu par un tirage sans remise dans une
population de taille N finie et connue. On peut établire des formules analogues aux cas
non exhaustif :
σ2 N − n
E(X) = µ et V ar(X) = × .
n N −1
N −n
Le facteur appelé facteur d’exhaustivité est inférieur à 1. Alors la variance
N −1
σ2 N − n σ2
dans le cas exhaustif × est plus faible que celle dans le cas non exhaustif .
n N −1 n

Interprétation : Le fait que la taille de la population est petite et le tirage est effectué
sans remise rend les résultats plus précis car la variance est plus petite.

2.3 Estimation ponctuelle


Nous nous intéresserons dans la suite à l’estimation des principales caractéristiques (ou
paramètres) d’un caractère dans une population, à savoir la moyenne, la variance et la
fréquence, à partir des valeurs calculées sur les échantillons.
Cependant un même paramètre peut être estimé de différentes manières. Par exemple
on sait que pour une variable aléatoire de Poisson, la moyenne est λ et la variance est
λ. Donc on peut estimer le paramètre λ, en utilisant la moyenne ou la variance dans

14
Pr. Raby Guerbaz Université Hassan II

l’échnatillon. Une question naturelle se pose : Quelle est l’estimation la plus bonne ? Et
bonne dans quel sense ?
Les paramètres à estimer seront notés les par des lettres grecques minuscules
– µ pour la moyenne de la population.
– σ pour l’écart type de la population.
– σ 2 pour la variance de la population.
– p pour la proportion dans la population.
Les estimateurs ( v.a. ou statistiques) seront notés par des majuscules
– X pour la moyenne empirique.
– S 2 pour la variance de la population.
– pb pour la proportion empirique.
Les réalisations d’échantillon seront notées par des lettres latines minuscules
– x pour la moyenne de l’échantillon.
– s pour l’écart type de l’échantillon.
– σ 2 pour la variance de l’échantillon.
– f pour la proportion dans l’échantillon.

Définition 21. Un estimaeur T = f (X1 , ..., Xn ) d’un paramètre θ est une statistique, et
sa réalisation f (x1 , ..., xn ) sera appelée estimation ponctuelle de θ.

Définition 22. On appelle erreur d’estimation la diference entre l’etimateur et le pa-


ramètre : Erreur = T − θ.
Cette Erreur peut être décomposer de la façon suivante :

fluctuation autour de la moyenne


z }| {
T −θ = T − E(T ) + E(T ) − θ
| {z }
Biais
1. Le terme T − E(T ) traduit la fluctuation de T autour de son espérance.
2. Le terme E(T ) − θ = B(T ) représente l’erreur systématique et s’appelle BIAIS de
l’ESTIMATEUR

Définition 23. 1. Si le biais B(T ) est nul ( E(T ) = θ), alors on dit que T est un
estimateur sans biais.
2. Si le biais B(T ) est positif, ( E(T ) > θ), alors l’estimateur surestime la valeur
du paramètre.
3. Si le biais B(T ) est négatif, ( E(T ) < θ), alors l’estimateur sousestime la valeur
du paramètre.

15
Pr. Raby Guerbaz Université Hassan II

Exemple : Soit X une variable aléatoire qui suit une loi de Poisson de paramètre λ,
alors
E(X) = V ar(X) = λ.
On désire estimer λ, on tire un échantillon (X1 , X2 , ..., Xn ) de taille n de même loi que X.
1. Nous avons E(X) = E(X) = λ, alors la moyenne empirique X est un estimateur
sans biais du paramètre λ d’une loi de Poisson.
2. Cependant E(S 2 ) = (n−1)
n
V ar(X) = (n−1)
n
λ < λ. Par suite la variance empirique S 2
est estimateur biaisé du même paramètre. Le biais est négatif (B(S 2 ) = − n1 ,) alors
l’estimateur sousestime la valeur du paramètre.

2.3.1 Estimation ponctuelle d’une moyenne


Soit X une caractère ( une variable aléatoire) dont on veut estimer la moyenne µ à
partir d’un échantillon (X1 , ..., Xn ) de même loi que X. La loi de X est inconnue.
X1 + X2 + ... + Xn
Théorème 24. La moyenne empirique X = est un estimateur effi-
n
cace de la moyenne µ.

En effet, l’etimateur X est sans biais car E(X) = µ. De plus il est convergeant car
V ar(X)
V ar(X) = → 0, quand n tend vers l’infinit.
n
On peut montrer qu’il est de variance minimale.

2.3.2 Estimation ponctuelle d’une variance


Soit X une vairable aléatoire qui suit une loi normale N (µ, σ). On veut estimer la
variance de X. Deux cas de figure se présentent :

La moyenne µ de la population est connue :

Si la moyenne de la population est connue alors


n
1X
Proposition 25. La statistique T = 2
(Xi − µ)2 est un estimateur efficace de la
n j=1
variance σ 2 .

16
Pr. Raby Guerbaz Université Hassan II

En effet, T 2 est un estimateur sans biais, car


n
2 1 X
E(T ) = E (Xi − µ)2
n j=1
n
1X
= E(Xi − µ)2 , avec E(Xi ) = µ,
n j=1
σ 2 + ... + σ 2
= = σ2 On rappel que V ar(Xi ) = E(Xi − µ)2 = σ 2
n
On peut aussi montrer que l’estimateur est convergeant et de variance minimale. (Ceci
reste en dehors du cadre de ce cours)

La moyenne µ est inconnue :

Si la moyenne de la population est inconnue alors


n
1X
Proposition 26. La statistique Se2 = (Xi − X)2 est un estimateur biaisé de la
n j=1
variance σ 2 .

En effet,
n
1X n−1 2
E(Se2 ) = E(Xi − X)2 = σ .
n j=1 n
Alors pour corriger le biais on prend l’estimateur
n e2
S2 = S .
n−1
On remarque que
n n n−1 2
E(S 2 ) = E(S 2 ) = σ = σ2.
n−1 n−1 n
Proposition 27. La statistique ( la variance corrigée )
n
2 n 1 X
Ś = S2 = (Xi − X)2
n−1 n − 1 j=1

est un estimateur de la variance σ 2 qui est sans biais et convergeant.

2.3.3 Estimation ponctuelle d’une proportion


Soit une population ayant des individus possédant une certaine caractéristique A. On
veut estimer à partir d’un échantillon de taille n la proportion d’individus possédant cette
caractéristique A. Soit K la v.a qui représente le nombre d’individus dans l’échantillon
possédant la caractéristique A.

17
Pr. Raby Guerbaz Université Hassan II

K
Proposition 28. La fréquence empirique pb = n
est l’estimateur efficace de p.
En effet, pb = Kn est un estimateur sans biais car, comme X1 , X2 , ..., Xn sont des variables
de Bernoulli, alors
E(X1 ) + E(X2 ) + ... + E(Xn )
p) =
E(b
n
p + p + ... + p
=
n
n×p
= = p.
n
En plus pb est un estimateur convergeant, car
V ar(X1 ) + V ar(X2 ) + ... + V ar(Xn )
V ar(b
p) =
n2
p(1 − p) + p(1 − p) + ... + p(1 − p)
=
n2
p(1 − p)
= .
n
alors V ar(bp) −→ 0, quand n → +∞.
Exemple d’application : On s’interesse à la proportion p des étudiants ayant un
Baccalauréat Sciences-économiques inscrit en S4 à la FSJES Aı̈n Sebaâ. On a prélevé
indépendamment deux échantillons de tailles n1 = 120 et n2 = 150. On constate que 48
étudiants du premier échantillon et 66 du second ont une un bac Sciences économiques.
Calculer 3 estimations ponctuelles de p.
Solution : Une première estimation utilise le premier échantillon de taille 120. Comme 48
étudiants parmi les 120 sont scientifiques, alors une première estimation ponctuelle de la
48
proportion est f1 = 120 = 0, 4. La deuxième estimation est calculée à partir du deuxième
66
échantillon f2 = 150 =. Maintenant, en regroupant les deux échantillons, on construit un
échantillon de taille 270. Sur cet échantillon on trouve 114 étudiants Scientifiques, alors
48+66
la fréquence des scientifiques dans l’échantillon global est f3 = 120+150 = 114
270
.

2.4 Estimation par intervalle de confiance


L’estimation d’un paramètre inconnu par une seule valeur est quelque fois insuffisante,
on prefere souvent donner un intervalle de valeurs. On cherche des intervalles dit ”intervalle
de confiance” qui, generalement, a 95% ou 99% des cas, contiennent la moyenne µ inconnue
ou le pourcentage p d’une certaine propriété que possède la population.
Définition 29. Soit X une v.a. dont la loi dépend d’un paramètre inconnu θ ; on appelle
INTERVALLE DE CONFIANCE pour un de niveau 1 − α (ou de seuil α), un intervalle
qui a la probabilité 1 − α de contenir la vraie valeur de θ.

18
Pr. Raby Guerbaz Université Hassan II

Dire qu’on aie sur à 95 % que la durée moyenne d’attente des clients dans une grande
distribution est entre 1 minute et 3 minutes, revient à dire que [1 ; 3] est un intervalle de
confiance pour la durée moyenne d’attente avec un niveau de confiance de 95 %.
Autrement dit, P(1 < µ < 3) = 0, 95).

Comment construire un intervalle de confiance ?

Remarque 2.4.1. Plus le niveau de confiance est élevé, plus la certitude est grande que
la méthode d’estimation produira une estimation contenant la vraie valeur de θ).
– Les niveaux de confiance les plus utilisés sont 90%, 95% et 99%.
– α est appelé le seuil ou le risque, et 1 − α est le niveau de confiance.

2.4.1 Intervalle de confiance pour une moyenne


Nous avons vu que la moyenne X d’un échantillon aléatoire permet d’estimer la vraie
moyenne de la population.

Nous voudrions estimer également la précision de cette moyenne, c’est-à-dire donner


une marge d’erreur ou un intervalle de confiance

Si la taille de l’échantillon est petite n < 30

Il faut que le caractère quantitatif X étudié ( Salaire, loyer, PIB,...) suit une loi normale
N (µ, σ). On distingue de cas :
a) L’écart type σ est connu : On se fixe le risque α et on cherche dans la table de la
loi normale la valeur u1−α , telle que
 
X −µ
P −u1− α2 ≤ √ ≤ u1− α2 = 1 − α,
σ/ n
Ceci est équivalent à
 
σ σ
P X − u1− 2 √ ≤ µ ≤ X + u1− 2 √
α α = 1 − α,
n n
u1− α2 est le fractile d’ordre 1 − α2 de la loi normale centrée réduite.
Résultat : Si x est une réalisation de X, l’intervalle de confiance de la moyenne µ de
seuil 1 − α est  
σ σ
IC = x − u1− α2 √ ≤ µ ≤ x + u1− α2 √
n n
b) L’écart type σ est inconnu : Si l’écart type σ est inconnu, alors on l’estime par
celui de l’échantillon corrigé noté s. Mais dans ce cas on a recours à une nouvelle loi de
probabilité : La loi de Student.

19
Pr. Raby Guerbaz Université Hassan II

Figure 2.2 – Echantillonnage aléatoire

Théorème 30. Dans le cas d’un échantillon Gaussien,

X −µ
√S
n

suit une loi de Student de degré de libérté n − 1

En appelant tn−1 le fractile d’ordre 1 − α2 , on peut écrire


!
X −µ
P −tn−1 ≤ S ≤ tn−1 = 1 − α.

n

Par suite  
S S
P X − tn−1 √ ≤ µ ≤ X + tn−1 √ = 1 − α.
n n
En remplaçant x et S par leurs valeurs calculées sur l’échantillon, on obtient l’intervalle
de confiance sur la moyenne µ :
 
s s
IC = x − tn−1 √ , x + tn−1 √
n n

Cas ou n ≥ 30, et X de loi quelconque

Lorsque la taille n de l’échantillon est grande (pratiquement dès que n > 30), on
appliquera les formules de l’intervalle de confiance sur µ, même si l’échantillon n’est pas
issu d’une population normale. En effet, le théorème central limite nous permet de dire

20
Pr. Raby Guerbaz Université Hassan II

Figure 2.3 – Echantillonnage aléatoire

que X est approximativement de loi N (µ, √σn ) lorsque n est grand.


Dans ce cas, un intervalle de confiance de la moyenne est donné par
 
σ σ
IC = x − u √ , x + u √ si σ est connu, et
n n
 
s s
IC = x − u √ , x + u √ si σ est inconnu, sest l’écart type corrigé
n n
Remarque 2.4.2. Dans le cas ou n > 30, on fait recours à la loi Normale dans les deux
cas σ connu et inconnu.

Exemple : La taille moyenne d’un échantillon de 51 filles de S4 est de 167,9 cm.


L’écart type de cet échantillon est de 5,3 cm. Si nous supposons que cet échantillon est
représentatif de la taille des filles belges âgées d’une vingtaine d’années, nous pouvons
calculer la taille moyenne de cette population, avec sa marge d’erreur :
s
e = u√ .
n

Cas d’un tirage exhaustif

Dans une population de N individus (taille de la population est connue), dont la


moyenne est µ et l’écart-type σ, nous utilisant les mêmes formules pour les intervalles

21
Pr. Raby Guerbaz Université Hassan II

σ s q
−n
de confiance on multiplie seulement √ et √ par le facteur N N −1
.
n n
C’est à dire " r r #
σ N −n σ N −n
x − u√ , x + u√
n N −1 n N −1
" r r #
s N −n s N −n
x − u√ , x + u√
n N −1 n N −1
" r r #
s N −n s N −n
x − tn−1 √ , x + tn−1 √
n N −1 n N −1

N −n
Remarque 2.4.3. Si N est très grand devant n, le facteur d’exhaustivité devient
N −1
proche de 1, donc on le néglige. On principe, on juge N grand par rapport à n, si le taux de
sondage n/N < 5% ; c’est à dire si l’échantillon constitue moins de 5% de la population.

2.4.2 Intervalle de confiance pour la variance d’une variable


Gaussienne
On désire estimer la variance σ 2 d’un caractère quantitatif X, qui suit une loi normale
de moyenne µ et de variance σ 2 . D’après le chapitre précédent, S 2 est un estimateur sans
biais de la variance σ 2 , c à d
n
21 X
E(S ) = E(Xi − X)2 = σ 2 .
n − 1 i=1

(n−1)×S 2
En plus σ2
suit une loi khi-deux de (n-1) degrés de libérté. On écrit

(n − 1) × S 2
∼ χ2n−1 .
σ2
Soient k1− α2 et k α2 les quantiles d’ordre 1 − α/2 et α/2 de la loi χ2n−1 . C’est à dire

(n − 1) × S 2 (n − 1) × S 2
   
P ≤ k α2 = α/2, et P ≤ k1− α2 = 1 − α/2
σ2 σ2

Alors
(n − 1)S 2
 
P k α2 < < k1− α2 = F (k1− α2 ) − F (k α2 )
σ2
= 1 − α/2 − α/2
= 1 − α.

22
Pr. Raby Guerbaz Université Hassan II

Ceci est équivalent à


!
(n − 1)S 2 (n − 1)S 2
P < σ2 < = 1 − α.
k1− α2 k α2

Alors l’intervalle de confiance pour la variance σ 2 de la population est de la forme


" #
(n − 1)s2 (n − 1)s2
;
k1− α2 k α2

et par suite un intervalle de confiance pour l’ecart type σ est donné par
" √ √ #
s n−1 s n−1
p ; p .
k1− α2 k α2

2.4.3 Intervalle de confiance pour une proportion


Si n est grand (et f pas trop proche de  0q
ou 1), en pratique n ≥ 30, nf > 5 et
n(1−f ) > 5, alors pb suit une loi normale N p, p(1−p)
n
. Alors un intervalle de confiance
de risque α pour une proportion p inconnue est donné par
" r r #
f (1 − f ) f (1 − f )
f −u , f +u , ou f est la fréquence obsérvée
n n

Exemple : Si 37 personnes ont voté pour le candidat aux élections, sur 136 électeurs
sondé, les bornes d’un intervalle de confiance sur p la proportion des élécteurs dans tout
le pays qui voteront pour ce candidat, au niveau de confiance 0.95, est dans comprie entre
" r r #
f (1 − f ) f (1 − f )
f −u , f +u
n n

37
avec u = 1, 96, et f = 136
.

2.4.4 Taille d’échantillon


Durant la préparation de l’enquête, le chercheur doit à un moment décider de la taille
de l’échantillon. Cette décision est importante car elle a une incidence sur
– Les coûts de l’étude.
– La précision des résultats.
Une première approche consiste à utiliser le Budget disponible :

Budget= Coûts fixes + taille de l’échantillon x Coût d’un Questionnaire

23
Pr. Raby Guerbaz Université Hassan II

On trouve ainsi la taille de l’échantillon n imposée par la contrainte budgétaire. Mais est
ce que cet échantillon est suffisant pour représenter la population entière ? ? ? ! ! ! !. Aucun
moyen de répondre.
Cependant une deuxième approche ( Plus rationnelle) consiste à utiliser la marge d’erreur
tolérée ( la précision de l’étude) pour calculer la taille minimale de l’échantillon afin qu’il
représente la population.

Taille d’échantillon pour estimer une moyenne

On distigue deux cas :


a) Ecart type connu : Pour trouver la taille d’échantillon in faut résoudre l’équation
σ
u √ ≤ e,
n

ou e est la marge d’erreur fixé à l’avance, u le fractile d’ordre 1 − α2 de la loi normale et


σ l’écart type de la population.
Ceci peut être écrit
√ σu
n≥ ,
e
alors  uσ 2
n≥ .
e
b) Ecart type inconnu :
Solution 1 : On utilise une étude pilote. On distribut un questionnaire d’essai et on
calcul l’écart type corrigé sur l’échantillon. Ensuite, on fixe la marge d’erreur qu’on peut
tolérée et le reste resemble au premier cas :
s
u √ ≤ e,
n
α
ou e est la marge d’erreur fixé à l’avance, u le fractile d’ordre 1 − 2
de la loi normale et
s l’estimation de l’écart type.
Ceci peut être écrit
√ s×u
n≥ ,
e
alors  2
u×s
n≥ .
e
Solution 2 : On utilise le fait que les valeur de la loi normale ne s’étendent pas plus loin
que 4σ ; alors
étendu des données
σ= .
4

24
Pr. Raby Guerbaz Université Hassan II

Exemple : Un magasin réalise un chiffre d’affaire d’au moins 1000 euros et d’au plus
2000 euros par jour. Pour estimer le chiffre d’affaire moyen on peut utiliser un écart type
de
2000 − 1000
σ= = 250 euros
4
Donc pour une marge erreur maximale e = 25 euros et un niveau de confiance de 95%, la
taille de l’échantillon doit être
 2
1, 96 × 250
n≥ = 384, 16.
e
Alors il faut éffectuer l’étude sur 385 jours pour estimer le chiffre d’affaire moyen avec une
marge d’erreur petite e=25 euros. Une étude très précise demande une taille d’échantillon
très grande.

Remarque 2.4.4. La marge d’erreur e est toujours donnée par


σ σ
e = u√ , ou e = u√ (si l’écart type est inconnu)
n n
Alors si je veux diminuer la marge d’erreur il suffit d’augmenter la taille de l’échantillon.
Ce qui est naturel ! !
Cependant, si on augmente 4 fois la taille de l’échantillon l’erreur est réduite seulement
à la moitié. En effet, si on utilise un échantillon 4 fois plus grand pour l’enquête. Alors
au lieu de n on travail sur n0 = 4n individus, la nouvelle marge d’erreur est maintenant
σ σ σ e
e0 = u √ = u √ = u √ = .
n0 4n 2 n 2
On augmente 4 fois les dépences et on récupère un léger gain en erreur, ceci montre que
l’augmentation de la taille de l’échantillon n’est pas la meilleur manière d’augmenter la
précision.

Taille d’échantillon pour estimer une proportion

De la même manière que dans le cas de la moyenne, si l’on se fixe la marge d’erreur e
à ne pas dépasser (avec une probabilité 1 − α), on cherche n tel que
r
f (1 − f )
u = e.
n
ou bien
u2 f (1 − f )
n= .
e2
Mais comme on n’a pas encore tiré l’échantillon, la fréquence dans l’échantillon est incon-
nue. Alors comment peut-on procéder ?

25
Pr. Raby Guerbaz Université Hassan II

Premier cas : Si l’on n’a au préalable aucune information sur f, on prend la valeur de f
qui nous donne la plus grande taille d’échantillon n. Ceci est réalisé si f (1 − f ) prend sa
valeur maximale qui est 0,25.
En effet, pour chercher la valeur de f qui maximise la fonction g(f ) = f (1 − f ) = f − f 2 ,
on dérive la focntion g, on obtient g 0 (f ) = 1 − 2f , et g 0 (f ) = 0 si f = 1/2 = 0, 5
En conclusion, la valeur maximale de f (1 − f ) est atteinte en f = 0, 5. ( f (1 − f ) =
0, 25 = 1/4)
Résultat : La taille d’échantillon est donnée par la formule

u2 × 0, 25 u2
n= = .
e2 4e2
Exemple : Pour mener une enquête ( un sondage ) tel que le pourcentage soit connu
(estimé) avec une marge d’erreur maximale de 10%, et ce pour un niveau de confiance de
95%, il faut interroger au moins
1, 96 × 0, 25
n≥ = 96
(0, 1)2

Deuxième cas : Si on sait à l’avance que la proportion qu’on désir estimer est inférieur
à 0,5. Par si on sait que la proportion ne peut pas dépasser 23%, alors la taille de
l’échantillon qu’il faut prendre est
1, 96 × 0, 23 × 0, 77
n≥
(0, 1)2

Troisième cas : Si on sait à l’avance que la proportion qu’on désir estimer est supperieur
à 0,5. Par si on sait que la proportion dépasse 80 %, alors la taille de l’échantillon qu’il
faut prendre est
1, 96 × 0, 8 × 0, 2
n≥
(0, 1)2

2.4.5 Cas exhaustif (taille de la population connue)


On sait que q dans le cas exhaustif, l’intervalle de confiance change par l’ajout du facteur
−n
d’exhaustivité N N −1
.
C’est à dire que la recherche d’un intervalle de
q confiance seqfait alors comme
q précédemment,
f (1−f ) f (1−f ) N −n
mais en remplaçant dans la marge d’erreur : n
par n
× N −1

Exemple : Un contrôleur de réception a reçu un lot de 5000 pièces. Pour estimer


le diamètre moyen d’une pièce, il utilise un échantillon de 60 pièces. Sur l’échantillon il
trouve un diamètre moyen de 2 cm. Supposons que la loi du diamètre est normale d’écart

26
Pr. Raby Guerbaz Université Hassan II

type σ = 0, 1 cm. Un intervalle de confiance de risque 5% est donnée par :


" r r #
0, 1 5000 − 60 0, 1 5000 − 60
2 − 1, 96 √ × ; 2 + 1, 96 √ ×
60 5000 − 1 60 5000 − 1

Si la proportion des pièces défectueuses dans l’échantillon de taille 60 est de 77%, alors
un intervalle de confiance pour la proportion dans la population de taille 5000 est
" r r r r #
0, 77 × 0, 23 5000 − 60 0, 77 × 0, 23 5000 − 60
0, 77 − 1, 96 × ; 0, 77 + 1, 96 × ×
60 5000 − 1 60 5000 − 1

A partir de la marge d’erreur e on calcul toujours les tailles d’échantillons. Dans le cas de
la moyenne la marge d’erreur est :
r
σ N −n
e = u√
n N −1

La formule de n en fonction de σ, N, e, et u sera déficile à retenir. Mais heureusement, il


y a une astuce simple :
– On calcul la taille de l’échantillon n en faisant comme si la taille de la population
n’est pas donnée.
– Puis on calcul la vraie taille d’échantillon n’ qu’on cherche avec une petite correction
N
n0 = N −1
n
+1

Exemple : Sur une population de 5000 habitant, on veut estimer une proportion avec une
marge d’erreur de 10% et un niveau de confiance de 95%. Donnez la taille de l’échantillon
nécessaire ?
Solution : On calcul la taille de l’échantillon sans prendre en compte la taille de la
population
u2 (1, 96)2
n= 2 = = 97
4e 4(0, 1)2
et maintenant on corrige
n = ...

27
Chapitre 3

Tests d’hypothèse :

Un test statistique est un mécanisme visant à trancher entre deux hypothèses à partir de
résultats observés sur un ou plusieurs échantillon(s). On formule une hypothèse de départ,
appelée hypothèse nulle et souvent notée (H0 ) et il s’agit de décider si on rejette ou non
cette hypothèse par opposition à une contre-hypothèse appelée hypothèse alternative et
souvent notée (H1 ).
Exemple : Un contrôleur de réception a reçu un lot de pièces sensées être de 5 mm de
diamètre ; mais il se demande si, par suite d’un étiquetage douteux, on ne lui a pas livré
par erreur des pièces de 6 mm de diamètre.
On sait que la machine fournie une légères variation et que le diamètre des pièces est en
fait distribué selon une loi normale N(m ; 0, 6). Le problème est de savoir si on a bien
m = 5, et pas plutôt m = 6.
1. Si une pièce prise au hasard dans le lot mesure exactement 5 mm, est-on sûr que le
lot est bon ?
2. Si elle fait exactement 5.8 mm, est-on sûr que le lot est mauvais ?
3. Est-ce la même chose si, sur 10 pièces prises au hasard, on a un diamètre moyen de
5.8 mm ?
4. A partir de quelle valeur du diamètre moyen peut on dire que le lot est mauvais ?
Procédure des tests d’hypothèse Pour réaliser un test d’hypothèse, il y a un enchai-
nement strict d’actions à effectuer. Cela commence par la formulation de l’hypothèse dans
le domaine considéré (médical, économique, social...) et sa traduction en événèments pro-
babilistes liés à H0 . On doit ensuite considérer la statistique d’écart (la loi théorique de
la différence) et choisir un seuil (alpha) de décision. On calcule la valeur de la statistique
d’écart pour nos valeurs puis il faut la comparer à la valeur théorique de la statistique
d’écart pour le seuil choisi ( α = 5% par exemple )et en déduire si on accepte H0 ou
non. Enfin, le calcul (ou la lecture) de la ”p-value” associé au dépassement de la valeur

28
Pr. Raby Guerbaz Université Hassan II

de la statistique d’écart permet de conclure de façon fine sur le fait que la différence est
significative ou non.

3.1 Tests de conformité


Les tests de conformité sont destinés à vérifier si un échantillon peut être considéré
comme extrait d’une population donnée ou représentatif de cette population, vis-à-vis
d’un paramètre comme la moyenne, la variance ou la fréquence observée. Ceci implique
que la loi théorique du paramètre est connue au niveau de la population.
Les étapes d’un test :
1. Il s’agit d’abord de formuler les hypothèses (H0 ) et (H1 ).
2. On choisit en général le risque de type I ( le seuil ), α. (souvent donné dans l’énoncé).
3. On détermine la variable de décision Z ou T (qui est une statistique) dont on connaı̂t
la loi si (H0 ) est vraie.
4. On détérmine la région critique ou région de rejet Irejet qui est l’ensemble des valeurs
de Z qui conduiront à rejeter (H0 ).
5. Le complémentaire de Irejet est appelé région d’acceptation Iaccept . Les points de
jonction entre les deux régions sont les points critiques.
6. On calcul la valeur de Z à partir de l’observation de l’échantillon.
7. Conclusion du test : acceptation ou rejet de (H0 ) selon que la valeur de Z est ou
non dans la région d’acceptation.

3.1.1 Les différentes catégories d’hypothèses

3.1.2 Test de conformité sur une moyenne


Cas d’une variable Normale

On suppose que X suit une loi normale de moyenne µ et d’écart type σ.


A) Cas ou σ est connu : La variable X étudiée au niveau de la population suit une loi
normale N (µ, σ) avec σ connu. Ainsi la distribution de X au niveau de l’échantillon sera :

σ X −µ
X ∼ N (µ, √ ), on peut aussi écrire Z = ∼ N (0, 1).
n √σ
n

a) Test Unilateral à droite :


Les hypothèses du test se présentent sous la forme :

29
Pr. Raby Guerbaz Université Hassan II

(
H0 : µ = µ0
H1 : µ > µ0
On considère comme variable de décision X. La région critique ( de rejet ) du test est
de la forme :
Irejet =]c, +∞[,
ou la frontière de la région critique aura pour expression :
σ
c = µ0 + z1−α √ .
n
et on détermine la valeur de z1−α à partir de la table de la loi normale centrée et réduite
tel que φ(z1−α ) = 1 − α.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone de rejet, alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte H0 ).

Remarque 3.1.1. Si on prend comme variable de décision


X − µ0
Z=
√σ
n

alors la région de rejet sera de la forme :

Ierejet = [z1−α , +∞[.

c’est à dire on rejette H0 si la valeur observée


x − µ0
z= ∈ Ierejet .
√σ
n

avec x la valeur de la moyenne obsérvée sur l’échantillon.

a) Test Unilateral à gauche :


Les hypothèses du test se présentent sous la forme :
(
H0 : µ = µ0
H1 : µ < µ0
On considère comme variable de décision X. La région critique ( de rejet ) du test est
de la forme :
Irejet =] − ∞, c[,
ou la frontière de la région critique aura pour expression :
σ
c = µ0 − z1−α √ .
n

30
Pr. Raby Guerbaz Université Hassan II

et on détermine la valeur de z1−α à partir de la table de la loi normale centrée et réduite


tel que φ(z1−α ) = 1 − α.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone de rejet, alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte H0 ).

Remarque 3.1.2. Si on prend comme variable de décision

X − µ0
Z= ,
√σ
n

alors la région de rejet sera de la forme :

Ierejet =] − ∞, −z1−α [.

c’est à dire on rejette H0 si la valeur observée


x − µ0
z= ∈ Ierejet .
√σ
n

avec x la valeur de la moyenne obsérvée sur l’échantillon.

a) Test bilateral :
Les hypothèses du test se présentent sous la forme :
(
H0 : µ = µ0
H1 : µ 6= µ0
On considère comme variable de décision X. La région d’acceptation du test comme
un intervalle symètrique autour de µ0 de la forme :

Iaccept = [c1 , c2 ],

ou :
La marge d0 erreur e e
z }| { z }| {
σ σ
c1 = µ 0 − z1− α2 √ et c2 = µ0 + z1− α2 √
n n
et on détermine la valeur de z1− α2 à partir de la table de la loi normale centrée et réduite
tel que φ(z1− α2 ) = 1 − α2 = N iveau de conf
2
iance+1
comme dans les intervalles de confiance.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone d’acceptation ( x ∈ [c1 , c2 ],) alors on accepte (H0 ), sinon, on rejette H0 .

Remarque 3.1.3. Si on prend comme variable de décision

X − µ0
Z=
√σ
n

31
Pr. Raby Guerbaz Université Hassan II

alors la région d’acceptation est :

Ieaccept = [−z1− α2 , +z1− α2 ].

c’est à dire on accept H0 si la valeur observée


x − µ0
z= ∈ Ieaccept .
√σ
n

avec x la valeur de la moyenne obsérvée sur l’échantillon.

A) Cas ou σ est inconnu : La démarche est la même que pour le test précédent mais
la variance de la population n’étant pas connue, elle est estimée par la variance corrigée
S 2 . La variable X étudiée au niveau de la population suit une loi normale N (µ, σ) avec σ
inconnu.
X − µ0
T = suit une loi de Student de (n-1) degrés de liberté.
√S
n

a) Test Unilateral à droite :


Les hypothèses du test se présentent sous la forme :
(
H0 : µ = µ0
H1 : µ > µ0
On considère comme variable de décision X. La région critique ( de rejet ) du test est
de la forme :
Irejet =]c, +∞[,
ou la frontière de la région critique aura pour expression :
s
c = µ0 + t(n−1,1−α) √ .
n
| {z }
e

ou s est l’écart type corrigé et et on détermine la valeur de t(n−1,1−α) à partir de la table


de la loi de Student.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone de rejet ( càd x ≥ c), alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte
H0 ).

Remarque 3.1.4. Si on prend comme variable de décision

X − µ0
T =
√S
n

32
Pr. Raby Guerbaz Université Hassan II

alors la région de rejet sera de la forme :

Ierejet =]t(n−1,1−α) , +∞[.

c’est à dire on rejette H0 si la valeur observée


x − µ0
t= ∈ Ierejet .
√s
n

avec x la valeur de la moyenne obsérvée sur l’échantillon et s l’écart type corrigé.

a) Test Unilateral à gauche :


Les hypothèses du test se présentent sous la forme :
(
H0 : µ = µ0
H1 : µ < µ0
On considère comme variable de décision X. La région critique ( de rejet ) du test est
de la forme :
Irejet =] − ∞, c[,
ou la frontière de la région critique aura pour expression :
σ
c = µ0 − e = µ0 − t(n−1,1−α) √ .
n

Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la


zone de rejet, alors on rejette (H0 ), sinon, on ne la rejette pas (on accepte H0 ).

Remarque 3.1.5. Si on prend comme variable de décision

X − µ0
T =
√S
n

alors la région de rejet sera de la forme :

Ierejet = [−t(n−1,1−α) , +∞[.

c’est à dire on rejette H0 si la valeur observée


x − µ0
z= ∈ Ierejet .
√s
n

avec x la valeur de la moyenne obsérvée sur l’échantillon.

33
Pr. Raby Guerbaz Université Hassan II

c) Test bilateral :
Les hypothèses du test se présentent sous la forme :
(
H0 : µ = µ0
H1 : µ 6= µ0
On considère comme variable de décision X. La région d’acceptation du test comme
un intervalle sypetrique autour de µ0 de la forme :

Iaccept = [c1 , c2 ],

ou :
La marge d0 erreur e e
z }| { z }| {
s s
c1 = µ0 − t(n−1,1− α2 ) √ et c2 = µ0 + t(n−1,1− α2 ) √
n n
et on détermine la valeur de t(n−1,1− α2 ) à partir de la table de Student comme pour les
intervalles de confiance.
Conclusion du test : Si x, la valeur de la moyenne sur l’échantillon, appartient à la
zone d’acceptation ( x ∈ [c1 , c2 ],) alors on accepte (H0 ), sinon, on rejette H0 .

Remarque 3.1.6. Si on prend comme variable de décision

X − µ0
T =
√S
n

alors la région d’acceptation est :


h i
Iaccept = −t(n−1,1− 2 ) , +t(n−1,1− 2 ) .
e α α

c’est à dire on accept H0 si la valeur observée


x − µ0
t= ∈ Ieaccept .
√s
n

avec x la valeur de la moyenne obsérvée sur l’échantillon.

Cas d’un échantillon de grande taille

Si la taille de l’échantillon est grande en pratique n ≥ 30, alors


a) Si σ est connu : Les résultats du paragraph précédent restent valables.
b) Si σ est inconnu, alors on l’estime par s, mais les résultats du paragraph précédent
restent valables en remplaçant tn−1 par z le fractile de la loi normale.

34
Pr. Raby Guerbaz Université Hassan II

3.2 Tests de conformité sur une variance d’une v.a


Gaussienne
Si X suit une loi normale N (µ, σ), alors on peut les tests suivants
( ( (
H0 : σ 2 = σ02 H0 : σ 2 = σ02 H0 : σ 2 = σ02
ou ou
H1 : σ 2 6= σ02 H1 : σ 2 > σ02 H1 : σ 2 < σ02

On se fixe α, le risque de type I et on connaı̂t la taille de l’échantillon.


A) cas ou la moyenne µ est connue : On prend comme variable de décision :
n
1X
T2 = (Xi − µ)2
n i=1
2
si σ 2 = σ02 , alors (n−1)T
σ2
suit une loi χ2n de n degrés de liberté.
Détémination de la région critique :
a) Pour le test bilatéral H1 de la forme σ 6= σ02 : On cherche la région d’acceptation
sous la forme [c1 , c2 ].
Soient kn ( α2 ) et kn les réels déterminés dans la table de la loi χ2n , tels que
  
 P nT22 < kn(1−α/2) = 1 − α/2
σ
 2 
 P nTσ2
< kn(α/2) = α/2

si σ 2 = σ02 , alors
nT 2
 
P kn(α/2) < 2 < kn(1−α/2) = 1 − α
σ0
Alors
σ02 kn(α/2) σ 2 kn(1−α/2)
 
P < T2 < 0 = 1 − α.
n n
L’intervalle d’acceptation pour T 2 au risque α est
 2
σ0 kn(α/2) σ02 kn(1−α/2)

Iaccept = ,
n n
Conclusion :
Si t2 , la réalisation de T 2 ∈ Iaccept , on accept (H0 ), sinon, on rejette (H0 ).
a) Pour Unilatéral à droite : H1 de la forme σ > σ02 .
On cherche la région critique sous la forme ]t1 , +∞[.
Soit kn,(1−α) le réel déterminé dans la table de la loi χ2n par
 2 
nT
P < kn,(1−α) = 1 − α.
σ02

35
Pr. Raby Guerbaz Université Hassan II

La région critique (ou intervalle de rejet) pour T 2 au risque α est


 2 
σ0 kn,(1−α)
Irejet = , +∞ .
n
Conclusion :
Si t2 , la réalisation de T 2 ∈ Irejet , on rejette (H0 ), sinon on ne rejette pas H0 .
Remarque : Si on choisit comme variable de décision Z, l’intervalle d’acceptation
pour Z au risque α pour un test bilatéral est
 
Irejet = kn,(α) , kn,(1−α)

.
L’intervalle de rejet pour Z au risque α, pour une test unilateral à droite et à gauche est
respectivement
[kn,(1−α) , +∞[ et ] − ∞, kn,α ].
B ) cas ou la moyenne µ est inconnue : On a

(n − 1)S 2
∼ χ2n−1 .
σ2
On reprend les résultats de a) en remplaçant T 2 par S 2 et χ2n par χ2n−1 .
Résumé :
Intervalle d’acceptation pour S 2 dans un test bilatéral :
 2
σ02

σ0
Iaccept = kn−1, α2 ; kn−1,1− α2 .
n−1 n−1

Intervalle de rejet pour S 2 dans un test unilatéral à droite :


 2 
σ0
Irejet = kn−1,1−α ; +∞ .
n−1

Intervalle de rejet pour S 2 dans un test unilatéral à gauche :

σ02
 
Irejet = −∞, kn−1,α .
n−1

3.3 Tests de conformité sur une proportion


Soit p la proportion de la population possédant le caractère considéré. On veut effectuer
un test (
H0 : p = p0
H1 : p > p0 , p 6= p0 , p < p0 .

36
Pr. Raby Guerbaz Université Hassan II

On q
prend comme variable de décision pb. Si p = p0 , alors la loi de pb est normale
N (p0 , p0 (1−p
n
0)
).
On se fixe α, le risque de type 1 et on connait la taille de l’échantillon.
On détérmine la région critique du test :
(a) Test bilateral p 6= p0
L’intervalle d’acceptation pour pb au risque α est
" r r #
p0 (1 − p0 ) p0 (1 − p0 )
Iaccept = p0 − u1−α/2 ; p0 + u1−α/2 .
n n

Conclusion :
Si la fréquence f sur l’échantillon, appartient à Iaccept , on accept (H0 ), sinon, on rejette
(H0 ).
(a) Test Unilateral à droite p > p0
L’intervalle de rejet de pb au risque α est
# r #
p0 (1 − p0 )
Irejet = p0 + u1−α ; 1 .
n

Conclusion :
Si la fréquence f sur l’échantillon, appartient à Irejet , on rejette (H0 ) en faveur de H1 ,
sinon, on accepte (H0 ).
(a) Test Unilateral à gauche p < p0
L’intervalle de rejet de pb au risque α est
" r "
p0 (1 − p0 )
Irejet = 0, p0 − u1−α .
n

Conclusion :
Si la fréquence f sur l’échantillon, appartient à Irejet , on rejette (H0 ) en faveur de H1 ,
sinon, on accepte (H0 ).

Tests de choix entre deux valeurs du paramètre

Ce type de test est appelé souvent : test d’une hypothèse simple contre une
hypothèse simple.
Soit X une variable aléatoire qui dépend d’un paramètre θ inconnu. Le problème est de
choisir entre deux valeurs numériques θ0 et θ1 du paramètre θ.
(
H0 : θ = θ0
H1 : θ = θ1

37
Pr. Raby Guerbaz Université Hassan II

Le risque de type I est donné, ainsi que la taille de l’échantillon. Calcul de la région
critique W, Z étant la variable de décision. Si θ1 > θ0 le test est traité le la même manière
qu’un test unilateral à droite.
Alors la région de rejet est de la forme Irejet = [θ0 + e, ∞[.
Conclusion : Si θ1 ∈ Irejet , alors on rejette (H0 ) en faveur de H1 et on dit que θ = θ1 .
Sinon on accepte (H0 ) est on décide que θ = θ0 .

3.3.1 Notion d’erreur et de puissance de test :


Lorsqu’on effectue un test d’hypothèse, deux types d’erreur sont susceptibles de surve-
nir :
Risque d’erreur de type I : (ou Erreur de première espèce)

α = P(rejeter H0 avec le test|H0 vraie dans la réalité).

Risque d’erreur de type II ( ou erreur de deuxième espèce) :

β = P(ne pas rejeter H0 avec le test |H1 vraie)

La puissance d’un test statistique est :

Puissance = 1-Risque de deuxième espèce=1-β.

Le seuil de signification d’un test statistique est le plus petit risque pour lequel la
valeur observée de la statistique du test permet le rejet de H0 . En anglais, le seuil de
signification se nomme ”p-value”. Il s’agit d’une quantité qui est toujours calculée dans
les logiciels spécialisés qui permettent d’effectuer des tests d’hypothèses.
Règle de décision en fonction du seuil de signification αs : Si le risque suppérieur au
seuil de signification, alors on rejette H0 . (Voir la solution de l’examen de l’année dernière)

38
Pr. Raby Guerbaz Université Hassan II

Remarque 3.3.1. Il n’est pas possible de calculer la puissance d’un test si on ne spécifie
pas préciséement H1 . Par exemple, on ne peut pas effectuer des calculs sous l’alternative
µ > 11000. Il faut spécifier une valeur simple, par exemple µ = 13000F r.

3.4 Tests de comparaison


Soient X1 et X2 deux variables aléatoires définies sur deux populations mères compa-
rables (éventuellement égales). La loi de X1 (resp. X2 ) dépend d’un paramètre inconnu
θ1 (resp. θ2 ). On souhaite tester l’hypothèse ”ces deux paramètres sont égaux” contre
l’hypothèse complémentaire ”ces deux paramètres son différents”, soit
(
H0 : θ1 = θ2
H1 : θ1 6= θ2 ou θ1 > θ2 ouθ1 < θ2 .
Pour effectuer ce test, on dispose d’un échantillon de taille n1 (resp. n2 ) de X1 (resp.
X2 ) permettant une estimation ponctuelle Tn1 (resp. Tn2 ) de θ1 (resp. θ2 ). On suppose de
plus que les v.a. X1 et X2 sont normales ou approximativement normales.
En supposant vraie, on détermine un risque de première espèce α, une zone de rejet
associée aux valeurs critiques.

3.4.1 Test de comparaison de deux moyennes :


Soient deux populations P1 et P2 et deux v.a X1 et X2 définies respectivement sur P1
et P2 , X1 et X2 étant indépendantes.
On pose µ1 = E(X1 ), µ2 = E(X2 ), σ1 = V ar(X1 ), et σ22 = V ar(X2 )
On veut tester l’hypothèse
(
H0 : µ1 = µ2
H1 : µ1 6= µ2 ou µ1 > µ2 ouµ1 < µ2 .

On dispose d’un échantillon de taille n1 issu de la population 1 qui donne une moyenne x1
et un écart type s1 et un deuxième échantillon de taille n2 de la population 2 qui donne
une moyenne x2 et un écart type s2 .

39
Pr. Raby Guerbaz Université Hassan II

Cas ou σ1 et σ2 sont connus

On supposera que X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 ) et que n1 , n2 > 30.


La variable de décision est la suivante
X1 − X2
Z=q 2 .
σ1 σ22
n1
+ n2

Si µ1 = µ2 , alors
X − X2
q1 2 ∼ N (0, 1)
σ1 σ22
n1
+ n2

(a) test bilatéral µ1 6= µ2 : Soit u1−α/2 le réel déterminé comme habituellement dans
la table de la loi centrée réduite N (0, 1).
L’intervalle d’acceptation pour Z au risque α est
 
Iaccept = −u1−α/2 ; +u1−α/2

Conclusion : Si
x1 − x2
z=q 2 ∈ Iaccept .
σ1 σ22
n1
+ n2
on accepte H0 , sinon on rejette H0 en faveure de H1 .
(b) test Unilatéral à droite µ1 > µ2 : Soit u1−α le réel déterminé comme habituelle-
ment dans la table de la loi centrée réduite N (0, 1).
L’intervalle de rejet est de la forme

Irejet = [u1−α ; ∞[

Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
σ1 σ
n1
+ n22
on rejette H0 , sinon on accepte H0 .
(c) test Unilatéral à gauche µ1 < µ2 : Soit u1−α le réel déterminé comme habituel-
lement dans la table de la loi centrée réduite N (0, 1).
L’intervalle de rejet est de la forme

Irejet = ]−∞, −u1−α ]

Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
σ1 σ
n1
+ n22
on rejette H0 , sinon on accepte H0 .

40
Pr. Raby Guerbaz Université Hassan II

Cas où σ1 et σ2 sont inconnus et n1 et n2 > 30

On supposera que X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 ) et que n1 , n2 > 30.


La variable de décision est la suivante
X1 − X2
Z=q 2 .
s1 s22
n1
+ n2

Si µ1 = µ2 , alors
X − X2
q 12 ∼ N (0, 1)
s1 s22
n1
+ n2

(a) test bilatéral µ1 6= µ2 :


Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle d’acceptation pour Z au risque α est
 
Iaccept = −u1−α/2 ; +u1−α/2

Conclusion : Si
x1 − x2
z=q 2 ∈ Iaccept .
s1 s22
n1
+ n2

on accepte H0 , sinon on rejette H0 en faveure de H1 .


(b) test Unilatéral à droite µ1 > µ2 :
Soit u1−α le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle de rejet est de la forme

Irejet = [u1−α ; ∞[

Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
s1 s
n1
+ n22
on rejette H0 , sinon on accepte H0 .
(c) test Unilatéral à gauche µ1 < µ2 :
Soit u1−α le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle de rejet est de la forme

Irejet = ]−∞, −u1−α ]

41
Pr. Raby Guerbaz Université Hassan II

Conclusion : Si
x −x
q 1 2 2 2 ∈ Irejet .
s1 s
n1
+ n22
on rejette H0 , sinon on accepte H0 .

Cas où σ1 et σ2 sont inconnus avec σ1 = σ2 et n1 et n2 < 30

On supposera que X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 ) et que n1 , n2 > 30.


La variable de décision est la suivante
X1 − X2
Z=q 2 2
q .
n1 s1 +n2 s2 1 1
n1 +n2 −2 n1
+ n2

Si µ1 = µ2 , alors
X1 − X2
q q ∼ tn1 +n2 −1
n1 s21 +n2 s22 1 1
n1 +n2 −2 n1
+ n2

(a) test bilatéral µ1 6= µ2 :


Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1.
L’intervalle d’acceptation pour Z au risque α est
 
Iaccept = −t1−α/2 ; +t1−α/2

Conclusion : Si
x1 − x2
z=q q ∈ Iaccept .
n1 s21 +n2 s2
2
1 1
n1 +n2 −2 n1
+ n2

on accepte H0 , sinon on rejette H0 en faveure de H1 .


(b) test Unilatéral à droite µ1 > µ2 :
Soit t1−α le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1
L’intervalle de rejet est de la forme

Irejet = [t1−α ; ∞[

Conclusion : Si
x1 − x2
q q ∈ Irejet .
n1 s21 +n2 s22 1 1
n1 +n2 −2 n1
+ n2

on rejette H0 , sinon on accepte H0 .


(c) test Unilatéral à gauche µ1 < µ2 :

42
Pr. Raby Guerbaz Université Hassan II

Soit u1−α le réel déterminé comme habituellement dans la table de la loi de Student de
degrés de liberté n1 + n2 − 1
L’intervalle de rejet est de la forme

Irejet = ]−∞, −t1−α ]

Conclusion : Si
x1 − x2
q q ∈ Irejet .
n1 s21 +n2 s2
2
1 1
n1 +n2 −2 n1
+ n2

on rejette H0 , sinon on accepte H0 .

3.5 Tests de comparaison de deux variances


On supposera que X1 ∼ N (µ1 , σ1 ) et X2 ∼ N (µ2 , σ2 ) et que n1 , n2 > 30.
On dispose d’un n1 -échantillon de X1 qui donne un écart type corrigé s1 et d’un n2 -
échantillon de X2 qui donne un écart type corrigé s2 .

On veut tester l’hypothèse


(
H0 : σ1 = σ2
H1 : σ1 6= σ2 ou σ1 > σ2 ouσ1 < σ2 .

La variable de décision est la suivante


s22
F = .
s22

Si σ12 = σ22 , alors


F ∼ F(n1 − 1, n2 − 1)
Pour calculer la région critique, on détermine dans la table de la loi de Fischer-Snedecor
F(n1 − 1, n2 − 1) les réels fα/2 et f1−α/2 tels que
( 
P F < fα/2 = α/2

P F < f1−α/2 = 1 − α/2.

L’intervalle d’acceptation pour F au risque α est


 
Iaccept = f1−α/2 ; fα/2

Conclusion : Si
s21
f= ∈ Iaccept .
s22

43
Pr. Raby Guerbaz Université Hassan II

on accepte H0 , sinon on rejette H0 en faveure de H1 .


Remarque importante
Si α est tel que l’on ne puisse pas lire dans la table de Fischer-Snedecor les valeurs f1−α/2
et fα/2 , on cherchera un intervalle d’acceptation pour F de la forme [fα1 , fα2 ], fα1 étant
définie par P(F < fα1 ) = α1 et fα2 étant définie par P(F > fα2 ) = α2 avec α = α1 + α2 .

3.6 test de comparaison de deux proportions


Soient p1 la proportion d’individus possédant le caractère considéré A dans la popula-
tion I et p2 la proportion d’individus possédant le même caractère dans la population II.
On dispose d’un n1 -échantillon de I et un n2 -échantillon de II. Soient F1 la fréquence empi-
rique associée à l’échantillon de I et F2 la fréquence empirique associée à léchantillon de II.

On veut tester l’hypothèse


(
H0 : p1 = p2
H1 : p1 6= p2 ou p1 > p2 ou p1 < p2 .
On note le risque de type I par α.
Dans le cas ou p1 = p2 = p, on considère la variable de décision :

F1 − F2
Z=p   ∼ N (0, 1).
p(1 − p) n11 + 1
n2

Pour réaliser le test on remplace p (inconnue) par son estimation

n1 f 1 + n2 f 2
f= .
n1 + n2
Alors, la statistique de test devient

F1 − F2
Z=p   ∼ N (0, 1).
f (1 − f ) n11 + 1
n2

(a) test bilatéral p1 6= p2 :


Soit u1−α/2 le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle d’acceptation pour Z au risque α est
 
Iaccept = −u1−α/2 ; +u1−α/2

44
Pr. Raby Guerbaz Université Hassan II

Conclusion : Si
f1 − f2
z=p   ∈ Iaccept .
f (1 − f ) n11 + 1
n2

on accepte H0 , sinon on rejette H0 en faveure de H1 .


(b) test Unilatéral à droite p1 > p2 :
Soit u1−α le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle de rejet est de la forme

Irejet = [u1−α ; ∞[

Conclusion : Si
f1 − f2
p   ∈ Irejet .
f (1 − f ) n11 + 1
n2

on rejette H0 , sinon on accepte H0 .


(c) test Unilatéral à gauche p1 < p2 :
Soit u1−α le réel déterminé comme habituellement dans la table de la loi centrée réduite
N (0, 1).
L’intervalle de rejet est de la forme

Irejet = ]−∞, −u1−α ]

Conclusion : Si
f1 − f2
p   ∈ Irejet .
f (1 − f ) n11 + 1
n2

on rejette H0 , sinon on accepte H0 .

45

Vous aimerez peut-être aussi