Vous êtes sur la page 1sur 151

Statistique inférentielle : méthodes.

Par Dr Moussa BAGAYOGO


Master/IUFIC
Université Thomas Sankara

Mai 2021

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 1 / 113


Plan de l’exposé
1 Introduction

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113


Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 2 / 113
Introduction

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 3 / 113
Introduction

Quelques problèmes

1 Un fabricant souhaite vérifier la qualité des ampoules électriques


produites par une nouvelle chaîne de production.
Il faut donc évaluer la durée moyenne de fonctionnement des
ampoules.
Comment évaluer cette durée moyenne ?
On ne peut pas tester toutes les ampoules !

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 4 / 113


Introduction

Quelques problèmes

1 Un fabricant souhaite vérifier la qualité des ampoules électriques


produites par une nouvelle chaîne de production.
Il faut donc évaluer la durée moyenne de fonctionnement des
ampoules.
Comment évaluer cette durée moyenne ?
On ne peut pas tester toutes les ampoules !
2 Le responsable d’un parti politique souhaite estimer la proportion des
militants favorables à la candidature de Mr X pour la prochaine
élection présidentielle.
Comment calculer la popularité d’un candidat au sein d’une
population ?
Interroger tous les militants est trop coûteux.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 4 / 113


Introduction

Population & Échantillon

Définition
La population : l’ensemble de tous les éléments considérés dans une étude.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 5 / 113


Introduction

Population & Échantillon

Définition
La population : l’ensemble de tous les éléments considérés dans une étude.

Définition
L’échantillon est un sous ensemble fini de la population.
La taille de l’échantillon est le nombre d’éléments sélectionnés pour
constituer l’échantillon.

Le but de l’inférence statistique.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 5 / 113


Introduction

Population & Échantillon

Définition
La population : l’ensemble de tous les éléments considérés dans une étude.

Définition
L’échantillon est un sous ensemble fini de la population.
La taille de l’échantillon est le nombre d’éléments sélectionnés pour
constituer l’échantillon.

Le but de l’inférence statistique.

Tirer des conclusions concernant certaines caractéristiques de la population


à partir des informations contenues dans l’échantillon.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 5 / 113


Introduction

Pour résumer

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 6 / 113


Introduction

Retour aux exemples

1 Le fabricant d’ampoules.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 7 / 113


Introduction

Retour aux exemples

1 Le fabricant d’ampoules. Il prélève un échantillon constitué de 130


ampoules.
Pour chaque ampoule, il mesure la durée de fonctionnement.
La moyenne de l’échantillon vaut 36 000 heures.
Une estimation pour la population est 36 000 heures.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 7 / 113


Introduction

Retour aux exemples

1 Le fabricant d’ampoules. Il prélève un échantillon constitué de 130


ampoules.
Pour chaque ampoule, il mesure la durée de fonctionnement.
La moyenne de l’échantillon vaut 36 000 heures.
Une estimation pour la population est 36 000 heures.
2 Le responsable du parti.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 7 / 113


Introduction

Retour aux exemples

1 Le fabricant d’ampoules. Il prélève un échantillon constitué de 130


ampoules.
Pour chaque ampoule, il mesure la durée de fonctionnement.
La moyenne de l’échantillon vaut 36 000 heures.
Une estimation pour la population est 36 000 heures.
2 Le responsable du parti. Il constitue un échantillon de taille 400. Parmi
les personnes sélectionnées, 250 sont favorables au candidat proposé.
Une estimation de la proportion de la population favorable à Mr X est
250/400 = 0.625
Quelle est la qualité de ces deux estimations ?

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 7 / 113


Rappels

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 8 / 113
Rappels Variable aléatoire discrètes

Variable aléatoire discrètes

Une variable aléatoire discrète prend un nombre au plus dénombrable


de valeurs. L’ensemble des valeurs prises par X peut donc s’écrire de
la forme {xi , i ∈ E } où E est un sous ensemble de N.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 9 / 113


Rappels Variable aléatoire discrètes

Variable aléatoire discrètes

Une variable aléatoire discrète prend un nombre au plus dénombrable


de valeurs. L’ensemble des valeurs prises par X peut donc s’écrire de
la forme {xi , i ∈ E } où E est un sous ensemble de N.
La loi de la variable aléatoire X est la suite des probabilités
pk = P(X = k) pour tout k ∈ E
L’espérance (moyenne) de X :

E(X ) =
X
pk xk
k∈E

La variance de X :
 

Var (X ) =
X X
pk xk2 −  pk xk 
k∈E k∈E

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 9 / 113


Rappels Variable aléatoire discrètes

Un exemple de loi discrète : la loi Binomiale

Épreuve de Bernoulli
• On appelle épreuve de Bernoulli, toute épreuve à deux éventualités.
• L’une des éventualités est appelée succès de probabilité notée p et
l’autre est appelée échec de probabilité notée q avec q = 1 − p.

Épreuve de Bernoulli
• On considère , n(n ≥ 2) épreuves de Bernoulli identiques et
indépendantes.
• Soit X la variable aléatoire égale au nombre de succès obtenu sur les n
épreuves,
• alors X suit une loi binomiale de paramètres n et p.
• On note X B(n; p).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 10 / 113


Rappels Variable aléatoire discrètes

Loi discrète

Loi de probabilité d’une loi binomiale


• Soit X une variable aléatoire qui suit une loi binomiale de paramètres
n et p.
• Alors la loi de probabilité de X est donnée par :

P(X = k) = Cnk p k (1 − p)n−k , k ∈ {0, 1, 2, · · · , n}

n!
avec Cnk = , n! = n × (n − 1) × (n − 2) × · · · × 1
k!(n − k)!

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 11 / 113


Rappels Variable aléatoire discrètes

Loi discrète

Caractéristiques d’une loi binomiale


Soit X une variable aléatoire binomiale de paramètres n et p.

X B(n, p)

Alors :
• son espérance mathématique est : E (X ) = np.
• sa variance est : V (X ) = np(1 − p)
• son écart type est : σ(X ) = V (X ) =
p p
np(1 − p)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 12 / 113


Rappels Variable aléatoire discrètes

Exemple 1

Dans une classe d’examen, le taux de succès est estimé à 60%. On


considère un groupe de 5 étudiants de cette classe.
Soit X la variable aléatoire égale au nombre d’ admis sur les 5 étudiants.
1 Déterminer la loi de probabilité de X puis calculer E (X ) et σ(X ).
2 Calculer la probabilité d’avoir :
a) aucun admis.
b) exactement 2 admis.
c) au moins 2 admis.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 13 / 113


Rappels Variable aléatoire discrètes

Exemple 2
Exemple 2
Dans un théâtre, on a constaté qu’en moyenne 5% des spectateurs qui ont
réservé une place n’assistent pas à la représentation. Quelle est la
probabilité pour que, sur 30 places louées, il y en ait 2 ou 3 ou 4
inoccupées ?

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 14 / 113


Rappels Variable aléatoire discrètes

Exemple 2
Exemple 2
Dans un théâtre, on a constaté qu’en moyenne 5% des spectateurs qui ont
réservé une place n’assistent pas à la représentation. Quelle est la
probabilité pour que, sur 30 places louées, il y en ait 2 ou 3 ou 4
inoccupées ?

Exemple 2 : corrigé
• On peut considérer que les 30 places sont tirées au sort dans une
population infinie comprenant une proportion p de personnes qui ne
viennent pas et une proportion q = 1 − p de personnes qui assistent à
la représentation.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 14 / 113


Rappels Variable aléatoire discrètes

Exemple 2
Exemple 2
Dans un théâtre, on a constaté qu’en moyenne 5% des spectateurs qui ont
réservé une place n’assistent pas à la représentation. Quelle est la
probabilité pour que, sur 30 places louées, il y en ait 2 ou 3 ou 4
inoccupées ?

Exemple 2 : corrigé
• On peut considérer que les 30 places sont tirées au sort dans une
population infinie comprenant une proportion p de personnes qui ne
viennent pas et une proportion q = 1 − p de personnes qui assistent à
la représentation.
• Le nombre de places inoccupées X est donc une variable binomiale de
paramètres : n = 30 et p = 0, 05.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 14 / 113


Rappels Variable aléatoire discrètes

Exemple 2
Exemple 2
Dans un théâtre, on a constaté qu’en moyenne 5% des spectateurs qui ont
réservé une place n’assistent pas à la représentation. Quelle est la
probabilité pour que, sur 30 places louées, il y en ait 2 ou 3 ou 4
inoccupées ?

Exemple 2 : corrigé
• On peut considérer que les 30 places sont tirées au sort dans une
population infinie comprenant une proportion p de personnes qui ne
viennent pas et une proportion q = 1 − p de personnes qui assistent à
la représentation.
• Le nombre de places inoccupées X est donc une variable binomiale de
paramètres : n = 30 et p = 0, 05.
• En vertu de la formule des probabilités totales, On a :

P(X = 2 ou 3 ou 4) = P(X = 2) + P(X = 3) + P(X = 4)


Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 14 / 113
Rappels Variable aléatoire discrètes

Exemple 2
Corrigé 2 (suite)
• En vertu de la formule des probabilités totales, On a :

P(X = 2 ou 3 ou 4) = P(X = 2) + P(X = 3) + P(X = 4)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 15 / 113


Rappels Variable aléatoire discrètes

Exemple 2
Corrigé 2 (suite)
• En vertu de la formule des probabilités totales, On a :

P(X = 2 ou 3 ou 4) = P(X = 2) + P(X = 3) + P(X = 4)

• Il nous faut donc calculer chacune de ces probabilités :


P(X = 2) = C30 2 p 2 q 28 = 29 × 30 × (0, 05)2 × (0, 95)28 = 0, 2586
2
P(X = 3) = C30 3 (0, 05)2 (0, 95)27 = 0, 1270

P(X = 4) = C30 4 (0, 05)2 (0, 95)26 = 0, 0451

En définitive : P(X = 2 ou 3 ou 4) = 0, 4307

Opérations
Soient X et Y deux variables aléatoires indépendantes.
Si X B(n1 , p) et Y B(n2 , p) alors (X + Y ) B(n1 + n2 , p)
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 15 / 113
Rappels Variable aléatoire discrètes

Loi de Poisson

Définition
• La loi de Poisson est la loi suivie par la variable aléatoire qui étudie les
événements où le futur est indépendant du passé et les événements
rares.
• Si une variable aléatoire X suit une loi de poisson de paramètre
λ (λ > 0), alors on note X P(λ).

Remarque
• La loi de poisson permet de modéliser des situations de comptages
(comme la loi binomiale), mais elle compte le nombre de succès
lorsque le nombre d’épreuves est très grand et la probabilité de succès
est très faible.
• Elle est aussi appelée loi des cas rares.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 16 / 113


Rappels Variable aléatoire discrètes

Loi de Poisson

Remarque
On utilise la loi de poisson pour d’écrire les phénomènes suivants :
∗ le nombre d’atterrissages des avions dans un aéroport ;
∗ le nombre de personnes qui arrivent à un guichet pendant un temps
donné ;
∗ le nombre d’appels téléphoniques reçu par un standard pendant un
temps donné ;
∗ le nombre d’accidents dans une entreprise ;
∗ le nombre de défauts d’article produit en grande série ;
∗ etc.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 17 / 113


Rappels Variable aléatoire discrètes

Loi de Poisson
Loi de probabilité d’une loi de Poisson
Si X P(λ), alors sa loi de probabilité est donnée par :

λk −λ
P(X = k) = e , k = 0, 1, 2 · · ·
k!

Caractéristiques d’une loi de Poisson


Soit X , variable aléatoire qui suit une loi de poisson de paramètre :

X P(λ)

Alors :
• son espérance mathématique est : E (X ) = λ
• sa variance est : V (X ) = E (X ) = λ

• son écart type est : σ(X ) = λ
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 18 / 113
Rappels Variable aléatoire discrètes

Loi de Poisson
Exemple
Le nombre moyen de personnes arrivant à une caisse d’un magasin en une
heure est 60. Calculer la probabilité que le nombre de personnes arrivant à
cette caisse durant une période de 6 minutes soit inférieure ou égale à 3.
On admet que le nombre de personnes arrivant à une caisse durant une
période donnée suit une loi de poisson.

Approximation de la loi binomiale par une loi de Poisson


• Soit X une variable aléatoire qui suit une loi binomiale X B(n, p).
• Si n ≥ 30 et p ∈]0, 0, 1[ alors la loi de X peut être approchée par une
loi de Poisson de paramètre λ = np.

Exemple
Soit X B(250; 0, 02).
Calculer P(X = 2) et P(X = 3) directement puis en utilisant
l’approximation par une loi de poisson.
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 19 / 113
Rappels Variable aléatoire discrètes

Loi de Poisson

Exemple
Soit X B(250; 0, 02).
Calculer P(X = 2) et P(X = 3) directement puis en utilisant
l’approximation par une loi de poisson.

Opérations
• Soient X et Y deux variables aléatoires indépendantes.
• Si X P(λ1 ) et Y P(λ2 ), alors

(X + Y ) P(λ1 + λ2 )

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 20 / 113


Rappels Variable aléatoire continue

Un exemple de variable aléatoire non discrète

On note X le temps du trajet entre Ouaga et Bobo. C’est une variable


aléatoire qui prend des valeurs comprises entre 250 mn et 300 mn.
La variable aléatoire X peut prendre toutes les valeurs de l’intervalle
[250; 300].

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 21 / 113


Rappels Variable aléatoire continue

Un exemple de variable aléatoire non discrète

On note X le temps du trajet entre Ouaga et Bobo. C’est une variable


aléatoire qui prend des valeurs comprises entre 250 mn et 300 mn.
La variable aléatoire X peut prendre toutes les valeurs de l’intervalle
[250; 300].
Cette variable aléatoire n’est donc pas une variable discrète.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 21 / 113


Rappels Variable aléatoire continue

Un exemple de variable aléatoire non discrète

On note X le temps du trajet entre Ouaga et Bobo. C’est une variable


aléatoire qui prend des valeurs comprises entre 250 mn et 300 mn.
La variable aléatoire X peut prendre toutes les valeurs de l’intervalle
[250; 300].
Cette variable aléatoire n’est donc pas une variable discrète.
Définition
On dit que X est une variable aléatoire continue.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 21 / 113


Rappels Variable aléatoire continue

Définition
La loi d’une variable aléatoire continue est définie à partir d’une fonction f
appelée densité qui vérifie les propriétés suivantes :
f est positive pour tout x ∈ R, f (x ) ≥ 0
l’aire en dessous la courbe représentative de f vaut 1, autrement dit
Z +∞
f (x )dx = 1
−∞

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 22 / 113


Rappels Variable aléatoire continue

Calcul des probabilités

Définition
X une variable aléatoire continue.
La fonction de répartition de X (notée F ) est définie par
F (x ) = P(X ≤ x )

Quelques propriétés
1 P(X = x ) = 0
2 P(X ≤ x ) = P(X < x )
3 P(a ≤ X ≤ b) = P(X ≤ b) − P(X ≤ a) = F (b) − F (a)
4 P(X ≥ b) = 1 − P(X ≤ b) = 1 − F (b)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 23 / 113


Rappels Variable aléatoire continue

Espérance/Variance

X une variable aléatoire continue de densité f


L’espérance de X s’écrit

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 24 / 113


Rappels Variable aléatoire continue

Espérance/Variance

X une variable aléatoire continue de densité f


L’espérance de X s’écrit
Z
E(X ) = xf (x )dx

et la variance de X

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 24 / 113


Rappels Variable aléatoire continue

Espérance/Variance

X une variable aléatoire continue de densité f


L’espérance de X s’écrit
Z
E(X ) = xf (x )dx

et la variance de X
Z Z 2
var (X ) = x 2 f (x )dx − xf (x )dx

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 24 / 113


Rappels Variable aléatoire continue

Loi normale ou gaussienne : définition


La loi gaussienne est une loi continue qui dépend de deux paramètres
µ ∈ R et σ > 0. Sa densité est
1
1 − (x −µ)2
fµ,σ (x ) = √ e 2σ 2
σ 2π

Définition (Cas particulier)


On dit que la loi gaussienne est standard si µ = 0 et σ = 1.
On note F0,1 sa fonction de répartition ou tout simplement F s’il y a pas
de confusion.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 25 / 113


Rappels Variable aléatoire continue

Le rôle des deux paramètres µ, σ

µ est un paramètre de position.


σ un paramètre de dispersion.

Propriétés
Soit X une variable aléatoire gaussienne.
E(X ) = µ, la moyenne
Var (X ) = σ 2 , la variance
σ est l’écart type de X

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 26 / 113


Rappels Variable aléatoire continue

Lecture de la table de la loi normale centrée réduite

Notons F la fonction de répartition de la loi normale centrée réduite X .


Z t
∀ t ∈ R, F (t) = P(X ≤ t) = f (x )dx
−∞

Lecture directe
On connait t et on cherche F (t). On a deux cas possibles :
• si t ≥ 0 ; on lit directement sur la table ou on procède par
interpolation linéaire ;
• si t < 0 ; on a F (t) = 1 − F (−t).
Exemple : F (1, 99) = 0, 9767; F (0, 83) = 0, 7967

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 27 / 113


Rappels Variable aléatoire continue

Lecture de la table de la loi normale centrée réduite

Lecture inverse
On connait F (t) et on cherche t.
Posons p = F (t) et on note t = F −1 (p) : Deux cas peuvent se présenter :
• si p ≥ 0, 5 on lit directement sur la table ou on procède par
interpolation linéaire ;
• si p < 0, 5 on a t = −F −1 (1 − p).
Exemple : déterminer F −1 (0, 8413); F −1 (0, 975); F −1 (0, 484).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 28 / 113


Rappels Variable aléatoire continue

Calculs pratiques

Soit F la fonction de répartition de la loi normale centrée réduite T avec


X −µ
T= . Soient a et b dans R, on a alors :
σ
X −µ a−µ a−µ
   
• P(X < a) = P(X ≤ a) = P ≤ =F
σ σ σ
X −µ a−µ a−µ
   
• P(X > a) = P(X ≥ a) = 1 − P ≤ = 1−F
σ σ σ

a−µ X −µ b −µ
 
P(a < X < b) = P(a ≤ X ≤ b) = P ≤ ≤
σ σ σ
b −µ a−µ
   
= F −F
σ σ

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 29 / 113


Rappels Variable aléatoire continue

Loi normale

Exemple
Les consommations journalières à Bobo-Dioulasso d’un buveur de thé
suivent une loi normale de moyenne m = 7 verres de thé et d’écart type
σ = 3 verres de thé. Calculer la probabilité que les consommations d’une
journée soient :
a) inférieure à 11,5 verres de thé ;
b) supérieure à 11,5 verres de thé ;
c) comprise entre 8,5 et 11,5 verres de thé.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 30 / 113


Rappels Variable aléatoire continue

Loi normale

Opérations
• Soient X et Y deux variables aléatoires indépendantes.
• Si X N (µ1 , σ1 ) et Y N (µ2 , σ2 ) alors
 q 
• (X + Y ) N µ1 + µ 2 , σ12 + σ22
 q 
• (X − Y ) N µ1 − µ 2 , σ12 + σ22

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 31 / 113


Rappels Variable aléatoire continue

Loi normale
Approximation d’une loi binomiale par une loi normale
Conditions d’approximation
Si la variable aléatoire discrète X suit la loi binomiale B(n, p), et si l’une
des conditions suivantes est réalisée :
• n « grand » (n ≥ 30) et p ∈]0, 1; 0, 9[
• ou [np > 15 et nq > 15]
• ou [npq > 10]

On peut approcher la loi de X par la loi normale de paramètres np et npq

Exemple
Chaque jour un vendeur d’automobile peut vendre une voiture avec une
probabilité de 30% ou aucune avec une probabilité de 70%. Soit X le
nombre de voitures vendues sur une période de 200 jours.
1 Quelle est la loi de X ?
2 Calculer la probabilité de vendre
Dr M. BAGAYOGO (CUP-Kaya)
moins de 60 voitures sur Mai
Master 2020-2021
les2021
200 jours.
32 / 113
Rappels Variable aléatoire continue

Loi normale

Exemple
Chaque jour un vendeur d’automobile peut vendre une voiture avec une
probabilité de 30% ou aucune avec une probabilité de 70%. Soit X le
nombre de voitures vendues sur une période de 200 jours.
1 Quelle est la loi de X ?
2 Calculer la probabilité de vendre moins de 60 voitures sur les 200 jours.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 33 / 113


Rappels Variable aléatoire continue

Loi normale
Approximation d’une loi de poisson par une loi normale
Conditions d’approximation
Si la variable aléatoire discrète X suit la loi de poisson P(λ), et si la
condition suivante est réalisée : [λ est « grand » (λ > 10)] on√peut
approcher la loi de X par la loi normale de paramètres λ et λ

Remarque
Lorsqu’on passe d’une loi discrète à une loi continue, on doit procéder à
une correction de continuité pour obtenir une meilleure approximation des
résultats. La correction de continuité consiste à ajouter ou à soustraire un
coefficient k suffisamment petit :
P(X = a) = P(a − k ≤ Y ≤ a + k)
P(X ≤ a) = P(Y ≤ a + k)
P(X ≤ a) = P(Y ≥ a − k)
où Y est la loi continue d’approximation de la loi discrète X avec k = 0, 5
ou k = 0, 05 ou k = 0, 005 selon la valeur de a.
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 34 / 113
Rappels Variable aléatoire continue

Loi normale

Exemple
Le service accueil d’une banque donne en moyenne 350 renseignements par
heure. Soit X la variable aléatoire égale au nombre de renseignements
données sur une période de 6 minutes. Réaliser une approximation de la loi
de X par une loi normale puis calculer P(X = 35).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 35 / 113


Méthode des sondages

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 36 / 113
Méthode des sondages

Sondage : introduction

Il existe deux approches pour connaître les caractéristiques statistiques


d’un caractère sur une population.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 37 / 113


Méthode des sondages

Sondage : introduction

Il existe deux approches pour connaître les caractéristiques statistiques


d’un caractère sur une population.
Le recensement est l’approche descriptive. Il consiste à mesurer le
caractère sur toute la population.
Le sondage est l’approche inférentielle. Lorsque le recensement n’est
pas possible pour des raisons de coût, de temps ou à cause de
certaines contraintes (test destructif par exemple), on a recours à un
sondage, c’est-à-dire à l’étude statistique sur un sous-ensemble de la
population totale, appelé échantillon. Si l’échantillon est constitué de
manière correcte, les caractéristiques statistiques de l’échantillon
seront proches de celles de la population totale.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 37 / 113


Méthode des sondages

Sondage : introduction

Exemples
Je désire connaître l’âge moyen de TOUS les étudiants de Ouagadougou.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 38 / 113


Méthode des sondages

Sondage : introduction

Exemples
Je désire connaître l’âge moyen de TOUS les étudiants de Ouagadougou.
1 Recensement : je demande l’âge à tous les étudiants et je calcule la
moyenne... ça risque d’être long ! ! !

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 38 / 113


Méthode des sondages

Sondage : introduction

Exemples
Je désire connaître l’âge moyen de TOUS les étudiants de Ouagadougou.
1 Recensement : je demande l’âge à tous les étudiants et je calcule la
moyenne... ça risque d’être long ! ! !
2 Sondage : je choisis une partie des étudiants (échantillon), je calcule la
moyenne des âges sur cette partie en espérant que cette moyenne soit
"proche" de l’âge moyen de tous les étudiants.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 38 / 113


Méthode des sondages

Sondage : introduction

Exemples
Je désire connaître l’âge moyen de TOUS les étudiants de Ouagadougou.
1 Recensement : je demande l’âge à tous les étudiants et je calcule la
moyenne... ça risque d’être long ! ! !
2 Sondage : je choisis une partie des étudiants (échantillon), je calcule la
moyenne des âges sur cette partie en espérant que cette moyenne soit
"proche" de l’âge moyen de tous les étudiants.

Nous voyons sur cet exemple que la mise au point d’un sondage nécessite
plusieurs choix pour le statisticien :

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 38 / 113


Méthode des sondages

Sondage : introduction

Exemples
Je désire connaître l’âge moyen de TOUS les étudiants de Ouagadougou.
1 Recensement : je demande l’âge à tous les étudiants et je calcule la
moyenne... ça risque d’être long ! ! !
2 Sondage : je choisis une partie des étudiants (échantillon), je calcule la
moyenne des âges sur cette partie en espérant que cette moyenne soit
"proche" de l’âge moyen de tous les étudiants.

Nous voyons sur cet exemple que la mise au point d’un sondage nécessite
plusieurs choix pour le statisticien :
comment choisir les étudiants ?
combien d’étudiants doit-on choisir ?
comment doit-on formuler la réponse
est-ce que l’estimation est satisfaisante ?
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 38 / 113
Méthode des sondages

Problème d’estimation satisfaisante ? ? ?

Choix des méthodes d’échantillonnage


Choix des méthodes de sondages
Choix des estimateurs

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 39 / 113


Méthode des sondages

Élections américaines de 1936

Duel entre Alfred Landon (Républicain) et Franklin Roosevelt


(Démocrate)
Un magazine interroge ses 2 millions de lecteurs : victoire de Landon.
Gallup fait un sondage sur 50 000 personnes : il prédit la victoire de
Roosevelt

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 40 / 113


Méthode des sondages

Élections américaines de 1936

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 41 / 113


Méthode des sondages

Jusqu’en 2016 ?

Est-ce la fin des sondages en 2016 ?


1 Brexit
2 Élection de Donald Trump
3 Primaires de la droite en France
Ces "échecs" s’expliquent par des choix de méthode : ils ne remettent pas
en cause la notion de sondages.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 42 / 113


Méthode des sondages

Élections américaines de 2016

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 43 / 113


Méthode des sondages

Utilisation

Enquêtes auprès des ménages : le moral des ménages, le taux de


chômage
Enquêtes auprès des entreprises - ESA (Enquête Sectorielle Annuelle) :
Chiffre d’affaire par secteur, chiffres d’investissement, . . .
Et d’autres sujets,
Biologie : dénombrement d’espèces
Politique
Marketing

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 44 / 113


Méthode des sondages

Questionnaire

Une fois les objectifs identifiées, il faut réaliser un questionnaire :


1 Qui colle aux concepts
2 Mais compréhensible par l’enquêté : ni équivoque, ni flou
3 Qui permette de la comparabilité avec d’autres sources

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 45 / 113


Méthode des sondages

Questionnaire

Ce n’est pas une science exacte !

1 Questions ouvertes ou fermées ?


2 Quelles modalités de réponse ?
3 Quel est l’ordre des questions ?

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 46 / 113


Méthode des sondages

Types de sondages

On a deux types de sondages essentiellement :

1 Méthodes aléatoires :
Plans de sondage
â Simples : à probabilités égales, à probabilités inégales
â Complexes : stratifié, en grappe, plusieurs degrés

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 47 / 113


Méthode des sondages

Types de sondages

On a deux types de sondages essentiellement :

1 Méthodes aléatoires :
Plans de sondage
â Simples : à probabilités égales, à probabilités inégales
â Complexes : stratifié, en grappe, plusieurs degrés
2 Méthodes par choix raisonné ou judicieux :
â Quotas ;
â Itinéraires ;
â Unités-types ;
â Volontariat ;
â Échantillonnage sur place ;

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 47 / 113


Méthode des sondages

Types de sondages

Taux de sondages
n
Le rapport t = avec :
N
n la taille de l’échantillon ;
N l’effectif de la population
est appelé taux de sondage ou bien taux d’échantillonnage.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 48 / 113


Méthode des sondages

Échantillonnage aléatoire simple

Cette méthode alloue une chance à tous les individus d’une population
d’être sélectionner. L’adoption de cette méthode est appropriée lorsque la
population est nombreuse et relativement homogène

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 49 / 113


Méthode des sondages

Échantillonnage aléatoire simple

Cette méthode alloue une chance à tous les individus d’une population
d’être sélectionner. L’adoption de cette méthode est appropriée lorsque la
population est nombreuse et relativement homogène
Principe
1 Définir clairement la nature de la population
2 Assigner un numéro à chaque individu de la population
3 Sélectionner l’échantillon en choisissant n’importe quelle méthode qui
donne une chance égale à tous les numéros d’être tirés

Ce choix peut se faire avec ou sans remise :


Avec remise : Un individu peut être choisi plusieurs fois.
Sans remise : Un individu déjà choisi ne peut l’être de nouveau. C’est
le cas habituel.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 49 / 113


Méthode des sondages

Échantillonnage aléatoire simple


Il s’agit de sélectionner à partir d’une liste ou base de sondage un
échantillon de n individu par tirage au sort et ceci en une seule étape

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 50 / 113


Méthode des sondages

Échantillonnage aléatoire simple

Cela peut être obtenu soit par la méthode de l’urne si la taille de la


population mère n’est pas trop grande.
Dans le cas contraire, on utilise des tables de nombres aléatoires.
Des statisticiens ont construit des tables comportant des suites de
chiffres de 0 à 9, tirés au hasard avec probabilités égales.
Des programmes informatiques mettant en œuvre des procédés
mathématiques appropriés, permettent désormais de générer à la
demande des séries de nombres aléatoires.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 51 / 113


Méthode des sondages

Sondage stratifié

C’est un tirage basé sur la répartition en strates.


Principe
La base de sondage est divisée en groupes homogènes (strates) selon
un critère lié à la variable à estimer (exemple tranche d’âge, sexe,
habitat urbain-rural etc..).
Puis un tirage au sort est réalisé dans chaque strate.
En pratique, on répartit d’abord les individus en sous-groupes
homogènes pour le caractère étudié (strates) puis on tire au sort à
l’intérieur de chacune de ces strates.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 52 / 113


Méthode des sondages

Sondage stratifié

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 53 / 113


Méthode des sondages

Sondage périodique

Les individus de la population mère sont ordonnés de 1 à N. Si n est


la taille de l’échantillon, le taux d’échantillonnage est
n
t=
N
On calcule la période f qui n’est rien d’autre que l’inverse du taux
d’échantillonnage :
1 N
f = =
t n
Lorsque la période n’appartient pas à N, on prend sa partie entière.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 54 / 113


Méthode des sondages

Sondage périodique

On choisit au hasard un numéro parmi les N individus de la


population mère.
Ce numéro sera retenu comme celui du premier individu de
l’échantillon.
Les autres individus sont choisis par bonds successifs croissants ou
décroissants de f en f jusqu’à l’obtention des n numéros.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 55 / 113


Distribution d’échantillonnage

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 56 / 113
Distribution d’échantillonnage Échantillonnage des moyennes

Échantillonnage des moyennes

Soit X une variable aléatoire sur une population mère Ω de taille N.


On note µ l’espérance mathématique de X et σ l’écart type de X .
(Les valeurs de µ et σ sont ici supposées connues.)
n étant un entier fixé, on considère tous les échantillons de taille n
extraits de Ω.
On note X n la variable aléatoire qui, à tout échantillon de taille n,
associe la moyenne des valeurs de X observées sur cet échantillon.
X n est donc une variable aléatoire puisque sa valeur diffère d’un
échantillon à l’autre.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 57 / 113


Distribution d’échantillonnage Échantillonnage des moyennes

Espérance et écart type de X n

Premier cas : La taille de la population mère est finie et l’échantillon


non exhaustif (avec remise) ou bien la population mère est infinie que
l’échantillon soit exhaustif ou non.
On a :
σ
E (X n ) = µ et σ(X n ) = √ .
n

Deuxième cas : La population mère est finie et l’échantillon est


exhaustif (sans remise). On a
s
σ N −n
E (X n ) = µ et σ(X n ) = √ .
n N −1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 58 / 113


Distribution d’échantillonnage Échantillonnage des moyennes

Loi de X n

Premier cas : Si X suit une loi normale ie X N (m, σ), alors la


variable aléatoire X n suit également une loi normale (quelque soit la
valeur de n). On a donc X n N (m, σ(X n )).
Deuxième cas : Si les échantillons sont de taille assez grande (n ≥ 30),
on peut considérer que X n suit une loi normale quelle que soit la loi
suivie par la variable aléatoire X .

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 59 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 60 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caratère et q = 1 − p la proportion de ceux ne la
possédant pas.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 60 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caratère et q = 1 − p la proportion de ceux ne la
possédant pas.
Pour chaque échantillon de taille n extrait de la population mère, la
proportion d’éléments possédant le caractère défini correspond à la
fréquence observée f .

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 60 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caratère et q = 1 − p la proportion de ceux ne la
possédant pas.
Pour chaque échantillon de taille n extrait de la population mère, la
proportion d’éléments possédant le caractère défini correspond à la
fréquence observée f .
Désignons par Fn la variable aléatoire qui, à chaque échantillon de
taille n, associe la proportion d’éléments de cet échantillon présentant
le caratère défini.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 60 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caratère et q = 1 − p la proportion de ceux ne la
possédant pas.
Pour chaque échantillon de taille n extrait de la population mère, la
proportion d’éléments possédant le caractère défini correspond à la
fréquence observée f .
Désignons par Fn la variable aléatoire qui, à chaque échantillon de
taille n, associe la proportion d’éléments de cet échantillon présentant
le caratère défini.
Fn est donc définie sur l’ensemble de tous les échantillons de taille n,
et désigne bien une variable aléatoire puisqu’elle diffère d’un
échantillon à l’autre.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 60 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Espérance et écart type de Fn


Notons Yn la variable aléatoire qui, à chaque échantillon de taille n,
associe le nombre d’éléments de cet échantillon présentant le caractère
défini. Yn suit la loi binomiale de paramètres n, p. (Yn B(n, p)).
On définit Fn = Ynn .

Yn 1 1
E (Fn ) = E ( ) = E (Yn ) = np = p.
n n n
On a :
1 1
 2
Yn pq
 
V (Fn ) = V = Yn , V (Yn ) = 2
npq = .
n n n n
D’où, l’écart type de Fn est :
r
q pq
σ(Fn ) = V (Fn ) = .
n
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 61 / 113
Distribution d’échantillonnage Échantillonnage des proportions

Loi de Fn

Si la taille n des échantilons est assez grande (n ≥ 30), on peut considérer


que Fn suit une loi normale.
r
pq
 
Si n ≥ 30, alors Fn N p, .
n

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 62 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Loi de Fn

Si la taille n des échantilons est assez grande (n ≥ 30), on peut considérer


que Fn suit une loi normale.
r
pq
 
Si n ≥ 30, alors Fn N p, .
n

Remarque
Si les échantillons de taille n sont constitués sans remise dans une
population mère de tailleqN, les résultats
q q donnés précédemment restent
pq pq
valables en remplaçant n par n
N−n
N−1 .

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 62 / 113


Distribution d’échantillonnage Échantillonnage des proportions

Estimation

Introduction aux estimations

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 63 / 113


Estimation : Sondage aléatoire simple

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 64 / 113
Estimation : Sondage aléatoire simple

Estimation ponctuelle d’une moyenne

Soit X une variable aléatoire définie sur une population mère Ω.


On note µ l’espérance mathématique X .
µ est le paramètre inconnu que l’on cherche à estimer.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 65 / 113


Estimation : Sondage aléatoire simple

Estimation ponctuelle d’une moyenne

Soit X une variable aléatoire définie sur une population mère Ω.


On note µ l’espérance mathématique X .
µ est le paramètre inconnu que l’on cherche à estimer.

On utilise pour cela un échantillon de taille n, sur lequel on calcule la


moyenne x̄ des valeurs observées de X .
x̄ donne une estimation ponctuelle de m.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 65 / 113


Estimation : Sondage aléatoire simple

Estimation ponctuelle d’une variance

On note σ 2 la variance d’une variable aléatoire X définie sur une


population mère Ω.
σ 2 est le paramètre inconnu que l’on cherche à estimer.

On utilise donc un échantillon de taille n, sur lequel on calcule la


variance (σ 0 )2 des valeurs observées de X .
Le nombre s 2 = n−1 (σ )
n 0 2 donne une estimation ponctuelle de
q
σ2. s= n
n−1 σ
0 donne une estimation ponctuelle de σ.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 66 / 113


Estimation : Sondage aléatoire simple

Estimation ponctuelle d’une proportion

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caractère et par q = 1 − p la proportion de ceux qui ne la
possèdent pas.
p est un paramètre inconnu que l’on cherche à estimer.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 67 / 113


Estimation : Sondage aléatoire simple

Estimation ponctuelle d’une proportion

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caractère et par q = 1 − p la proportion de ceux qui ne la
possèdent pas.
p est un paramètre inconnu que l’on cherche à estimer.

On utilise pour cela un échantillon de taille n, sur lequel on calcule la


proportion f des éléments de l’échantillon possédant le caractère
défini.
f donne une estimation ponctuelle de p.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 67 / 113


Estimation : Sondage aléatoire simple

Estimation par intervalle de confiance d’une moyenne

Soit X une variable aléatoire d’espérance mathématique inconnue m


et d’écart type σ.
Soit x̄ la moyenne des valeurs observées de X sur un échantillon de
taille n.

L’intervalle de confiance au seuil de confiance α (pour le paramètre µ) est :

σ σ
 
IC = x̄ − tα √ ; x̄ + tα √ ,
n n
où tα est le réel tel que π(tα ) = 2 ,
α+1
π la fonction de répartition de la loi
normale centrée réduite.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 68 / 113


Estimation : Sondage aléatoire simple

Estimation par intervalle de confiance d’une moyenne

Remarque
Si l’écart type de la population mère σ est inconnu,
q on peut, dans la cas
n ≥ 30 le remplacer par son estimation s = n−1 n
σ 0 , où σ 0 est l’écart type
calculé sur l’échantillon. On a donc :

σ0 σ0
 
IC = x̄ − tα √ ; x̄ + tα √ .
n−1 n−1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 69 / 113


Estimation : Sondage aléatoire simple

Estimation par intervalle de confiance d’une proportion

Considérons une population mère Ω dans laquelle chaque élément


possède ou non un caractère donné.
Désignons par p la proportion d’individus de cette population
possédant ce caractère.
p est le paramètre inconnu pour lequel nous cherchons un intervalle IC
dans lequel nous sommes sûres que p se trouve au seuil de confiance α
Soit f la proportion correspondante observée sur un échantillon de
taille n assez grande (n ≥ 30).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 70 / 113


Estimation : Sondage aléatoire simple

Estimation par intervalle de confiance d’une proportion

L’intervalle de confiance au seuil de confiance α (pour le paramètre p) est :


 s s 
f (1 − f ) f (1 − f ) 
Iα = f − tα ; f + tα , (1)
n−1 n−1

où tα est le réel tel que π(tα ) = 2 ,


α+1
π la fonction de répartition de la loi
normale centrée réduite.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 71 / 113


Estimation : Sondage aléatoire simple

Taille d’échantillon

1 Jusqu’à présent la taille d’échantillon n était fixée.


2 Cependant, on pose souvent la question au statisticien : "A partir de
combien d’élément un échantillon est-il valable ?"
3 Nous chercherons la taille d’échantillon minimum n0 de manière à ce
que l’intervalle de confiance ne soit pas trop grand.
4 Plus précisément, nous fixons une demi-longueur h0 pour l’intervalle
de confiance et nous cherchons la taille d’échantillon n0 pour laquelle
la demi-longueur de l’intervalle de confiance vaut h0 .

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 72 / 113


Estimation : Sondage aléatoire simple

Cas de la moyenne

σ σ
 
IC = x̄ − tα √ ; x̄ + tα √
n n
La demi longueur de l’IC vaut donc
σ
tα √
n
ou encore
s  2
σ n S
tα √ = tα 1−
n N n
s
S2 n
' tα on prend le taux de sondage est proche de 0.
n N
s
σ2
' tα
n
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 73 / 113
Estimation : Sondage aléatoire simple

La demi longueur dépend de la variance de tous les individus qui est


inconnue
Une solution consiste à utiliser un majorant σmax
2 de cette variance σ 2
Ce majorant sera en général déterminé sur la base d’une enquête
précédente.
La demi longueur de l’IC sera alors au plus égale à
s
2
σmax

n
On se place dans le pire des cas, c’est-à-dire celui où la variance vaut
2 .
σmax
Par conséquent la taille d’échantillon minimum n0 telle que la demi
longueur de l’IC ne dépasse pas h0 sera la solution de l’équation
s
2
σmax
tα = h0
n0
tα2 σmax
2
C’est-à-dire n0 =
h02
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 74 / 113
Estimation : Sondage aléatoire simple

Taille de l’échantillon : Cas de la proportion


Pour la proportion, on a négligera le taux de sondage et on approchera
la demi-longueur de l’IC par :
s
p(1 − p)

n
Ici le problème est que cette demi longueur dépend de la proportion p
qui est inconnue.
Cependant une simple étude de fonction montre que
1
∀ p ∈ [0, 1], p(1 − p) ≤
4
Par conséquent, la demi longueur de l’IC est au plus égale à
s
1

4n

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 75 / 113


Estimation : Sondage aléatoire simple

Taille de l’échantillon : Cas de la proportion

On se place dans le pire des cas où p(1 − p) = 1/4


s
1
tα = h0
4n0

c’est-à-dire
tα2
n0 =
4h02

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 76 / 113


Estimation : Sondage stratifié

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 77 / 113
Estimation : Sondage stratifié

Contexte

On note N le nombre d’individus dans la population.


On souhaite évaluer une caractéristique de la population.
On note Xi la valeur de ce caractère mesurée sur le i ème individu.
On cherche estimer la moyenne du caractère sur la population
N
1X
µ= Xi
N i=1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 78 / 113


Estimation : Sondage stratifié

Contexte

On suppose que la population P est partagée en H sous-ensembles ou


strates notées Ph , h = 1, · · · , H.
taille de la strate h : Nh ;
N
1 X
moyenne de la strate h : µh = Xi
Nh i∈P
h
N
1
variance de la strate : σh2 = (Xi − µh )2
X
Nh i∈P
h

variance corrigée de la strate h :


N
1 Nh
Sh2 = (Xi − µh )2 =
X
σ2
Nh − 1 i∈P Nh − 1 h
h

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 79 / 113


Estimation : Sondage stratifié

Propriétés
1 Réécriture de µ :
N N
1X 1X
µ= Xi = Nh µh
N i=1 N i=1

2 Réécriture de σ 2 :
N H H
1X 1X 1X
σ2 = (Xi − µ)2 = Nh σh2 + Nh (µh − µ)2
N i=1 N i=1 N i=1
= Variance intra-strate + Variance inter-strate.

Le premier terme représente la moyenne des variances des strates.


Le second est dû aux différences entre strates : si par exemple
l’échantillon est stratifié entre étudiant, enseignant, ATOS, ce terme
représente le contraste d’âge entre ces différentes catégories.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 80 / 113


Estimation : Sondage stratifié

Contexte

Définition
Un plan de sondage est dit stratifié si dans chaque strate on
sélectionne un échantillon aléatoire de taille fixe nh et que les
sélections sont réalisées indépendamment d’une strate à une autre.
On suppose en outre dans ce cours qu’au sein de chaque strate les
plans sont simples et sans remise.

Condition
H
Les nh doivent vérifier nh = n
X

h=1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 81 / 113


Estimation : Sondage stratifié Cas général

Estimateur de la moyenne et de la variance

Pour chaque strate h, on note x h la moyenne calculée sur l’échantillon


issu de la strate h
1 X
xh = xi
nh i∈E
h

L’estimateur µ
b s’écrit alors :

H
1 X
b=
µ Nh x h
N h=1

La variance de µ
b est donnée par :

H
1 X Nh − n h 2
V (µ
b) = 2
Nh Sh (2)
N h=1 nh

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 82 / 113


Estimation : Sondage stratifié Plan avec allocation proportionnelle

Définition
Dans un plan stratifié avec allocation proportionnelle, on choisit les nh de
telle sorte que la proportion d’individus provenant de la strate h dans
l’échantillon soit la même que dans la population, c’est-à-dire :
nh Nh
=
n N
D’où
Nh
nh = n
N

Remarque
Cette procédure ne donne généralement pas de résultat entier. Il faut alors
recourir à une procédure d’arrondi (et vérifier que l’on a toujours
H
nh = n).
X

h=1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 83 / 113


Estimation : Sondage stratifié Plan avec allocation proportionnelle

Estimateur de la variance

Soit µ l’estimateur construit pour un plan avec allocation proportionnelle.


On a :
H
1 n 1 X
 
V (µ
b) = 1− Nh Sh2 (3)
n N N h=1

Remarque
Dans le cas d’un plan avec allocation proportionnelle on aura le choix entre
cette formule (3) et (2) pour calculer la variance de l’estimateur µ
b.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 84 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Plan avec allocation optimale

Définition
Dans un plan stratifié avec allocation optimale, on choisit les tailles
H
d’échantillons n1 , · · · , nH telles que nh = n et telles que la variance de
X

h=1
l’estimateur V (µ
b) soit minimale. La solution de ce problème est

Nh S h
nh = n × H
X
Nh S h
h=1

Par définition, l’estimateur construit avec un plan d’allocation


optimale possède la plus petite variance possible (parmi tous les plans
stratifiés).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 85 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Plan avec allocation optimale

Le prix à payer est que pour construire un tel estimateur (pour choisir
les tailles d’échantillons dans chaque strate.
Il nous faut connaître la variance corrigée du caractère dans chaque
strate de la population.
La variance de l’estimateur associé à ce plan est toujours donnée par
(2)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 86 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Plan avec allocation optimale


Remarque
Là encore, les nh ne sont pas nécessairement entiers, il faut recourir à
une procédure d’arrondi.
De plus la formule précédente peut parfois conduire à des choix de nh
tels que nh > Nh
Dans ce cas, on fait un recensement dans les strates où le problème se
pose et on recalcule les valeurs de nh pour les strates restantes.
La formule précédente nécessite de connaître les variances corrigées de
chaque strate Sh (ou plutôt leurs racines carrées).
En pratique, il faut donc les estimer.
En sondage, on utilise souvent les résultats d’enquêtes précédentes.

Intervalles de confiance
Pour les estimateurs construits par plans stratifiés, on peut calculer des
intervalles de confiance comme pour les plans simples.
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 87 / 113
Estimation : Sondage stratifié Plan avec allocation optimale

Tests

Introduction aux tests statistiques

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 88 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Tests

Exemple introductif
Une machine fabrique des tiges d’acier. Si la machine est réglée
correctement, l’utilisateur obtient une population de tiges de longueurs
moyenne m et d’écart-type σ. On désire savoir si cette machine se dérègle.
Ainsi, on prélèvera, à intervalles réguliers, des échantillons pour mesurer la
longueur effective des tiges.
Nous faisons alors l’hypothèse H0 dite « hypothèse nulle : la machine est
bien réglée ». On teste alors cette hypothèse, deux cas se présentent :
• la la machine est bien réglée, on accepte H0 .
• la machine est mal réglée, on rejette H0 et donc on accepte H1 dite
hypothèse alternative.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 89 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Tests

Définition
• Un test statistique est une méthode permettant de prendre une
décision à partir d’informations fournies par un échantillon.
• Cette décision dépend donc de l’échantillon. Ainsi qu’elle que soit la
décision prise, on court deux sortes de risques :
∗ le risque dit de première espèce noté α, est la probabilité de rejeter
l’hypothèse H0 alors qu’elle est vraie.
∗ le risque dit de seconde espèce noté β, est la probabilité d’accepter
l’hypothèse H0 alors qu’elle est fausse en réalité.
• Un test est bon si on arrive à minimiser α et β.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 90 / 113


Estimation : Sondage stratifié Plan avec allocation optimale

Tests

Position du problème
• On considère une population P sur laquelle on veut étudier un
paramètre θ inconnue.
• Pour ce faire on prélève un échantillon de taille n, on obtient θe .
• Sur la base de cette valeur observée θe , on se propose de comparer la
vraie valeur θ à une valeur θ0 , fixée à priori, constituant la standard, la
norme.
• Ce qui revient au test d’hypothèse d’hypothèses alternatives H0 et H1 .
• L’hypothèse H1 , peut prendre des formes différentes suivant la nature
de la question posée :
  
 H0
 : θ = θ0  H0
 : θ = θ0  H0
 : θ = θ0

: θ 6= θ0 : θ < θ0 : θ > θ0

 H 
 H 
 H
1 1 1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 91 / 113


Test relatifs à une moyenne

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 92 / 113
Test relatifs à une moyenne

Test

Problème
• Soit une population mère de moyenne inconnue m et d’écart-type σ.
• Sur un échantillon de taille n, on a trouvé une moyenne x̄ .
• On supposera que la population mère est distribuée normalement ou
que la taille n de l’échantillon est assez grande (n ≥ 30).
• On doit tester la moyenne m par rapport à la valeur notée m0 qui est
la valeur standard.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 93 / 113


Test relatifs à une moyenne

Test

Test bilatéral
On veut tester 
 H0
 : m = m0

: m 6= m0

 H
1

au risque d’erreur de première espèce α.


Notons t1− α2 le réel vérifiant F (t1− α2 ) = 1 − α2 , où F la fonction de
répartition de la loi normale centrée réduite.
On définit
σ σ
 
ICα = m0 − t1− α2 √ ; m0 + t1− α2 √
n n
avec F (t1− α2 ) = 1 − α2 .
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 94 / 113


Test relatifs à une moyenne

Test

Remarque
• Généralement, l’écart type σ de la population mère est inconnu.
q
• Dans ce cas, on remplace σ par sa valeur estimée s = n−1 n
σ 0 , où σ 0
est l’écart type des valeurs observées sur l’échantillon, à condition que
n ≥ 30.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 95 / 113


Test relatifs à une moyenne

Tes

Exemple
Le bureau d’analyse économique du ministère américain du commerce a
indiqué que le revenu annuel moyen d’un habitant de Caroline du Nord
était de 18688 dollards en 1995. Un chercheur de l’état du Caroline du Sud
veut effectuer le test suivant :

 H0
 : m = 18688
. (4)
: m 6= 18688

 H
1

Quelle est la conclusion appropriée si un échantillon de 401 habitants de


Caroline du Sud fournit en 2007, un revenu annuel moyen de 16860
dollards et un écart type de 14624 dollards ? Utilisez un seuil de
signification de 0, 05.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 96 / 113


Test relatifs à une moyenne

Test unilatéral

Test unilatéral à gauche


On veut tester 
 H0
 : m = m0

: m > m0

 H
1

au risque d’erreur de première espèce α.


Notons t1−α le réel vérifiant F (t1−α ) = 1 − α, où F la fonction de
répartition de la loi normale centrée réduite.
On définit
σ
 
ICα = −∞; m0 + t1−α √
n
avec F (t1−α ) = 1 − α.
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 97 / 113


Test relatifs à une moyenne

Test unilatéral

Test unilatéral à droite


On veut tester 
 H0
 : m = m0

: m < m0

 H
1

au risque d’erreur de première espèce α.


Notons t1−α le réel vérifiant F (t1−α ) = 1 − α, où F la fonction de
répartition de la loi normale centrée réduite.
On définit
σ
 
ICα = m0 − t1−α √ ; +∞
n
avec F (t1−α ) = 1 − α.
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 98 / 113


Test relatifs à une moyenne

Test unilatéral

Remarque
Dans les deux cas de tests unilatéraux, il est très fréquent qu’on ne
σ0
connaisse pas σ, alors on prend √σn = √n−1

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 99 / 113


Test relatif à une fréquence

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 100 / 113
Test relatif à une fréquence

Test

Position du problème
• Considérons une population mère dans laquelle une proportion p
inconnue d’individus possède un caractère donné.
• Sur un échantillon de taille n, on a trouvé une proportion f d’individus
possédant ce caractère.
• Soit Fn la variable aléatoire dont les valeurs possibles sont les
fréquences observées sur les différents échantillons de taille n.
• On suppose que n est assez grand (n ≥ q
30) ; ainsi, la loi de Fn peut
p(1−p)
être approchée par la loi normale N (p, n ).
• On veut tester la proportion p par rapport à la valeur p0 qui est la
valeur standard, la norme.

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 101 / 113


Test relatif à une fréquence

Test

Test bilatéral
On veut tester

 H0
 : p = p0
au risque d’erreur de première espèce α
: p 6= p0

 H
1

Notons t1− α2 le réel vérifiant F (t1− α2 ) = 1 − α2 , où F la fonction de


répartition de la loi normale centrée réduite.
On définit
 q q 
p0 (1−p0 ) p0 (1−p0 )
ICα = p0 − t1− 2 α
n ; p0 + t1− 2
α
n avec F (t1− α2 ) = 1 − α2 .
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 102 / 113


Test relatif à une fréquence

Test

Test unilatéral à gauche


On veut tester

 H0
 : p = p0
au risque d’erreur de première espèce α
: p > p0

 H
1

Notons t1−α le réel vérifiant F (t1−α ) = 1 − α, où F la fonction de


répartition de la loi normale centrée réduite.
On définit
 q 
p0 (1−p0 )
ICα = −∞; p0 + t1− 2 α
n avec F (t1− α2 ) = 1 − α.
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 103 / 113


Test relatif à une fréquence

Test

Test unilatéral à droite


On veut tester

 H0
 : p = p0
au risque d’erreur de première espèce α
: p < p0

 H
1

Notons t1−α le réel vérifiant F (t1−α ) = 1 − α, où F la fonction de


répartition de la loi normale centrée réduite.
On définit
 q 
p0 (1−p0 )
ICα = p0 − t1− 2 α
n ; +∞ avec F (t1− α2 ) = 1 − α.
• On accepte H0 avec le risque α, si x̄ ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄ ∈
/ ICα

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 104 / 113


Test de comparaison de deux populations

Plan de l’exposé
1 Introduction
2 Rappels
Variable aléatoire discrètes
Variable aléatoire continue
3 Méthode des sondages
4 Distribution d’échantillonnage
Échantillonnage des moyennes
Échantillonnage des proportions
5 Estimation : Sondage aléatoire simple
6 Estimation : Sondage stratifié
Cas général
Plan avec allocation proportionnelle
Plan avec allocation optimale
7 Test relatifs à une moyenne
8 Test relatif à une fréquence
9 Test de comparaison de deux populations
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 105 / 113
Test de comparaison de deux populations

Test

Données
Population P1 Population P1
Caractère étudiés C C
Moyenne m1 (inconnu) m2 (inconnu)
Écart-type σ1 (inconnu) σ2 (inconnu)
Échantillon E1 Échantillon E1
Taille n1 , (n1 ≥ 30) n2 , (n2 ≥ 30)
Moyenne x̄1 (connu) x̄2 (connu)
Écart-type σ10 (connu) σ20 (connu)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 106 / 113


Test de comparaison de deux populations

Test
Comparaison de deux moyennes
On veut tester 
 H0 : m1 = m2

: m1 6= m2

 H
1

au risque d’erreur de première espèce α.


Notons t1− α2 le réel vérifiant F (t1− α2 ) = 1 − α2 , où F la fonction de
répartition de la loi normale centrée réduite.
On définit  s s 
σ 2 σ 2 σ 2 σ 2
ICα = −t1− α2 1
+ 2; t α 1
+ 2
n1 n2 1− 2 n1 n2

avec F (t1− α2 ) = 1 − α2 .
• On accepte H0 avec le risque α, si x̄1 − x̄2 ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si x̄1 − x̄2 ∈
/ ICα
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 107 / 113
Test de comparaison de deux populations

Test

Remarques
• Si H0 est acceptée, on dit que la différence m1 − m2 n’est pas
significative au risque α.
• Si σ1 et σ2 sont inconnus ( n1 ≥ 30 et q n2 ≥ 30), on les remplace
q par
leurs valeurs estimées respectives s1 = n1 −1 σ1 et s2 = n2 −1 σ2 , où
n1 0 n2 0

σ10 (respectivement σ20 ) est l’écart type des valeurs observées sur
l’échantillon choisi dans Ω1 (respectivement Ω2 ).

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 108 / 113


Test de comparaison de deux populations

Exemple

Dans une agglomération, une enquête par sondage a été réalisée sur les
dépenses alimentaires mensuelles des ménages.
L’échantillon comprenait 327 ménages d’ouvriers et 286 ménages
d’employés. On a observé les valeurs suivantes concernant la moyenne et
l’écart type de la consommation alimentaire de ces deux catégories sociales

Effectifs Moyenne Ecart type

Ouvriers n1 = 327 x̄1 = 61200 σ10 = 10400

Employ és n2 = 286 x̄2 = 64200 σ20 = 11800

Peut-on conclure au risque d’erreur de première espèce α = 1% qu’en


moyenne, les dépenses dans les ménages d’ouvriers et ceux d’employés sont
les mêmes ?

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 109 / 113


Test de comparaison de deux populations

Test

Données
Population P1 Population P1
Caractère étudiés C C
Proportion p1 (inconnu) p2 (inconnu)
Échantillon E1 Échantillon E1
Taille n1 , (n1 ≥ 30) n2 , (n2 ≥ 30)
Proportion f1 (connu) f2 (connu)

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 110 / 113


Test de comparaison de deux populations

Test
Comparaison de deux proportions
On veut tester 
 H0 : p1 = p2

: p1 6= p2

 H
1

au risque d’erreur de première espèce α.


Notons t1− α2 le réel vérifiant F (t1− α2 ) = 1 − α2 , où F la fonction de
répartition de la loi normale centrée réduite.
n1 f1 + n2 f2
On pose f =
n1 + n2
On définit
s s
1 1 1 1
"    #
ICα = −t1− α2 f (1 − f ) + ; t1− α2 f (1 − f ) +
n2 n2 n2 n2

avec F (t1− α2 ) = 1 − α2 .
Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 111 / 113
Test de comparaison de deux populations

Test

Comparaison de deux proportions


• On accepte H0 avec le risque α, si f¯1 − f¯2 ∈ ICα
• On rejette H0 et donc on accepte H1 avec un risque α si f¯1 − f¯2 ∈
/ ICα

Remarque
Si H0 est acceptée, on dit que p1 − p2 n’est pas significative au risque α

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 112 / 113


Test de comparaison de deux populations

Test

Exemple
A l’issue d’un examen, il y a 23 reçus et 17 ajournés dans une classe et 15
reçus et 25 ajournés dans une autre classe. La différence observée entre les
deux pourcentages de réussite est-elle significative d’une différence de
niveau entre les deux classes, au seuil de 5%

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 113 / 113


Test de comparaison de deux populations

FIN

Merci pour votre aimable


attention !

Dr M. BAGAYOGO (CUP-Kaya) Master 2020-2021 Mai 2021 114 / 113

Vous aimerez peut-être aussi