Académique Documents
Professionnel Documents
Culture Documents
STATISTIQUE INFERENTIELLE
Support de cours
✓ Un cours pédagogique
1
Support de cours de STATISTIQUE INFERENTIELLE
Avertissement
2
Support de cours de STATISTIQUE INFERENTIELLE
SOMMAIRE
CH 2 : TESTS STATISTIQUES
I. Tests d’hypothèses
II. Tests d’ajustement du chi-deux
III. Tests d’indépendance du chi-deux
III. Exercices
EXERCICES CORRIGES
REFERENCES BIBLIOGRAPHIQUES
3
Support de cours de STATISTIQUE INFERENTIELLE
La statistique inférentielle étudie les valeurs caractéristiques d'une population à partir d'étude sur
des échantillons de cette population.
En effet pour étudier une population statistique, on peut recenser chacun des éléments de la
population, (cette méthode est souvent longue et coûteuse) ou bien examiner qu'une partie de la
population (échantillon) et en tirer informations sur la population totale, c'est la méthode des
sondages.
Cette méthode se compose en deux étapes :
L’échantillonnage (choix des échantillons) et l'estimation (utilisation des résultats observés sur
les échantillons pour induire des résultats sur la population mère)
I. Lois d'échantillonnage :
La théorie de l’échantillonnage consiste, connaissant des propriétés d’une population mère, à
déterminer des propriétés d’échantillons qui en sont extraits.
Chaque échantillon de taille n constitué, avec ou sans remise, à partie d’une population mère
finie, forme une distribution statistique. Celle-ci peut être caractérisée par une moyenne, un
écart-type ou une proportion ( fréquence ). La série des valeurs obtenues pour l’une de ces
caractéristiques, à partir de l’ensemble des échantillons tirés de la population mère, constitue une
distribution d’échantillonnage de moyennes, d’écarts-type, de proportions.
De façon similaire, chaque distribution d’échantillonnage sera caractérisée par une moyenne ou
un écart-type.
4
Support de cours de STATISTIQUE INFERENTIELLE
Exemple 1 : Une machine automatique produit des pièces dont le poids moyen est 5 grammes
avec un écart-type de 0,25 grammes.
Le responsable de la production désire contrôler le poids de ces pièces et prélève à cet effet 100
pièces, à intervalles réguliers.
1) A quelle loi de probabilité obéit la variable aléatoire X de cette distribution
d’échantillonnage de moyenne ?
2) Calculer la probabilité que X soit au plus égale à 5,01 grammes.
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
5
Support de cours de STATISTIQUE INFERENTIELLE
Remarques :
▪ Si la variable X est distribuée dans les populations A et B suivant une loi normale, alors la
variable aléatoire D = X A − X B obéit à une loi normale même si nA < 30 ou nB < 30.
▪ Les conditions d’application du facteur d’exhaustivité sont identiques à celles
précédemment définies.
Exemple 2 : Une société produit des briques dans deux unités : A et B. Ceux produits par
l’unité A permettent 150 allumages en moyenne avec un écart-type de 20 allumages. Les
briquets produits par B assurent 140 allumages en moyenne avec un écart-type de 15 allumages.
Le contrôleur de la société prélève 150 briquets de A et 200 briquets de B.
Calculer la probabilité que le nombre moyen d’allumage des briquets de l’échantillon de A soit
supérieur de plus de 15 au nombre moyen d’allumage de l’échantillon provenant de B.
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
On considère une population mère et A une classe (catégorie) de cette population c'est à dire
un sous ensemble de . Soit X une variable aléatoire à valeur dans {0 ; 1 } définie de la façon
suivante pour tout élément de : X( ) = 1 si A
X( ) = 0 si A
On prélève avec remise un échantillon ( non exhaustif ) de taille n de cette population, c'est à
dire n éléments de ; ce qui correspond à n variables aléatoires indépendantes X1, X2, X3,
..... , Xn de même loi que X.
6
Support de cours de STATISTIQUE INFERENTIELLE
Remarques :
▪ Si la population est distribuée selon une loi normale, alors la loi d’échantillonnage de la
fréquence obéit également à une loi normale même si n < 30 .
▪ Les conditions d’application du facteur d’exhaustivité sont identiques à celles précédemment
définies.
▪ Les remarques relatives aux lois de probabilités suivies par les distributions d’échantillonnage
de moyennes et de différences de moyennes s’appliquent également au cas des pourcentages.
II. Estimation :
C’est le problème inverse de l’échantillonnage ; c'est-à-dire connaissant des renseignements sur
un ou plusieurs échantillons, on cherche à en déduire des informations sur la population mère.
7
Support de cours de STATISTIQUE INFERENTIELLE
b) Pourcentage ( ou fréquence )
De même, on choisit le pourcentage f e des éléments possédant une certaine propriété dans un
échantillon prélevé aléatoirement dans une population mère comme meilleure estimation
ponctuelle du pourcentage inconnu p des éléments de cette population ayant cette propriété :
p = fe
c) Variance et Ecart-type
n
On choisit le nombre e2 , où n est l’effectif et e2 la variance d’un échantillon prélevé au
n −1
hasard dans une population mère , comme meilleure estimation ponctuelle de la variance
n
inconnue 2 de cette population : 2 = e2 .
n −1
n
De même, on choisit le nombre e , où n est l’effectif et e l’écart-type d’un échantillon
n −1
prélevé au hasard dans une population mère , comme meilleure estimation ponctuelle de l’écart-
n
type inconnu de cette population : = e .
n −1
Exemple 4 :
Une société de distribution intégrée envisage d’implanter un supermarché à proximité d’un
centre urbain important. Elle entreprend de déterminer la loi de probabilité de la valeur
hebdomadaire des achats de la ménagère et procède au sondage de 40 d’entre elles.
(x )
40
2
i −x = 15425,09 .
i =1
Le responsable de l’étude suppose que la population mère obéit à une loi normale ; il vous
demande d’en estimer les paramètres.
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
……………………………………………………………………………………………………
suit approximativement une loi normale centrée réduite N ( 0 ; 1 ) ( voir loi normale )
9
Support de cours de STATISTIQUE INFERENTIELLE
Soit F la variable aléatoire qui à chaque échantillon de taille n associe la fréquence du nombre
d'éléments qui appartiennent à la catégorie choisie.
F-p
Donc la variable aléatoire T définie par : T = suit approximativement une loi
σ
normale centrée réduite N (0 ; 1) ( voir loi normale ) .
On cherche un intervalle de confiance de la fréquence p , c'est à dire un intervalle tel que la
probabilité que la fréquence p appartienne à cet intervalle soit égale à où [0 ; 1]. On
appelle cet intervalle de confiance avec le coefficient de confiance ou avec le risque 1 - .
Le risque que l'on prend à dire que p appartient à cet intervalle est donc de 1 - .
10
Support de cours de STATISTIQUE INFERENTIELLE
III. Exercices
B- A la suite d’une vérification des quelques fichiers disponibles à la direction de la CNPS, le responsable
a constaté des anomalies dans les informations données par certaines PME. Il relève alors 10 entreprises
et compte le nombre d’employés déclarés par chacune d’elles. Les résultats sont consignés dans le tableau
suivant :
Numéro de la PME 1 2 3 4 5 6 7 8 9 10
Nombre d’employés 25 30 15 12 4 18 3 9 14 20
1- On demande de déterminer le nombre moyen d’employés par PME avec un niveau de confiance
symétrique de 95%.
2- Même question si la taille de l’échantillon est de 60, la variance et la moyenne empiriques restant les
mêmes que celles obtenues à partir du tableau statistique.
11
Support de cours de STATISTIQUE INFERENTIELLE
12