Vous êtes sur la page 1sur 77

Cours de Statistique

Inférentielle

Préparé par

GOLO Yao Nukunu, (Ph.D)


Faculté des Sciences Économiques et de Gestion (FASEG)
Email : ygolo@univ-lome.tg

Novembre 2019
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Avertissement

Ce document constitue une compilation des principaux résultats du cours dénommé statistique décisionnelle pour les étudiants en 3e année de
Licence en économie ou gestion. Ce polycopié ne dispense pas les étudiants de la présence aux cours, mais un simple support de cours.
Par ailleurs, il est clair que nous abordons très peu l’aspect régression, données corrélées, ou estimation non paramétrique. En effet, ces
problèmes peuvent être étudiés plus tard de manière détaillée.
Enfin, comme tout polycopié, il y a très probablement des coquilles qui subsistent. Merci de m’en faire part si vous en trouvez.

2
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Lectures conseillées (dans l'ordre d'importance)


─ McClave J. T., Sincich T. (2013) "Statistics", Twelfth Edition Pearson
─ Newbold P., Carlson W. L., Thorne B. M., (2013) "Statistics for Business and Economics"
Global Edition Perason
─ Mendenhall W. M., Sincich T. L., (2015) "Statistics for Engineering and the Sciences" Sixth
Edition Taylor & Francis Group.
─ Scheaffer R. L, Mulekar M. S., McClave J. T (2010) "Probability and Statistics for Engineers",
Fifth Edition Cengage Learning.
─ De Groot M. H. et Schervish M. J. (2012) "Probability and Statistics" Fourth Edition.
Addison-Wesley.
─ Lecoutre Jean-Piérre (2001), « Statistiques et probabilités Travaux dirigés »
─ Hurlin C. et Mignon Valérie (2015) "Statistique et probabilités en économie-gestion" Dunod, ISBN
978-2-1007-8023-5
─ Anderson-Sweeney-Williams (2008) : « Statistiques pour l’économie et la gestion » Traduction de
la 4e édition américaine par Claire Borsenberger. Ouvertures économiques, Nouveaux
Horizons, éd de Boeck.
─ Bouffard F. Viviani J-L, Zouhhad R. (2005) « Mathématiques appliquées : manuels et
applications » 6e édition Dunod.
─ Cheng-Few Lee, John C. Lee, Alice C. Lee (2013) “Statistics for Business and Financial
Economics” Third Edition
─ David S. Moore (2010). “The Practice of Statistics for Business and Economics” Third Edition
─ Christian Larousse (1977), “Statistique exercices corrigés avec rappels de cours” tome 3, sciences
économiques 3e année. ed Dunod, 4e edition.
─ Dominick Salvatore, D. Reagle (2002) « Statistics And Econometrics ». McGRAW-HILL New
York 2e éd.

3
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Introduction

Supposons que vous travailliez pour une grande entreprise et que votre superviseur vous demande de décider
si une nouvelle version d'un smartphone doit être produite et vendue. Vous commencez par réfléchir aux
innovations et aux nouvelles fonctionnalités du produit. Ensuite, vous vous arrêtez et réalisez les
conséquences de la décision. Le produit devra générer des bénéfices, alors la tarification et les coûts de
production et de distribution sont donc très importants. La décision d'introduire le produit repose sur de
nombreuses alternatives. Alors, comment saurez-vous? Par où commencer ?

Sans avoir une grande expérience dans l'industrie, il est essentiel de commencer à développer une intelligence
qui fera de vous un expert. Vous choisissez trois autres personnes avec qui travailler et vous les rencontrez.
La conversation porte sur ce que vous devez savoir et sur les informations et données dont vous avez besoin.
Lors de votre réunion, de nombreuses questions sont posées. Combien de concurrents sont déjà sur le marché?
Comment sont évalués les smartphones? Quelles sont les caractéristiques de conception des produits concurrents? Quelles sont les
fonctionnalités requises par le marché? Que veulent les clients dans un smartphone? Qu'est-ce que les clients aiment des produits
existants? Les réponses s'appuieront sur une veille stratégique constituée de données et d'informations
collectées au moyen d'enquêtes auprès des clients, d'analyses techniques et d'études de marché. En
fin de compte, votre présentation pour étayer votre décision concernant l’introduction d’un nouveau
smartphone repose sur les statistiques que vous utilisez pour résumer et organiser vos données, les
statistiques que vous utilisez pour comparer le nouveau produit aux produits existants, et les statistiques
pour : estimer les ventes, les coûts et les revenus futurs. Les statistiques seront au centre de la
conversation que vous aurez avec votre superviseur au sujet de cette décision très importante.

En tant que décideur, la statistique intervient comme un outil pour soutenir la prise de décision. N’a de bons
arguments que celui ou celle dont le raisonnement est appuyé par des statistiques bien choisies et bien
présentées (c’est la statistique descriptive). Ne peut définir de stratégie pertinente ou ne peut prévoir efficacement
les quantités à produire, acheter ou vendre, que celui ou celle qui sait modéliser les données et en extraire les
lois des phénomènes en jeu (c’est la statistique inférentielle). Ainsi donc, l’analyse statistique appliquée aide les
managers à prendre des décisions efficientes. Le programme à aborder s’articule comme suit :

Chapitre 1 : Théorie de l’échantillonnage


Chapitre 2 : Estimation
Chapitre 3 : Tests statistiques (Paramétriques)
Chapitre 4 : Tests statistiques (non paramétriques)

4
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Chapitre 1 : Rappels sur les lois normales


─ Loi normale centrée réduite ( )
Définition : Une variable aléatoire suit une loi normale centrée réduite si elle peut
prendre toute valeur réelle et si sa densité de probabilité est donnée par :

Cette fonction de densité est une fonction paire, et son graphique admet l’axe des
ordonnées comme axe de symétrie. Il y a un maximum pour qui correspond au
mode de cette distribution. Compte tenu de deux points d’inflexion, le graphique est
simple à tracer et présente l’allure caractéristique connue sous le nom de courbe en
cloche.
est une fonction de densité, car

C'est-à-dire que

Or

Fonction paire :

Maximum pour

Points d’inflexion :

Fonction symétrique
Cette distribution de probabilité possède une moyenne égale à 0. Le graphique étant
symétrique par rapport à l’axe des ordonnées (parité de la densité), on a une surface
totale (égale à 1) comprise entre la courbe et l’axe des abscisses, partagée en deux
parties égales par l’axe vertical (soit 0,5 à gauche et 0,5 à droite). La médiane de cette
distribution est aussi égale à 0. Enfin, le sommet de la « cloche » est au point x = 0 .

5
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Graphique de la fonction de densité de la loi normale centrée réduite

Sa fonction de répartition s’écrit :

Moments :

Coefficients d’asymétrie et d’aplatissement

Lecture de la table de la loi Normale centrée réduite



; 0

6
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020


≥ = 1− ∗
<

≤− = ∗
≥ =1− ∗
<

≥− = ∗

≤ ∗
≤ = −

Lire les probabilités suivantes

0≤ ∗
≤ 1.2 ; −0.9 ≤ ∗
≤0 ; 0.3 ≤ ∗
≤ 1.56 ; −0.2 ≤ ∗
≤ 0.2

≤ = 0.5; ∗
≤ = 0.8749; ∗
≥ = 0.117; ∗
≥ = 0.617

─ Loi normale de Laplace-Gauss

Définition :
Une variable aléatoire réelle , prenant ses valeurs dans , suit une loi de Laplace-
Gauss ou loi normale, de paramètres et , si sa densité de probabilité est
donnée par :

La fonction définit une densité. En effet :

Fonction de répartition

Cette intégrale n’ayant pas d’expression mathématique simple, des tables donnent les
valeurs de la fonction de répartition.

Moments
Espérance mathématique et variance

7
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Propriété 1
Si est une variable aléatoire normale, alors toute fonction du 1er degré (fonction
affine) de suit aussi une loi normale.
Soit une variable aléatoire distribuée selon une loi normale , la variable
aléatoire suit aussi une loi normale avec et
(l’écart type de valant ).

Propriété 2
Si on a variables aléatoires normales et indépendantes, alors leur somme
suit une loi normale . Avec

8
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Chapitre 2 : Théorie de l’échantillonnage

─ Introduction

La problématique de l’inférence statistique consiste, à partir d’un échantillon de données provenant d’une
population de caractéristiques inconnues, à déduire des propriétés sur la population en contrôlant au mieux
le risque de se tromper.

Le problème général est le suivant : on souhaite étudier une caractéristique (appelée aussi caractère ou
variable statistique) associée à des individus appartenant à une population. Rappelons qu'une population est un
ensemble, fini ou non, d'éléments que l'on souhaite étudier. Il peut s'agir par exemple d'êtres humains (adultes, enfants,
chômeurs, salariés, etc.), d'animaux ou encore d'objets (entreprises, voitures, ordinateurs, incendies, accidents,
etc.). La caractéristique étudiée peut être qualitative (par exemple la catégorie socio-professionnelle de
1'individu : cadre, employé, etc.) ou quantitative (par exemple la taille ou le salaire de l’individu). Pour mener à
bien cette étude, la statistique propose deux solutions : le recensement et l'échantillonnage.

Un recensement consiste à mesurer, ou observer, la (ou les) caractéristique(s) d'intérêt de façon exhaustive pour tous les
individus de la population. Une telle solution n'est bien évidemment applicable que lorsque la taille de la
population étudiée est relativement faible. Dans la plupart des cas, il est nécessaire de recourir à la seconde
solution: l'échantillonnage.
L'échantillonnage se définit comme la méthode de construction d'un échantillon, qui est un sous ensemble
de la population. Au sens strict, un échantillon consiste en une collection d'individus sélectionnés dans la

l'échantillon, notée . On parle alors de −échantillon.


population statistique étudiée. Le nombre d'individus sélectionnés dans l'échantillon correspond à la taille de

Quel est l'intérêt de constituer un échantillon ? L'idée est d'étudier les caractéristiques d'intérêt pour les
individus sélectionnés dans l'échantillon afin d'en tirer de l'information sur ces mêmes caractéristiques pour
l'ensemble de la population. Par conséquent, d'un côté la dimension de l'échantillon doit être suffisamment
importante pour que l'on puisse obtenir une information fiable sur la population, mais d' un autre côté elle
doit être la plus petite possible afin de limiter le coût de l'enquête.

Une question se pose à ce stade : comment choisir les individus qui composent l'échantillon ? La
réponse à une telle question renvoie aux différentes méthodes d’échantillonnage.

9
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

─ Méthodes d’échantillonnage

statistique. On associe alors à chaque individu ! une variable aléatoire X i , dont on observe une seule
Un échantillonnage correspond à des tirages indépendants et équiprobables d’individus au sein de la population

réalisation xi .

Il y a plusieurs manières de choisir un échantillon d’une population, qu’on peut regrouper dans deux
catégories :
─ Échantillonnage non aléatoire (ou déterministe),
─ Échantillonnage aléatoire
Échantillonnage non aléatoire (ou sur la base du jugement)
Dans ce cas, le statisticien ou l’analyste utilise son expérience et ses connaissances personnelles pour choisir
les unités statistiques devant faire partie de l’échantillon pour avoir un échantillon représentatif de la
population statistique.
─ par quota (reproduire les caractéristiques de la population statistique)
─ de convenance (les unités sont faciles à toucher ou à contacter)
─ selon le jugement du statisticien
─ boule de neige (un répondant de référer à un autre qui présente les mêmes caractéristiques)

Échantillonnage aléatoire
Un échantillon aléatoire est obtenu en utilisant un mécanisme probabiliste, de telle sorte que l’on connait par
avance la probabilité qu’une unité donnée de la population soit incluse dans l’échantillon. Pour obtenir un
échantillon représentatif de la population, il faut procéder par échantillonnage aléatoire. Cette forme
d’échantillonnage permet de calculer précisément l’erreur due à l’échantillonnage et par conséquent, de juger
de la valeur de l’information partielle ainsi obtenue. Les techniques utilisées en statistique inférentielle
reposant sur des concepts probabilistes, l’information que techniques utilisent comme élément de base doit
absolument provenir d’un échantillon aléatoire. Selon Dagnelie (1998), « un échantillon est dit aléatoire quand tous
les individus de la population ont une même probabilité de faire partie de l'échantillon ». Parmi les diverses méthodes
utilisées pour obtenir un échantillon aléatoire, les principales sont les suivantes : l’échantillonnage aléatoire simple,
l’échantillonnage stratifié, l’échantillonnage par grappes, et l’échantillonnage systématique.
─ Échantillonnage aléatoire simple : un échantillon est dit aléatoire simple si il est choisi par un
processus de sélection de objets d’une population de sorte que chaque membre de la population ait
la même probabilité d’être sélectionné, la sélection d’un membre de la population étant indépendante
de la sélection de tout autre membre, et chaque échantillon possible de taille a la même probabilité
d’être choisit.
Les échantillons aléatoires sont idéals. Il est souvent important que l’échantillon soit représentatif de la
population. L’échantillonnage aléatoire est l’assurance contre les biais pouvant influencer la sélection des
échantillons. Dans la pratique, les analystes développent des méthodes d’échantillonnage alternatives
pour minimiser le cout de l’échantillonnage. Mais la base pour savoir si ces méthodes alternatives soient
acceptables, c’est lorsqu’elles aboutissent aux résultats sont proches de l’échantillonnage aléatoire simple.
─ Échantillonnage aléatoire stratifié : la population est découpée en sous populations (strates)
homogènes. Les individus sont ensuite sélectionnés de manière aléatoire dans chaque strate.
10
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

─ Échantillonnage par grappes : la population est découpée en sous-populations (grappes)


hétérogènes. On sélectionne ensuite de manière aléatoire les grappes à retenir.
─ Échantillonnage systématique : les individus sont tirés de manière régulière dans la base de
sondage. On se sert souvent d’un seul nombre aléatoire pour établir un point de départ séquentiel, et
on choisit les unités dans la population à des intervalles fixe en termes de temps, d’espace ou d’ordre
d’occurrence. Dans certains cas, l’échantillonnage systématique peut s’avérer plus commode et plus
efficace que l’échantillonnage aléatoire simple.
Pour la suite dans ce cours, on s’intéressera essentiellement à l’échantillonnage aléatoire simple. La définition
d’un échantillon aléatoire simple et la procédure de sélection d’un tel échantillon varient selon que la
population est finie ou infinie.

─ Distribution d’échantillonnage

population, telle que la moyenne de la population, " en utilisant une statistique de l’échantillon, comme la
Considérons un échantillon aléatoire qui est utilisé pour faire une inférence sur certaines caractéristiques de la

moyenne de l’échantillon ̅ . On constate que chaque échantillon a différentes valeurs observées, et donc
différentes moyennes de l’échantillon. La distribution d’échantillonnage de la moyenne de l’échantillon est la
distribution de probabilité des statistiques des échantillons obtenues de tous les échantillons possible ayant le
même nombre d’observation issus de la population.

3.1. Illustration de la distribution d’échantillonnage

quatre individus $ = 4 : Pierre, Paul, Jacques et Jean. On suppose que leurs poids exprimés en
Notons le poids d'un individu, supposé déterministe, et imaginons que notre population soit constituée de

= 65 ; = 73 ; = 82 ; = 68
kilogrammes sont respectivement égaux à :
%&'((' )'*+ %*,- )*./,'0

La moyenne du poids (poids moyen) dans la population est donnée par :


65 + 73 + 82 + 68
"= = 72
4
Si l'on souhaite constituer un échantillon aléatoire de taille = 2 (sans remise), il convient de tirer deux
individus parmi les quatre individus de la population et d'observer leur poids moyen.

Échantillons couples de poids moyenne empirique Probabilités


(Pierre, Jean) (65; 73) 69 1/6
(Pierre, Paul) (65; 82) 73,5 1/6
(Pierre, Jacques) (65; 68) 66,5 1/6
(Jean, Paul) (73; 82) 77,5 1/6
(Jean, Jacques) (73; 68) 70,5 1/6
(Paul, Jacques) (82; 68) 75 1/6

On obtient un total de 06 échantillons avec une probabilité de 1/6 d’être sélectionné pour chacun. En
fonction de l’échantillon choisi, la moyenne empirique se présente comme une variable aléatoire. Dans ce cas

11
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

il sera possible de présenter sa distribution de probabilité ou la distribution d’échantillonnage pour les


différentes moyennes empiriques de la population (les deux dernières colonnes du tableau précédent).

Le tableau suivant présente des résultats similaires pour un échantillon de taille = 3 issu de la même

plus proche de la moyenne de la population " = 72 . On trouvera ceci vrai – la distribution


population que précédemment. Il faut noter que les moyennes sont concentrées dans un champ beaucoup

d’échantillonnage devient concentrée autour de la moyenne de la population lorsque la taille de


l’échantillon augmente. Ce résultat important fournit une base importante pour l’inférence statistique.

échantillons couples de poids moyennes empiriques probabilités


(Pierre, Jean, Paul) (65; 73; 82) 73,3333333 0,25
(Pierre, Jean, Jacques) (65; 73; 68) 68,6666667 0,25
(Jean, Paul, Jacques) (73; 82; 68) 74,3333333 0,25
(Pierre, Paul Jacques) (65; 82; 68) 71,6666667 0,25

Dans ces exemples, il a été possible de définir tous les échantillons possibles étant donné la taille de la
population et de l’échantillon. Et pour chaque échantillon possible, la moyenne empirique a été calculée, et la
distribution de probabilité a été construite.
De ces exemples simples, on voit que lorsque la taille de l’échantillon devient grande, la distribution de la
moyenne empirique – distribution d’échantillonnage – devient plus concentrée autour de la moyenne de la
population. Dans la plupart des travaux statistiques, les populations sont très grandes, et il n’est souvent
pas rationnel de construire la distribution de tous les échantillons possibles d’une taille donnée. Mais en
utilisant ce qu’on a appris sur les variables aléatoires, on peut montrer que les distributions d’échantillonnage
pour les échantillons de toutes populations ont des caractéristiques similaires que celles qu’on a montré dans
les exemples simples de population discrète.

3.2. Distribution d’échantillonnage de la moyenne de l’échantillon

Soit Soit un échantillon aléatoire de observations issu d’une très grande population de moyenne " et de
(empirique)

variance 2 3 ; les observations d’échantillon sont les variables 4, 3 , ⋯ + . Avant que l’échantillon ne soit

observations individuelles comme des variables aléatoires d’une population de moyenne " et de variance 2 3 .
observé, il y a une incertitude par rapport aux résultats. Cette incertitude est modélisé en considérant les

Soient les variables aléatoires 4, 3 , ⋯ + d’un échantillon issu d’une population. La valeur de la moyenne de
Moyenne de l’échantillon

+
1 1
l’échantillon de ces variables aléatoires est définie par

7= 8 & = 4 + 3 + ⋯+ +
&94
Considérons la distribution d’échantillonnage de la variable 7 . À ce point, on ne peut pas déterminer la forme
de la distribution d’échantillonnage, mais on peut déterminer la moyenne et la variance de la distribution
d’échantillonnage à partir des définitions basiques vues dans les cours de probabilités.

12
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Étant une variable aléatoire, cette moyenne n’est rien d’autre que l’espérance mathématique de 7 .
Moyenne de la moyenne de l’échantillon (empirique)

+
1 1 "
:; 7 < = : = 8 &> = :? 4 + 3 +⋯+ + @= ="
&94
L’espérance mathématique d’une combinaison linéaire de variables aléatoires est une combinaison linéaire des espérances
Ainsi, l’espérance mathématique de la moyenne empirique ou de l’échantillon est la moyenne de la
population. Si les échantillons de n observations aléatoires sont indépendamment et identiquement tirés d’une
population, alors lorsque le nombre d’échantillons devient grand, la moyenne des moyennes de l’échantillon
approche la vraie valeur de la moyenne de la population. Une seule moyenne de l’échantillon peut être plus
grande ou plus petite que la moyenne de la population. Cependant, en moyenne, il n’y a pas de raison d’espérer la
moyenne de l’échantillon plus grand ou plus petit que la moyenne de la population.

Exemple :
Dans l’exemple des échantillons de 2 individus sur 4, on peut calculer l’espérance mathématique de la variable

1 1 1
aléatoire comme suit :
:; 7 < = 8 ̅ ̅ = 69 A B + 73.5 A B + ⋯ + 75 A B = 72
6 6 6
Ce résultat donne la moyenne de la population ".

Variance de la moyenne de l’échantillon (empirique)


Maintenant que nous avions établit que la distribution des moyennes de l’échantillon est concentrée autour de
la moyenne de la population, on souhaite déterminer la variance de la distribution d’échantillonnage des
moyennes.
Si la population est très grande par rapport à la taille de l’échantillon, alors les distributions des observations
individuelles d’échantillons aléatoires indépendants sont les mêmes. On a vu en calcul de probabilité que la
variance d’une combinaison linéaire de variables aléatoires indépendantes est la somme des coefficients linéaires au carrée multiplié

+ +
1 1 1 1 1 23 23
par la variance des variables aléatoires. Il s’en suit que :
3
C D; 7 < = C D = 8 &> = C D ?A 4 + 3 + ⋯+ + B@ = 8A B 2&3 = 3
=
&94 &94
La variance de la distribution d’échantillonnage de 7 décroit lorsque la taille de l’échantillon augmente. En
effet, cela veut dire que les échantillons de grandes tailles entrainent beaucoup plus de distributions
d’échantillonnage concentrées. L’exemple simple dans la section précédente démontre ce résultat. Ainsi, les

population. La variance de la moyenne de l’échantillon est notée : 2E̅3 et l’écart type correspondant est donné
grands échantillons donnent de plus grande certitude par rapport à l’inférence de la moyenne de la

2
par :
2E̅ =

Cela correspond au cas où la population mère est finie et l’échantillon est non exhaustif (tirage avec remise)

Lorsque la taille de l’échantillon n’est pas une petite fraction de la taille de population $, alors les membres
ou si la population est infinie, que l’échantillon soit ou non exhaustif.

individuels de l’échantillon ne sont pas distribués indépendamment. On peut montrer dans ce cas que la
variance de la moyenne de l’échantillon est comme suit :

13
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

23 $ −
C D 7 =
$−1
GH+
GH4
Où le facteur est appelé facteur d’exhaustivité ou facteur de correction de la population finie. Ce cas
s’applique lorsque la population mère est finie (avec n N > 1 20 ) et l’échantillon exhaustif (tirage sans
remise).

de 7 . Pour beaucoup d’applications, la moyenne et la variance définissent la distribution d’échantillonnage.


Nous venons de développer les expressions de la moyenne et la variance de la distribution d’échantillonnage

On verra qu’avec des analyses additionnelles, ces résultats peuvent devenir très puissants pour certaines
applications pratiques. On analyse d’abord ces résultats sous l’hypothèse selon laquelle la population sous-
jacente a une distribution de probabilité normale. Ensuite, nous explorons la distribution d’échantillonnage de
la moyenne d’échantillon lorsque la population sous-jacente n’a pas une distribution normale. Ce second cas
va fournir des résultats puissants pour beaucoup d’applications pratiques en économie et en gestion.

4. Théorème central limite

, variables aléatoires indépendantes suivant toutes la même loi normale $ ", 2 . Pour
Un cas particulier

, on a : = ". Donc
Soit
tout
+

: 4 + 3 +⋯+ + = . " ⟹ : J8 &K = ."


&94
̅= ∑+ ⟹: ̅ ="
4
Si on pose que + &94 &

De même, Pour tout , on a . Les variables aléatoires étant indépendantes,

23 2
C ̅ = ⟹ 2E̅ =

Les variables aléatoires étant indépendantes et suivant une loi normale, leur somme
suit une loi normale et ̅ = + ∑+&94
4
& suit également une loi normale.

En conclusion, ̅ suit une loi normale


2 ̅−" ̅−" ̅−"
̅ → $ A", B⇒O= = 2 → $ 0, 1 PQ √ A B → $ 0, 1
√ 2E̅ 2

possède la variable aléatoire ̅ lorsque l’hypothèse de normalité des variables n’est plus satisfaite.
Comme on ne rencontre pas toujours des variables normales, il est nécessaire d’étudier quelle propriété

Théorème : soit , variables aléatoires indépendantes suivant la même loi (c'est-à-dire,

suffisamment grand, la variable aléatoire ̅ suit approximativement une loi normale


identiquement distribuées). On dit tout simplement qu’on a variables i.i.d, admettant une moyenne et
une variance . Pour
2 ̅−" ̅−" ̅−"
̅ → $ A", B⇒O= = 2 → $ 0, 1 PQ √ A B → $ 0, 1
√ 2E̅ 2

14
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Exemple 1 :
Supposons qu’en se basant sur les données historiques, on croit que l’augmentation du pourcentage annuel de
salaire des directeurs des moyennes entreprises est normalement distribué avec une moyenne de 12.2% et
d’écart-type de 3.6%. Un échantillon aléatoire de 9 observations est obtenu de cette population, et la
moyenne de l’échantillon est calculée. Quelle est la probabilité que cette de l’échantillon soit supérieur à
14.4% ?

On sait que " = 12.2; 2 = 3.6; R = 9


Solution

Soit ̅ la moyenne de l’échantillon, et son écart-type est calculé comme ceci :


2 3.6
2E̅ = = = 1.2
√ √9

̅ − " 14.4 − 12.2


Alors on peut calculer :

̅ > 14.4 = A > B = S > 1.83 = 0.0336


2E̅ 1.2
La probabilité que la moyenne de l’échantillon soit supérieure à 14.4% est seulement de 0.0336.

Exemple 2 :
Le fabricant de bougie (moteur) déclare que la durée de vie de ses bougies est normalement distribuée avec
une moyenne de 60 000 miles et l’écart-type est de 4 000 miles. Un échantillon aléatoire de 16 bougies a une
durée de vie moyenne de 58 500 miles. Si la déclaration du fabricant est correcte, quelle est la probabilité de
trouver la moyenne de l’échantillon égale à 58 500 ou moins ?

Solution :

2 4000
Pour calculer la probabilité, on calcule d’abord l’écart type de la moyenne de l’échantillon.
2E̅ = = = 1 000
√ √16

̅ − " 58 500 − 60 000


La probabilité cherchée est donnée par :

̅ < 58 500 = T < U= S < −1.50 = 0.0668


2E̅ 1 000

Exercice :
Une machine automatique produit des pièces dont le poids moyen est 5 grammes avec un écart-type de 0.25
grammes. Le responsable de la production désire contrôler le poids de ces pièces et prélève à cet effet 100
pièces, à intervalles réguliers. Calculer la probabilité que la moyenne de cet échantillon soit au plus égale à 5.01 grammes.

échantillons (V < WX
5. Distribution d'échantillonnage de la moyenne empirique de petits

Pour les grands échantillons, Le théorème central limite nous dit que ̅ suit approximativement une loi
normale. Lorsque la taille de l'échantillon n'est pas grande pour appliquer le théorème central limite, la
population devra satisfaire certaines conditions telles que la normalité de la population.
Si la population est normalement distribuée, alors:

15
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

si 2 est connu, on a
̅−" ̅−" ̅−"
O= = 2 → $ 0, 1 ⟺ √ A B → $ 0, 1
2E̅ 2

si 2 est inconnu, on l'estime en utilisant les données de l'échantillon. Dans ce cas la loi devient une loi
de Student à − 1 degré de liberté (table 3 annexe).

̅−" ̅−" ̅−"


Z= = →R −1 ⟺√ A B→R −1
2E̅ [ [

6. Distribution d’échantillonnage de la différence de moyennes (2 populations,


2 échantillons)

moyenne "4 R "3 , et de variances 243 R 233 respectivement. On s’intéresse à la différence "4 − "3 , pour
Elle est utile lorsqu’il s’agit de comparer les moyennes de deux populations. Soient deux populations de

ce faire, on extrait deux échantillons aléatoires indépendants de tailles 4 R 3 de chaque population. Soient
̅4 R ̅3 les moyennes empiriques de chaque échantillon.

Cas 1 : Si les échantillons sont de grandes tailles c'est-à-dire ( 4, 3 ≥ 30 la variable aléatoire \ = ̅4 − ̅ 3

suit une loi normale d’espérance µ = µ1 − µ2 et d’écart-type : 2] = ^+ + +a ou b] = ^+ + +a


_à _a 0à 0a
` a ` a

243 233 b43 b33


\ → $ c "4 − "3 , d + e PQ \ → $ c "4 − "3 , d + e
4 3 4 3

\ − "4 − "3
Dans ce cas les variables centrées réduites sont obtenues,

→ $ 0, 1 b! 243 R 233 bP R P Q b
23 23
d 4 + 3
4 3

\ − "4 − "3
Ou

→ $ 0, 1 b! 243 R 233 bP R ! P Q b
b3 b33
d 4 +
4 3

Note : lorsque 243 R 233 bP R ! P Q b on les remplace par les variances empiriques (ou des

Cas 2 : lorsque les échantillons sont de petites tailles, c'est-à-dire 4 , 3 < 30 , on suppose que les
échantillons).

populations sont normales et les écart-types sont inconnus. On utilise la loi de Student à la place de la loi

Les écart-types sont inconnus mais supposés être égaux 243 = 233
normale.

16
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

\ − "4 − "3
→ R +` g+aH3; h
bf3 bf3
d +
4 3

− 1 b43 + 3 − 1 b33
bf3 =
4

4+ 3−2

─ Les écart types sont inconnus et supposés inégaux 243 ≠ 233 .

\ − "4 − "3
→ R j; h
b43 b43
d +
4 3

b43 b33
3
avec

? + @
= 4 3
b43 ⁄ 4 b3⁄ 3 3
+ 3 3
4−1 3−1

nombre entier directement supérieur. Si par exemple = 17.35 alors le degré de liberté est de 18.
Note : dans la plupart des cas, le calcul du degré de liberté donne une valeur fractionnelle. Dans la pratique, on utilise le

Exercice :
Une société produit des briquets dans deux unités : A et B. ceux produits par l’unité A permettent 150
allumages en moyenne avec un écart-type de 20 allumages. Les briquets produits par B assurent 140 allumages
en moyenne avec un écart-type de 15 allumages. Le contrôleur de la société prélève 150 briquets de A et 200
briquets de B.
Calculer la probabilité que le nombre moyen d’allumages des briquets de l’échantillon de A soit supérieur de
plus de 15 au nombre moyen d’allumages de l’échantillon provenant de B.

7. Distribution d’échantillonnage de proportion d’échantillon (empirique)

Soit le nombre de succès dans un échantillon binomiale de observations avec le paramètre l . le


Proportion empirique

paramètre est la proportion des membres de la population ayant la caractéristique d’intérêt. On définit la
proportion d’échantillon (empirique, ou encore fréquence observée) comme
m=

probabilité de succès l . comme résultat, m est la moyenne d’un ensemble de variables aléatoires
est la somme d’un ensemble de variables aléatoires indépendantes de Bernouilli, chacune avec la

De plus, le théorème central limite peut être utilisé pour argumenter que la distribution de probabilité de m
indépendantes, et les résultats développés précédemment pour les moyennes de l’échantillon restent valable.

peut être modélisée comme une variable aléatoire normalement distribuée.

17
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

La moyenne et la variance de la distribution d’échantillonnage de la proportion empirique m peuvent être

:; < = l, C D = l 1−l
obtenues à partir de la moyenne et la variance du nombre de succès de .

1
Ainsi,

:;m< = : ? @ = :; < = l
On constate donc que la moyenne de la distribution de m est la proportion de la population l.
La variance de m est la variance de la distribution de la population des variables de Bernouilli divisée par .

1 l 1−l l 1−l
2n3 = C D A B = 3
C D = → 2n = d

m−l
Et si la taille de l’échantillon est grande, on a :
O=
→ $ 0, 1
2n
Cette approximation est valide si l 1 − l > 5. Parfois de manière plus rigoureuse, on valide si l ≥ 10 et
1 − l ≥ 10. Cela dans le cas où, la population mère est finie et l’échantillon est non exhaustif
(tirage avec remise) ou si la population est infinie, que l’échantillon soit ou non exhaustif, la variable
aléatoire F a pour caractéristique.
Mais si la population mère est finie (avec n N > 1 20 ) et l’échantillon exhaustif (tirage sans remise),
les caractéristiques doivent subir une correction d’exhaustivité. Ainsi, l’écart-type devient :

pq N − n
σF = .
n N −1
Exemple 1 :
Une élection a eu lieu et un candidat a eu 40 % des voix. On prélève un échantillon de 100 bulletins de vote.
Quelle est la probabilité que, dans l'échantillon, le candidat ait entre 35 % et 45 % des voix ?

Nous avons = 100 R l = 0,4. La variable aléatoire m correspondant à la fréquence des votes pour le
Solution

candidat dans l'échantillon vérifie donc :

 0, 4*0, 6   0, 24 
F a N  0, 4;  = N  0, 4; 
 100   100 
Posons x = 62.5675 (x − x ) = 0.6498
2
i
2

P ( 0,35 ≤ F ≤ 0, 45 ) = P ( −1, 02 ≤ T ≤ 1, 02 ) = 2π (1, 02 ) − 1


P ( 0,35 ≤ F ≤ 0, 45 ) = 0, 6922
Il y a donc environ 69 % de chance que, dans un échantillon de taille n = 100, le candidat ait entre 35 % et
45 % des voix.
Exemple 2

18
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Un échantillon aléatoire de 270 maisons a été tiré d’une grande population de vieilles maisons pour estimer la
proportion de maison avec câblage électrique dangereux. Si en fait, 20% de maison a un câblage dangereux,
quelle est la probabilité pour que la proportion empirique sera entre 16%et 24% ?
Solution
l = 0.20 R = 270
On peut donc calculer l’écart type de la proportion d’échantillon m comme suit :

l 1−l 0.20 1 − 0.20


2n = d =d = 0.024
270

016 − l m − l 0.24 − l
0.16 < m < 0.24 = A < < B
2n 2n 2n
0.16 − 0.20 0.24 − 0.20
A <O< B
0.024 0.024
−1.67 < O < 1.67 = 0.9050
Exercice :
Le responsable du service abonnement d’une chaîne de télévision codée constate que 2% des abonnés
résilient leur contrat au terme d’un an. Le directeur de la chaine prélève un échantillon aléatoire de 200
abonnés. Calculer la probabilité que le nombre de résiliations au terme de l’année soit supérieur à 4%. Calculer la probabilité
que ce nombre soit au plus égal à 1%.

8. Distribution d’échantillonnage de la différence de proportions

Chacune des deux populations fournie respectivement les proportions l4 et l3 . Pour arriver à les comparer,
Dans cette section, on développe la procédure pour comparer deux proportions de populations statistiques.

on extrait un échantillon de taille 4 de la population 1 qui fournit une proportion o4 et 3 de la population 2


de proportion o3 .
Si les échantillons sont de grandes tailles c'est-à-dire ( 4 , 3 ≥ 30 la variable aléatoire \ = o4 − o3 suit une
loi normale d’espérance l = l4 − l3 et d’écart-type : 2] = ^ +
f` 4Hf` fa 4Hfa
+` +a

l4 1 − l4 l3 1 − l3
\ → $ c l4 − l3 , d + e
4 3

o4 − o3 − l4 − l3
alors
O= → $ 0, 1
l4 1 − l4 l3 1 − l3
^ +
4 3

Exercice (sch401)
On suppose qu’un fabricant dispose deux usines. Avec des observations sur une longue période, il est connu
que approximativement 4% et 2.5% de pièces défectueuses sont produit sur ces deux sites. Des échantillons
de 200 pièces sont sélectionnés sur une production hebdomadaire dans chaque usine. Quelle est la probabilité
que les proportions d’échantillons diffèrent de plus de 2% ?

19
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

9. Distribution d’échantillonnage des variances d’échantillons (empiriques)


Considérons à présent les distributions d’échantillonnage des variances d’échantillons (empiriques). En
comprenant la distribution d’échantillonnage de la variance empirique, on peut faire les inférences par rapport
à la variance de la population. Ainsi, les processus qui ont une variance élevée peuvent être identifiés et
améliorer. De plus, une faible variance de la population améliore notre capacité à faire des inférences par
rapport aux moyennes de la population en utilisant les moyennes empiriques.

moyenne inconnue " et de variance inconnue 2 3 . On note les membre de l’échantillon comme 4 , 3 , ⋯ , + .
On commence par considérer un échantillon aléatoire de observations issu d’une population avec une

2 3 = :; − " 3<
La variance de la population est l’espérance :

Ce qui suppose qu’on considère la moyenne de & − ̅ 3 sur observations. Comme " est inconnu, on
utilise la moyenne de l’échantillon ̅ pour calculer la variance de l’échantillon.

4, 3, ⋯ , + ,
9.1. Variance empirique
Soient les observations d’un échantillon aléatoire issu d’une population. La quantité
+
1
b3 = 8 − ̅ 3
−1 &
&94
est appelée variance empirique corrigée, et sa racine carrée, l’écart type empirique. Étant donné un échantillon
spécifique, on peut calculer la variance empirique corrigée, et elle sera différente pour chaque échantillon

On peut être initialement surpris par l’utilisation de − 1 comme diviseur dans la formule précédente. Une
aléatoire à cause de la différence entre les observations des échantillons.

explication simple est que dans un échantillon aléatoire de observations, on a différentes valeurs

seulement − 1 différentes valeurs qui peuvent être uniquement définies. De plus, on peut montrer que la
indépendantes ou degré de liberté. Mais après avoir connu la valeur calculée de la moyenne empirique, il y a

:;b 3 < = 2 3
valeur espérée de la variance empirique calculée de cette manière est la variance de la population.

La conclusion selon laquelle la valeur espérée de la variance empirique est la variance de la population est un
résultat d’ordre général. Mais pour l’inférence statistique, on aimerait connaitre d’avantage par rapport à la
distribution d’échantillonnage. Si on peut supposer que la distribution de la population sous-jacente est
normale, alors on peut montrer que la variance empirique et la variance de la population sont reliées à travers
une distribution de probabilité connue sous la distribution de Chi-deux ou Khi-deux.

9.2. Distribution de Chi-deux des variances empirique et de la population

variance de la population est 2 3 et la variance empirique résultante est b 3 , on peut montrer que :
Étant donné un échantillon aléatoire de observations issu d’une population normalement distribuée dont la

− 1 b 3 ∑+&94 & − ̅ 3
p 3+H4 = =
23 23
a une distribution connu sous la distribution de Chi-deux p 3 avec − 1 degré de liberté. Elle correspond à
une distribution de la somme des carrées de − 1 variables aléatoires normales centrées et réduites
indépendantes. Cette distribution et les probabilités qui en découlent exigent que la population sous jacente
soit normale.

20
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Cette distribution est définie uniquement pour des valeurs positives étant donné que les variances sont toutes
positives. La fonction de densité est asymétrique avec une longue queue positive.
Graphique d’une loi de

p 3. = 16.919 ; p 3.rq, r = 3.325; p 3.rq, 3q = 14.6114; p 3. = 37.6525


Table 2 (annexe)

q, r q, 3q

référant au degré de liberté noté s (Upsilon). Une distribution de Chi-deux avec s degré de liberté est notée
On peut caractériser un membre particulier de la famille de distributions Chi-deux par un seul paramètre se

p 3t . La moyenne et la variance de cette distribution sont égales au nombre de degré de liberté et deux fois le
nombre de degré de liberté.
:up 3t v = s R C Dwp 3t x = 2s

− 1 b3
En utilisant ces résultats pour la moyenne et la variance de Chi-deux, on trouve que :
:y z= −1
23
−1
:;b 3 < = −1
23
:;b 3 < = 2 3
Pour obtenir la variance de b , on a
3

− 1 b3
C DT U=2 −1
23
− 1 3b3
C D b3 = 2 − 1
2{
22 {
C D b = 3
−1

9.3. Distribution de Fisher (F-Statistique) des variances empiriques de deux


échantillons issus des populations normales.

comparer les variances des populations. Une telle comparaison se fait en estimant le ratio 243 ⁄233 .
Lorsque deux échantillons issus des populations normalement distribuées, il est souvent intéressant de

tailles 4 R 3 donnant des variances empiriques b43 R b33 . Si les populations en question ont pour
Soient deux échantillons aléatoires indépendants issus des distributions normales avec respectivement les

variances 243 R 233 , alors


b43 ⁄243
m= →m
b33 ⁄233
t` ,ta

21
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

avec s4 = 4 − 1 et s3 = 3 −1
Graphique de la densité de la loi de Fisher

Les Tables en annexe 4 désignent les probabilités de la queue droite c'est-à-dire de la forme:

mh; t`, ta

1
m4Hh; =
t`, ta
mh; ta, t`
1 1
m .4 = 1.92; m .4 = 1.84, m = = = 0.54
; 3 ,4q ; 4q,3 .r ; 3 ,4q
m .4 ; 4q,3 1.84

22
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Chapitre 3 : Estimation
─ Théorie de l’estimation
1.1. Exposé du problème
Un aspect important de l’inférence statistique consiste à obtenir des estimations fiables des caractéristiques d’une
population à partir d’un échantillon extrait de cette population. C’est un problème de décision concernant des
paramètres tels que :
─ l’espérance mathématique notée m ou µ (pour un caractère mesurable),
─ la variance ou l’écart-type notée σ ,
─ la proportion p (pour un caractère dénombrable).
Comme un échantillon ne peut donner qu’une information partielle sur la population, les estimations ainsi
obtenues seront inévitablement entachées d’erreurs que l’on doit minimiser autant que possible. En résumé :
Estimer un paramètre, c’est donner une valeur approchée de ce paramètre, à partir des résultats obtenus
sur un échantillon aléatoire extrait de la population.

De façon générale, le problème à résoudre peut se formuler ainsi :


Soit X une caractéristique d’un phénomène dont les réalisations dépendent du « hasard ». La variable X est
donc une variable aléatoire dont les caractéristiques (moment, variance... ) sont inconnues. On observe les
réalisations d’un échantillon aléatoire issu de la population étudiée. Cette réalisation doit permettre d’induire
des valeurs ou estimations des paramètres de la loi suivie par la variable X . Ces estimations peuvent revêtir
deux formes :
─ soit une valeur unique, l’estimation ponctuelle, ou valeur la plus probable que prendra le
paramètre,
─ soit un ensemble de valeurs appartenant à un intervalle, l’estimation par intervalle de
confiance. Un intervalle de confiance doit avoir de « grandes chances »» de contenir la vraie
valeur du paramètre, il est toujours associé à un risque d’erreur α .
La théorie de l’estimation fait intervenir des fonctions ou statistiques particulières, appelées estimateurs, dont
nous allons donner les propriétés essentielles.

1.2. Définition d’une statistique

X est une variable aléatoire dont la fonction de répartition F ( x;θ ) et la densité f ( x;θ ) dépendent du
paramètre θ ; Dθ est l’ensemble des valeurs possibles de ce paramètre.
On considère un échantillon de taille n de cette variable X = ( X 1 ,K , X n ) . Une statistique est une fonction
mesurable T des variables aléatoires X i . :
T = Φ ( X 1 , X 2 ,LL , X n )
À un échantillon, on peut associer différentes statistiques. La théorie de l’estimation consiste à définir des
statistiques particulières, appelées estimateurs.
Une fois l’échantillon effectivement réalisé, l’estimateur prend une valeur numérique, appelée estimation du

On notera |} l’estimateur du paramètre θ .


paramètre θ .

23
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Exemple :
Soit X la statistique :
1 n
X = T ( X 1 ,K , X n ) =  Xi
n i =1

considérée comme un estimateur, a priori raisonnable, de l’espérance mathématique : = ". En effet :


c’est-à-dire la fonction moyenne arithmétique des n observations d’un échantillon. Cette statistique peut être

─ cette statistique prend en compte toutes les observations,


─ cette statistique possède les propriétés suivantes :
var ( X )
E (T ) = E ( X ) var ( T ) =
n
Si la loi de la variable aléatoire X est connue, on peut en déduire celle de X . L’estimation ponctuelle de
l’espérance mathématique m de la variable X est obtenue en réalisant effectivement un échantillon de taille n
et en calculant la moyenne arithmétique des n observations.

2. Estimation ponctuelle
Le but de la théorie de l’estimation est de choisir, parmi toutes les statistiques possibles, le meilleur
estimateur, c’est-à-dire celui qui donnera une estimation ponctuelle la plus proche possible du paramètre et
ceci, quel que soit l’échantillon.

2.1. Définition d’un estimateur


Soit X une variable aléatoire dont la loi de probabilité f ( x;θ ) dépend d’un seul paramètre θ .
X = ( X 1 ,K , X n ) est un échantillon de taille n de cette variable.
Une statistique, est une fonction mesurable T ( X ) des variables aléatoires X i . On note, en général, θˆ
l’estimateur du paramètre θ .
Une fois l’échantillon effectivement réalisé, l’estimateur prend une valeur numérique, appelée estimation
ponctuelle du paramètre θ par la statistique T .

2.2. Principales qualités d’un estimateur

a. Estimateur sans biais


L’erreur d’estimation est mesurée par la quantité T − θ qui peut s’écrire :
T − θ = T − E (T ) + E (T ) − θ

─ T − E (T ) représente les fluctuations de l’estimateur T autour de sa valeur moyenne (T ) (espérance


mathématique).
─ E (T ) − θ est une erreur systématique car l’estimateur T varie autour de son espérance
mathématique E (T ) et non autour de la valeur θ du paramètre sauf si E (T ) = θ .

La quantité E (T ) − θ est le biais de l’estimateur. Un estimateur est sans biais si. : Z = |. Un estimateur est
biaisé si E (T ) ≠ θ . Un estimateur est asymptotiquement sans biais si E (T ) → θ quand la taille n de
l’échantillon tend vers l’infini.

24
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Souvent, |} surestime ou sous estime le paramètre, mais il s’en suit de la notion d’espérance que, si la
procédure d’échantillonnage se répète plusieurs fois, alors, en moyenne, la valeur obtenue à partir d’un
estimateur non biaisé serait égal au paramètre de la population. Il semble raisonnable d’affirmer que, toutes
choses égales par ailleurs, cette propriété est désirable pour un estimateur.

La figure suivante illustre les fonctions de densité de probabilité de deux estimateurs, |}4 R |}3 de |.
Exemple 1 : comparaison d’ordre général

Dans le graphique de gauche, il est évident que |}4 est un estimateur sans biais de |, alors que, |}3 est un
estimateur biaisé de |. Dans le graphique de droite, les estimateurs |}4 R |}~ sont tous sans biais, le choix
entre les deux devra donc être basé sur d’autres critères (variance par exemple).

Exercice 1 : montrer que la variance empirique corrigée b 3 est un estimateur sans biais de la variance de la
population 2 3 , c'est-à-dire : [ 3 = 2 3 .

Exercice 2 : montrer que la variance empirique •€• = V ∑V„9‚ ƒ„ − ƒ



‚ •
est un estimateur biaisé de la variance
de la population.

b. Estimateur efficace
Dans plusieurs problèmes pratiques, différents estimateurs non biaisés peuvent être obtenu et les méthodes
de choix parmi eux devraient être trouvées. Dans cette situation, il est naturel de préférer l’estimateur dont la
distribution est beaucoup plus concentrée autour du paramètre de la population à estimer. Les valeurs d’un tel
estimateur sont beaucoup moins différentes de toute autre quantité fixe, à partir du paramètre à estimer que
pour les autres. En prenant la variance comme mesure de concentration, l’efficacité d’un estimateur comme
critère de préférence d’un estimateur est introduite.

variance est appelé estimateur plus efficace (efficace) ou estimateur sans biais à variance minimale. Soient |}4 R |}3 deux
S’il y a plusieurs estimateurs sans biais d’un paramètre, alors l’estimateur sans biais ayant la plus petite

estimateurs sans biais de |, basés sur les mêmes nombres d’observations d’échantillon.
‡ ‚ est dit plus efficace que †
† ‡ • si ˆ‰Š †
‡ ‚ < ˆ‰Š †
‡•

25
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Exemple : supposons 4 , ⋯ , q un échantillon aléatoire issu d’une population avec : & = " et C & =
2 3 , ! = 1, ⋯ ,5. Soient les estimateurs proposés pour la moyenne de la population ".
1 1 1
"̂ 4 = 4; "̂ 3 = 4 + q ; "̂ ~ = +2 ; "̂ { = ̅ = +⋯+
2 2 4 q
5 4 q

Quel estimateur choisir parmi les quatre et pourquoi ?

3
Solution

: "̂ 4 = " ; : "̂ 3 = " ; : "̂ ~ = " ; : "̂ { = "


2
Ainsi, "̂ 4 ; "̂ 3 R "̂ { sont sans biais. On élimine "̂ ~ parce qu’il est biaisé et surestime ".
1 23 23
C "̂ 4 = C 4 = 2 , C "̂ 3 = ;C 4 + C q < =
3
, C "̂ { = C ̅ =
4 2 5
Dans cet exemple, on peut choisir l’estimateur "̂ { parce qu’il est non biaisé et a la plus petite variance parmi
les trois estimateurs non biaisés.

c. Précision d’un estimateur


La précision d’un estimateur est mesurée par l’erreur quadratique moyenne (Mean Squared Error (MSE)).
Parfois, il y a un échange entre le biais et l’efficacité d’un estimateur. Des fois, on gagne en acceptant certains
biais avec pour intérêt d’augmenter l’efficacité d’un estimateur. Le MSE qui est l’espérance du carrée de la

Œ[: Z = :; Z − | 3 <
différence entre les estimateurs et les paramètres est utilisé comme mesure de la précision.

En écrivant comme précédemment T − θ = T − E (T ) + E (T ) − θ et en remarquant, après développement


{ }
que le terme E T − E (T )   E (T ) − θ  est nul, ( E (T ) − θ est une constante et T − E (T ) , une variable

Œ[: Z = C D Z + ;: Z − |<3
centrée), on obtient :

Œ[: Z = C D Z + ;•! !b Z <3


Ou

Pour rendre l’erreur quadratique moyenne (MSE) la plus petite possible, il faut que :
─ E (T ) = θ , donc choisir un estimateur sans biais,
─ var (T ) soit petite.

En particulier, si Z est sans biais, alors Œ[: Z = C D Z . Soient Z4 R Z3 deux estimateurs de |. On dira
que Z4 bR lŽQb oo! •Q Z3 si Œ[: Z4 ≤ Œ[: Z3 . Et si Z4 R Z3 sont sans biais, alors cela est
équivalent à : C D Z4 ≤ C D Z3 .
Parmi les estimateurs sans biais, on choisira donc celui qui a la variance la plus petite, cette propriété traduit
l’efficacité de l’estimateur.

Exemple : on considère |}4 R |}3 deux différents estimateurs de |. L’estimateur |}4 est sans biais, alors que
:w|}3 x = 7| ⁄2. On sait de plus que Cw|}4 x = 8 et Cw|}3 x = 5. Lequel des deux estimateurs est meilleur pour
estimer | ? Dans quel sens est-il meilleur ?

26
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Comme l’espérance :w|}3 x = 7| ⁄2, |}3 est un estimateur biaisé de |. Alors on ne peut pas comparer les
Solution

variances pour déterminer lequel entre |}4 R |}3 est le meilleur estimateur de |. Par contre pour comparer les
deux estimateurs, on peut utiliser le Œ[: des deux estimateurs.
Comme |}4 est sans biais, Œ[:w|}4 x = Cw|}4 x = 8
•! !bw|}3 x = :w|}3 x − | = 7| ⁄2 − | = 5| ⁄2

Œ[:w|}3 x = Cw|}3 x + u•! !bw|}3 xv = 5 + 5| ⁄2


3 3

On peut dire que |}4 est un meilleur estimateur que |}3 si Œ[:w|}4 x < Œ[:w|}3 x, ce qui serait le cas si 8 <
5 + 5| ⁄2 3. En d’autres termes, si | 3 > 12⁄25. Ainsi, dans le sens de Œ[:, on conclut que :
|}4 est meilleur estimateur de | que |}3 pour | < −•12⁄25 ou | > •12⁄25
|}3 est meilleur estimateur de | que |}4 pour −•12⁄25 < | < •12⁄25

d. Estimateur convergent
La propriété de convergence d’un estimateur est relative à son comportement lorsque la taille de l’échantillon
devient grande. Une statistique est un estimateur convergent d’un paramètre de la population si, lorsque la
taille de l’échantillon augmente, il devient presque certain que la valeur de la statistique est beaucoup plus

Mathématiquement, Z ‘P D’ Db |, si Z converge en probabilité vers | c'est-à-dire si :


proche de la valeur du paramètre de la population.

∀” > 0, lim |Z − || > ” = 0


+→˜

∀” > 0, lim |Z − || ≤ ” = 1
Ou
+→˜
On note T P
n →∞
→θ

Si Z est un estimateur asymptotiquement sans biais du paramètre | (c'est-à-dire : Z š⎯⎯œ |),


Note : Condition suffisante de convergence en probabilité

+→˜
tend vers l’infini (c'est-à-dire C D Z š⎯⎯œ 0), alors Z

+→˜
converge en probabilité vers | lorsque tend vers l’infini (donc • est un estimateur
et si sa variance tend vers zéro lorsque

convergent de †).

Si Z est un estimateur sans biais du paramètre | au lieu de asymptotiquement sans biais, on dit
que • est un estimateur absolument convergent de †

Un estimateur est convergent si sa distribution tend à se concentrer autour de la valeur inconnue du


paramètre θ quand la taille n de l’échantillon tend vers l’infini.

Exercice (sch 432/chvm 280))

27
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Soit supposons 4 , ⋯ , + un échantillon aléatoire issu d’une population normale de variance 2 3 . On


considère l’estimateur suivant pour 2 3 :
∑+&94 − 7
[ =
∗3 &

Montrer que [ ∗3 est un estimateur biaisé de 2 3 .


Estimer la quantité de biais lorsque [ ∗3 est utilisé pour estimer 2 3

Quel est le meilleur estimateur entre [ ∗3 et [ 3 ?



e. Inégalité de Fréchet-Darmois-Cramer-Rao (FDCR)


Fonction de vraisemblance

probabilité de ce −uplet, notée žw ; |x, et définie par :


Comme on l’a noté un peu plus haut, on appelle vraisemblance (likelihood) de l’échantillon , la loi de

žw ; |x = Ÿ & = & ||
&94

+
si est une variable aléatoire discrète, et par

žw ; |x = Ÿ o &; |
&94
Si est une variable aléatoire continue de densité o ;| .

= | 1−| 0≤|≤1
Exemple 1 : fonction de densité de loi binomiale
E¡ 4HE¡
o &; |
0 b! P
+ +

žw ; |x = Ÿ = & || = Ÿ | E¡ 1 − | = | ∑ E¡ 1 − |
4HE¡ ∑ 4HE¡
&
&94 &94

ln žw ; |x = 8 & ln | + £ − 8 & ¤ ln 1−|

−¥ 3 1 1
Exemple 2 : fonction de densité de la loi normale

o & ; ¥; 2 = ¤ ¨ l §− £
&
2√2¦ 2 2
+
1 + 1
žw ; |x = Ÿ o & ; | = A B l §− 3 8 & − ¥ 3 ¨
2√2¦ 22
&94
1
Lnžw ; |x = − Ln 2¦2 3 − 3 8 & − ¥ 3
2 22

Information de Fischer
La quantité d’information apportée par un échantillon est l’expression suivante sous réserve de l’existence de
l’intégrale :

28
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

dLnžw ; |x
3

ª+ | = ªE` ,⋯,E« | = : =T U >


d|

dLnžw ; |x
3

= - =T U > žw ; |xd
®¯ d|

Si l’ensemble :° une dépend pas de | et si la vraisemblance žw ; |x est dérivable au moins jusqu’à l’ordre
deux, la quantité d’information de Fisher possède les propriétés suivantes :
dLnžw ; |x
bR Q D! Ž Žé RP!D RDé
d|
dLnžw ; |x
ª+ | = C D y z
d|
d3 Lnžw ; |x
ª+ | = −: y z
d| 3
ª+ | = ª4 |
ª4 | est la quantité d’information de 1 échantillon de taille , avec
dLnow ; |x
3

ª4 | = : =T U >
d|
Théorème : sous les hypothèses de Cramer-Rao, en particulier si : = Ω est indépendant du paramètre à
estimer |, pour tout estimateur sans biais Z de |, on a :
1
C° Z ≥ = •n |
ª+ |
La quantité •n | est la borne inférieure de Fréchet-Darmois-Cramer-Rao (FDCR en abrégé).
Note : un estimateur sans biais Z est dit efficace si sa variance est égale à la borne inférieure de FDCR :
1
C° Z = = •n |
ª+ |
Ou, un estimateur sans biais Z est dit asymptotiquement efficace si :
C° Z
lim = 1 PQ lim ª+ | C° Z = 1
+→˜ •n | +→˜

→ $ ¥; 2 . Déterminer ª+ ¥
Exemple :

1 1 −¥ 3
On considère
o = l §− £ ¤ ¨
&
2√2¦ 2 2
+

žw ; |x = Ÿ o &; |
&94
1 +
1
žw ; |x = A B l §− 8 & − ¥ 3¨
2√2¦ 22 3
1
Lnžw ; |x = − Ln 2¦2 3 − 38 & −¥ 3
2 22
+
dLnžw ; |x 1
= 38 −¥
d¥ 2 &
&94

29
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

d3 Lnžw ; |x
= − 3 ⟹ ª+ ¥ = −: £− 3 ¤ ⟹ ª+ ¥ = 3
d¥3 2 2 2
De plus, C D ̅ = ³ = , donc ̅ est un estimateur efficace de ¥ pour la loi normale.
4 _a
« ´ +

f. Recherche du meilleur estimateur

─ la précision d’un estimateur Z dépend de sa variance, c’est-à-dire de la loi de Z qui dépend elle-même
La recherche du meilleur estimateur d’un paramètre est un problème difficile à résoudre. En effet :

de la loi de la variable aléatoire . Il faut donc connaître la forme de cette loi ;


─ une statistique est un résumé apporté par un échantillon, il est donc très important de ne pas perdre
d’information.
En tenant compte de ces deux impératifs, on peut aborder la recherche du meilleur estimateur suivant deux
méthodes :
─ soit en recherchant des statistiques exhaustives qui conduisent à des estimateurs sans biais, de variance
minimale,
─ soit en étudiant la quantité d’information de Fisher qui apporte des indications sur la précision d’un
estimateur.
Un estimateur optimal au sens du critère de la variance (ou de l'erreur quadratique) est l’estimateur sans
biais qui possède la variance la plus faible parmi tous les estimateurs sans biais.

3. Méthodes de construction d’un estimateur

d'un estimateur |} = ’ 4 , ⋯ , + à partir des variables aléatoires de l'échantillon 4 , ⋯ , + . Pour un même


Une méthode d'estimation est une méthode mathématique qui permet de dériver la forme fonctionnelle

problème, on peut parfois appliquer plusieurs méthodes d'estimation. À chaque méthode d'estimation
correspond un estimateur particulier. Si l'on se restreint aux seules méthodes d'estimation paramétriques, il
existe de nombreuses méthodes suivant le problème étudié et les hypothèses retenues.
Citons par exemple :
─ la méthode des moindres carrés ordinaires ;
─ la méthode des moindres carrés généralisés ;
─ la méthode du maximum de vraisemblance ;
─ la méthode des moments généralisés;
─ la méthode des variables instrumentales;
─ la méthode des doubles moindres carrés ordinaires.

30
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

4. Estimation par intervalle de confiance


L’estimation ponctuelle d’un paramètre u donne une valeur numérique unique à ce paramètre, mais n’apporte
aucune information sur la précision des résultats, c’est-à-dire qu’elle ne tient pas compte des erreurs dues aux
fluctuations d’échantillonnage, par exemple. Aussi étant donné que l’estimateur ponctuel est une variable
aléatoire, elle peut différer du paramètre estimé sans qu’on puisse juger de la grandeur de cet écart.
Pour évaluer la confiance que l’on peut avoir en une estimation, il est nécessaire de lui associer un intervalle
qui contient, avec une certaine probabilité, la vraie valeur du paramètre, c’est l’estimation par intervalle de confiance.
Elle permet donc d’apporter un complément en construisant autour de l’estimateur ponctuel un intervalle
avec un certains risque d’erreur α qui correspond à un seuil de confiance de 1 − α .

4.1. Construction d’un intervalle de confiance

Un intervalle de confiance sur le paramètre | pour un niveau de confiance de 1 − µ (ou un niveau de risque
µ), avec µ ∈ <0, 1;est un encadrement du type :
·≤| ≤• =1−µ
où · R • sont des variables aléatoires, fonctions des variables de l'échantillon 4, ⋯ , + .

ª‘4Hh = ; ; <
Une réalisation de cet intervalle de confiance est notée :

R sont les réalisations respectives des variables · R • , obtenues à partir de la réalisation de


l'échantillon 4 , ⋯ , + .

Ainsi, on cherche à encadrer la valeur de | (inconnue) par deux variables aléatoires · R •, telles que la
probabilité que la valeur de | soit comprise entre ces deux variables soit précisément égale à 1 − µ. Ces
variables sont des fonctions des variables de l'échantillon. Dès lors, à partir de la réalisation 4 , ⋯ , + de
l'échantillon, on peut déduire des réalisations des variables · R •, et une réalisation de l'intervalle, c'est-à-dire
deux valeurs encadrant la vraie valeur | pour un niveau de confiance de1 − µ.
Par exemple, si pour un échantillon 4 , ⋯ , + et µ = 5 %, on obtient ª‘ .rq = ;1.2; 1.5<, cela signifie que
pour cette réalisation de l'échantillon (c'est-à-dire pour ces données), il y a 95 % de chances que la valeur de |
soit comprise entre 1,2 et 1,5.

4.2. Exemples d’intervalles de confiance


4.2.1. Intervalle de confiance pour les paramètres d’une loi normale
La variable aléatoire X suit une loi normale N ( µ ;σ ) . Les paramètres à estimer sont la
moyenne µ et l’écart-type σ .

─ Estimation et intervalle de confiance de la moyenne


1 n
L’estimateur sans biais de la moyenne µ est la statistique X =  X i qui suit la loi normale
n i =1
(
N µ ;σ )
n .

Deux cas sont à distinguer, selon que l’écart-type est connu ou estimé.
31
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Cas1 : l’écart-type σ est connu.


Étant donné un seuil α , (donc un degré de confiance de 1 µ) on construit pour la moyenne

̅ "
X de l’échantillon, un intervalle de probabilité. On a vu avec l’échantillonnage que :

O ⟶ $ 0, 1
2 ⁄√
Avec Sh⁄3 qui représente la valeur issue de la loi normale centrée et réduite telle que la
probabilité de la queue supérieure est de µ ⁄2.
L’intervalle de probabilité est déterminé comme suit :
w Sh⁄3 O Sh⁄3 x 1 µ

̅ "
T Sh⁄3 Sh⁄3 U 1 µ
2 ⁄√
La valeur Sh⁄3 est lue sur la table de la loi normale centrée et réduite.
On en déduit l’intervalle de confiance pour la moyenne µ :
2 2
A ̅ Sh⁄3 " ̅ 1 Sh⁄3 B 1 µ
√ √
Où x est la moyenne arithmétique de l’échantillon.

2
ª‘ ̅ º Sh⁄3 ⇔ ̅ º Sh⁄3 2E̅

Exemple :
Supposons que les heures d’achat des clients d’un centre commercial local soient normalement distribuées
avec un écart type connu de la population de 20 minutes. Un échantillon aléatoire de 64 acheteurs de

moyenne de la population, ".


l'épicerie locale avait un temps moyen de 75 minutes. Déterminer l’intervalle de confiance de 95% pour la

32
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Solution

2 20
L’intervalle de confiance est donné par :

ª‘ = ̅ º Sh⁄3 = 75 º 1.96
√ √64
ª‘ .rq ;70.1; 79.9<

population inconnue s'étend d'environ 70 minutes à environ 80 minutes. L’intervalle ;70.1; 79.9< a une
Sur la base d'un échantillon de 64 observations, un intervalle de confiance de 95% pour la moyenne de

probabilité égale à 0.95 de contenir la vraie valeur de la durée d’achat d’un client dans ce centre commercial.
Le niveau de confiance de l'intervalle implique qu'à long terme, 95% des intervalles ainsi trouvés contiennent la valeur vraie de la

Niveaux de confiance usuelles et valeurs correspondante de ¼½⁄•


moyenne de la population.

µ
Niveau de confiance 90% 95% 98% 99%

Sh⁄3
0,1 0,05 0,02 0,01
1,645 1,96 2,33 2,58

Cas 2 : l’écart-type σ n’est pas connu (‰¾¿À V 30


Étant donné un seuil α , (donc un degré de confiance de 1 µ) on construit pour la moyenne

̅ "
X de l’échantillon, un intervalle de probabilité. On a vu avec l’échantillonnage que :

⟶ $ 0, 1
O
2 ⁄√
Mais lorsque la variance est inconnue, elle est estimée à partir de l’échantillon. Comme on l’a vu
dans le chapitre sur l’échantillonnage, on estime cette variance en utilisant un estimateur sans
biais de la variance c'est-à-dire :
+
1
[ 3
8 ̅ 3
2Á 3
1 &
&94

̅ "
Ainsi donc

⟶[ Z 1
[⁄√
Avec Rh⁄3 qui représente la valeur issue de la loi de Student telle que la probabilité de la queue
supérieure est de µ ⁄2.
L’intervalle de probabilité est déterminé comme suit :
w Rh⁄3 O Rh⁄3 x 1 µ

33
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

̅−"
T−Rh⁄3 < < Rh⁄3 U = 1 µ
[ ⁄√
Le seuil α étant donné, on lit sur la table de Student le nombre Rh⁄3 1 tel que :
[ [
A ̅ Rh⁄3 1 " ̅ 1 Rh⁄3 1 B 1 µ
√ √
[
ª‘ ̅ º Rh⁄3 1

Exemple :

5. On a obtenu les résultats


Afin d’étudier le salaire hebdomadaire, en euros, des ouvriers d’un secteur d’activité, on
procède à un tirage non exhaustif, d’un échantillon de taille
suivants :
229 255 280 203 229
858,2

On suppose que la loi suivie par la variable aléatoire « salaire hebdomadaire » est une loi
normale de moyenne µ et d’écart-type σ inconnus.
─ Estimation ponctuelle de la moyenne, la moyenne arithmétique : 239.2

[ 3 858.2 29.3 3
─ Estimation ponctuelle de la variance (estimateur non biaisé) :

─ Intervalle de confiance pour la moyenne, seuil de confiance 0.99 (intervalle


bilatéral à risque symétriques).
E̅ HÂ
Ã⁄√+
La variable aléatoire suit une loi de Student à ( n − 1) degrés de liberté. D’où la suite des

[
calculs en tenant compte des résultats donnés par l’échantillon :

ª‘ ̅ º Rh⁄3 1

29.3 29.3
ª‘ ̅ºR 4 → ª‘ 239.2 º R 4
√5 √5
.rr . q .rr . q

ª‘ .rr 239.2 º 60.3

34
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Exercice: Pour estimer le taux d'intérêt moyen sur les prêts à 5 ans consentis par les banques pour l'achat de
voitures neuves, on analyse les comptes de 64 banques pris au hasard, où l'on trouve un taux moyen de
11.65% avec un écart type de 1.20%.
1. Déterminer un intervalle de confiance au seuil de 5% pour le taux d'intérêt moyen
2. Peut-on considérer que ce taux d'intérêt est de 12% au seuil de 5%?

─ Estimation et intervalle de confiance pour la variance


Comme précédemment, deux cas sont à distinguer, selon que la moyenne µ est connue ou
estimée.

Cas 1 : la moyenne µ est connue


Le meilleur estimateur de la variance est la statistique :
+
1
[ €3
= 8 & −" 3

&94
+Ã Äa
_a
La variable aléatoire suit une loi du Chi-deux à n degrés de liberté. Un intervalle de
probabilité pour la variable aléatoire χ 2 ( n ) est (les bornes de l’intervalle sont lues sur la table
de la loi du Chi-deux).

£p 34Hh⁄3 < p3 < ph3⁄3 ¤= 1−µ


On en déduit un intervalle de confiance bilatéral pour σ 2 à risques symétriques (b €3 est la
valeur de la statistique [ €3 donnée par l’échantillon)
b €3 b €3
≤ 23 ≤
ph3⁄3 p 34Hh⁄3

Exemple :
Soit X une variable aléatoire suivant la loi normale N ( 40;σ ) . Pour estimer la variance, on

précédemment) pour cet échantillon. On obtient b €3 = 12.


prélève un échantillon de taille n = 25 et on calcule la valeur de la statistique T (définie

─ Intervalle de confiance bilatéral, à risques symétriques, pour la variance.


─ Niveau de confiance : 1 − α = 0.95 .
+Ã Äa
─ La statistique _a suit une loi du chi-deux à n = 25 degrés de liberté. On obtient
successivement :
35
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

p 3. 3q 25 = 40.644; R p 3.rÅq 25 = 10.120


L’intervalle [ 7.381, 22.866] a une probabilité égale à 0.95 de contenir la vraie valeur de la
variance de la loi considérée.

Cas 2 : la moyenne µ n’est pas connue

= ∑+&9 − ̅
+H4 Ã a 4 3
La statistique
_a _a & est une variable de Chi-deux à ( n − 1) degrés de liberté.
La démarche est la même que dans le cas 1.

£p 34Hh⁄3 − 1 < p3 − 1 < ph3⁄3 −1 ¤=1−µ

Les bornes de l’intervalle sont lues sur la table de la loi du chi-deux.


D’où l’intervalle de confiance, bilatéral, à risques symétriques :

− 1 b3 − 1 b3
─ pour la variance ( s 2 étant la valeur de la statistique S 2 donnée par l’échantillon) :

≤ 2 3

ph3⁄3 p 34Hh⁄3

Exemple : (suite de l’exemple précédent en considérant que la moyenne est inconnue)


Exemple :
On suppose que la durée de vie d’ampoules électriques suit une loi normale d’écart-type 100
heures. Quelle est la taille minimale de l’échantillon à prélever pour que l’intervalle de
confiance, à 95 %, de la durée de vie moyenne de ces ampoules ait une longueur inférieure à 20
heures ?
Les hypothèses faites entraînent que la largeur de l’intervalle de confiance (bilatéral, à risques
σ
symétriques) pour la moyenne est égale à : 2 × 1.96 × .
n
100
D’où l’équation : 2 ×1.96 × = 20 et n = 385 .
n
4.2.2. Intervalle de confiance pour la moyenne d’une loi quelconque
Quelle que soit la taille de l’échantillon, on prendra pour estimateurs sans biais de la moyenne,
la statistique X , et de la variance, la statistique
+
1
[3 = 8 − ̅ 3
−1 &
&94

… → Ç £È,
Cas 1 : Æ suit une loi inconnue, V est grand V ≥ WX Aƒ ¤B
É
√V

Si la taille de l’échantillon est grande, en pratique n > 30 , grâce au théorème central limite, on
utilise les résultats précédents pour calculer l’intervalle de confiance pour la moyenne. Si la
série prélevée est faible, il faut utiliser les lois suivies par les paramètres étudiés.
Si 2 est connu, on est ramené au premier cas (c'est-à-dire la loi normale)
Si 2 n'est pas connu, on approche la loi de Student par loi Normale


36
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Exemple :
On considère un échantillon de 40 paquets de biscuits provenant d’une production de 2 000
unités. Le poids moyen obtenu pour cet échantillon est égal à 336 g et l’écart-type empirique,
c’est-à-dire la quantité s , est égal à 0.86g.
Quelle est l’estimation, par intervalle de confiance, du poids moyen de ces paquets de biscuits,
pour l’ensemble de la fabrication, avec les seuils de confiance 0.90, 0.95 et 0.99 ?

4.2.3. Intervalle de confiance de la différence des moyennes de deux lois normales

Cette situation est comparable aux cas où on a des échantillons de grandes tailles ( 4 , ≥ 30
indépendantes
3

Soient X 1 et X 2 deux variables aléatoires indépendantes, suivant les lois normales N ( µ1 ; σ 1 ) et N ( µ 2 ; σ 2 ) .


Le paramètre à estimer est la différence des moyennes D = µ1 − µ2 .

On considère deux échantillons indépendants de taille n1 pour la variable X 1 et de taille n2 pour la variable
X2 .
La variable aléatoire \ = ̅4 − ̅ 3 suit une loi normale d’espérance µ = µ1 − µ2 et d’écart-type :

243 233
2] = d +
4 3

Cas 1:
Si les écart-types sont connus, alors l'intervalle de confiance est donnée par:

243 233
ª‘ = ̅4 − ̅ 3 º Sh⁄3 d +
4 3

Cas 2:
Les écart-types sont inconnus (avec les grands échantillons), on utilise toujours la loi normale même si les
écart-types devraient être estimés.

b43 b33
ª‘ = ̅4 − ̅ 3 º Sh⁄3 d +
4 3

Lorsqu'on a des échantillons de petites tailles, c'est-à-dire 4, 3 < 30

Cas 3:
Les écart-types sont inconnus mais supposés être égaux, dans ce cas si les populations sont normales, alors on
utilise la loi de Student.

bf3 bf3
ª‘ = ̅4 − ̅3 º R +` g+a H3; h⁄3 d +
4 3

37
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

− 1 b43 1 1 b33
bf3 =
4 3

41 3 2
Cas 4:
Les écart types sont inconnus et supposés inégaux.

b43 b33
ª‘ ̅4 ̅ 3 º R j; h⁄3 d 1
4 3

avec
b43 b33
3
? 1 @
4 3
b43 ⁄ 3 b33 ⁄ 3
4
1 3
4 1 3 1

4.2.4. Intervalle de confiance pour le rapport des variances de deux lois normales
Soient X 1 et X 2 deux variables aléatoires indépendantes suivant les lois normales

N ( µ1 ; σ 1 ) et N ( µ1 ; σ 2 ) .

p43 ⁄
Le résultat suivant est connu:

m → m +` ,+a
4
p43 ⁄ 3

1 b43 1 b33
Il est également connu que:

→ p+3` H4 , R → p+3a H4
4 3
243 233
Et donc
1 b43
4
Ê 1
243 4
b43 233 b43 233
T 3U T 3 U T 3U T 3U → m 1, 1
1 b33 24 b3 b3 24 4 3
3
Ê 1
233 3

Ce résultat permet de déterminer un intervalle de confiance pour le rapport de deux variances ou pour tester
l’égalité de deux variances. On utilise les méthodes exposées dans les paragraphes précédents. On obtient par
exemple :

£m4Hh⁄3 4 1, 3 1 m mh⁄3 4 1, 3 1 ¤ 1 µ

b43 233
Jm4Hh⁄3 1, 1 T 3U T 3U mh⁄3 1, 1 K 1 µ
b3 24
4 3 4 3

b33 233 b33


J Ë m4Hh⁄3 1, 1 Ë mh⁄3 1, 1 K 1 µ
b43 243 b43
4 3 4 3

38
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

1
La propriété suivante de la loi de Fisher nous conduit aux résultat suivant:

m4Hh⁄3 − 1, −1 =
4 3
mh⁄3 3 − 1, 4 −1
_a
On obtient l'intervalle de confiance autour du ratio _aà comme suit:

b33 1 b33
ª‘ = J × ; × mh⁄3 − 1, −1 K
b43 mh⁄3 3 − 1, 4 −1 b43 4 3

Où s′ désigne la valeur de la statistique S ′ donnée par l’échantillon considéré ; les valeurs de


Fα 2 ( n1 − 1; n2 − 1) et de F1−α 2 ( n1 − 1; n2 − 1) sont lues sur les tables.

Exemple :
Une firme d’expertises en contrôle de matériaux a demandé à un laboratoire d’effectuer une vérification sur la
résistance à la compression de tubes fabriqués par deux usines U1 et U 2 .
On supposera que la résistance à la compression des tubes provenant de chaque usine peut être considérée
comme la réalisation de variables aléatoires suivant des lois normales.

4 = 16 4 = 14
Usine U1 Usine U2
Nombre de cylindre
Résistance moyenne x1 = 90.60 x2 = 94.40
Variance empirique s12 = 62.80 s22 = 55.70

Déterminer un intervalle de confiance bilatéral, à risque symétriques, pour le rapport σ 12 σ 22 des deux
variances (seuil de confiance 90%).
Peut-on considérer comme vraisemblance au seuil α = 10% , l’hypothèse selon laquelle la variance de la
résistance à la compression des tubes provenant de chaque usine est identique ?

39
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

4.2.5. Intervalle de confiance pour une proportion


Ce problème apparaît dans de nombreuses situations quand on veut estimer par exemple (liste non
exhaustive) :
─ la proportion de pièces défectueuses dans une fabrication donnée,
─ la proportion d’électeurs qui voteront pour un candidat déterminé,
─ la proportion de ménagères qui achèteront une nouvelle marque d'un produit.
Soit une population où une proportion p des individus possède un certain caractère, cette population est supposée
infinie (ou finie si le tirage s’effectue avec remise). Le problème consiste à déterminer un intervalle de confiance pour
la proportion p à partir des résultats apportés par un échantillon de taille n .
À cet échantillon, on associe la variable aléatoire X qui « compte » le nombre de succès au cours de n essais
indépendants, cette variable suit la loi binomiale B ( n; p ) . Le paramètre à estimer est la probabilité p de

Un estimateur sans biais du paramètre p est la fréquence m+ = ⁄ de succès à l’issue de n épreuves,


succès au cours d’une épreuve.

étant le nombre de succès obtenus au cours de ces n épreuves :

p (1 − p )
E ( Fn ) = p Var ( Fn ) =
n
Selon les valeurs de n et de p , cette loi admet différentes lois limites qui sont utilisées pour déterminer un
intervalle de confiance. Dans la pratique, on peut :
─ utiliser les tables statistiques qui donnent les limites inférieures et supérieures d’un intervalle
de confiance calculées pour différents seuils et différentes valeurs de n et ,
─ utiliser et justifier l’approximation normale.
Intervalle de confiance d’une proportion calculée avec l’approximation normale:
Si l'échantillon est de grande taille (et si), l'approximation normale est valide, la loi de la variable aléatoire Fn
(fréquence des succès) peut être approchée par la loi normale :

l 1−l
$ Ìl; d Í

p . Si l 1 − l > 5, alors
La table de la loi normale centrée réduite permet de construire un intervalle de confiance pour la probabilité

l 1−l o+ 1 − o+
d ≈d

o+ − l
Ainsi, la statistique à utiliser est donnée par:

O=
^o+ 1 − o+

Un intervalle bilatéral à risques symétriques ( fn est la fréquence observée sur l’échantillon) est donné par :

w−Sh⁄3 < O < Sh⁄3 x = 1 − µ

40
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

o+ − l
⎛−Sh⁄3 < < Sh⁄3 ⎞ = 1 − µ
^o+ 1 − o+
⎝ ⎠
o+ 1 − o+ o+ 1 − o+
Ì−Sh⁄3 d < o+ − l < Sh⁄3 d Í=1−µ

o+ 1 − o+ o+ 1 − o+
Ìo+ − Sh⁄3 d < l < o+ + Sh⁄3 d Í=1−µ

Les bornes de l'intervalle de confiance sont donc:


o+ 1 − o+
ª‘ = o+ º Sh⁄3 d

Exemple :
Dans un échantillon pris au hasard de 100 automobilistes, on constate que 25 d’entre eux possèdent une
voiture de cylindrée supérieure à 1 600 cc. Quel est l’intervalle de confiance pour la proportion
d’automobilistes possédant une voiture de cylindrée supérieure à 1 600 cc (intervalle bilatéral, à risques
symétriques, seuil de confiance 95 %) ?
Estimation ponctuelle de p : le nombre d’automobilistes possédant une voiture de cylindrée supérieure à 1
600 cc dans un échantillon de taille n = 100 suit la loi binomiale B (100; p ) .

Un estimateur non biaisé pour la proportion p est donné par la fréquence o+ = +


Ó

D’où l’estimation ponctuelle de p : o+ = 4 = 0.25


3q

Si on remplace p par son estimation (0.25), on obtient l'intervalle de confiance :


Pr ( 0.25 − 0.085 < p < 0.25 + 0.085 ) = Pr ( 0.165 < p < 0.335 ) = 0.95

L’intervalle [ 0.165; 0.335] a 95 chances sur 100 de contenir la vraie valeur de la proportion

4.2.6. Intervalle de confiance pour la différence de proportions (grands échantillons)


La présente situation suppose l'estimation de la différence de 2 proportions à partir des échantillons de
grandes tailles tirés des populations indépendantes. Si & a une distribution binomiale de taille & et de
probabilité de succès l& , alors l4 − l3 peut être estimé par 4⁄ 4 − 3⁄ 3 . Après avoir choisit les
échantillons, on estime l4 par o4 = 4 ⁄ 4 et l3 par o3 = 3 ⁄ 3 .
Dans ces conditions, l'intervalle de confiance au seuil µ est donné par:

o4 1 − o4 o3 1 − o3
ª‘ = o4 − o3 º Sh⁄3 d +
4 3

4 o4 ≥ 10, 1 − o4 ≥ 10; 3 o3 ≥ 10, R 1 − o3 ≥ 10


Dans le cas présent, l'approximation normale est valide lorsque:
4 3

Exemple
41
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Au cours de l'année électorale, plusieurs sondages ont et faits pour déterminer la perception que les électeurs
ont d'un candidat donné. Dans un échantillon aléatoire de 120 inscrits d'une circonscription , 107 des

circonscription Ô , seulement 73 indiquent supporter le même candidat. Les proportions dans les deux
inscrits indiquent qu'ils supportent le candidat en question. Dans un échantillon de 141 inscrits dans la

populations sont notées lE et lÕ . Trouver un intervalle de confiance à niveau de confiance de 95% de la


différence des proportions lE − lÕ .

5. Détermination de la taille de l’échantillon


Dans le cas où on a estimé la moyenne d’une population normale, la variance est connue.

moyenne " et de variance 2 3 , l’intervalle de confiance au seuil 1 µ autour de la moyenne de la


On a vu que lorsque l’échantillon aléatoire de taille est extrait d’une population distribuée normalement de

2
population est donné par :
̅ º Sh⁄3

Sh⁄3 2
On a donc pour marge d’erreur dans la construction de l’intervalle,
Œ:

Sh⁄3 2
Si la marge d’erreur est déterminée par avance, on a donc

Œ:

Sh⁄3 2 3
Et don peut déterminer en prenant le carrée de l’expression précédente.

Ö ×
Œ:

On a vu que pour un échantillon de observations, un intervalle de confiance au seuil de confiance de 1 µ


Proportion de population

pour la proportion de la population est donnée par :

o+ 1 o+
o+ º Sh⁄3 d

On obtient comme marge d’erreur,


o+ 1 o+
Œ: Sh⁄3 d

comme o+ 1 o+ ne peut pas dépasser 0.25, sa valeur lorsque la proportion empirique est égale à 0.5. Donc
On ne peut pas utiliser ce résultat pour déterminer directement la taille nécessaire pour l’échantillon. Mais

la plus grande valeur de la marge d’erreur, Œ: est donnée par

0.25 0.5Sh⁄3
Œ: Sh⁄3 d

0.5Sh⁄3
On obtient dans ce cas,


Œ:

0.25wSh⁄3 x
3
On a donc

Œ: 3

42
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Chapitre 3 : Les Tests statistiques (Paramétriques)

La théorie des tests consiste à formuler des hypothèses particulières sur les paramètres ou sur les lois qui
interviennent dans les problèmes étudiés, puis à apporter un jugement sur ces hypothèses. Ce jugement est
basé d’une part, sur les résultats obtenus sur un ou plusieurs échantillons extraits de la population concernée
et d’autre part, sur l’acceptation d’un certain risque dans la prise de décision.

1. Notions générales sur les tests statistiques

Exemple introductif :
Considérons des lampes à incandescence dont la durée de vie est une variable aléatoire gaussienne de
moyenne µ = 1000 heures et d’écart-type σ = 100 heures (résultats établis expérimentalement). Un ingénieur
propose un nouveau procédé de fabrication qui doit améliorer, affirme-t-il, cette durée de vie moyenne et la
rendre égale à 1 075 heures. Cependant, le procédé, étant plus onéreux, ne pourra être accepté que si
l’amélioration est réelle.

Le résultat qui doit être vérifié est donc µ > 1000 heures. Deux hypothèses sont en présence :
─ Soit µ = 1000 heures est une hypothèse encore vraie et le nouveau procédé n’a pas modifié de façon
significative la durée de vie des lampes,
─ soit µ = 1075 heures et le nouveau procédé a apporté une réelle amélioration.
La deuxième affirmation est aussi une hypothèse car aucune expérience ne permet d’affirmer que la moyenne
des durées de vie augmentera réellement ( µ > 1000 heures). En effet, il est possible que le nouveau procédé
de fabrication n’améliore pas la durée de vie des ampoules de façon appréciable, il pourrait même la diminuer.
En conclusion, rejeter l’hypothèse µ = 1000 heures ne conduit pas nécessairement à accepter l’hypothèse
µ > 1000 heures.

Les hypothèses ayant été formulées, il faut les accepter ou les rejeter à l’aide des données apportées par un
échantillon. Une incertitude est toujours associée au jugement apporté par le statisticien, mais ce dernier doit
essayer de limiter ce risque.

2. Principe d’un test d’hypothèse


Soit une population dont les éléments possèdent un certain caractère, dénombrable ou mesurable. Ce
caractère est une variable aléatoire X dont la loi de probabilité dépend d’un paramètre θ , dont la valeur
exacte est inconnue. Cependant, grâce à des connaissances déduites des propriétés d’échantillons ou grâce à
une certaine expérience, on est en mesure de formuler une hypothèse sur ce paramètre, θ = θ0 , par exemple.
Une hypothèse est un énoncé quantitatif sur les caractéristiques (ou paramètres) d’une population.
La statistique utilisée pour estimer ce paramètre θ lui donne une valeur différente de θ0 , θ0′ par exemple.
La différence entre ces deux valeurs θ0 et θ0′ peut être due, soit à des fluctuations d’échantillonnage, soit à
une mauvaise appréciation de la valeur de θ , ou encore à d’autres raisons.
Pour décider si l’hypothèse θ = θ0 , formulée à l’égard du paramètre, peut être gardée ou rejetée, par
comparaison avec la valeur θ 0′ déduite de l’échantillon, il faut élaborer une stratégie permettant de tester si
l’écart observé θ 0 − θ 0′ est trop grand pour être dû aux erreurs d’échantillonnage, ou au contraire, n’est pas
en contradiction avec la loi de la variable aléatoire X .
Dans le premier cas, on doit rejeter l’hypothèse θ = θ0 , on dit que le test est significatif ; en revanche, dans le
deuxième cas, on doit garder l’hypothèse θ = θ0 .

43
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

a. Élaboration d’un test


Dans l’exemple précédent, on teste une hypothèse, que l’on appelle hypothèse nulle ou hypothèse H0 :
H0 : µ = µ0 = 1000 heures
Les résultats apportés par un échantillon aléatoire de taille n doivent permettre de rejeter ou non cette
hypothèse.
Si cette hypothèse ne peut pas être rejetée, on doit admettre que la différence observée entre la moyenne x
de l’échantillon et la valeur µ0 est due au hasard. Si, au contraire, le procédé a apporté un changement dans la
fabrication, l’hypothèse proposée H0 est erronée. Il existe alors une deuxième hypothèse appelée hypothèse
alternative ou hypothèse H1 . Cette hypothèse peut se formuler de différentes façons :

"≠" ; ">" ; "<"

En général, si on est amené à rejeter l’hypothèse H0 , c’est-à-dire si on considère que l’hypothèse H1 est vraie,
on devra apporter des corrections à un procédé de fabrication. Mais ces modifications ne peuvent être
envisagées que dans la mesure où les résultats observés sont convaincants, car cette décision repose sur
l’information apportée par un échantillon.
Il faut donc admettre que toute décision prise comporte un certain risque qu’elle soit erronée. Ce risque est
donné par le seuil de signification du test.

On peut, par exemple, accepter un risque α = 0.05 de rejeter l’hypothèse H0 , alors qu’elle est vraie, c’est
donc le risque d’accepter l’hypothèse H1 . Cette conclusion signifie que le résultat obtenu sur un échantillon
n’avait que 5 chances sur 100 de se produire ou, en d’autres termes, les valeurs apportées par l’échantillon et
la valeur µ0 sont considérées comme significativement différentes.

b. Principales définitions
─ Une hypothèse statistique est une affirmation concernant certaines caractéristiques d’une
population telles que la valeur d’un ou de plusieurs paramètres, la forme de la distribution...
─ Un test d’hypothèse ou test statistique est une démarche conduisant à élaborer une règle de décision
permettant de faire un choix entre deux hypothèses statistiques. Les hypothèses envisagées a
priori s’appellent :
 L’hypothèse nulle H0 . C’est l’hypothèse selon laquelle on fixe apriori la valeur d’un paramètre. Elle
spécifie une valeur particulière à analyser .
 L’hypothèse alternative H1 . On peut choisir pour cette hypothèse n’importe quelle hypothèse
compatible avec le problème étudié, mais différente de H0 . Elle énonce la modification de
l'hypothèse nulle à tester dans l'analyse.
Avant toute démarche statistique, il faut définir à quelle condition l’une ou l’autre des hypothèses sera
considérée comme vraisemblable. Les deux hypothèses ne jouent pas le même rôle. En effet, c’est l’hypothèse
nulle H0 qui est soumise au test et toute démarche statistique consiste à la considérer comme vraie. Si le test
conduit à la rejeter, c’est l’hypothèse alternative H1 qui sera considérée comme vraie.
─ La statistique du test: est la quantité de l'échantillon sur laquelle la décision de rejeter ou non
l'hypothèse nulle est basée.
─ La région ou la zone de rejet: est l'ensemble des valeurs de la statistique du test qui entraine le rejet
de l'hypothèse nulle en faveur de l'hypothèse alternative. Le complémentaire de la région de

44
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

rejet est l'ensemble des valeurs de la statistique du test ne conduisant pas au rejet de
l'hypothèse alternative (région de non rejet).
─ La valeur critique : est la frontière entre la zone de rejet et la zone de non rejet.

Comme hypothèse nulle H0 , on peut tester :


─ une valeur particulière d’un paramètre : θ = θ0 ,
─ l’égalité des valeurs d’un paramètre défini sur deux populations différentes,
─ l’ajustement d’une distribution théorique à une distribution expérimentale.
L’hypothèse alternativeH1peut être :
θ = θ1 θ > θ0 θ < θ0 θ ≠ θ 0

Exemple:
Il est connu que les statistiques déduites des grands échantillons suivent la loi normale. Cela permet de

par exemple Ø : | = | pour le paramètre | dont l'estimateur est |} suit une distribution normale de
déterminer facilement la statistique du test pour tester les hypothèses. Comme illustration, on choisit de tester

moyenne | et d'écart type 2°‡ . On suppose que 2°‡ est connu ou on peut obtenir une bonne approximation
lorsque la taille de l'échantillon est grande.

|} − |
La statistique du test est donc:

O=
2°‡
En considérant les différentes hypothèses alternatives avec un risque d'erreur µ, on a:

Pour une hypothèse alternative du type: Ú‚ : † > †X (un test unilatéral à droite) on a:

Pour une hypothèse alternative du type: Ú‚ : † < †X (un test unilatéral à gauche) on a:

45
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Pour une hypothèse alternative du type: Ú‚ : † ≠ †X (un test bilatéral à risque symétrique) on a:

−Sh⁄3 Sh⁄3

Risques et probabilités d’erreur


Les tests d’hypothèse font intervenir la loi de la distribution de la statistique utilisée comme estimateur pour le
paramètre entrant en jeu dans l’hypothèse H0 .
Pour établir la crédibilité de l’hypothèse H0 , des règles très précises doivent être énoncées pour permettre de
conclure au rejet ou à l’acceptation de H0 .
Cependant, pour des événements dans lesquels le hasard intervient, il est impossible de prendre la bonne
décision sans risque de se tromper. Il faut donc mettre en œuvre une règle conduisant à rejeter H0 , si elle est
vraie, que dans une faible proportion des cas. Cette décision a un caractère probabiliste, toute décision
comporte un risque qu’elle soit erronée. Ce risque, noté α , qui est le risque de rejeter à tort l’hypothèse H0 alors
qu’elle est vraie et qui favorise donc l’hypothèse H1 s’appelle seuil de signification ou risque de première espèce (erreur
de type I).

µ = ÛD Ü R D Ø |Ø bR D ! Ý

Ce risque α définit la région critique W , d’aire α et de probabilité α , sous l’hypothèse H0 . C’est l’ensemble
des valeurs de la variable aléatoire de décision qui conduisent à écarter H0 au profit de H1 .
La région complémentaire, W , d’aire (1 − α ) et de probabilité (1 − α ) , représente la région d’acceptation de
l’hypothèse H0 .
La règle de décision peut se formuler de la façon suivante :
Si la valeur de la statistique considérée appartient à la région d’acceptation W , on favorise l’hypothèse nulle H0 , si elle
appartient à la région critique W , on favorise l’hypothèse alternative H1 .
La règle de décision comporte un risque β ou risque de deuxième espèce, c’est le risque de ne pas rejeter H0
alors que H1 est vraie :

µ= Û l b D Ü R D Ø |Ø bR o Qbb Ý

On peut aussi écrire, en introduisant la région critique W :

( )
Pr W / H 0 = 1 − α Pr (W / H1 ) = 1 − β

46
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

En résumé:
─ Erreur de première espèce : on rejette H0 alors que H0 est vraie.
─ Erreur de deuxième espèce : on ne rejette pas H0 alors que H1 est vraie.

La démarche d'un test statistique


À partir des différents éléments présentés jusqu' à présent (hypothèse nulle, hypothèse alternative, région
critique, seuil critique, statistique de test, risque de première espèce), nous pouvons résumer la démarche d’un

Étape 1. Poser l'hypothèse nulle ÚX et l’hypothèse alternative ÚX , en faisant attention à ce


test statistique de la façon suivante :

que l’hypothèse nulle corresponde à l’hypothèse pour laquelle le coût associé à l'erreur de type I

Étape 2. Définir la forme de la région critique : cela revient à définir la statistique de test Z ainsi que
soit le plus élevé.

la zone de rejet de l'hypothèse nulle ÚX exprimée en fonction des réalisations de cette


statistique.
─ Étape 3. À partir des hypothèses faites sur la (ou les) variable(s) d'intérêt et l'échantillon,
dériver la distribution exacte ou la distribution asymptotique de la statistique de test T sous

Étape 4. Déterminer la (ou les) valeur(s) critique(s) en fonction du niveau de risque ½ du test.
l'hypothèse nulle.

Étape 5. Calculer la réalisation de la statistique de test Z à partir des observations de




l'échantillon.

de test appartient à la région critique, on conclut au rejet de l'hypothèse nulle Ø pour un


─ Étape 6. Comparer cette réalisation à la région critique du test. Si la réalisation de la statistique

niveau de risque ½. Si, au contraire, cette réalisation n'appartient pas à la région critique, on
conclut que l'on ne peut pas rejeter l’hypothèse nulle Ø pour un niveau de risque ½.

3. Principaux tests paramétriques


a. Tests sur les paramètres µ et σ d’une loi normale (une seule population)
i. Test sur la moyenne µ des grands échantillons
Cette section traite du cas où, on a de grands échantillons d'une population normale, ou de grands

central limite. On choisit un risque de première espèce µ.


échantillons d'une population de loi quelconque mais se ramenant à une loi normale par le biais du théorème

Lorsque l’écart-type 2 est connu ou estimé par [. Selon l’hypothèse H1 , différents cas sont à étudier :
La statistique du test (lorsque Ø vraie) est donnée par:
̅−"
O= → $ 0, 1
2 ⁄√

ÚX : Þ = ÞX ß¼ ÚX : Þ ≤ ÞX ¾• Ú‚ : Þ > ÞX

La variable de décision est la statistique ̅ dont la loi est facile à établir :


Loi de X sous H0 (
N µ0 ; σ n )
Loi de X sous H1 N ( µ ;σ
1 n)

47
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

̅−"
En désignant par α le risque de première espèce, la région critique est définie par :
O > Sh = µ ≡ T > Sh U = µ
2⁄√
Décision: l'hypothèse nulle est rejetée si

̅−"
> Sh PQ ̅ " 1 Sh 2⁄√
2 ⁄√

̅ "
Ou encore lorsque
O.*-.,-é O-, Sh
2 ⁄√

ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX

La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas précédent. En

̅ "
désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
2⁄√
Décision: l'hypothèse nulle est rejetée si

̅ "
Sh PQ ̅ " Sh 2⁄√
2⁄√

̅ "
Ou encore lorsque
O.*-.,-é O-, Sh
2⁄√

ÚX : Þ ÞX ¾• Ú‚ : Þ i ÞX

La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas précédent. En

̅ "
désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Sh⁄3 O Sh⁄3 x µ ≡ T Sh⁄3 Sh⁄3 U µ
2⁄√
Décision: l'hypothèse nulle est rejetée si

̅ " ̅ " ̅ "


á á Sh⁄3 ≡ Sh⁄3 PQ Sh⁄3
2 ⁄√ 2⁄√ 2⁄√

̅ " Sh⁄3 2⁄√ PQ ̅ " 1 Sh⁄3 2⁄√


De manière équivalente, on a:

̅ "
Ou encore lorsque
|O.*-.,-é | á á O-, Sh⁄3
2⁄√

ii. Test sur la moyenne µ des petits échantillons


Cette section traite du cas où, on a des échantillons de petite taille d'une population normale, ou lorsque la loi

On choisit un risque de première espèce µ.


est inconnue et que le théorème central limite ne peut plus fonctionner mais on fait l'hypothèse de normalité.

Dans ce cas, l’écart-type 2 est estimé par [. Selon l’hypothèse H1 , différents cas sont à étudier :

48
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

La statistique du test (lorsque Ø vraie) est donnée par:

̅−"
Z= → [RQâ R 1
b ⁄√

ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX

̅ "
En désignant par α le risque de première espèce, la région critique est définie par :
wZ R +H4 ,h x µ ≡ T R +H4 ,h U µ
b ⁄√
Décision: l'hypothèse nulle est rejetée si

̅ "
R +H4 ,h PQ ̅ " 1 R +H4 ,h b⁄√
b⁄√

̅ "
Ou encore lorsque
Z.*-.,-é R-, R +H4 ,h
b⁄√

ÚX : Þ ÞX ß¼ ÚX : Þ ÞX ¾• Ú‚ : Þ ÞX

La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas

̅ "
précédent. En désignant par α le risque de première espèce, la région critique est définie par :
wZ R +H4 ,h x µ ≡ T R +H4 ,h U µ
b ⁄√
Décision: l'hypothèse nulle est rejetée si

̅ "
R +H4 ,h PQ ̅ " R +H4 ,h b⁄√
b ⁄√

̅ "
Ou encore lorsque
Z.*-.,-é R-, R +H4 ,h
b ⁄√

ÚX : Þ ÞX ¾• Ú‚ : Þ i ÞX

La variable de décision est la statistique ̅ dont la loi est facile à établir comme dans le cas
précédent. En désignant par α le risque de première espèce symétrique, la région critique est

̅ "
définie par :
w R +H4 ,h⁄3 Z R +H4 ,h⁄3 x µ ≡ T R +H4 ,h⁄3 R +H4 ,h⁄3 U µ
b ⁄√

Décision: l'hypothèse nulle est rejetée si

̅ " ̅ " ̅ "


á á R +H4 ,h⁄3 ≡ R +H4 ,h⁄3 PQ R +H4 ,h⁄3
b ⁄√ b⁄√ b ⁄√

49
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

̅ < " − R +H4 ,h⁄3 b⁄√ PQ ̅ > " + R +H4 ,h⁄3 b⁄√
De manière équivalente, on a:

̅−"
Ou encore lorsque
|Z.*-.,-é | = á á > R-, = R +H4 ,h⁄3
b ⁄√

Exemple :
On prélève au hasard, dans une population suivant une loi normale de variance égale à 25, un échantillon de
taille n = 16 . En choisissant un risque de première espèce α = 0.05 (risque bilatéral, symétrique) quelle est la
règle de décision si l’on veut tester les hypothèses :
H 0 : µ = µ0 = 45 et H1 : µ = µ1 ≠ 45 ?

Exemple :
Un fabricant de téléviseurs achète un certain composant électronique à un fournisseur. Un accord entre le
fournisseur et le fabricant stipule que la durée de vie de ces composants doit être égale à 600 heures au moins.
Le fabricant qui vient de recevoir un lot important de ce composant veut en vérifier la qualité. Il tire au
hasard un échantillon de 16 pièces. Le test de durée de vie pour cet échantillon donne les résultats suivants.

620 570 565 590 530 625 610 595


540 580 605 575 550 560 575 615

Le fabricant doit-il accepter le lot ? (On choisit un risque de première espèce égal à 5%.) Quel est le risque de
deuxième espèce ? On admettra que la durée de vie de ces composants suit une loi normale.

Exemple

hebdomadaire de réparation est " = 1200$ . Pour savoir si cette déclaration est vérifiée, les coûts de
Une société fixe son budget annuel pour une nouvelle usine en faisant l'hypothèse que le coût moyen

donne ̅ = 1290$ et un écart type de 110$. Est-ce que l'échantillon indique que 1200$ n'est pas bien fixé
réparation de 10 semaines sont obtenus pour des usines similaires. L'échantillon est supposé aléatoire et

On donne µ = 0.05
pour le coût moyen hebdomadaire de réparation? On suppose que le coût moyen est normalement distribué.

b. Test sur l’écart-type É

concernant la valeur de la variance de la population 2 3 . Pour ce faire, on utilise la statistique utilisée lors de la
Généralement, la variance de la population est inconnue. Souvent il est souhaitable de faire un test

construction de l'intervalle de confiance.

Si la moyenne µ est connue la statistique (sous l'hypothèse Ø ) du test est:

[ €3
3 →p+
3
2

Ø : 2 3 = 2 3 PQ Ø : 2 3 ≤ 2 3 b Ø4 : 2 3 > 2 3

En désignant par α le risque de première espèce, la région critique est définie par :

wp 3+ > p 3+ ,h x = µ
50
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

[ €3
Décision: On rejette l'hypothèse nulle si
> p 3+
23

[ €3
ou si
p.*-.,-é
3
p-,
3
p 3+
23 ,h

Ø : 2 3 2 3 PQ Ø : 2 3 2 3 b Ø4 : 2 3 2 3
En désignant par α le risque de première espèce, la région critique est définie par :

wp 3+ p 3+ ,4Hh x 1 µ

[ €3
Décision: On rejette l'hypothèse nulle si
p 34Hh
23 ,+

[ €3
ou si
p.*-.,-é
3
p-,
3
p 3+
23 ,4Hh

Ø : 23 23 b Ø4 : 2 3 i 2 3
En désignant par α le risque de première espèce symétrique , la région critique est définie par :

wp 3+ ,4Hh⁄3 p 3+ p 3+ ,h⁄3 x µ

[ €3 [ €3
Décision: On rejette l'hypothèse nulle si
p 3
PQ p 3+ ,4Hh⁄3
23 + ,h⁄3
23
Si la moyenne µ est inconnue la statistique (sous l'hypothèse Ø ) du test est:

1 [3
→ p 3+H4
23

Ø : 23 2 3 PQ Ø : 2 3 23 b Ø4 : 2 3 23

En désignant par α le risque de première espèce, la région critique est définie par :

wp 3+H4 p 3+H4 ,h x µ

1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,h
23

1 [3
ou si
p.*-.,-é
3
p-,
3
p 3+H4 ,h
23

51
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Ø : 23 2 3 PQ Ø : 2 3 23 b Ø4 : 2 3 23

En désignant par α le risque de première espèce, la région critique est définie par :

wp 3+H4 p 3+H4 ,4Hh x 1 µ

1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,4Hh
23

1 [3
ou si
p.*-.,-é
3
p-,
3
p 3+H4 ,4Hh
2 3

Ø : 23 23 b Ø4 : 2 3 i 2 3

En désignant par α le risque de première espèce symétrique , la région critique est définie par :

wp 3+H4 ,4Hh⁄3 p 3+H4 p 3+H4 ,4Hh⁄3 x µ

1 [3 1 [3
Décision: On rejette l'hypothèse nulle si
p 3+H4 ,h⁄3 PQ p 3+H4 ,4Hh⁄3
23 23

Exemple
Une machine produit des pièces de machine. Le producteur déclare que la variance du diamètre ne peut pas

0.0003. En supposant la normalité du diamètre, peut-on rejeter l'affirmation du producteur? (µ 0.05 .


être supérieur à 0.0002 cm. Un échantillon de 10 pièces est choisit et donne une variance d'échantillon de

c. Tests sur une proportion (grand échantillons)


Le but est de tester si la proportion p d’individus d’une population P , présentant un certain caractère
qualitatif peut être considérée comme égale ou non à une valeur p0 .

m (nombre d’individus présentant ce caractère) suit la loi


Un estimateur sans biais de p est la proportion F d’individus présentant ce caractère dans un échantillon
aléatoire de taille n . La variable aléatoire
binomiale B ( n; p ) . Si la taille de l'échantillon est grande de sorte à appliquer le théorème central limite (
np et n (1 − p ) sont supérieurs à 5), on peut approximer la loi binomiale par une loi normale. On en déduit
que F suit approximativement la loi normale :

 p (1 − p ) 
N  p; 
 
o+ l
 n 
O → $ 0, 1
•l 1 l ⁄
Sous l'hypothèse Ø : l l , la statistique du test est donnée par:

52
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

o+ − l
O= → $ 0, 1
•l 1 l ⁄

ÚX : ä äX ß¼ ÚX : ä äX ¾• Ú‚ : ä äX

o+ l
En désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
•l 1 l ⁄
Décision: l'hypothèse nulle est rejetée si

o+ l
Sh PQ o+ l 1 Sh •l 1 l ⁄
•l 1 l ⁄

o+ l
Ou encore lorsque
O.*-.,-é O-, Sh
•l 1 l ⁄

ÚX : ä äX ß¼ ÚX : ä äX ¾• Ú‚ : ä äX

o+ l
En désignant par α le risque de première espèce, la région critique est définie par :
O Sh µ≡ T Sh U µ
•l 1 l ⁄

Décision: l'hypothèse nulle est rejetée si

o+ l
Sh PQ o+ l Sh •l 1 l ⁄
•l 1 l ⁄

o+ l
Ou encore lorsque
O.*-.,-é O-, Sh
•l 1 l ⁄

ÚX : ä äX ¾• Ú‚ : ä i äX

o+ l
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Sh⁄3 O Sh⁄3 x µ ≡ T Sh⁄3 Sh⁄3 U µ
•l 1 l ⁄
Décision: l'hypothèse nulle est rejetée si

o+ l o+ l o+ l
á á Sh⁄3 ≡ Sh⁄3 PQ Sh⁄3
•l 1 l ⁄ •l 1 l ⁄ •l 1 l ⁄

o+ l Sh⁄3 •l 1 l ⁄ PQ o+ l 1 Sh⁄3 •l 1 l ⁄
De manière équivalente, on a:

Ou encore lorsque

53
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

o+ l
|O.*-.,-é | á á O-, Sh⁄3
•l 1 l ⁄

Exemple
Une machine dans une usine doit être réparée si elle produit plus de 10% de pièce défectueuse dans un grand
lot de production journalière. Un échantillon aléatoire de 100 pièces sont choisit sur une production

l'échantillon fournit des éléments pour supporter cette décision à un niveau de signification de µ 0.01?
journalière et contient 15 pièces défectueuses et on propose que la machine devra être réparé. Est-ce que

d. Tests d'hypothèses pour le cas des échantillons multiples (02 échantillons) : tests
paramétriques de comparaison d’échantillons

i. Test sur la différence des moyennes issues de 2 populations normales


(échantillons de grandes tailles)

première population a pour moyenne "4 et de variance 243 de laquelle est tiré un échantillon de taille 4 qui
On considère le cas où on a deux échantillons aléatoire indépendants issus de deux populations normales. La

fourni une moyenne empirique ̅4 . La deuxième population a pour moyenne "3 et de variance 233 de laquelle
est tiré un échantillon de taille 3 donne une moyenne empirique de ̅3 . Le test de comparaison est destiné à
déterminer, à partir de ̅4 et ̅ 3, s’il existe une différence entre les deux moyennes inconnues "4 et "3 .
Dans le chapitre sur la distribution d'échantillonnage, il a été montré que la variable aléatoire \ ̅4 ̅3
suit une loi normale d’espérance µ = µ1 − µ2 et d’écart-type :

23 23
2] d 4 1 3
4 3

̅4 ̅3 "4 "3
on a donc
O → $ 0, 1
23 233
d 4 1
4 3

La statistique du test sous l'hypothèse Ø : "4 "3 \ est donnée par:

̅4 ̅3 \
O
243 233
d 1
4 3

Les tests suivantes peuvent être menés en fonction des hypothèses alternatives.

Ø : "4 "3 \ PQ Ø : "4 "3 \ b Ø4 : "4 "3 \

En désignant par α le risque de première espèce, la région critique est définie par :

54
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

⎛ ⎞
̅ − ̅3 − \
O > Sh = µ ≡ ⎜ 4 > Sh ⎟ = µ
⎜ ⎟
243 233
d +
⎝ 4 3 ⎠

Décision: l'hypothèse nulle est rejetée si

̅4 − ̅ 3 − \ 243 233
> Sh PQ ̅4 − ̅ 3 > \ + Sh d +
23 233
4 3
d 4 +
4 3

̅4 − ̅ 3 − \
Ou encore lorsque
O.*-.,-é = > O-, = Sh
23 233
d 4 +
4 3

Ø : "4 − "3 = \ PQ Ø : "4 − "3 ≥ \ b Ø4 : "4 − "3 < \

En désignant par α le risque de première espèce, la région critique est définie par :

⎛ ⎞
̅ − ̅3 − \
O < −Sh = µ ≡ ⎜ 4 < −Sh ⎟ = µ
⎜ ⎟
23 23
d 4 + 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

̅4 − ̅ 3 − \ 243 233
< −Sh PQ ̅4 − ̅ 3 < \ − Sh d +
243 233
4 3
d +
4 3

̅4 − ̅ 3 − \
Ou encore lorsque
O.*-.,-é = < −O-, = −Sh
23 233
d 4 +
4 3

Ø : "4 − "3 = \ b Ø4 : "4 − "3 ≠ \

En désignant par α le risque de première espèce symétrique, la région critique est définie par :

55
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

⎛ ⎞
̅4 − ̅ 3 − \
w−Sh⁄3 < O < Sh⁄3 x = µ ≡ ⎜−Sh⁄3 < < Sh⁄3 ⎟ = µ
⎜ ⎟
23 23
d 4 + 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

ç ̅ − ̅ −\ ç ̅4 − ̅ 3 − \ ̅4 − ̅ 3 − \
> Sh⁄3 ≡ < −Sh⁄3 PQ > Sh⁄3
4 3

ç 23 233 ç 23 233 23 233


d 4 + d 4 + d 4 +
4 3 4 3 4 3

De manière équivalente, on a:
243 233 243 233
̅4 − ̅3 < \ − Sh⁄3 d + PQ ̅4 − ̅3 > \ + Sh⁄3 d +
4 3 4 3

Ou encore lorsque

ç ̅ − ̅ −\ ç
|O.*-.,-é | = > O-, = Sh⁄3
4 3

ç 243 233 ç
d +
4 3

Note: Les précédents tests sont menés sur de grands échantillons issus des populations normales, ou de grands échantillons issus
de populations de lois quelconques mais pouvant se ramener à une loi normale à travers le théorème central limite. Ces différentes
formules s'appliquent lorsque les variances des populations sont connues, si elles ne sont pas connues, les mêmes formules sont
appliquées en remplaçant juste la variance par sa valeur estimée.

Exemple :

On dispose de deux échantillons de tubes, construits suivant deux procédés de fabrication A et B. On a


mesuré les diamètres de ces tubes et on a trouvé (en millimètres) :

Procédé A 52,8 52,9 51,9 50,9 53,4


Procédé B 52,1 51,3 51,5 51,1

On suppose que les diamètres sont distribués suivant une loi normale et que les écarts-types sont égaux à :
σ A = 1mm et σ B = 0.45mm .
Peut-on affirmer au niveau 5% qu’il y a une différence significative entre les procédés de fabrication A et B ?

Exemple
Une étude est menée pour comparer la durée que prenne un homme et une femme dans certaines tâches
d'assemblage. Des échantillons de 50 hommes et 50 femmes sont utilisés dans une expérience dans laquelle

56
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

chaque personne est chronométrée en secondes sur des tâches identiques. Les résultats sont résumés dans le
tableau suivant:
Hommes Femmes

̅
50 50

b 3
42 38
18 14
Est-ce que les données des échantillons apportent de preuves suffisantes pour affirmer qu'il y a différence
entre la durée d'exécution des tâches entre les hommes et les femmes ?

ii. Test sur la différence des moyennes issues de 2 populations normales


(échantillons de petites tailles, variances inconnues)
Dans ces cas où les variances de la population sont inconnues et que les tailles des échantillons sont petites,
on estime les variances par les variances empiriques et on utilise la loi de Student.

première population a pour moyenne "4 de laquelle est tiré un échantillon de taille 4 qui fourni une
On considère le cas où on a deux échantillons aléatoires indépendants issus de deux populations normales. La

moyenne empirique ̅4 et variance empirique b43 . La deuxième population a pour moyenne "3 de laquelle est
tiré un échantillon de taille 3 donne une moyenne empirique de ̅3 et de variance empirique b33 . Le test de
comparaison est destiné à déterminer, à partir de ̅4 et ̅3 , s’il existe une différence entre les deux moyennes
inconnues "4 et "3 .

Dans ce cas, on détermine bf3 qui est l'écart types empirique des deux échantillons mis ensemble. C'est une
Cas 1: les variances sont inconnues mais supposées égales

moyenne pondérée des écarts types empiriques des deux échantillons.

− 1 b43 1 1 b33 1 b43 1 1 b33


bf3 =
4 3
⇒ bf d 4 3

41 3 2 41 3 2

Il a été montré que la variable aléatoire \ ̅4 ̅ 3 dans le cas présent suit une de Student à
41 3 2 degré de liberté.
La statistique du test sous l'hypothèse Ø : "4 "3 \ est donnée par:

̅4 ̅3 \
Z
1 1
bf ^ 1
4 3

Les tests suivantes peuvent être menés en fonction des hypothèses alternatives.

Ø : "4 "3 \ PQ Ø : "4 "3 \ b Ø4 : "4 "3 \

En désignant par α le risque de première espèce, la région critique est définie par :

̅4 ̅3 \
Z Rh µ≡ ⎛ Rh ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

57
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

̅4 − ̅ 3 − \ 1 1
Rh PQ ̅4 ̅3 \ 1 Rh bf d 1
1 1
bf ^ 1
4 3
4 3

̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
1 1
bf ^ 1
4 3

Ø : "4 "3 \ PQ Ø : "4 "3 \ b Ø4 : "4 "3 \

En désignant par α le risque de première espèce, la région critique est définie par :

̅4 ̅3 \
Z Rh µ≡ ⎛ Rh ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

̅4 ̅3 \ 1 1
Rh PQ ̅4 ̅3 \ Rh bf d 1
1 1
bf ^ 1
4 3
4 3

̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
1 1
bf ^ 1
4 3

Ø : "4 "3 \ b Ø4 : "4 "3 i \

En désignant par α le risque de première espèce symétrique, la région critique est définie par :

̅4 ̅3 \
w Rh⁄3 Z Rh⁄3 x µ≡ ⎛ Rh⁄3 Rh⁄3 ⎞ µ
1 1
bf ^ 1
⎝ 4 3 ⎠

Décision: l'hypothèse nulle est rejetée si

̅4 ̅3 \ ̅4 ̅3 \ ̅4 ̅3 \
çç çç Rh⁄3 ≡ Rh⁄3 PQ Rh⁄3
1 1 1 1 1 1
bf ^ 1 bf ^ 1 bf ^ 1
4 3 4 3 4 3

1 1 1 1
De manière équivalente, on a:

̅4 ̅3 \ Rh⁄3 bf d 1 PQ ̅4 ̅3 \ 1 Rh⁄3 bf d 1
4 3 4 3

58
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Ou encore lorsque

̅4 ̅3 \
|Z.*-.,-é | çç çç Z-, Rh⁄3
1 1
bf ^ 1
4 3

Cas 2: les variances sont inconnues inégales

Il a été montré que la variable aléatoire \ ̅4 ̅ 3 dans le cas présent suit une de Student à
Dans ce cas les l'écart types empiriques des deux échantillons sont utilisés mais degré de liberté change.
degré de
liberté.
b43 b33
3
? 1 @
4 3
b43 ⁄ 3 b33 ⁄ 3
4
1 3
4 1 3 1

La statistique du test sous l'hypothèse Ø : "4 "3 \ est donnée par:

̅4 ̅3 \
Z
b43 b33
d 1
4 3

Les tests suivants peuvent être menés en fonction des hypothèses alternatives.

Ø : "4 "3 \ PQ Ø : "4 "3 \ b Ø4 : "4 "3 \

En désignant par α le risque de première espèce, la région critique est définie par :

⎛ ⎞
̅ ̅3 \
Z Rh µ≡ ⎜ 4 Rh ⎟ µ
⎜ ⎟
b3 b3
d 41 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

̅4 ̅3 \ b43 b33
Rh PQ ̅4 ̅3 \ 1 Rh d 1
b43 b33
4 3
d 1
4 3

̅4 ̅3 \
Ou encore lorsque
Z.*-.,-é Z-, Rh
b43 b33
d 1
4 3

59
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Ø : "4 − "3 = \ PQ Ø : "4 − "3 ≥ \ b Ø4 : "4 − "3 < \

En désignant par α le risque de première espèce, la région critique est définie par :

⎛ ⎞
̅ − ̅3 − \
Z < −Rh =µ≡ ⎜ 4 < −Rh ⎟=µ
⎜ ⎟
b 3
b 3
d 4+ 3
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

̅4 − ̅ 3 − \ b43 b33
< −Rh PQ ̅4 − ̅ 3 < \ − Rh d +
b43 b33
4 3
d +
4 3

̅4 − ̅ 3 − \
Ou encore lorsque
Z.*-.,-é = < −Z-, = −Rh
b3 b33
d 4 +
4 3

Ø : "4 − "3 = \ b Ø4 : "4 − "3 ≠ \

En désignant par α le risque de première espèce symétrique, la région critique est définie par :

⎛ ⎞
̅4 − ̅ 3 − \
w−Rh⁄3 < Z < Rh⁄3 x=µ≡ ⎜−Rh⁄3 < < Rh⁄3 ⎟=µ
⎜ ⎟
b3 b33
d 4 +
⎝ 4 3 ⎠
Décision: l'hypothèse nulle est rejetée si

ç ̅ − ̅ −\ ç ̅4 − ̅ 3 − \ ̅4 − ̅ 3 − \
> Rh⁄3 ≡ < −Rh⁄3 PQ > Rh⁄3
4 3

ç b43 b33 ç b43 b33 b43 b33


d + d + d +
4 3 4 3 4 3

De manière équivalente, on a:
b43 b33 b43 b33
̅4 − ̅ 3 < \ − Rh⁄3 d + PQ ̅4 − ̅3 > \ + Rh⁄3 d +
4 3 4 3

Ou encore lorsque

60
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

ç ̅ − ̅ −\ ç
|Z.*-.,-é | = > Z-, = Rh⁄3
4 3

ç b3 b33 ç
d 4 +
4 3

Exemple
Le concepteur d'une nouvelle machine de découpage de tôle déclare que sa nouvelle machine peut découper
plus vite celle actuellement utilisée. Un échantillon de 9 tôles de même caractéristiques est découpé par
chaque type de machine. La durée de découpage est en secondes.

Ancienne machine Nouvelle machine

̅
9 9

b 3
35.22 31.56
24.44 20.03

Au risque de première espèce de 5%, est ce que la déclaration du concepteur est vérifiée? on suppose une
distribution normale pour le temps de découpage.

e. Test de différence de moyennes pour des échantillons appariés

Les deux tests précédents marchent seulement dans le cas où les échantillons peuvent avoir de dépendance.
C'est souvent le cas lorsque des observations sont répétées sur la même unité d’échantillon tel que compter le
nombre d'accident dans des usines avant et après l'institution d'un programme de sécurité. Si on considère 2
usines différentes, le comptage est indépendant, mais dans une même usine, avant et après, le programme, le

Soit 4 , Ô4 , ⋯ , + , Ô+ désignant un échantillon de couples d'observation c'est-à-dire & , Ô& désigne deux
comptage devient dépendant.

mesures sur la même unité d'échantillon !.

: & − : Ô& = : & − Ô&

et la comparaison de : & et : Ô& peut se faire comme la moyenne de : & − Ô& .


Soit \& = & − Ô& , l'hypothèse : & − : Ô& = 0 est équivalente à : \& = 0.
Pour construire la statistique du test, on suppose que \4 , ⋯ , \+ est un échantillon aléatoire de la différence,
suivant une loi normale de moyenne "] et de variance 2]3 .

La statistique du test sous l'hypothèse nulle Ø : "] = "è est:


… − "è
\
Z= → Rh , = −1
b] ⁄√
+ +
1 1
avec,

\… = 8 \& R [] =
3 …
8 \& − \ 3
−1
&94 &94

Les hypothèses suivantes peuvent être testées

Ø : "] = "è PQ Ø : "] ≤ "è b Ø : "] > "è

En désignant par α le risque de première espèce, la région critique est définie par :
61
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

… − "è
\
Z > Rh =µ≡ T > Rh U=µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si

… − "è
\
> Rh …
PQ \ "è 1 Rh b] ⁄√
b] ⁄√


\ "è
Ou encore lorsque

Z.*-.,-é Z-, Rh
b] ⁄√

Ø : "] "è PQ Ø : "] "è b Ø : "] "è

… "è
\
En désignant par α le risque de première espèce, la région critique est définie par :
Z Rh µ≡ T Rh U µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si


\ "è
Rh …
PQ \ "è Rh b] ⁄√
b] ⁄√


\ "è
Ou encore lorsque
Z.*-.,-é Z-, Rh
b] ⁄√

Ø : "] "è b Ø : "] i "è

\… "è
En désignant par α le risque de première espèce symétrique, la région critique est définie par :
w Rh⁄3 Z Rh⁄3 x µ ≡ T Rh⁄3 Rh⁄3 U µ
b] ⁄√
Décision: l'hypothèse nulle est rejetée si


\ "è …
\ "è …
\ "è
á á Rh⁄3 ≡ Rh⁄3 PQ Rh⁄3
b] ⁄√ b] ⁄√ b] ⁄√

… "è
\ Rh⁄3 b] ⁄√ PQ …
\ "è 1 Rh⁄3 b] ⁄√
De manière équivalente, on a:


\ "è
Ou encore lorsque
|Z.*-.,-é | á á Z-, Rh⁄3
b] ⁄√

f. Test sur le ratio de variances (de distributions normales)


Il y a nombre de situations dans lesquelles on s'intéresse à la comparaison des variances de deux lois
normales. Par exemple, dans certains tests précédents, on avait supposé les variances égales et utilisé les
variances empiriques pour déterminer la variance du groupe. Les études de contrôle de qualité sont souvent
concernées par les questions de quelle processus a la variance la plus petite.
62
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Pour faire un tel test, on introduit la distribution de probabilité de Fisher m . On considère b43 la variance
empirique d'un échantillon aléatoire de taille 4 issu d'une population normale de variance 243 . Un deuxième
échantillon de taille 3 , de variance empirique b33 issu d'une population normale de variance 233 . Il a été

− 1 b43
montré que la variable aléatoire
4
Ê 1
243 4
b43 233 b43 233
T 3U T 3 U T 3U T 3U → m 1, 1
1 b33 24 b3 b3 24
4 3
3
Ê 1
233 3

La statistique du test sous l'hypothèse nulle Ø : 243 233 est donnée par:

b43
m → m 4 1, 1
b33 3

Ø : 243 233 PQ Ø : 243 233 b Ø4 : 243 233


Les hypothèses suivantes peuvent être testées:

b43
On rejette l'hypothèse nulle si:

m mh 1, 1
b33 4 3

b43
ou

mé*-.,-é m-, mh 1, 1
b33 4 3

Ø : 243 233 PQ Ø : 243 233 b Ø4 : 243 233

b43
On rejette l'hypothèse nulle si:
m m4Hh 1, 1
b33
4 3

b43
ou si

mé*-.,-é m-, m4Hh 1, 1


b33 4 3

Ø : 243 233 PQ b Ø4 : 243 i 233

b43 b43
On rejette l'hypothèse nulle si:

m mh⁄3 1, 1 PQ m m4Hh⁄3 1, 1
b33 4 3
b33 4 3

Exemple

Une machine produit des pièces de machine. Sur un échantillon de 10 pièces produites par cette machine, on
obtient une variance d'échantillon de 0.0003. On souhaite comparer cette variance avec celle d'un de ses
concurrents. On choisit alors un échantillon de 20 pièces de sa production qui fournit une variance empirique

inférieure à celle du producteur? (µ 0.05 .


de 0.0001. En supposant la normalité du diamètre, peut-on conclure que la variance du concurrent est

63
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

g. Tests sur la différence de proportions (grands échantillons)

Dans cette section, on développe la procédure pour comparer deux proportions de population statistiques.
Pour se faire, on considère le modèle standard où on choisit un échantillon de taille 4 de la population 1 qui
fournit une proportion l4 et 3 de la population 2 de proportion l3 .
Dans le chapitre de la théorie de l'échantillonnage, on a montré que si o4 désigne la proportion empirique de
l'échantillon issu de la population 1 et o3 la proportion empirique de la population 2, alors

o4 − o3 − l4 − l3
O= → $ 0, 1
l4 1 l4 l3 1 l3
^
4 3

La statistique du test sous l'hypothèse nulle Ø : l4 l3 0 PQ Ø : l4 l3

o4 o3
O → $ 0, 1
l 1 l l 1 l
^
4 3
Avec l qui est inconnu peut être estimé par
4 l̂ 1 3 l̂

41 3
Les hypothèses suivantes peuvent être testées:

Ø : l4 l3 0 PQ Ø : l4 l3 0 b Ø4 : l4 l3 0

o4 o3
Décision: on accepte l'hypothèse nulle si
Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3

o4 o3
ou
Oé*-.,-é O-, Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3

Ø : l4 l3 0 PQ Ø : l4 l3 0 b Ø4 : l4 l3 0

o4 o3
Décision: on accepte l'hypothèse nulle si
Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3

o4 o3
ou
Oé*-.,-é O-, Sh
l̂ 1 l̂ l̂ 1 l̂
^
4 3

Ø : l4 l3 0 b Ø : l4 l3 i 0

Décision: on accepte l'hypothèse nulle si


64
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

o4 − o3
−Sh⁄3 < < Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂
^ −
4 3
ou

o4 − o3
çç çç > Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂
^ −
4 3

o4 − o3 o4 − o3
ou encore
< −Sh⁄3 PQ > Sh⁄3
l̂ 1 − l̂ l̂ 1 − l̂ l̂ 1 − l̂ l̂ 1 − l̂
^ − ^ −
4 3 4 3

Exemple :
La gendarmerie nationale procède au contrôle des charges transportées par les camions. Sur 473 camions
contrôlés au mois de Janvier, 105 s’avèrent être en surcharge. 128 des 500 camions contrôlés en février
présentent une charge supérieure à celle autorisée.
Peut on conclure que la proportion des camions en surcharge en février est supérieure à celle de Janvier ?

65
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

66
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Table 2.1 : Table de Chi-deux ê•ë,½

wpt3 > pt,h


3
x=µ

67
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Table 2.2. Table de Chi-deux ê•ë,½

wpt3 pt,h
3
x µ

68
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Support de cours de Statistiques Inférentielles _ Niveau Licence3_2019-2020

Table 3. Table de Student à ë degré de liberté

wRt > Rt,h x = µ

69
GOLO Yao Nukunu-Ph.D in Economics-FASEG-Université de Lomé – ygolo@univ-lome.tg
Table 4.1a. Table de Fisher ½ = X. ‚X

wmt`, ta > mt`, ta ,h x = µ

70
Table 4.1b. Table de Fisher ½ = X. ‚X

wmt`, ta > mt`, ta ,h x = µ

71
Table 4.2a. Table de Fisher ½ = X. Xì

wmt`, ta > mt`, ta ,h x = µ

72
Table 4.2b. Table de Fisher ½ = X. Xì

wmt`, ta > mt`, ta ,h x = µ

73
Table 4.3a. Table de Fisher ½ = X. X•ì

wmt`, ta > mt`, ta ,h x = µ

74
Table 4.3b. Table de Fisher ½ = X. X•ì

wmt`, ta > mt`, ta ,h x = µ

75
Table 4.4a. Table de Fisher ½ = X. X‚

wmt`, ta > mt`, ta ,h x = µ

76
Table 4.4a. Table de Fisher ½ = X. X‚

wmt`, ta > mt`, ta ,h x = µ

77

Vous aimerez peut-être aussi